Accueil › Catalogue › Meilleur LLM sur Radeon RX 7900 XTX (24 GB) en 2026

Meilleur LLM sur Radeon RX 7900 XTX (24 GB) en 2026

La Radeon RX 7900 XTX (24 GB GDDR6, 960 Go/s) est l'alternative AMD à la RTX 4090. 24 Go + bande passante similaire = mêmes capacités VRAM. Compatible ROCm 6 + llama.cpp/Ollama.

Classement

🇨🇳 Qwen 3 30B-A3B

Alibaba · 30B paramètres · Apache 2.0 · 131 072 tokens ctx

MoE 30B/3B actifs hybrid thinking. MMLU 81.4, AIME24 80.4. 100+ langues.

Pourquoi ce rang MoE 30B/3B actifs hybrid thinking. MMLU 81.4, AIME24 80.4. 100+ langues.

ollama run qwen3:30b-a3b

Sur Radeon RX 7900 XTX

Q5_K_M

23 GB · 40 tok/s

🇺🇸 Granite 4.0 H-Small 32B-A9B

IBM · 32B paramètres · Apache 2.0 · 128 000 tokens ctx

Hybride Mamba-2 + MoE 32B/9B actifs. ~70% de RAM en moins en long contexte. Apache 2.0.

Pourquoi ce rang Hybride Mamba-2 + MoE 32B/9B actifs. ~70% de RAM en moins en long contexte. Apache 2.0.

ollama run granite4:small-h

Sur Radeon RX 7900 XTX

Q5_K_M

23 GB · 30 tok/s

🇨🇳 Qwen 3 VL 30B-A3B

Alibaba · 30B paramètres · Apache 2.0 · 262 144 tokens ctx

Vision MoE 30B/3B actifs. Sweet spot vision Qwen 3. 256k ctx.

Pourquoi ce rang Vision MoE 30B/3B actifs. Sweet spot vision Qwen 3. 256k ctx.

ollama run qwen3-vl:30b

Sur Radeon RX 7900 XTX

Q5_K_M

23 GB · 40 tok/s

🇺🇸 Trinity Mini 26B-A3B

Arcee AI · 26B paramètres · Apache 2.0 · 131 072 tokens ctx

MoE 26B/3B actifs par labo US. Rapide grâce aux 3B actifs. Apache 2.0.

Pourquoi ce rang MoE 26B/3B actifs par labo US. Rapide grâce aux 3B actifs. Apache 2.0.

ollama pull hf.co/arcee-ai/Trinity-Mini-26B-GGUF

Sur Radeon RX 7900 XTX

Q5_K_M

18 GB · 40 tok/s

Kanana 2 30B-A3B Thinking

Kakao · 30B paramètres · Apache 2.0 · 131 072 tokens ctx

Agentic coréen MoE 30B/3B actifs. Couvre KR/EN/JP/ZH/TH/VI. Apache 2.0. MLA attention.

Pourquoi ce rang Agentic coréen MoE 30B/3B actifs. Couvre KR/EN/JP/ZH/TH/VI. Apache 2.0. MLA attention.

ollama pull hf.co/kakaoai/Kanana-2-30B-GGUF

Sur Radeon RX 7900 XTX

Q5_K_M

22 GB · 40 tok/s

🇨🇳 Qwen 3 Omni 30B-A3B

Alibaba · 30B paramètres · Apache 2.0 · 131 072 tokens ctx

Omni MoE 30B/3B actifs. Streaming speech. 119 langues ASR. Apache 2.0.

Pourquoi ce rang Omni MoE 30B/3B actifs. Streaming speech. 119 langues ASR. Apache 2.0.

ollama run qwen3-omni:30b

Sur Radeon RX 7900 XTX

Q5_K_M

23 GB · 40 tok/s

🇨🇳 LLaDA 2.0 Uni 16B

Ant Group / inclusionAI · 16B paramètres · Apache 2.0 · 8 192 tokens ctx

Premier dLLM open Apache 2.0 : MoE 16B/1B + décodeur diffusion 6.2B. Texte+vision unifié. Sortie 22 avril 2026.

Pourquoi ce rang Premier dLLM open Apache 2.0 : MoE 16B/1B + décodeur diffusion 6.2B. Texte+vision unifié. Sortie 22 avril 2026.

# HuggingFace : inclusionAI/LLaDA2.0-Uni (Flash Attn 2 + CUDA 12.4 requis)

Sur Radeon RX 7900 XTX

Q5_K_M

22 GB · 60 tok/s

🇨🇳 DeepSeek R1 Distill 32B

DeepSeek · 32B paramètres · MIT · 32 768 tokens ctx

Le meilleur raisonneur open-weight accessible.

Pourquoi ce rang Le meilleur raisonneur open-weight accessible.

ollama run deepseek-r1:32b

Sur Radeon RX 7900 XTX

Q5_K_M

23 GB · 12 tok/s

Tableau comparatif

Rang	Modèle	Params	VRAM Q4	Contexte	Licence	Sur Radeon RX 7900 XTX
#1	Qwen 3 30B-A3B	30B	19 GB	131 072	Apache 2.0	40 tok/s · Q5_K_M
#2	Granite 4.0 H-Small 32B-A9B	32B	19 GB	128 000	Apache 2.0	30 tok/s · Q5_K_M
#3	Qwen 3 VL 30B-A3B	30B	19 GB	262 144	Apache 2.0	40 tok/s · Q5_K_M
#4	Trinity Mini 26B-A3B	26B	15 GB	131 072	Apache 2.0	40 tok/s · Q5_K_M
#5	Kanana 2 30B-A3B Thinking	30B	18 GB	131 072	Apache 2.0	40 tok/s · Q5_K_M
#6	Qwen 3 Omni 30B-A3B	30B	19 GB	131 072	Apache 2.0	40 tok/s · Q5_K_M
#7	LLaDA 2.0 Uni 16B	16B	18 GB	8 192	Apache 2.0	60 tok/s · Q5_K_M
#8	DeepSeek R1 Distill 32B	32B	19 GB	32 768	MIT	12 tok/s · Q5_K_M

Méthodologie du classement

Filtre : Q4_K_M ≤ 22 Go. Bonus 13-32B (peak 24 Go). 960 Go/s GDDR6 + ROCm 6 mature.

Critères pris en compte :

Q4_K_M ≤ 22 Go
ROCm 6 compatible
Qwen 3 32B Q5 fluide
24 Go au prix d'une 4070 Ti Super

Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.

Questions fréquentes

RX 7900 XTX vs RTX 4090 ?

Même 24 Go. 7900 XTX 960 Go/s vs 4090 1008 Go/s = quasi identique en bande passante. Mais CUDA reste mieux supporté (Ollama, vLLM, ExLlamaV2). 4090 ~30-50 % plus rapide en pratique. Voir RTX 4090.

ROCm est-il fiable en 2026 ?

Oui, ROCm 6 stable + Ollama supporte AMD nativement. llama.cpp + ROCm tourne bien. vLLM AMD progresse mais moins mature que CUDA. Pour Ollama/chat, ça marche bien. Voir guide.

Prix RX 7900 XTX en 2026 ?

~750-900 € neuve, ~600-700 € occasion. Excellent rapport €/Go VRAM vs RTX 4090 neuve (~1500 €) ou RTX 3090 occasion (~650 €).

Llama 70B sur 7900 XTX ?

Q4 (~40 Go) ne tient pas. Q3 (~32 Go) ne tient pas. Q2 (~24 Go) tient juste mais qualité dégradée. Pour 70B fluide, viser 2× 7900 XTX ou Mac Studio. Voir Mac Studio.

Comparatifs en tête-à-tête

Approfondissez avec nos duels détaillés des finalistes :

Meilleur LLM sur Radeon RX 7900 XTX (24 GB) en 2026

Classement

Tableau comparatif

Méthodologie du classement

Questions fréquentes

Comparatifs en tête-à-tête

Pour aller plus loin