Accueil › Catalogue › Meilleur LLM sur Radeon RX 6700 XT (12 GB) en 2026

Meilleur LLM sur Radeon RX 6700 XT (12 GB) en 2026

Classement mis à jour le 15/07/2026

La Radeon RX 6700 XT (12 GB GDDR6, 384 Go/s) est l'AMD mid-range RDNA 2. 12 Go en occasion ~250 € = Qwen 3 14B Q4 accessible via ROCm.

Classement

🇨🇳 Qwen 3 14B

Alibaba · 14B paramètres · Apache 2.0 · 131 072 tokens ctx

Dense 14B avec hybrid thinking. Égale Qwen 2.5 32B Base sur STEM/code.

Pourquoi ce rang Dense 14B avec hybrid thinking. Égale Qwen 2.5 32B Base sur STEM/code.

ollama run qwen3:14b

Sur Radeon RX 6700 XT

Q5_K_M

11 GB · 6 tok/s

🇺🇸 Phi-4 Reasoning 14B

Microsoft · 14B paramètres · MIT · 32 768 tokens ctx

Raisonneur MIT 14B. Bat R1-Distill-Llama-70B sur AIME/GPQA avec 50× moins de paramètres.

Pourquoi ce rang Raisonneur MIT 14B. Bat R1-Distill-Llama-70B sur AIME/GPQA avec 50× moins de paramètres.

ollama run phi4-reasoning:14b

Sur Radeon RX 6700 XT

Q5_K_M

11 GB · 6 tok/s

🇨🇳 DeepSeek R1 Distill Qwen 14B

DeepSeek · 14B paramètres · MIT · 131 072 tokens ctx

R1 distillé Qwen 14B. AIME24 69.7, MATH-500 93.9. Dépasse o1-mini sur beaucoup de benchmarks.

Pourquoi ce rang R1 distillé Qwen 14B. AIME24 69.7, MATH-500 93.9. Dépasse o1-mini sur beaucoup de benchmarks.

ollama run deepseek-r1:14b

Sur Radeon RX 6700 XT

Q5_K_M

11 GB · 6 tok/s

🇺🇸 Phi-4 14B

Microsoft · 14B paramètres · MIT · 16 384 tokens ctx

Raisonnement exceptionnel pour sa taille. Orienté STEM.

Pourquoi ce rang Raisonnement exceptionnel pour sa taille. Orienté STEM.

ollama run phi4:14b

Sur Radeon RX 6700 XT

Q5_K_M

11 GB · 6 tok/s

🇫🇷 Mistral Nemo 12B Instruct

Mistral AI · 12B paramètres · Apache 2.0 · 128 000 tokens ctx

Codéveloppé avec NVIDIA. 128k ctx, Tekken tokenizer, fort en multilingue européen.

Pourquoi ce rang Codéveloppé avec NVIDIA. 128k ctx, Tekken tokenizer, fort en multilingue européen.

ollama run mistral-nemo:12b

Sur Radeon RX 6700 XT

Q5_K_M

9 GB · 8 tok/s

🇺🇸 Gemma 3 12B

Google · 12B paramètres · Gemma · 128 000 tokens ctx

Sweet spot multimodal. 128k ctx, vision, 140 langues.

Pourquoi ce rang Sweet spot multimodal. 128k ctx, vision, 140 langues.

ollama run gemma3:12b

Sur Radeon RX 6700 XT

Q5_K_M

9 GB · 7 tok/s

Tableau comparatif

Rang	Modèle	Params	VRAM Q4	Contexte	Licence	Sur Radeon RX 6700 XT
#1	Qwen 3 14B	14B	9 GB	131 072	Apache 2.0	6 tok/s · Q5_K_M
#2	Phi-4 Reasoning 14B	14B	9 GB	32 768	MIT	6 tok/s · Q5_K_M
#3	DeepSeek R1 Distill Qwen 14B	14B	9 GB	131 072	MIT	6 tok/s · Q5_K_M
#4	Granite 4.0 H-Tiny 7B-A1B	7B	4 GB	128 000	Apache 2.0	60 tok/s · Q8
#5	Phi-4 14B	14B	9 GB	16 384	MIT	6 tok/s · Q5_K_M
#6	Mistral Nemo 12B Instruct	12B	7 GB	128 000	Apache 2.0	8 tok/s · Q5_K_M
#7	Gemma 3 12B	12B	7 GB	128 000	Gemma	7 tok/s · Q5_K_M

Où acheter ce GPU ?

Comparez les prix de Radeon RX 6700 XT chez nos marchands partenaires (prix et stock à jour) :

DartyVoir Radeon RX 6700 XT → RakutenVoir Radeon RX 6700 XT → AmazonVoir Radeon RX 6700 XT →

Liens affiliés — QuelLLM peut percevoir une commission sur les achats, sans surcoût pour vous, ce qui n'influence pas le classement (établi de façon indépendante). En tant que Partenaire Amazon, QuelLLM réalise un bénéfice sur les achats remplissant les conditions requises.

Mémo gratuit

Quel modèle de code faire tourner sur TA machine ?

Reçois le mémo VRAM → meilleur modèle de code → commande Ollama (un seul écran, copier-coller). Et passe au kit Copilote Local pour en faire un setup qui marche vraiment.

Le kit Copilote Local — les configs Ollama + Cline + Aider prêtes à coller, Modelfiles réglés, dépannage, espace en ligne à vie →

Pas de spam. Désinscription en 1 clic. Tes données restent chez nous (jamais revendues).

Ta carte → le meilleur modèle de code à faire tourner en local, et la commande Ollama exacte :

Ta VRAM	GPU / Mac typiques	Modèle de code conseillé	Commande Ollama
8 Go	RTX 4060 / 3060 · M1-M2 16 Go	Qwen2.5-Coder 7B (Q4)	`ollama run qwen2.5-coder:7b`
12 Go	RTX 4070 / 5070	Qwen2.5-Coder 14B (Q4)	`ollama run qwen2.5-coder:14b`
16 Go	RTX 5070 Ti / 4080 / 5080 · RX 9070 XT · M4 24 Go	DeepSeek-Coder-V2-Lite 16B ou Qwen2.5-Coder 14B Q8	`ollama run deepseek-coder-v2:16b`
24 Go	RTX 3090 / 4090 · RX 7900 XTX · M4 Pro 48 Go	Qwen2.5-Coder 32B (Q4) — le « proche Copilot »	`ollama run qwen2.5-coder:32b`
32 Go	RTX 5090	Qwen2.5-Coder 32B en Q5/Q6 ou Devstral Small 2 (agentique)	`ollama run devstral`
48 Go+	Mac M4 Max 64 Go · M2 Ultra 128 Go	Qwen3-Coder 30B-A3B (MoE rapide) ou un 32B en Q8	`ollama run qwen3-coder:30b`

⚠️ Piège licence : Codestral 22B = Mistral Non-Production License → interdit pour coder au travail. Pour un usage pro, reste sur Qwen2.5-Coder, Devstral ou DeepSeek-Coder (Apache 2.0 / MIT). 💡 Ça plante en mémoire ? Garde ~1,5 Go de VRAM libre pour le contexte, ou descends d'un cran de quantization.

🔌 Pour le brancher dans VS Code : Cline (agent multi-fichiers), Aider (CLI) ou Tabby/Twinny (autocomplétion FIM) — tous se connectent à Ollama en local. Le kit Copilote Local — configs prêtes à coller + setup testé — est dispo : /copilote-local.

Méthodologie du classement

Filtre : Q4_K_M ≤ 11 Go. Bonus 7-14B. 384 Go/s + ROCm 6.

Critères pris en compte :

Q4_K_M ≤ 11 Go
Qwen 3 14B Q4 accessible
AMD 12 Go pas cher
ROCm 6

Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.

Questions fréquentes

RX 6700 XT vs RTX 3060 12 GB ?

6700 XT = 384 Go/s vs 3060 = 360 Go/s. Quasi identique. NVIDIA CUDA ROCm AMD : différence d'écosystème. NVIDIA reste plus simple. Voir RTX 3060 12GB.

Sweet spot LLM 6700 XT ?

Mistral 7B Q5 (~5,5 Go) à 28 tok/s, Qwen 3 14B Q4 (~8 Go) à 18 tok/s. Correct chat/code.

ROCm sur RDNA 2 en 2026 ?

Supporté mais moins prioritaire que RDNA 3/4. Reste stable pour Ollama/llama.cpp. Voir guide.

Vaut mieux 7700 XT neuve ?

7700 XT = même 12 Go + 432 Go/s + RDNA 3. Plus moderne, ~400 € neuve. Voir RX 7700 XT.

Comparatifs en tête-à-tête

Approfondissez avec nos duels détaillés des finalistes :

Meilleur LLM sur Radeon RX 6700 XT (12 GB) en 2026

Classement

🇨🇳 Qwen 3 14B

🇺🇸 Phi-4 Reasoning 14B

🇨🇳 DeepSeek R1 Distill Qwen 14B

🇺🇸 Granite 4.0 H-Tiny 7B-A1B

🇺🇸 Phi-4 14B

🇫🇷 Mistral Nemo 12B Instruct

🇺🇸 Gemma 3 12B

Tableau comparatif

Où acheter ce GPU ?

Quel modèle de code faire tourner sur TA machine ?

Méthodologie du classement

Questions fréquentes

Comparatifs en tête-à-tête

Pour aller plus loin