QuelLLMFR Analyser ma config →
Accueil Catalogue Meilleur LLM sur RTX 3080 Ti (12 GB) en 2026

Meilleur LLM sur RTX 3080 Ti (12 GB) en 2026

La RTX 3080 Ti (12 GB GDDR6X, 912 Go/s) a la bande passante la plus rapide pour 12 Go de toute l'offre consumer. Qwen 3 14B Q4 à 55-65 tok/s — plus rapide que 4070 sur le même modèle.

Classement

1

🇨🇳 Qwen 3 14B

Alibaba · 14B paramètres · Apache 2.0 · 131 072 tokens ctx

Dense 14B avec hybrid thinking. Égale Qwen 2.5 32B Base sur STEM/code.

Pourquoi ce rang Dense 14B avec hybrid thinking. Égale Qwen 2.5 32B Base sur STEM/code.
ollama run qwen3:14b
Sur RTX 3080 Ti
Q5_K_M
11 GB · 20 tok/s
2

🇺🇸 Phi-4 Reasoning 14B

Microsoft · 14B paramètres · MIT · 32 768 tokens ctx

Raisonneur MIT 14B. Bat R1-Distill-Llama-70B sur AIME/GPQA avec 50× moins de paramètres.

Pourquoi ce rang Raisonneur MIT 14B. Bat R1-Distill-Llama-70B sur AIME/GPQA avec 50× moins de paramètres.
ollama run phi4-reasoning:14b
Sur RTX 3080 Ti
Q5_K_M
11 GB · 20 tok/s
3

🇨🇳 DeepSeek R1 Distill Qwen 14B

DeepSeek · 14B paramètres · MIT · 131 072 tokens ctx

R1 distillé Qwen 14B. AIME24 69.7, MATH-500 93.9. Dépasse o1-mini sur beaucoup de benchmarks.

Pourquoi ce rang R1 distillé Qwen 14B. AIME24 69.7, MATH-500 93.9. Dépasse o1-mini sur beaucoup de benchmarks.
ollama run deepseek-r1:14b
Sur RTX 3080 Ti
Q5_K_M
11 GB · 20 tok/s
4

🇺🇸 Granite 4.0 H-Tiny 7B-A1B

IBM · 7B paramètres · Apache 2.0 · 128 000 tokens ctx

Hybride 7B/1B actifs. Coût compute extrêmement faible. Edge/embarqué.

Pourquoi ce rang Hybride 7B/1B actifs. Coût compute extrêmement faible. Edge/embarqué.
ollama run granite4:tiny-h
Sur RTX 3080 Ti
Q8
7 GB · 180 tok/s
5

🇺🇸 Phi-4 14B

Microsoft · 14B paramètres · MIT · 16 384 tokens ctx

Raisonnement exceptionnel pour sa taille. Orienté STEM.

Pourquoi ce rang Raisonnement exceptionnel pour sa taille. Orienté STEM.
ollama run phi4:14b
Sur RTX 3080 Ti
Q5_K_M
11 GB · 20 tok/s
6

🇫🇷 Mistral Nemo 12B Instruct

Mistral AI · 12B paramètres · Apache 2.0 · 128 000 tokens ctx

Codéveloppé avec NVIDIA. 128k ctx, Tekken tokenizer, fort en multilingue européen.

Pourquoi ce rang Codéveloppé avec NVIDIA. 128k ctx, Tekken tokenizer, fort en multilingue européen.
ollama run mistral-nemo:12b
Sur RTX 3080 Ti
Q5_K_M
9 GB · 25 tok/s
7

🇺🇸 Gemma 3 12B

Google · 12B paramètres · Gemma · 128 000 tokens ctx

Sweet spot multimodal. 128k ctx, vision, 140 langues.

Pourquoi ce rang Sweet spot multimodal. 128k ctx, vision, 140 langues.
ollama run gemma3:12b
Sur RTX 3080 Ti
Q5_K_M
9 GB · 22 tok/s

Tableau comparatif

Rang Modèle Params VRAM Q4 Contexte Licence Sur RTX 3080 Ti
#1 Qwen 3 14B 14B 9 GB 131 072 Apache 2.0 20 tok/s · Q5_K_M
#2 Phi-4 Reasoning 14B 14B 9 GB 32 768 MIT 20 tok/s · Q5_K_M
#3 DeepSeek R1 Distill Qwen 14B 14B 9 GB 131 072 MIT 20 tok/s · Q5_K_M
#4 Granite 4.0 H-Tiny 7B-A1B 7B 4 GB 128 000 Apache 2.0 180 tok/s · Q8
#5 Phi-4 14B 14B 9 GB 16 384 MIT 20 tok/s · Q5_K_M
#6 Mistral Nemo 12B Instruct 12B 7 GB 128 000 Apache 2.0 25 tok/s · Q5_K_M
#7 Gemma 3 12B 12B 7 GB 128 000 Gemma 22 tok/s · Q5_K_M

Méthodologie du classement

Filtre : Q4_K_M ≤ 11 Go. Bonus 7-14B. Bande passante 912 Go/s record pour 12 Go consumer.

Critères pris en compte :

  • Q4_K_M ≤ 11 Go
  • Qwen 3 14B Q4 à 60 tok/s
  • GDDR6X 912 Go/s record
  • 12 Go best speed

Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.

Questions fréquentes

3080 Ti : bande passante record pour 12 Go ?

Oui — 912 Go/s vs 4070 Ti 504 Go/s, 5070 672 Go/s. Pour les 7-14B qui exploitent la bande passante (FP16 / Q5+), la 3080 Ti reste la plus rapide en 12 Go. Voir guide.

3080 Ti vs 4070 Ti Super ?

3080 Ti = 12 Go + 912 Go/s. 4070 Ti Super = 16 Go + 672 Go/s. Pour speed sur 14B, 3080 Ti. Pour accès aux 24B (Mistral Small), 4070 Ti Super. Voir 4070 Ti Super.

3080 Ti occasion ~450-500 € : bon plan ?

Oui pour 7-14B speed. Mais 3090 occasion ~650 € donne 24 Go pour 30 % de plus = bien meilleur LLM. Voir RTX 3090.

Sweet spot LLM 3080 Ti ?

Qwen 3 14B Q4 (~8 Go) à 55-65 tok/s, Mistral Nemo 12B Q5 (~9 Go) à 45 tok/s. Excellent code/chat.

Comparatifs en tête-à-tête

Approfondissez avec nos duels détaillés des finalistes :

Pour aller plus loin