🇨🇳 Qwen 3 14B
Dense 14B avec hybrid thinking. Égale Qwen 2.5 32B Base sur STEM/code.
ollama run qwen3:14b
La RTX 3080 Ti (12 GB GDDR6X, 912 Go/s) a la bande passante la plus rapide pour 12 Go de toute l'offre consumer. Qwen 3 14B Q4 à 55-65 tok/s — plus rapide que 4070 sur le même modèle.
Dense 14B avec hybrid thinking. Égale Qwen 2.5 32B Base sur STEM/code.
ollama run qwen3:14b
Raisonneur MIT 14B. Bat R1-Distill-Llama-70B sur AIME/GPQA avec 50× moins de paramètres.
ollama run phi4-reasoning:14b
R1 distillé Qwen 14B. AIME24 69.7, MATH-500 93.9. Dépasse o1-mini sur beaucoup de benchmarks.
ollama run deepseek-r1:14b
Hybride 7B/1B actifs. Coût compute extrêmement faible. Edge/embarqué.
ollama run granite4:tiny-h
Raisonnement exceptionnel pour sa taille. Orienté STEM.
ollama run phi4:14b
Codéveloppé avec NVIDIA. 128k ctx, Tekken tokenizer, fort en multilingue européen.
ollama run mistral-nemo:12b
Sweet spot multimodal. 128k ctx, vision, 140 langues.
ollama run gemma3:12b
| Rang | Modèle | Params | VRAM Q4 | Contexte | Licence | Sur RTX 3080 Ti |
|---|---|---|---|---|---|---|
| #1 | Qwen 3 14B | 14B | 9 GB | 131 072 | Apache 2.0 | 20 tok/s · Q5_K_M |
| #2 | Phi-4 Reasoning 14B | 14B | 9 GB | 32 768 | MIT | 20 tok/s · Q5_K_M |
| #3 | DeepSeek R1 Distill Qwen 14B | 14B | 9 GB | 131 072 | MIT | 20 tok/s · Q5_K_M |
| #4 | Granite 4.0 H-Tiny 7B-A1B | 7B | 4 GB | 128 000 | Apache 2.0 | 180 tok/s · Q8 |
| #5 | Phi-4 14B | 14B | 9 GB | 16 384 | MIT | 20 tok/s · Q5_K_M |
| #6 | Mistral Nemo 12B Instruct | 12B | 7 GB | 128 000 | Apache 2.0 | 25 tok/s · Q5_K_M |
| #7 | Gemma 3 12B | 12B | 7 GB | 128 000 | Gemma | 22 tok/s · Q5_K_M |
Filtre : Q4_K_M ≤ 11 Go. Bonus 7-14B. Bande passante 912 Go/s record pour 12 Go consumer.
Critères pris en compte :
Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.
3080 Ti : bande passante record pour 12 Go ?
Oui — 912 Go/s vs 4070 Ti 504 Go/s, 5070 672 Go/s. Pour les 7-14B qui exploitent la bande passante (FP16 / Q5+), la 3080 Ti reste la plus rapide en 12 Go. Voir guide.
3080 Ti vs 4070 Ti Super ?
3080 Ti = 12 Go + 912 Go/s. 4070 Ti Super = 16 Go + 672 Go/s. Pour speed sur 14B, 3080 Ti. Pour accès aux 24B (Mistral Small), 4070 Ti Super. Voir 4070 Ti Super.
3080 Ti occasion ~450-500 € : bon plan ?
Oui pour 7-14B speed. Mais 3090 occasion ~650 € donne 24 Go pour 30 % de plus = bien meilleur LLM. Voir RTX 3090.
Sweet spot LLM 3080 Ti ?
Qwen 3 14B Q4 (~8 Go) à 55-65 tok/s, Mistral Nemo 12B Q5 (~9 Go) à 45 tok/s. Excellent code/chat.
Approfondissez avec nos duels détaillés des finalistes :