🇫🇷 Lucie 7B
LLM souverain francophone, entraîné sur corpus FR.
ollama run lucie:7b
La RTX 3060 Ti (8 GB GDDR6X, 448 Go/s) est plus rapide que la 3060 12 Go mais limitée à 8 Go. Compromis perf vs VRAM : la 3060 12 GB gagne souvent pour LLM.
LLM souverain francophone, entraîné sur corpus FR.
ollama run lucie:7b
Raisonnement chain-of-thought distillé. Bluffant en maths.
ollama run deepseek-r1:7b
Vision SOTA 7B. Vidéo >1h, grounding bbox, OCR multilingue. DocVQA 95.7.
ollama run qwen2.5vl:7b
Premier omni open : texte+image+audio+vidéo en entrée, texte+parole en sortie. Pas de tag Ollama officiel.
# GGUF : ggml-org/Qwen2.5-Omni-7B-GGUF (pas d'Ollama officiel)
Dense 7B 100% ouvert (poids + données + code). Transparence totale pour recherche.
ollama run olmo-3:7b
Hybride 7B/1B actifs. Coût compute extrêmement faible. Edge/embarqué.
ollama run granite4:tiny-h
Mode hybride thinking/fast. 119 langues, 32k natif (131k via YaRN).
ollama run qwen3:8b
| Rang | Modèle | Params | VRAM Q4 | Contexte | Licence | Sur RTX 3060 Ti |
|---|---|---|---|---|---|---|
| #1 | Lucie 7B | 7B | 5 GB | 4 096 | Apache 2.0 | 12 tok/s · Q5_K_M |
| #2 | DeepSeek R1 Distill 7B | 7B | 5 GB | 32 768 | MIT | 12 tok/s · Q5_K_M |
| #3 | Qwen 2.5 VL 7B | 7B | 6 GB | 128 000 | Apache 2.0 | 8 tok/s · Q5_K_M |
| #4 | Qwen 2.5 Omni 7B | 7B | 6 GB | 32 768 | Apache 2.0 | 8 tok/s · Q5_K_M |
| #5 | OLMo 3 7B | 7B | 5 GB | 8 192 | Apache 2.0 | 12 tok/s · Q5_K_M |
| #6 | Granite 4.0 H-Tiny 7B-A1B | 7B | 4 GB | 128 000 | Apache 2.0 | 60 tok/s · Q8 |
| #7 | Qwen 3 8B | 8B | 5 GB | 131 072 | Apache 2.0 | 12 tok/s · Q5_K_M |
Filtre : Q4_K_M ≤ 7 Go. Bonus 3-9B. 448 Go/s = correct mais 8 Go contraignant.
Critères pris en compte :
Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.
3060 Ti 8 GB vs 3060 12 GB : LLM ?
3060 Ti plus rapide (~25 %) sur 7B. 3060 12 GB débloque 13-14B en Q4. Pour LLM principalement, 3060 12 GB. Pour mixed (jeu + LLM léger), 3060 Ti. Voir 3060 12GB.
3060 Ti occasion : prix ?
~150-200 € en France. Une des meilleures affaires entry-level LLM. Mistral 7B Q4 à 28 tok/s utilisable pour chat/code.
Modèles sweet spot 3060 Ti ?
Mistral 7B Q5 (~5,5 Go, 35 tok/s), Qwen 3 8B Q4 (~5 Go, 32 tok/s), Llama 3.2 3B Q4 (~2 Go, 70+ tok/s).
Vaut-il mieux investir dans la 5060 neuve ?
5060 GDDR7 448 Go/s = pareil bande passante mais Neural Engine moderne. ~340 € neuf vs ~180 € occasion. Préférez 3060 Ti occasion en budget serré. Voir RTX 5060.
Approfondissez avec nos duels détaillés des finalistes :