🇺🇸 Granite 4.0 H-Tiny 7B-A1B
Hybride 7B/1B actifs. Coût compute extrêmement faible. Edge/embarqué.
ollama run granite4:tiny-h
La RTX 2060 (6 GB GDDR6, 336 Go/s) en occasion ~100 € est l'entry-level LLM le plus abordable. 6 Go limitent aux 3-7B en Q4 mais permettent de découvrir le LLM local.
Hybride 7B/1B actifs. Coût compute extrêmement faible. Edge/embarqué.
ollama run granite4:tiny-h
LLM souverain francophone, entraîné sur corpus FR.
ollama run lucie:7b
Raisonnement chain-of-thought distillé. Bluffant en maths.
ollama run deepseek-r1:7b
Texte+image+audio → texte. Mixture-of-LoRAs, jusqu'à ~2.8h d'audio. Pas de tag Ollama officiel.
# Via HuggingFace : microsoft/Phi-4-multimodal-instruct (pas d'Ollama officiel)
Dense 7B 100% ouvert (poids + données + code). Transparence totale pour recherche.
ollama run olmo-3:7b
Seul MoE 100% ouvert (poids+données+code). 7B/1.3B actifs. Compétitif Llama2-13B-Chat.
ollama run olmoe
Le classique français. Rapide, polyvalent, excellente base pour débuter.
ollama run mistral:7b-instruct
| Rang | Modèle | Params | VRAM Q4 | Contexte | Licence | Sur RTX 2060 |
|---|---|---|---|---|---|---|
| #1 | Granite 4.0 H-Tiny 7B-A1B | 7B | 4 GB | 128 000 | Apache 2.0 | 60 tok/s · Q5_K_M |
| #2 | Lucie 7B | 7B | 5 GB | 4 096 | Apache 2.0 | 12 tok/s · Q5_K_M |
| #3 | DeepSeek R1 Distill 7B | 7B | 5 GB | 32 768 | MIT | 12 tok/s · Q5_K_M |
| #4 | Phi-4 Multimodal 5.6B | 5.6B | 4 GB | 128 000 | MIT | 15 tok/s · Q5_K_M |
| #5 | OLMo 3 7B | 7B | 5 GB | 8 192 | Apache 2.0 | 12 tok/s · Q5_K_M |
| #6 | OLMoE 1B-7B Instruct | 7B | 4 GB | 4 096 | Apache 2.0 | 50 tok/s · Q5_K_M |
| #7 | Mistral 7B Instruct | 7B | 5 GB | 32 768 | Apache 2.0 | 12 tok/s · Q5_K_M |
Filtre : Q4_K_M ≤ 5 Go. Bonus 1-7B et fort bonus ≤ 3B. 336 Go/s correct entry.
Critères pris en compte :
Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.
RTX 2060 6 GB : LLM possible ?
Oui pour 1-7B. Phi-4 Mini 3,8B Q4 à 35-40 tok/s, Llama 3.2 3B Q4 à 50+ tok/s, Mistral 7B Q4 à 15-18 tok/s. Voir guide.
6 Go suffisant en 2026 ?
Tout juste — Mistral 7B Q4 prend 4,5 Go + 1 Go contexte + 0,5 Go OS = serré. Préférez Phi-4 Mini ou Llama 3.2 3B (2-3 Go). Voir guide 6 Go.
2060 vs 3050 8 GB occasion ?
3050 8 GB = +2 Go VRAM mais ancien (224 Go/s vs 2060 336 Go/s). 2060 plus rapide sur 7B mais 3050 ouvre plus de modèles. Selon priorité. Voir RTX 3050 8GB.
Vaut-il mieux upgrader vers 5050 ?
5050 8 GB neuve ~280 € vs 2060 6 GB occasion ~100 €. Si LLM est l'usage principal, 5050 (GDDR7, +8 Go, Neural Engine moderne). Sinon 2060 reste fonctionnel. Voir RTX 5050.
Approfondissez avec nos duels détaillés des finalistes :