🇺🇸 Granite 4.0 H-Tiny 7B-A1B
Hybride 7B/1B actifs. Coût compute extrêmement faible. Edge/embarqué.
ollama run granite4:tiny-h
L'iMac M4 (16-32 Go, 120 Go/s) embarque la même puce que le Mac mini M4 dans une dalle 24". Excellent poste fixe LLM pour les configurations 7-14B en Q4.
Hybride 7B/1B actifs. Coût compute extrêmement faible. Edge/embarqué.
ollama run granite4:tiny-h
Dense 14B avec hybrid thinking. Égale Qwen 2.5 32B Base sur STEM/code.
ollama run qwen3:14b
Raisonneur MIT 14B. Bat R1-Distill-Llama-70B sur AIME/GPQA avec 50× moins de paramètres.
ollama run phi4-reasoning:14b
R1 distillé Qwen 14B. AIME24 69.7, MATH-500 93.9. Dépasse o1-mini sur beaucoup de benchmarks.
ollama run deepseek-r1:14b
LLM souverain francophone, entraîné sur corpus FR.
ollama run lucie:7b
Raisonnement chain-of-thought distillé. Bluffant en maths.
ollama run deepseek-r1:7b
Mode hybride thinking/fast. 119 langues, 32k natif (131k via YaRN).
ollama run qwen3:8b
| Rang | Modèle | Params | VRAM Q4 | Contexte | Licence | Sur Apple M4 (24 GB) |
|---|---|---|---|---|---|---|
| #1 | Granite 4.0 H-Tiny 7B-A1B | 7B | 4 GB | 128 000 | Apache 2.0 | 60 tok/s · FP16 |
| #2 | Qwen 3 14B | 14B | 9 GB | 131 072 | Apache 2.0 | 6 tok/s · Q8 |
| #3 | Phi-4 Reasoning 14B | 14B | 9 GB | 32 768 | MIT | 6 tok/s · Q8 |
| #4 | DeepSeek R1 Distill Qwen 14B | 14B | 9 GB | 131 072 | MIT | 6 tok/s · Q8 |
| #5 | Lucie 7B | 7B | 5 GB | 4 096 | Apache 2.0 | 12 tok/s · FP16 |
| #6 | DeepSeek R1 Distill 7B | 7B | 5 GB | 32 768 | MIT | 12 tok/s · FP16 |
| #7 | Qwen 3 8B | 8B | 5 GB | 131 072 | Apache 2.0 | 12 tok/s · FP16 |
Filtre : 1-15B dont Q4_K_M tient sous 14 Go. Bonus 7-14B (peak iMac M4) et licences libres.
Critères pris en compte :
Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.
iMac M4 16 Go : quel modèle pour de l'IA locale ?
Mistral 7B Q4 (~4,5 Go) ou Qwen 3 8B Q4 (~5 Go) — 25-32 tok/s, fluide pour du chat. Voir le guide iMac M4.
iMac M4 vs Mac mini M4 pour les LLM ?
Strictement même puce M4 + même bande passante 120 Go/s. iMac M4 = écran + design intégré, plus cher. Mac mini M4 = serveur compact. Voir Mac mini M4.
iMac M4 24 / 32 Go : peut-on monter à 12-14B ?
Oui — Mistral Nemo 12B Q4 (~7 Go) ou Qwen 3 14B Q4 (~8 Go) tournent à 18-22 tok/s. Au-delà (30B), il faut un Mac Studio. Voir Mac Studio.
L'iMac M4 est-il bon pour la création + LLM ?
Oui — la dalle 24" 4,5K et la M4 gèrent Photoshop / Lightroom / Logic ET un Ollama en arrière-plan sans soucis. Idéal poste créatif solo avec assistant LLM local.
Approfondissez avec nos duels détaillés des finalistes :