🇫🇷 Devstral Small 2 24B
Spécialiste coding 24B Apache 2.0. 72.2% SWE-Bench. 256k ctx, FR lab.
ollama run devstral-small2:24b
Classement des LLM open-weights spécialisés ou performants pour la génération, le refactoring et l'autocomplétion de code. On privilégie les modèles évalués sur HumanEval/MBPP, avec un contexte ≥ 32k tokens pour couvrir des fichiers entiers, et une licence permissive.
Spécialiste coding 24B Apache 2.0. 72.2% SWE-Bench. 256k ctx, FR lab.
ollama run devstral-small2:24b
Le meilleur LLM de code open-weight. Niveau Claude 3.5 Sonnet.
ollama run qwen2.5-coder:32b
MoE spécialisé code. Rapide malgré la taille.
ollama run deepseek-coder-v2:16b-lite-instruct
Coder 14B. HumanEval 89.6, LiveCodeBench 37.1. Sweet spot VRAM pour code self-host.
ollama run qwen2.5-coder:14b
Dense 27B multimodal sortie 22 avril 2026. 262k ctx (1M YaRN). SWE-bench Verified 77.2%.
ollama run qwen3.6:27b
Dense 30B Apache 2.0, 12 langues dont FR, 131k ctx, GQA 32Q/8KV. Tool calling OpenAI-compatible. Sortie 29 avril 2026.
ollama run granite4.1:30b
Spécialisé code. Rivalise avec les modèles propriétaires sur HumanEval.
ollama run qwen2.5-coder:7b
| Rang | Modèle | Params | VRAM Q4 | Contexte | Licence |
|---|---|---|---|---|---|
| #1 | Devstral Small 2 24B | 24B | 14 GB | 256 000 | Apache 2.0 |
| #2 | Qwen 2.5 Coder 32B | 32B | 19 GB | 131 072 | Apache 2.0 |
| #3 | DeepSeek Coder V2 Lite 16B | 16B | 10 GB | 131 072 | MIT |
| #4 | Qwen 2.5 Coder 14B Instruct | 14B | 9 GB | 131 072 | Apache 2.0 |
| #5 | Qwen 3.6 27B | 27B | 16 GB | 262 144 | Apache 2.0 |
| #6 | Granite 4.1 30B Instruct | 30B | 17 GB | 131 072 | Apache 2.0 |
| #7 | Qwen 2.5 Coder 7B | 7B | 5 GB | 131 072 | Apache 2.0 |
On filtre les modèles dont les tags incluent « code » et qui restent ≤ 100B (au-delà ce n'est plus « local »). Le classement combine : spécialisation code (nom contient « coder », « codestral », « devstral »), contexte long, licence permissive, et taille sweet spot 7-32B.
Critères pris en compte :
Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.
Quel est le meilleur LLM open-source pour coder en 2026 ?
Notre #1 est Devstral Small 2 24B (24B, Apache 2.0). Il combine une précision HumanEval élevée, un contexte de 256 000 tokens et une licence permissive.
Quelle VRAM faut-il pour un bon LLM de code ?
Pour un modèle 7B Coder en Q4_K_M, 6-8 GB de VRAM suffisent. Pour un 32B Coder en Q4, prévoyez 20-24 GB (RTX 4090, 3090, 7900 XTX). En Q5 ou Q8 ça grimpe vite — consultez le configurateur.
Puis-je l'utiliser en production commerciale ?
Oui si la licence est Apache 2.0 ou MIT. Codestral est sous Mistral Non-Production License — uniquement pour usage perso/recherche. Qwen et DeepSeek sont libres.
Comment intégrer un LLM local dans VS Code ?
Via l'extension Continue, qui se branche à votre serveur Ollama ou LM Studio local. Aider fonctionne en CLI pour du refactoring multi-fichiers.
Approfondissez avec nos duels détaillés des finalistes :