🇨🇳 Qwen 3 30B-A3B
MoE 30B/3B actifs hybrid thinking. MMLU 81.4, AIME24 80.4. 100+ langues.
ollama run qwen3:30b-a3b
Pour un usage commercial (SaaS, produit payant, service interne d'entreprise), seules les licences permissives (Apache 2.0, MIT, BSD) sont réellement tranquilles. On écarte les licences communautaires avec seuils d'utilisateurs, et les licences non-prod.
MoE 30B/3B actifs hybrid thinking. MMLU 81.4, AIME24 80.4. 100+ langues.
ollama run qwen3:30b-a3b
Hybride Mamba-2 + MoE 32B/9B actifs. ~70% de RAM en moins en long contexte. Apache 2.0.
ollama run granite4:small-h
Petit frère de gpt-oss 120B. 21B/3.6B actifs. Égale o3-mini sur laptop.
ollama run openai/gpt-oss:20b
Vision MoE 30B/3B actifs. Sweet spot vision Qwen 3. 256k ctx.
ollama run qwen3-vl:30b
Raisonneur compact MoE 21B/3B actifs. Apache 2.0. Rapide grâce aux 3B actifs.
ollama pull hf.co/baidu/ernie-4.5-21b-GGUF
MoE 26B/3B actifs par labo US. Rapide grâce aux 3B actifs. Apache 2.0.
ollama pull hf.co/arcee-ai/Trinity-Mini-26B-GGUF
Agentic coréen MoE 30B/3B actifs. Couvre KR/EN/JP/ZH/TH/VI. Apache 2.0. MLA attention.
ollama pull hf.co/kakaoai/Kanana-2-30B-GGUF
Omni MoE 30B/3B actifs. Streaming speech. 119 langues ASR. Apache 2.0.
ollama run qwen3-omni:30b
| Rang | Modèle | Params | VRAM Q4 | Contexte | Licence |
|---|---|---|---|---|---|
| #1 | Qwen 3 30B-A3B | 30B | 19 GB | 131 072 | Apache 2.0 |
| #2 | Granite 4.0 H-Small 32B-A9B | 32B | 19 GB | 128 000 | Apache 2.0 |
| #3 | gpt-oss 20B | 21B | 13 GB | 128 000 | Apache 2.0 |
| #4 | Qwen 3 VL 30B-A3B | 30B | 19 GB | 262 144 | Apache 2.0 |
| #5 | ERNIE 4.5 21B-A3B Thinking | 21B | 13 GB | 131 072 | Apache 2.0 |
| #6 | Trinity Mini 26B-A3B | 26B | 15 GB | 131 072 | Apache 2.0 |
| #7 | Kanana 2 30B-A3B Thinking | 30B | 18 GB | 131 072 | Apache 2.0 |
| #8 | Qwen 3 Omni 30B-A3B | 30B | 19 GB | 131 072 | Apache 2.0 |
Filtre strict : licence contient Apache, MIT ou BSD. Pas de Llama Community (seuil 700M MAU), pas de Mistral NPL, pas de Gemma (licence custom permissive mais avec clauses d'usage acceptable).
Critères pris en compte :
Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.
Llama 3.3 70B est-il libre commercialement ?
Non, Llama 3.3 est sous "Llama 3.3 Community License" — libre sauf si votre produit dépasse 700M MAU. Pour un produit grand public futur, c'est un risque. Préférez Qwen (Apache 2.0) ou Mistral (Apache 2.0 sur les modèles Open).
Et Gemma de Google ?
Gemma est sous "Gemma License" — permissive mais avec clause d'usage acceptable (pas pour armes, surveillance de masse, etc.). Pour la plupart des usages B2B, c'est OK, mais lisez attentivement si votre produit touche à la défense ou à la sécurité.
Puis-je fine-tuner un modèle Apache 2.0 et le revendre ?
Oui — Apache 2.0 permet la modification et la redistribution, y compris commerciale. Vous devez juste garder l'attribution et la licence dans les poids redistribués. Vos propres données d'entraînement restent les vôtres.
Qwen vient de Chine — y a-t-il un risque légal ?
Les modèles Qwen sont publiés sous Apache 2.0 par Alibaba Cloud. La licence est valide internationalement. Pour des usages très sensibles (défense, santé), certaines entreprises préfèrent Mistral (🇫🇷) ou IBM Granite (🇺🇸) pour la traçabilité de provenance.
Approfondissez avec nos duels détaillés des finalistes :