Accueil › Catalogue › Meilleur LLM local libre pour usage commercial

Meilleur LLM local libre pour usage commercial

Pour un usage commercial (SaaS, produit payant, service interne d'entreprise), seules les licences permissives (Apache 2.0, MIT, BSD) sont réellement tranquilles. On écarte les licences communautaires avec seuils d'utilisateurs, et les licences non-prod.

Classement

🇨🇳 Qwen 3 30B-A3B

Alibaba · 30B paramètres · Apache 2.0 · 131 072 tokens ctx

MoE 30B/3B actifs hybrid thinking. MMLU 81.4, AIME24 80.4. 100+ langues.

Pourquoi ce rang Licence Apache 2.0 — libre pour usage commercial sans restriction. 30B paramètres.

ollama run qwen3:30b-a3b

VRAM Q4

19 GB

35 GB en Q8

🇺🇸 Granite 4.0 H-Small 32B-A9B

IBM · 32B paramètres · Apache 2.0 · 128 000 tokens ctx

Hybride Mamba-2 + MoE 32B/9B actifs. ~70% de RAM en moins en long contexte. Apache 2.0.

Pourquoi ce rang Licence Apache 2.0 — libre pour usage commercial sans restriction. 32B paramètres.

ollama run granite4:small-h

VRAM Q4

19 GB

35 GB en Q8

🇺🇸 gpt-oss 20B

OpenAI · 21B paramètres · Apache 2.0 · 128 000 tokens ctx

Petit frère de gpt-oss 120B. 21B/3.6B actifs. Égale o3-mini sur laptop.

Pourquoi ce rang Licence Apache 2.0 — libre pour usage commercial sans restriction. 21B paramètres.

ollama run openai/gpt-oss:20b

VRAM Q4

13 GB

23 GB en Q8

🇨🇳 Qwen 3 VL 30B-A3B

Alibaba · 30B paramètres · Apache 2.0 · 262 144 tokens ctx

Vision MoE 30B/3B actifs. Sweet spot vision Qwen 3. 256k ctx.

Pourquoi ce rang Licence Apache 2.0 — libre pour usage commercial sans restriction. 30B paramètres.

ollama run qwen3-vl:30b

VRAM Q4

19 GB

35 GB en Q8

🇨🇳 ERNIE 4.5 21B-A3B Thinking

Baidu · 21B paramètres · Apache 2.0 · 131 072 tokens ctx

Raisonneur compact MoE 21B/3B actifs. Apache 2.0. Rapide grâce aux 3B actifs.

Pourquoi ce rang Licence Apache 2.0 — libre pour usage commercial sans restriction. 21B paramètres.

ollama pull hf.co/baidu/ernie-4.5-21b-GGUF

VRAM Q4

13 GB

23 GB en Q8

🇺🇸 Trinity Mini 26B-A3B

Arcee AI · 26B paramètres · Apache 2.0 · 131 072 tokens ctx

MoE 26B/3B actifs par labo US. Rapide grâce aux 3B actifs. Apache 2.0.

Pourquoi ce rang Licence Apache 2.0 — libre pour usage commercial sans restriction. 26B paramètres.

ollama pull hf.co/arcee-ai/Trinity-Mini-26B-GGUF

VRAM Q4

15 GB

28 GB en Q8

Kanana 2 30B-A3B Thinking

Kakao · 30B paramètres · Apache 2.0 · 131 072 tokens ctx

Agentic coréen MoE 30B/3B actifs. Couvre KR/EN/JP/ZH/TH/VI. Apache 2.0. MLA attention.

Pourquoi ce rang Licence Apache 2.0 — libre pour usage commercial sans restriction. 30B paramètres.

ollama pull hf.co/kakaoai/Kanana-2-30B-GGUF

VRAM Q4

18 GB

33 GB en Q8

🇨🇳 Qwen 3 Omni 30B-A3B

Alibaba · 30B paramètres · Apache 2.0 · 131 072 tokens ctx

Omni MoE 30B/3B actifs. Streaming speech. 119 langues ASR. Apache 2.0.

Pourquoi ce rang Licence Apache 2.0 — libre pour usage commercial sans restriction. 30B paramètres.

ollama run qwen3-omni:30b

VRAM Q4

19 GB

35 GB en Q8

Tableau comparatif

Rang	Modèle	Params	VRAM Q4	Contexte	Licence
#1	Qwen 3 30B-A3B	30B	19 GB	131 072	Apache 2.0
#2	Granite 4.0 H-Small 32B-A9B	32B	19 GB	128 000	Apache 2.0
#3	gpt-oss 20B	21B	13 GB	128 000	Apache 2.0
#4	Qwen 3 VL 30B-A3B	30B	19 GB	262 144	Apache 2.0
#5	ERNIE 4.5 21B-A3B Thinking	21B	13 GB	131 072	Apache 2.0
#6	Trinity Mini 26B-A3B	26B	15 GB	131 072	Apache 2.0
#7	Kanana 2 30B-A3B Thinking	30B	18 GB	131 072	Apache 2.0
#8	Qwen 3 Omni 30B-A3B	30B	19 GB	131 072	Apache 2.0

Méthodologie du classement

Filtre strict : licence contient Apache, MIT ou BSD. Pas de Llama Community (seuil 700M MAU), pas de Mistral NPL, pas de Gemma (licence custom permissive mais avec clauses d'usage acceptable).

Critères pris en compte :

Licence Apache 2.0 / MIT / BSD
Aucune clause d'usage restrictive
Compatible SaaS
Poids librement redistribuables

Le scoring est entièrement transparent : consultez notre méthodologie pour les détails de calcul VRAM/tokens/sec.

Questions fréquentes

Llama 3.3 70B est-il libre commercialement ?

Non, Llama 3.3 est sous "Llama 3.3 Community License" — libre sauf si votre produit dépasse 700M MAU. Pour un produit grand public futur, c'est un risque. Préférez Qwen (Apache 2.0) ou Mistral (Apache 2.0 sur les modèles Open).

Et Gemma de Google ?

Gemma est sous "Gemma License" — permissive mais avec clause d'usage acceptable (pas pour armes, surveillance de masse, etc.). Pour la plupart des usages B2B, c'est OK, mais lisez attentivement si votre produit touche à la défense ou à la sécurité.

Puis-je fine-tuner un modèle Apache 2.0 et le revendre ?

Oui — Apache 2.0 permet la modification et la redistribution, y compris commerciale. Vous devez juste garder l'attribution et la licence dans les poids redistribués. Vos propres données d'entraînement restent les vôtres.

Qwen vient de Chine — y a-t-il un risque légal ?

Les modèles Qwen sont publiés sous Apache 2.0 par Alibaba Cloud. La licence est valide internationalement. Pour des usages très sensibles (défense, santé), certaines entreprises préfèrent Mistral (🇫🇷) ou IBM Granite (🇺🇸) pour la traçabilité de provenance.

Comparatifs en tête-à-tête

Approfondissez avec nos duels détaillés des finalistes :

Meilleur LLM local libre pour usage commercial

Classement

Tableau comparatif

Méthodologie du classement

Questions fréquentes

Comparatifs en tête-à-tête

Pour aller plus loin