Le projet

Pourquoi QuelLLM.fr

Parce qu'en 2026, la majorité des gens croient encore que « faire de l'IA » veut dire « envoyer ses données chez OpenAI ». Ce site existe pour montrer qu'il y a une autre voie, et la rendre accessible en français.

Le constat

Un LLM local, aujourd'hui, c'est possible pour 80% des gens sans acheter un serveur. Une RTX 3060 à 350 € fait tourner Mistral 7B à 40 tokens/seconde. Un MacBook M2 fait tourner Llama 3.1 70B quantisé.

Mais entre possible et accessible, il y a un fossé. La doc est éparpillée, souvent en anglais, souvent obsolète d'un mois sur l'autre. C'est ce fossé qu'on essaie de combler.

La promesse

Un site qui répond à une question simple : est-ce que ça tourne chez moi, et comment. Pas une galerie de modèles, pas une couche au-dessus d'Ollama.

Un configurateur qui comprend votre matos. Des guides qui marchent. Un catalogue qui dit la vérité sur ce qui tient ou pas en VRAM. Des benchmarks qu'on a vraiment mesurés.

212

modèles dans le catalogue

187

guides rédigés

GPU couverts

100%

francophone

Nos non-négociables

Les lignes qu'on ne franchira pas, même si elles rendent le projet plus difficile à rentabiliser.

Indépendance

Ni levée de fonds, ni VC, ni partenariat cloud. On n'est pas payé pour recommander tel ou tel modèle. Si on dit qu'un modèle est bien, c'est parce qu'il l'est.

Souveraineté

Faire tourner un LLM chez soi, c'est reprendre la main sur ses données. C'est aussi soutenir un écosystème européen qui existe, mais qu'on entend peu.

Pédagogie

Les guides sont écrits pour être lus. Pas de jargon gratuit, pas de copier-coller de la doc officielle. Chaque phrase doit servir à quelque chose.

Gratuité

Site gratuit, consultable sans compte. Pas de paywall, pas de newsletter premium, pas d'affiliation déguisée.

Qui est derrière ?

Je m'appelle Mohamed Meguedmi, je suis entrepreneur. Dans chacune des boîtes que j'ai montées, l'IA est devenue un outil du quotidien — codage, rédaction, analyse, support. Sauf qu'envoyer mes prompts chez OpenAI ou Anthropic m'a vite posé problème : données clients sensibles, coûts qui grimpent avec l'usage, dépendance à un fournisseur qui peut changer ses règles du jour au lendemain.

J'ai donc basculé sur du local — Ollama, llama.cpp, LM Studio, selon les machines et les cas d'usage. QuelLLM.fr, c'est le carnet de tests que je tenais pour moi : quel modèle tient sur quelle carte, quelle quantification garder, quelle commande exacte évite les pièges. Je l'ai ouvert publiquement parce que je n'ai pas trouvé l'équivalent en français. Pas de société, pas d'équipe — juste ce site, mis à jour au fil de mes tests. Me retrouver sur LinkedIn.

On en est où

Le projet est vivant. Un test, un guide, une correction — à chaque fois que l'IA locale évolue, ça passe ici.

Envie d'aider, de proposer un modèle ou de signaler une erreur ?

Contribuer →