Le catalogue des LLM open-weights
qui tournent en local.
Tous les modèles pertinents, avec VRAM requise par quantification, vitesse estimée et cas d'usage. Les modèles français sont mis en avant.
Trouvez votre LLM selon votre besoin
Pas envie de passer par le configurateur ? Nos classements thématiques sélectionnent les meilleurs modèles auto-hébergeables par cas d'usage et matériel.
La documentation QuelLLM.
147+ tutoriels en français, testés sur Windows, macOS et Linux. De la première installation aux techniques avancées de RAG et fine-tuning.
À la une
— nos guides essentielsInstaller Ollama sur Windows
Installation pas à pas d'Ollama sur Windows 11 avec support CUDA.
Quel LLM sur RTX 4090 (24 Go) ?
RTX 4090 24 Go, la référence IA locale 2023-2025. Llama 3 70B Q4, Mistral, DeepSeek, benchmarks tokens/sec mesurés, optimisations CUDA.
Quel LLM sur RTX 5090 (32 Go) ?
RTX 5090 2025 : 32 Go de VRAM GDDR7, bande passante 1792 Go/s. Faire tourner Llama 70B Q4 en local, benchmarks mesurés, configurations idéales.
DeepSeek V4 Pro 1.6T : architecture, installation, benchmarks
Guide complet DeepSeek V4 Pro 1.6T MoE (49B actifs, MIT, 1M ctx) : architecture CSA+HCA, hardware requis, benchmarks vs GPT-5, installation locale.
Démarrer avec LM Studio
Le ChatGPT local avec interface graphique. Zéro ligne de commande.
Quel LLM sur RTX 3060 12 Go ?
RTX 3060 12 Go : le GPU LLM budget iconique. 12 Go pour 250 € d'occasion, Mistral, Llama 3 8B, Phi-4 14B, benchmarks détaillés.
DeepSeek V4 Flash 284B : le 1er frontier qui tient sur Mac Studio
DeepSeek V4 Flash 284B MoE (13B actifs, MIT, 1M ctx) : le premier modèle frontière exécutable sur workstation. Installation Mac Studio Ultra, benchmarks, comparatif Pro.
Installer Ollama sur macOS (Apple Silicon)
Tirer parti de Metal et de la mémoire unifiée M1/M2/M3/M4.
Quel LLM sur Mac mini M4 / M4 Pro (16–64 Go) ?
Mac mini M4 : le meilleur rapport perf/prix pour l'IA locale en 2026. Benchmarks, config recommandée, usage serveur domestique.
Quel LLM sur RTX 3090 / 3090 Ti (24 Go) ?
RTX 3090 et 3090 Ti 24 Go d'occasion : toujours excellent pour LLM en 2026. Llama 3 70B Q4, benchmarks, verdict perf/prix, refroidissement.
Quel LLM pour 12 Go de VRAM ?
12 Go VRAM (RTX 3060 12GB, 4070, 5070) : sweet spot 2026. Phi-4 14B Q4, Qwen 14B Q5, RAG multi-stage. Le guide définitif.
Votre première conversation locale
Lancer Ollama, charger Mistral, dialoguer. Le tutoriel du jour 1.
Quel LLM sur RTX 5070 Ti (16 Go) ?
RTX 5070 Ti 16 Go : le sweet spot 2025 pour l'IA locale. Benchmarks Ollama, modèles 14B/24B confortables, comparatif avec 4070 Ti Super.
Quel LLM sur MacBook Pro M4 Pro / Max (24–128 Go) ?
MacBook Pro M4 Pro / Max 2025 : bande passante 546 Go/s, quels modèles exploitent vraiment la puce, quelles limites pratiques.
Quel LLM sur RTX 4070 / 4070 Super / 4070 Ti (12 Go) ?
RTX 4070, 4070 Super et 4070 Ti 12 Go : comparatif LLM, modèles 13B confortables, limites des 12 Go, benchmarks mesurés.
Ollama vs LM Studio vs Jan vs GPT4All
Tableau récap pour choisir l'outil adapté à votre profil.
Quel LLM pour 8 Go de VRAM ?
Le guide complet pour 8 Go de VRAM (RTX 3050/3060 8GB, 4060, 5050, 5060) : Mistral 7B, Llama 3.1 8B, astuces pour étirer la VRAM.
Les bases du prompting
Structurer ses requêtes pour obtenir des réponses utiles.
Quel LLM sur MacBook Pro M3 Pro / Max (18–128 Go) ?
MacBook Pro M3 Pro / Max : le meilleur laptop pour l'IA locale en 2026. Modèles 70B, contexte 32k, Flash Attention.
Quel LLM sur RTX 5080 (16 Go) ?
RTX 5080 Blackwell : 16 Go GDDR7 à 960 Go/s. Benchmarks Mistral, Llama 3.1, Phi-4, Qwen 32B en Q4. Configuration Ollama optimale.
Quel LLM pour 16 Go de VRAM ?
16 Go VRAM (RTX 4070 Ti Super, 5070 Ti, 5080, 4060 Ti 16GB) : Mistral Small 24B, Qwen 32B Q3, le palier pro 2026.
Choisir son GPU pour l'IA locale
RTX 4070 vs 4090 vs Mac M-Max : le guide d'achat 2026.
RAG local : introduction
Comprendre le Retrieval-Augmented Generation pour discuter avec vos docs.
Quel LLM sur Mac Studio (M2 / M3 / M4 Ultra, 64–512 Go) ?
Mac Studio Ultra : jusqu'à 512 Go de mémoire unifiée. Faire tourner Llama 70B, 123B, DeepSeek 671B en local. Le guide power user.
Quel LLM sur RTX 4080 / 4080 Super (16 Go) ?
RTX 4080 et 4080 Super 16 Go pour LLM local : tous les modèles qui rentrent, benchmarks, comparatif 4080 vs 4080 Super, verdict achat.
Quel LLM sur Radeon RX 7900 XTX (24 Go) ?
Radeon RX 7900 XTX 24 Go : alternative AMD à RTX 4090 pour LLM. ROCm 6.x, Llama 70B Q4, benchmarks tokens/sec, verdict 2026.
Quel LLM pour 24 Go de VRAM ?
24 Go VRAM (RTX 3090, 4090, RX 7900 XTX) : Llama 70B en offload, Qwen 32B Q5, fine-tuning LoRA. Le palier sérieux.
Installer Ollama sur Linux
Script d'install, systemd, configuration GPU NVIDIA/AMD.
Quel LLM sur MacBook Air M3 (8 / 16 / 24 Go) ?
Guide complet LLM pour MacBook Air M3 : Mistral, Llama, Qwen — quelle taille, quelle quantization, combien de tokens/sec.
Quel LLM sur RTX 4060 Ti (8 / 16 Go) ?
RTX 4060 Ti 8 Go vs 16 Go : la version 16 Go transforme le LLM local. Benchmarks, modèles recommandés, +100 € bien dépensés.
Trois chemins,
selon qui vous êtes.
Chaque parcours est une séquence de guides pensée pour un profil précis. Du premier téléchargement jusqu'à un setup opérationnel.
« Je veux juste essayer, sans prise de tête. »
Vous avez entendu parler des LLM locaux et voulez voir ce que ça donne sur votre machine. Aucun code, aucune config système — en 10 minutes vous chattez avec votre premier modèle.