QuelLLM.fr — le guide francophone des LLM auto-hébergés

Mistral, Lucie, Magistral — souverainetés FR.

⚜

En français

Contexte long, synthèse précise sur vos docs.

❖

Pour RAG

DeepSeek R1, QwQ, Phi-4 Reasoning.

∿

Pour raisonner

Top qualité en 24 GB VRAM.

◈

Sur RTX 4090

Modèles 🇫🇷 🇩🇪 🇪🇺 — origine et transparence.

✦

Souverain européen

Voir les 14 classements→

Centre d'apprentissage

La documentation QuelLLM.

149+ tutoriels en français, testés sur Windows, macOS et Linux. De la première installation aux techniques avancées de RAG et fine-tuning.

⌘ K

À la une

— nos guides essentiels

★ À la une

Installation · Ollama

Installer Ollama sur Windows

Installation pas à pas d'Ollama sur Windows 11 avec support CUDA.

Débutant·3 min·Clara M.

★ À la une

Installation · LM Studio

Démarrer avec LM Studio

Le ChatGPT local avec interface graphique. Zéro ligne de commande.

Débutant·5 min·Clara M.

★ À la une

Premiers pas · Prompting

Les bases du prompting

Structurer ses requêtes pour obtenir des réponses utiles.

Débutant·10 min·Léa B.

149 résultats

Débutant 3 min

Installer Ollama sur Windows

Installation pas à pas d'Ollama sur Windows 11 avec support CUDA.

OllamaLire →

Quel LLM sur RTX 4090 (24 Go) ?

RTX 4090 24 Go, la référence IA locale 2023-2025. Llama 3 70B Q4, Mistral, DeepSeek, benchmarks tokens/sec mesurés, optimisations CUDA.

Quel LLM sur RTX 5090 (32 Go) ?

RTX 5090 2025 : 32 Go de VRAM GDDR7, bande passante 1792 Go/s. Faire tourner Llama 70B Q4 en local, benchmarks mesurés, configurations idéales.

RTX 50Lire →

Avancé 16 min

DeepSeek V4 Pro 1.6T : architecture, installation, benchmarks

Guide complet DeepSeek V4 Pro 1.6T MoE (49B actifs, MIT, 1M ctx) : architecture CSA+HCA, hardware requis, benchmarks vs GPT-5, installation locale.

DeepSeekLire →

Débutant 5 min

Démarrer avec LM Studio

Le ChatGPT local avec interface graphique. Zéro ligne de commande.

LM StudioLire →

Quel LLM sur RTX 3060 12 Go ?

RTX 3060 12 Go : le GPU LLM budget iconique. 12 Go pour 250 € d'occasion, Mistral, Llama 3 8B, Phi-4 14B, benchmarks détaillés.

RTX 30Lire →

Intermédiaire 14 min

DeepSeek V4 Flash 284B : le 1er frontier qui tient sur Mac Studio

DeepSeek V4 Flash 284B MoE (13B actifs, MIT, 1M ctx) : le premier modèle frontière exécutable sur workstation. Installation Mac Studio Ultra, benchmarks, comparatif Pro.

DeepSeekLire →

Débutant 3 min

Installer Ollama sur macOS (Apple Silicon)

Tirer parti de Metal et de la mémoire unifiée M1/M2/M3/M4.

OllamaLire →

Débutant 11 min

Quel LLM sur Mac mini M4 / M4 Pro (16–64 Go) ?

Mac mini M4 : le meilleur rapport perf/prix pour l'IA locale en 2026. Benchmarks, config recommandée, usage serveur domestique.

Mac miniLire →

Quel LLM sur RTX 3090 / 3090 Ti (24 Go) ?

RTX 3090 et 3090 Ti 24 Go d'occasion : toujours excellent pour LLM en 2026. Llama 3 70B Q4, benchmarks, verdict perf/prix, refroidissement.

RTX 30Lire →

Quel LLM pour 12 Go de VRAM ?

12 Go VRAM (RTX 3060 12GB, 4070, 5070) : sweet spot 2026. Phi-4 14B Q4, Qwen 14B Q5, RAG multi-stage. Le guide définitif.

Débutant 6 min

Votre première conversation locale

Lancer Ollama, charger Mistral, dialoguer. Le tutoriel du jour 1.

PromptingLire →

Quel LLM sur RTX 5070 Ti (16 Go) ?

RTX 5070 Ti 16 Go : le sweet spot 2025 pour l'IA locale. Benchmarks Ollama, modèles 14B/24B confortables, comparatif avec 4070 Ti Super.

RTX 50Lire →

Quel LLM sur MacBook Pro M4 Pro / Max (24–128 Go) ?

MacBook Pro M4 Pro / Max 2025 : bande passante 546 Go/s, quels modèles exploitent vraiment la puce, quelles limites pratiques.

MacBook ProLire →

Quel LLM sur RTX 4070 / 4070 Super / 4070 Ti (12 Go) ?

RTX 4070, 4070 Super et 4070 Ti 12 Go : comparatif LLM, modèles 13B confortables, limites des 12 Go, benchmarks mesurés.

Débutant 8 min

Ollama vs LM Studio vs Jan vs GPT4All

Tableau récap pour choisir l'outil adapté à votre profil.

OutilsLire →

Quel LLM pour 8 Go de VRAM ?

Le guide complet pour 8 Go de VRAM (RTX 3050/3060 8GB, 4060, 5050, 5060) : Mistral 7B, Llama 3.1 8B, astuces pour étirer la VRAM.

Les bases du prompting

Structurer ses requêtes pour obtenir des réponses utiles.

PromptingLire →

Quel LLM sur MacBook Pro M3 Pro / Max (18–128 Go) ?

MacBook Pro M3 Pro / Max : le meilleur laptop pour l'IA locale en 2026. Modèles 70B, contexte 32k, Flash Attention.

MacBook ProLire →

Quel LLM sur RTX 5080 (16 Go) ?

RTX 5080 Blackwell : 16 Go GDDR7 à 960 Go/s. Benchmarks Mistral, Llama 3.1, Phi-4, Qwen 32B en Q4. Configuration Ollama optimale.

RTX 50Lire →

Quel LLM pour 16 Go de VRAM ?

16 Go VRAM (RTX 4070 Ti Super, 5070 Ti, 5080, 4060 Ti 16GB) : Mistral Small 24B, Qwen 32B Q3, le palier pro 2026.

Débutant 12 min

Choisir son GPU pour l'IA locale

RTX 4070 vs 4090 vs Mac M-Max : le guide d'achat 2026.

GPULire →

Débutant 12 min

RAG local : introduction

Comprendre le Retrieval-Augmented Generation pour discuter avec vos docs.

ConceptsLire →

Avancé 13 min

Quel LLM sur Mac Studio (M2 / M3 / M4 Ultra, 64–512 Go) ?

Mac Studio Ultra : jusqu'à 512 Go de mémoire unifiée. Faire tourner Llama 70B, 123B, DeepSeek 671B en local. Le guide power user.

Mac StudioLire →

Quel LLM sur RTX 4080 / 4080 Super (16 Go) ?

RTX 4080 et 4080 Super 16 Go pour LLM local : tous les modèles qui rentrent, benchmarks, comparatif 4080 vs 4080 Super, verdict achat.

Quel LLM sur Radeon RX 7900 XTX (24 Go) ?

Radeon RX 7900 XTX 24 Go : alternative AMD à RTX 4090 pour LLM. ROCm 6.x, Llama 70B Q4, benchmarks tokens/sec, verdict 2026.

Radeon RX 7000Lire →

Quel LLM pour 24 Go de VRAM ?

24 Go VRAM (RTX 3090, 4090, RX 7900 XTX) : Llama 70B en offload, Qwen 32B Q5, fine-tuning LoRA. Le palier sérieux.

Débutant 4 min

Installer Ollama sur Linux

Script d'install, systemd, configuration GPU NVIDIA/AMD.

OllamaLire →

Quel LLM sur MacBook Air M3 (8 / 16 / 24 Go) ?

Guide complet LLM pour MacBook Air M3 : Mistral, Llama, Qwen — quelle taille, quelle quantization, combien de tokens/sec.

MacBook AirLire →

Quel LLM sur RTX 4060 Ti (8 / 16 Go) ?

RTX 4060 Ti 8 Go vs 16 Go : la version 16 Go transforme le LLM local. Benchmarks, modèles recommandés, +100 € bien dépensés.