Quel LLM tourne sur votre machine

Mistral, Lucie, Magistral — souverainetés FR.

⚜

En français

Contexte long, synthèse précise sur vos docs.

❖

Pour RAG

DeepSeek R1, QwQ, Phi-4 Reasoning.

∿

Pour raisonner

Top qualité en 24 GB VRAM.

◈

Sur RTX 4090

Modèles 🇫🇷 🇩🇪 🇪🇺 — origine et transparence.

✦

Souverain européen

Débutant·10 min·Mohamed Meguedmi

Voir les 14 classements→

Centre d'apprentissage

La documentation QuelLLM.

187+ tutoriels en français, testés sur Windows, macOS et Linux. De la première installation aux techniques avancées de RAG et fine-tuning.

⌘ K

À la une

— nos guides essentiels

★ À la une

Premiers pas · Concepts

IA locale : faire tourner une IA sur votre PC ou Mac (2026)

Qu'est-ce qu'une IA locale, comment l'installer gratuitement et la faire tourner sans cloud ni connexion. Le guide complet 2026 + comparatif des outils.

★ À la une

Entreprise · Déploiement

IA de code en entreprise : protéger code propriétaire, NDA et secret industriel

Déployer une IA de code 100% locale (Ollama + Cline + Aider + Tabby) pour une équipe dev sous NDA et secret industriel : pourquoi Copilot et Cursor exposent votre code propriétaire, ce qu'exigent le RGPD et l'AI Act, l'architecture poste vs serveur GPU Tabby, et l'audit de non-exfiltration.

Avancé·16 min·Mohamed Meguedmi

★ À la une

Installation · Ollama

Installer Ollama sur Windows 11 : guide complet (2026)

Comment installer Ollama sur Windows 11 : téléchargement, support CUDA/GPU, premier modèle en 5 minutes et commandes de base. Guide pas à pas en français.

Débutant·3 min·Mohamed Meguedmi

187 résultats

Débutant 3 min

Installer Ollama sur Windows 11 : guide complet (2026)

Comment installer Ollama sur Windows 11 : téléchargement, support CUDA/GPU, premier modèle en 5 minutes et commandes de base. Guide pas à pas en français.

Quel LLM sur RTX 4090 (24 Go) ?

RTX 4090 24 Go, la référence IA locale 2023-2025. Llama 3 70B Q4, Mistral, DeepSeek, benchmarks tokens/sec mesurés, optimisations CUDA.

RTX 40Lire →

Quel LLM sur RTX 5090 (32 Go) ?

RTX 5090 2025 : 32 Go de VRAM GDDR7, bande passante 1792 Go/s. Faire tourner Llama 70B Q4 en local, benchmarks mesurés, configurations idéales.

RTX 50Lire →

Avancé 16 min

DeepSeek V4 Pro en local : VRAM, hardware requis et installation

Quelle machine pour DeepSeek V4 Pro (1.6T MoE, 49B actifs, MIT) ? VRAM/RAM requises, installation locale, benchmarks vs GPT-5 et limites réelles.

DeepSeekLire →

Débutant 5 min

LM Studio pour débutants : premier chat local en 10 minutes

Votre premier LLM local avec LM Studio : installer, télécharger un modèle et discuter en 10 minutes. Zéro ligne de commande, idéal débutants.

LM StudioLire →

Quel LLM sur RTX 3060 12 Go ?

RTX 3060 12 Go : le GPU LLM budget iconique. 12 Go pour 250 € d'occasion, Mistral, Llama 3 8B, Phi-4 14B, benchmarks détaillés.

RTX 30Lire →

Intermédiaire 14 min

DeepSeek V4 Flash 284B : le 1er frontier qui tient sur Mac Studio

DeepSeek V4 Flash 284B MoE (13B actifs, MIT, 1M ctx) : le premier modèle frontière exécutable sur workstation. Installation Mac Studio Ultra, benchmarks, comparatif Pro.

DeepSeekLire →

Débutant 3 min

Installer Ollama sur macOS (Apple Silicon)

Tirer parti de Metal et de la mémoire unifiée M1/M2/M3/M4.

Débutant 11 min

Quel LLM sur Mac mini M4 / M4 Pro (16–64 Go) ?

Mac mini M4 : le meilleur rapport perf/prix pour l'IA locale en 2026. Benchmarks, config recommandée, usage serveur domestique.

Mac miniLire →

Quel LLM sur RTX 3090 / 3090 Ti (24 Go) ?

RTX 3090 et 3090 Ti 24 Go d'occasion : toujours excellent pour LLM en 2026. Llama 3 70B Q4, benchmarks, verdict perf/prix, refroidissement.

RTX 30Lire →

Quel LLM pour 12 Go de VRAM ?

12 Go VRAM (RTX 3060 12GB, 4070, 5070) : sweet spot 2026. Phi-4 14B Q4, Qwen 14B Q5, RAG multi-stage. Le guide définitif.

Débutant 6 min

Votre première conversation locale

Lancer Ollama, charger Mistral, dialoguer. Le tutoriel du jour 1.

PromptingLire →

Quel LLM sur RTX 5070 Ti (16 Go) ?

RTX 5070 Ti 16 Go : le sweet spot 2025 pour l'IA locale. Benchmarks Ollama, modèles 14B/24B confortables, comparatif avec 4070 Ti Super.

RTX 50Lire →

Quel LLM sur MacBook Pro M4 Pro / Max (24–128 Go) ?

MacBook Pro M4 Pro / Max 2025 : bande passante 546 Go/s, quels modèles exploitent vraiment la puce, quelles limites pratiques.

MacBook ProLire →

Quel LLM sur RTX 4070 / 4070 Super / 4070 Ti (12 Go) ?

RTX 4070, 4070 Super et 4070 Ti 12 Go : comparatif LLM, modèles 13B confortables, limites des 12 Go, benchmarks mesurés.

RTX 40Lire →

Débutant 8 min

Ollama vs LM Studio vs Jan vs GPT4All

Tableau récap pour choisir l'outil adapté à votre profil.

OutilsLire →

Quel LLM pour 8 Go de VRAM ?

Le guide complet pour 8 Go de VRAM (RTX 3050/3060 8GB, 4060, 5050, 5060) : Mistral 7B, Llama 3.1 8B, astuces pour étirer la VRAM.

Avancé 16 min

IA de code en entreprise : protéger code propriétaire, NDA et secret industriel

DéploiementLire →

Débutant 6 min

Installer Ollama : Windows, macOS et Linux (guide 2026)

Comment installer Ollama en 5 minutes sur Windows, macOS et Linux : prérequis RAM/GPU, commandes essentielles et premier modèle à lancer.

Les bases du prompting

Structurer ses requêtes pour obtenir des réponses utiles.

PromptingLire →

Quel LLM sur MacBook Pro M3 Pro / Max (18–128 Go) ?

MacBook Pro M3 Pro / Max : le meilleur laptop pour l'IA locale en 2026. Modèles 70B, contexte 32k, Flash Attention.

MacBook ProLire →

Quel LLM sur RTX 5080 (16 Go) ?

RTX 5080 Blackwell : 16 Go GDDR7 à 960 Go/s. Benchmarks Mistral, Llama 3.1, Phi-4, Qwen 32B en Q4. Configuration Ollama optimale.

RTX 50Lire →

Quel LLM pour 16 Go de VRAM ?

16 Go VRAM (RTX 4070 Ti Super, 5070 Ti, 5080, 4060 Ti 16GB) : Mistral Small 24B, Qwen 32B Q3, le palier pro 2026.

Débutant 12 min

Choisir son GPU pour l'IA locale

RTX 4070 vs 4090 vs Mac M-Max : le guide d'achat 2026.

GPULire →

Débutant 12 min

RAG local : introduction

Comprendre le Retrieval-Augmented Generation pour discuter avec vos docs.

ConceptsLire →

Avancé 13 min

Quel LLM sur Mac Studio (M2 / M3 / M4 Ultra, 64–512 Go) ?

Mac Studio Ultra : jusqu'à 512 Go de mémoire unifiée. Faire tourner Llama 70B, 123B, DeepSeek 671B en local. Le guide power user.

Mac StudioLire →

Quel LLM sur RTX 4080 / 4080 Super (16 Go) ?

RTX 4080 et 4080 Super 16 Go pour LLM local : tous les modèles qui rentrent, benchmarks, comparatif 4080 vs 4080 Super, verdict achat.

RTX 40Lire →

Quel LLM sur Radeon RX 7900 XTX (24 Go) ?

Radeon RX 7900 XTX 24 Go : alternative AMD à RTX 4090 pour LLM. ROCm 6.x, Llama 70B Q4, benchmarks tokens/sec, verdict 2026.

Radeon RX 7000Lire →

Quel LLM pour 24 Go de VRAM ?

24 Go VRAM (RTX 3090, 4090, RX 7900 XTX) : Llama 70B en offload, Qwen 32B Q5, fine-tuning LoRA. Le palier sérieux.

Débutant 4 min

Installer Ollama sur Linux

Script d'install, systemd, configuration GPU NVIDIA/AMD.