Llama 3.1 405B Instruct
Llama 3.1 405B Instruct (405B, Llama 3.1 Community) : VRAM requise par quantization, tokens/seconde mesurés, cas d'usage. Référence dense open 405B. MMLU 88.6, HumanEval 89.0. HF gated. 240+ Go en Q4.
Activez JavaScript pour accéder au configurateur interactif et à la bibliothèque de guides.