NVIDIA y Google Cloud aprovecharon Google Cloud Next en Las Vegas para presentar una nueva fase de su larga colaboración en ingeniería, introduciendo actualizaciones de la plataforma de hipercomputación de IA de Google Cloud para escalar la IA física y automatizada en entornos de producción. Ambas compañías continúan codiseñando infraestructura que abarca silicio, sistemas, redes y software para dar soporte a cargas de trabajo de IA cada vez más complejas, incluyendo agentes autónomos, robótica y gemelos digitales.
La infraestructura A5X, basada en Vera Rubin, apunta a fábricas de IA a gran escala.
Google Cloud presentó instancias bare-metal A5X construidas en NVIDIA Vera Rubin NVL72 Sistemas a escala de rack. Estos sistemas están diseñados para mejorar significativamente la economía y la eficiencia de la inferencia, ofreciendo un costo por token hasta 10 veces menor y un rendimiento de tokens por megavatio 10 veces mayor que la generación anterior.
La plataforma A5X integra SuperNIC NVIDIA ConnectX-9Se basa en la arquitectura de red Virgo de próxima generación de Google. Esta arquitectura permite escalar clústeres hasta 80 000 GPU Rubin en un solo sitio y hasta 960 000 GPU en implementaciones multisitio. El diseño está orientado a entornos de entrenamiento e inferencia de IA a hiperescala, donde el rendimiento de la red y la optimización a nivel de sistema son fundamentales.
Google Cloud destacó que se requiere una infraestructura altamente integrada y servicios de IA gestionados para dar soporte a la próxima generación de cargas de trabajo de IA. Esta plataforma combinada permite a los clientes entrenar, optimizar e implementar modelos, priorizando el rendimiento, la eficiencia y la escalabilidad operativa.
La amplia cartera de productos de Blackwell permite una aceleración a la medida.
Google Cloud también describió su cartera de instancias basadas en NVIDIA Blackwell, que abarca una amplia gama de tamaños de implementación y perfiles de rendimiento. Las ofertas incluyen máquinas virtuales A4 basadas en sistemas NVIDIA HGX B200, configuraciones A4X y A4X Max construidas sobre las plataformas GB200 y GB300 NVL72, y acceso fraccional a GPU a través de instancias G4 con GPU RTX PRO 6000 Blackwell Server Editions.
Esta gama permite a las organizaciones alinear la infraestructura con los requisitos de carga de trabajo. Las configuraciones abarcan desde GPU fraccionadas para tareas de inferencia más sencillas hasta racks NVL72 completos con 72 GPU interconectadas mediante la tecnología NVLink de quinta generación y NVLink Switch. En el extremo superior, las implementaciones pueden escalar hasta decenas de miles de GPU para el entrenamiento de modelos a gran escala y la inferencia distribuida.
Estos sistemas están diseñados para dar soporte a una amplia gama de cargas de trabajo de IA, incluidos los modelos de mezcla de expertos (MoE), la inferencia multimodal, el procesamiento de datos a gran escala y las cargas de trabajo de simulación para robótica e IA física.
Los primeros usuarios ya están aprovechando la plataforma. Thinking Machines Lab está utilizando GB300 NVL72OpenAI utiliza instancias A4X Max basadas en para escalar el entrenamiento de su API Tinker, mientras que OpenAI ejecuta cargas de trabajo de inferencia a gran escala, incluido ChatGPT, en instancias basadas en GB200 y GB300 en Google Cloud.
La IA confidencial se extiende a las GPU de Blackwell.
Google Cloud está ampliando las capacidades de computación confidencial a su infraestructura de IA. Los modelos Gemini que se ejecutan en las GPU NVIDIA Blackwell y Blackwell Ultra ya están disponibles en versión preliminar en Google Distributed Cloud, lo que permite a las organizaciones implementar modelos más cerca de las fuentes de datos confidenciales.
NVIDIA Confidential Computing permite crear entornos de ejecución cifrados donde las indicaciones y los datos de ajuste fino permanecen protegidos contra el acceso no autorizado, incluso por parte de los operadores de la nube. Esta funcionalidad también estará disponible en entornos multiusuario mediante máquinas virtuales Confidential G4 con GPU RTX PRO 6000 Blackwell.
Esto supone la primera implementación de computación confidencial para las GPU de Blackwell en la nube pública, dirigida a sectores regulados que requieren una estricta protección de datos al tiempo que mantienen el acceso a una infraestructura de IA de alto rendimiento.
Modelos abiertos y pipelines de aprendizaje por refuerzo gestionados para IA agenica
La plataforma admite un amplio ecosistema de modelos, incluidos los modelos Gemini y Gemma de Google y los modelos abiertos Nemotron de NVIDIA. NVIDIA Nemotron 3 Super ahora está integrado con la plataforma Gemini Enterprise Agent, lo que permite a los desarrolladores crear e implementar flujos de trabajo basados en agentes y razonamiento.
Google Cloud también presenta clústeres de entrenamiento administrados con una API de aprendizaje por refuerzo basada en NVIDIA NeMo. Este servicio automatiza el aprovisionamiento de clústeres, la orquestación de tareas y la gestión de fallos, lo que permite el entrenamiento de aprendizaje por refuerzo a gran escala. El objetivo es reducir la complejidad operativa y permitir que los equipos se centren en el comportamiento y la optimización de los modelos.
CrowdStrike utiliza las herramientas NVIDIA NeMo, incluidas Data Designer, Automodel y Megatron Bridge, para generar datos sintéticos y ajustar modelos de ciberseguridad específicos del dominio. Estos flujos de trabajo se ejecutan en infraestructura basada en Blackwell, lo que acelera los procesos de detección y respuesta ante amenazas.
Ampliación de las cargas de trabajo de IA industrial y física
La plataforma conjunta también se centra en casos de uso de IA industrial y física. Las aplicaciones de Cadence y Siemens Digital Industries Software ya están disponibles en Google Cloud con aceleración de NVIDIA, lo que permite el diseño, la simulación y los flujos de trabajo de fabricación en sectores como el de semiconductores, automoción, aeroespacial y maquinaria pesada.
Las bibliotecas NVIDIA Omniverse e Isaac Sim están disponibles en Google Cloud Marketplace, lo que permite el desarrollo de gemelos digitales físicamente precisos y sistemas de simulación robótica. Estas herramientas permiten a las organizaciones simular y validar sistemas antes de su implementación.
Además, los microservicios NVIDIA NIM se pueden implementar en Vertex AI y Google Kubernetes Engine para dar soporte a cargas de trabajo de IA de visión y robótica. Estos servicios permiten funcionalidades como el análisis de vídeo en tiempo real, la planificación robótica y el procesamiento automatizado de datos.
Enfoque en la plataforma: De la experimentación a la producción
Estas actualizaciones posicionan a Google Cloud AI Hypercomputer como una plataforma integral para trasladar cargas de trabajo de IA desde la investigación hasta la producción. Gracias a su estrecha integración de capacidades de computación, redes, software y seguridad, la plataforma está diseñada para dar soporte a sistemas de agentes a gran escala, automatización industrial y aplicaciones de IA en tiempo real.




Amazon