Los asistentes a la conferencia Oracle CloudWorld presencian cómo Oracle Cloud Infrastructure presenta su primer superclúster OCI de escala zetta.
En la conferencia Oracle CloudWorld, Infraestructura en la nube de Oracle (OCI) presentó su primer supercluster OCI a escala zetta, impulsado por la plataforma NVIDIA Blackwell. Esta solución se creó para ayudar a las empresas a acelerar las cargas de trabajo de IA y el procesamiento de datos, aprovechando más de 100,000 XNUMX GPU de última generación de NVIDIA. Estos superclusters ofrecen flexibilidad para la implementación, ya sea en entornos locales, públicos o de nube soberana.
En su escala máxima, el supercúmulo OCI ofrece más de tres veces la cantidad de GPU que la supercomputadora Frontier y más de seis veces la de otros hiperescaladores. Estos sistemas pueden escalar hasta 131,072 GPU Blackwell y ofrecer 2.4 zettaflops de computación de IA máxima, gracias a las tarjetas de interfaz de red NVIDIA ConnectX-7 y la red Quantum-2 InfiniBand. Se espera que los sistemas basados en Blackwell estén disponibles en la primera mitad de 2025.
Vista previa de las instancias de hardware con refrigeración líquida NVIDIA GB200 NVL72
Oracle también presentó una vista previa de su NVIDIA GB200 NVL72 En la conferencia, se presentaron instancias de hardware con refrigeración líquida diseñadas para aplicaciones de IA generativa. Estas instancias permiten el entrenamiento de IA a gran escala y la inferencia en tiempo real de modelos de billones de parámetros, actuando como una única GPU masiva a través del dominio NVIDIA NVLink ampliado de 72 GPU. Además, OCI anunció la próxima disponibilidad de las GPU NVIDIA HGX H200 Tensor Core, capaces de conectar ocho GPU en una única instancia de hardware, lo que permite a las empresas escalar hasta 65,536 200 GPU HXNUMX. Se espera que estas ofertas aceleren la inferencia y el entrenamiento de IA en tiempo real a gran escala.
Presentamos las instancias aceleradas por GPU NVIDIA L40S
Para cargas de trabajo de IA de rango medio, Oracle introdujo la disponibilidad general de GPU NVIDIA L40S-Instancias aceleradas. Las soluciones de borde de Oracle también brindan implementaciones de IA escalables, incluido Roving Edge Device v2, que admite hasta tres GPU NVIDIA L4 Tensor Core, incluso en ubicaciones remotas o desconectadas.
Las empresas ya están aprovechando los superclusters de OCI para la innovación en IA. Reka, una startup de modelos básicos, está utilizando estos clústeres para desarrollar modelos avanzados de IA multimodales para agentes empresariales. Según Dani Yogatama, cofundador y director ejecutivo de Reka, la infraestructura les permite gestionar modelos y contextos grandes de manera eficiente mientras escalan la capacitación a nivel de clúster.
Oracle y NVIDIA también mostraron nuevas integraciones para acelerar las cargas de trabajo de IA generativa en Oracle Autonomous Database. Estas integraciones destacan cómo las GPU NVIDIA pueden mejorar las capacidades de IA en las bases de datos Oracle. Las demostraciones incluyeron la aceleración de las incrustaciones de vectores en masa, la optimización de la generación de índices de gráficos vectoriales y el impulso de la generación y traducción de texto con microservicios de inferencia NIM de NVIDIA. Estas innovaciones permiten a las empresas integrar sin problemas la IA en la gestión de datos estructurados y no estructurados dentro de las bases de datos Oracle.
Abordar la residencia de datos
A escala global, Oracle y NVIDIA están colaborando para ofrecer una infraestructura de IA soberana, que aborde las necesidades de residencia de datos de los gobiernos y las empresas. La startup brasileña Wide Labs utilizó las GPU NVIDIA H100 Tensor Core y el marco NeMo en los centros de datos brasileños de OCI para crear Amazônia IA, un gran modelo de lenguaje para el portugués brasileño, que garantiza la soberanía de los datos. De manera similar, Nomura Research Institute en Japón está mejorando su plataforma de IA financiera con LLMs y, al mismo tiempo, cumple con las regulaciones financieras y los requisitos de soberanía de datos utilizando la infraestructura Alloy de OCI con GPU NVIDIA. Zoom también está aprovechando las GPU NVIDIA en los centros de datos de OCI en Arabia Saudita para cumplir con las regulaciones de datos locales.
La empresa de modelado geoespacial RSS-Hydro está utilizando la infraestructura OCI impulsada por NVIDIA para simular los impactos de las inundaciones en la región de Kumamoto, en Japón. Esto demuestra cómo se puede aplicar la IA a los esfuerzos de mitigación del cambio climático a través de la tecnología de gemelos digitales.
Las empresas también pueden acelerar la automatización de tareas en OCI mediante el uso de software NVIDIA, como los microservicios NIM y NVIDIA cuOpt. Estas soluciones permiten a las empresas adoptar rápidamente la IA generativa para tareas como la generación de código y la optimización de rutas. La plataforma de software AI Enterprise de NVIDIA, que incluye estas herramientas, está disponible en Oracle Cloud Marketplace y ofrece a las empresas recursos potentes para mejorar los flujos de trabajo impulsados por IA y los procesos de agentes.
Interactuar con StorageReview
Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed