StorageReview.com
AI  ◇  Empresa

AMD Instinct MI355X logra mejoras en MLPerf Inference v6.0 con más de 1 millón de tokens por segundo y admite la pila ROCm escalable.

AMD ha publicado los resultados de MLPerf Inference v6.0, posicionando la GPU Instinct MI355X como una plataforma de inferencia escalable para implementaciones de nodo único, multinodo y heterogéneas. La presentación va más allá de las mejoras incrementales al añadir nuevas cargas de trabajo, demostrando un rendimiento a escala de clúster que supera el millón de tokens por segundo y validando la reproducibilidad en un ecosistema de socios en constante crecimiento. Objetivos de la arquitectura CDNA 4.

Gráficos NVIDIA MLPerf v6
AI  ◇  Empresa

NVIDIA establece récords de inferencia MLPerf v6.0 con la plataforma Blackwell Ultra.

NVIDIA ha publicado los resultados de MLPerf Inference v6.0, destacando las mejoras a nivel de sistema impulsadas por un codiseño riguroso entre hardware, software y modelos. La compañía posiciona el rendimiento de inferencia y la economía de tokens como las métricas principales para el rendimiento de la fábrica de IA, yendo más allá de las especificaciones máximas del acelerador para medir la producción bajo cargas de trabajo reales. En esta ronda, los sistemas construidos sobre NVIDIA Blackwell

Pila Vera Rubin de GTC 26
AI  ◇  Empresa

WEKA integra NeuralMesh con NVIDIA STX para solucionar los cuellos de botella de memoria en la inferencia de IA.

WEKA anunció la integración de su plataforma NeuralMesh con la arquitectura de referencia NVIDIA STX, posicionando su Augmented Memory Grid como un componente central para la infraestructura de IA de próxima generación. La solución combinada aborda una de las principales limitaciones en entornos de inferencia a gran escala: las limitaciones de memoria que afectan el rendimiento, el costo y la escalabilidad. Al ejecutarse en NeuralMesh, la Augmented Memory Grid de WEKA amplía

Gráfico del panel de control de WEKA NeuralMesh
AI  ◇  Empresa

WEKA anuncia la disponibilidad general de NeuralMesh AIDP.

WEKA ha anunciado la disponibilidad general de su plataforma de datos de IA NeuralMesh, una infraestructura componible orientada a empresas y diseñada para implementaciones en fábricas de IA. Basada en la arquitectura de referencia de la plataforma de datos de IA de NVIDIA, NeuralMesh AIDP proporciona una pila integrada que ofrece datos listos para IA a entornos de producción, con el objetivo de acelerar el tiempo de implementación para aplicaciones de IA a gran escala. La plataforma

AI  ◇  Empresa

IBM y NVIDIA anuncian la ampliación de su colaboración para poner en marcha la IA empresarial.

En GTC 2026, IBM y NVIDIA anunciaron una expansión significativa de su asociación de más de una década, centrada en llevar la IA de las fases piloto a la producción a gran escala. La colaboración apunta a varios cuellos de botella críticos en la adopción de la IA empresarial, incluido el análisis de datos nativo de GPU, el procesamiento inteligente de documentos y la infraestructura para entornos regulados. El esfuerzo conjunto tiene como objetivo proporcionar una

Espacio de nombres global de VDURA
AI  ◇  Empresa  ◇  Almacenamiento empresarial

VDURA presenta RDMA y la estratificación sensible al contexto para plataformas de datos de IA en GTC 2026.

Durante GTC 2026, VDURA presentó actualizaciones de su plataforma de datos que mejoran la utilización de la GPU y la eficiencia del almacenamiento en entornos de IA. El anuncio incluye la disponibilidad general del acceso directo a memoria remota (RDMA), una vista previa de su tecnología de niveles de almacenamiento sensible al contexto y configuraciones de infraestructura validadas basadas en las CPU AMD EPYC Turin y la red NVIDIA ConnectX-7. Las actualizaciones

AI  ◇  Empresa

NVIDIA Groq 3 LPX: Todo lo que sabemos

La LPU, o Unidad de Procesamiento del Lenguaje, es un acelerador de inferencia de IA personalizado diseñado y construido por Groq, Inc. Fundada en 2016 por Jonathan Ross, un ex ingeniero de Google reconocido como uno de los inventores originales de la TPU, Groq pasó años desarrollando una arquitectura de procesador determinista y definida por software desde cero. A diferencia de las GPU, que dependen

HPE ProLiant Compute DL380a Gen12
AI  ◇  Empresa

HPE amplía su cartera de soluciones de computación de IA de NVIDIA con IA de nube privada escalable e integración de GPU Blackwell.

HPE ha anunciado una expansión significativa de la cartera de NVIDIA AI Computing by HPE, introduciendo sistemas integrados diseñados para escalar las implementaciones de IA empresariales manteniendo la seguridad y la gobernanza. La actualización se centra en arquitecturas de ingeniería conjunta y validadas destinadas a acelerar el tiempo de obtención de valor para la inferencia de IA y el desarrollo de modelos. El CEO de HPE, Antonio Neri, y el CEO de NVIDIA, Jensen Huang, posicionaron

AI  ◇  Empresa

NVIDIA DGX Rubin NVL8 admite Intel Xeon 6 como opción de CPU anfitriona para inferencia de IA basada en x86.

En NVIDIA GTC 2026, Intel anunció que sus procesadores Intel Xeon 6 se están utilizando como CPU anfitrionas para los sistemas NVIDIA DGX Rubin NVL8. Este éxito de diseño extiende el uso establecido de Xeon dentro de las plataformas GPU de NVIDIA y subraya el papel del procesador en la orquestación de infraestructuras de IA aceleradas por GPU a gran escala. A medida que las cargas de trabajo de IA transitan hacia sistemas masivos,

AI  ◇  Empresa

HPE Cray GX5000 y AI Factory incorporan NVIDIA Vera Rubin NVL72, Quantum-X800 InfiniBand y nuevas opciones de Blackwell.

HPE ha presentado actualizaciones de la cartera NVIDIA AI Computing by HPE para dar soporte a fábricas de IA a gran escala y supercomputadoras de próxima generación. Las ofertas combinan computación, GPU, redes, refrigeración líquida, software y servicios en soluciones de pila completa diseñadas para entornos soberanos y a gran escala. NVIDIA AI integrada en la plataforma de supercomputación exaescala de HPE. Laboratorio Nacional Argonne, HLRS, Hudson River Trading,