Inicio Empresa Arista colabora con NVIDIA para demostrar tecnología avanzada de centro de datos de IA

Arista colabora con NVIDIA para demostrar tecnología avanzada de centro de datos de IA

by harold fritts

Arista Networks ha anunciado una demostración de tecnología innovadora para crear centros de datos de IA que alinean los dominios de red y de computación en una única entidad de IA administrada.

Arista Networks ha anunciado una demostración de tecnología innovadora para crear centros de datos de IA que alinean los dominios de red y de computación en una única entidad de IA administrada. Esta iniciativa, llevada a cabo en colaboración con NVIDIA, busca construir redes de IA generativa óptimas que ofrezcan tiempos de finalización de trabajos más bajos al permitir a los clientes configurar, administrar y monitorear de manera uniforme clústeres de IA en componentes críticos, incluidas redes, NIC y servidores.

Gestión unificada para clústeres de IA

A medida que los grupos de IA y los grandes modelos de lenguaje (LLM) continúan expandiéndose, la complejidad y la cantidad de componentes involucrados también aumentan significativamente. Estos componentes incluyen GPU, NIC, conmutadores, ópticas y cables, que deben funcionar de manera cohesiva para formar una red integral. Los controles uniformes garantizan que los servidores de IA que alojan NIC y GPU estén sincronizados con los conmutadores de red de IA en varios niveles. Sin esta alineación, existe el riesgo de una mala configuración o desalineación, particularmente entre las NIC y los conmutadores de red, lo que puede afectar gravemente la finalización del trabajo debido a problemas de red difíciles de diagnosticar.

Gestión coordinada de la congestión

Los grandes clústeres de IA requieren una gestión de la congestión sincronizada para evitar la caída de paquetes y la infrautilización de las GPU. También son necesarios una gestión y un seguimiento coordinados y simultáneos para optimizar los recursos informáticos y de red. En el centro de la solución de Arista se encuentra un agente basado en EOS que permite la comunicación entre la red y el host, coordinando configuraciones para optimizar los clústeres de IA.

Agente de IA remoto para un control mejorado

El Arista EOS que se ejecuta en conmutadores Arista se puede ampliar a servidores y NIC conectados directamente a través de un agente de IA remoto. Esto permite un único punto de control y visibilidad en todo un centro de datos de IA, creando una solución unificada. El agente de IA remoto, alojado en una SuperNIC NVIDIA BlueField-3 o ejecutándose en el servidor y recopilando telemetría de la SuperNIC, permite que EOS en el conmutador de red configure, monitoree y depure problemas de red en el servidor. Esto garantiza la configuración de la red de un extremo a otro y la coherencia de la calidad de servicio (QoS), lo que permite gestionar y optimizar los clústeres de IA como una solución cohesiva.

John McCool, director de plataforma de Arista Networks, afirmó: “Arista tiene como objetivo mejorar la eficiencia de la comunicación entre la red descubierta y la topología de GPU para mejorar los tiempos de finalización del trabajo a través de la orquestación, configuración, validación y monitoreo coordinados de la computación acelerada de NVIDIA, NVIDIA SuperNIC. , y la infraestructura de red de Arista”.

Esta nueva tecnología destaca cómo un agente de IA remoto basado en Arista EOS permite gestionar un clúster de IA integrado como una única solución. Al extender las capacidades de EOS a servidores y SuperNIC a través de agentes remotos de IA, Arista garantiza un seguimiento y notificación continuos de problemas o fallas de rendimiento entre hosts y redes, lo que permite un aislamiento rápido y la minimización de los impactos. Los conmutadores de red basados ​​en EOS mantienen un conocimiento constante de la topología precisa de la red y la extensión de EOS a SuperNIC y servidores con el agente de IA remoto mejora la optimización coordinada de la QoS de extremo a extremo en todos los elementos del centro de datos de IA, lo que en última instancia reduce los tiempos de finalización de los trabajos. .

El siguiente paso para Arista Networks

Arista Networks exhibirá la tecnología de agente de IA en la celebración del décimo aniversario de la IPO de Arista en la Bolsa de Nueva York el 10 de junio, y se espera que las pruebas con los clientes comiencen en la segunda mitad de 5. Esta demostración representa un paso importante hacia el logro de una plataforma interoperable y de múltiples proveedores. ecosistema que permite un control y una coordinación perfectos entre las redes de IA y la infraestructura informática de IA, abordando las crecientes demandas de las cargas de trabajo de IA y LLM.

Interactuar con StorageReview

Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed