inicio Empresa Análisis profundo del servidor GPU con refrigeración líquida Dell PowerEdge XE9640

Análisis profundo del servidor GPU con refrigeración líquida Dell PowerEdge XE9640

by harold fritts

El Dell PowerEdge XE9640 es un servidor de montaje en bastidor con aceleración de GPU 4x capaz de brindar potencia de IA de manera eficiente desde el punto de vista energético, gracias a la refrigeración líquida. El XE9640 fue anunciado durante SC22 junto con el XE8640 y uno de nuestros favoritos, el de 8 vías XE9680 Servidor GPU. Hoy en día, el XE9640 está disponible de forma generalizada y estamos profundizando en el hardware subyacente.

El Dell PowerEdge XE9640 es un servidor de montaje en bastidor con aceleración de GPU 4x capaz de brindar potencia de IA de manera eficiente desde el punto de vista energético, gracias a la refrigeración líquida. El XE9640 fue anunciado durante SC22 junto con el XE8640 y uno de nuestros favoritos, el de 8 vías XE9680 Servidor GPU. Hoy en día, el XE9640 está disponible de forma generalizada y estamos profundizando en el hardware subyacente.

Dell PowerEdge XE9640

Dell PowerEdge XE9640

Familia de servidores acelerados por GPU de Dell

La familia de servidores PowerEdge XE está diseñada específicamente para cargas de trabajo complejas de IA y HPC que requieren rendimiento y confiabilidad. Estos servidores están diseñados para ser inteligentes, basados ​​en conocimientos y de alto rendimiento. Hoy en día, la familia de servidores XE comprende la XE9680 (¿Mencionamos que era uno de los favoritos de Jordan?), XE9640, XE8640 y XE8545. El hilo común entre todos estos servidores es el diseño para admitir una amplia variedad de iniciativas de IA con una opción de enfriamiento que tenga sentido para el cliente.

Productos

Propósito Beneficios Casos de uso
XE9680 Diseñado para impulsar el conocimiento con aceleración de IA diseñada para un rendimiento óptimo y el tiempo de obtención de valor más rápido Aproveche el rendimiento extremo para IA y HPC con 8 GPU NVIDIA H100 o A100 Tensor Core SXM Modelos de lenguaje grande
El funcionamiento inteligente refrigerado por aire (hasta 35 °C) maximiza la conversión de datos en resultados Procesamiento natural del lenguaje
El funcionamiento inteligente refrigerado por aire (hasta 35 °C) maximiza la conversión de datos en resultados Entrenamiento del motor de recomendaciones grandes
Modelado y simulación
Gemelos digitales y fabricación
XE9640 Diseñado específicamente para impulsar iniciativas de IA en un servidor inteligente de 2U altamente denso y refrigerado por líquido. Obtenga mejores resultados para la IA con 4 GPU NVIDIA H100 Tensor Core o 4 GPU Intel Data Center Max OAM Procesamiento natural del lenguaje
Las CPU y GPU inteligentes con refrigeración líquida maximizan el rendimiento Entrenamiento del motor de recomendaciones grandes
Menor TCO con eficiencia de utilización de energía optimizada Modelado y simulación
Inteligencia Artificial, Capacitación ML/DL para reconocimiento de objetos
XE8640 Impulse cargas de trabajo de IA, HPC y análisis con un rendimiento superior Automatice el análisis de información con 4 GPU NVIDIA H100 para una amplia gama de aplicaciones Modelos de lenguaje de conjunto de datos medianos
Funciona con refrigeración por aire (hasta 35 °C) para aumentar la eficiencia energética. Procesamiento natural del lenguaje
Aumente las operaciones con opciones de expansión inteligentes Modelado y simulación
Inteligencia artificial, capacitación e inferencia de ML/DL, reconocimiento de imágenes
XE8545 Rendimiento de aplicaciones de gráficos e inteligencia artificial convencionales Aumente el rendimiento del entrenamiento y la inferencia con 4 GPU NVIDIA A100 Modelado y simulación, incluido análisis sísmico.
El funcionamiento enfriado por aire (hasta 35 °C) impulsa un funcionamiento eficiente Inteligencia artificial, capacitación e inferencia de ML/DL, reconocimiento de imágenes y Chatbot
Reduzca el coste total de propiedad con una solución equilibrada entre rendimiento y vatios

Dell PowerEdge XE9640: diversidad de GPU y refrigeración líquida

El objetivo principal era mejorar las capacidades analíticas existentes y facilitar la generación de nuevos modelos predictivos o biomarcadores. Para ello, se buscaba vincular los datos de imágenes con la Historia Clínica Electrónica (HCE), utilizando técnicas de procesamiento del lenguaje natural (PLN) para su análisis. PowerEdgeXE9640 ofrece refrigeración líquida directa (DLC) para GPUS y CPU gracias a una profunda asociación con su socio CoolIT. El servidor vende algunos ventiladores para garantizar que las tarjetas de expansión DRAM, almacenamiento y PCIe reciban suficiente flujo de aire y refrigeración. Dicho esto, estos ventiladores no necesitan funcionar a máximas RPM, lo que ahorra una cantidad sustancial de energía.

Bandeja Dell PowerEdge XE9640 NVIDIA H100

Dell PowerEdge XE9640: bandeja de GPU NVIDIA

El PowerEdge XE9640 trae diversidad de GPU a la mesa, ofreciendo una opción entre 4x NVIDIA NVLink interconectado GPU H100 SXM5 Módulo de 700W o 4x Intel XeLink interconectado Intel Data Center GPU Max 1550 Módulo acelerador (OAM) de plataforma de computación abierta (OCP) de 600 W.

Gracias a tecnologías como NVIDIA NVLink e Intel Xelink, estas GPU se comunican sin problemas, agrupando de manera efectiva su memoria y núcleos. Esto es especialmente beneficioso para manejar cargas de trabajo coherentes con la memoria, como los modelos de lenguaje grande (LLM). Esta versatilidad lo hace adecuado para una amplia gama de cargas de trabajo de IA. Por supuesto, la pregunta obvia es: "¿Qué pasa con AMD Instinct?" Dell evalúa constantemente compatibilidad adicional con GPU, pero no ofrece una solución AMD en este servidor en el momento del lanzamiento.

Bandeja de GPU Intel Dell PowerEdge XE9640

Dell PowerEdge XE9640: bandeja de GPU Intel

Esta diversidad de GPU permite a los usuarios abordar las crecientes demandas de la IA generativa, el modelado de simulación industrial y la investigación científica de vanguardia. Por ejemplo, las capacidades del acelerador Intel Data Center GPU Max del PowerEdge XE9640 se han utilizado en el Centro de Computación Avanzada de Texas (TACC) para su Supercomputadora Stampede3.

En términos de densidad y refrigeración, el PowerEdge XE9640 ha sido diseñado y diseñado para hacer un uso eficiente del espacio del rack y al mismo tiempo aumentar el rendimiento. Con su perfil compacto de 2RU, este servidor ofrece una impresionante capacidad de GPU por rack, lo que maximiza el valioso espacio del centro de datos. Al emplear DLC, el PowerEdge XE9640 supera a los sistemas tradicionales enfriados por aire en términos de eficiencia y rentabilidad.

Dell PowerEdge XE9640: el resto del hardware

Más allá de “sólo” las GPU, la ingeniería detrás de la serie XE es de primera clase. Acabamos de publicar un revisión en vídeo del XE9640 y XE8640. El video proporciona excelentes detalles sobre el diseño, desde el acceso a la unidad y el enrutamiento de las tuberías DLC en el XE9640 hasta la refrigeración líquida de GPU de circuito cerrado en el XE8640 y el camino para futuras mejoras en todos los servidores XE. Está incluido a continuación como referencia.

Además del XE9640, quitar el bisel proporciona un fácil acceso a las unidades NVMe. Dos ranuras en el lado derecho del chasis admiten las unidades del subsistema de almacenamiento optimizado para arranque (BOSS) NVMe e incluyen HWRAID 1 a través de 2 SSD M.2. Hoy en día, el almacenamiento primario se proporciona a través de 4 unidades NVMe U.2 Gen4. Esto se duplicará en una versión futura gracias a una opción para una bandeja SSD que admita 8 unidades NVMe E3.S Gen5. La plataforma no admite HW RAID para las bahías NVMe U.2, aunque la mayoría no lo necesitará. Muchas de estas cajas de GPU aprovechan conjuntos de datos masivos de forma externa. El almacenamiento local, en este caso, no será la fuente principal de estos grandes conjuntos de datos.

Por supuesto, existen buenas opciones de expansión en la parte posterior del servidor para los profesionales de la IA que necesitan aprovechar matrices de almacenamiento masivas. El XE9640 admite cuatro ranuras PCIe Gen5, dos de media altura y dos de altura completa. Además, tiene una ranura NIC PCIe Gen3 OCP.

Dell PowerEdge XE9640 frontal

Dell PowerEdge XE9640 frontal

Para calmar los temores de una fuga, los servidores refrigerados por líquido incluyen informes de detección de fugas en iDRAC. El método de Dell para detectar fugas es bastante increíble cuando se perforan diferentes partes del chasis. Por ejemplo, en la toma de la placa de enfriamiento de la CPU a continuación, se pueden distinguir finos rastros de cobre en un patrón redondeado alrededor de todo el bloque de agua. Si gotea agua sobre estas conexiones, el circuito de cableado abierto detecta un pequeño cortocircuito y el sistema sabe que se ha producido una fuga. El cable trenzado se utiliza con un método de detección similar en otras partes del chasis. Esto es visible en nuestra foto del bloque principal de distribución de líquido con numerosas mangueras en la parte delantera del chasis. Además, las CDU CoolIT y el resto del circuito también cuentan con informes de detección de fugas en muchos puntos del camino.

Dell PowerEdge XE9640

Detección de fugas Dell PowerEdge XE9640

Por cierto, los modelos XE8640 y XE9680 refrigerados por aire también incluyen refrigeración líquida de GPU de circuito cerrado con la misma detección de fugas a través de iDRAC.

Optimización de la potencia por rack

El PowerEdge XE9640 ofrece a los clientes la oportunidad de ajustar su utilización de energía por rack. Con nueve servidores por rack, una carga máxima de computación acelerada podría demandar alrededor de 41 kW de potencia, utilizando una distribución de energía trifásica para un rendimiento equilibrado. Para ampliar, los centros de datos pueden implementar bastidores que albergan 12, 18 o incluso 21 servidores PowerEdge XE9640, alcanzando niveles de potencia de aproximadamente 54 kW, 81 kW y 95 kW, respectivamente. Esta adaptabilidad permite a los centros de datos optimizar el uso de energía de sus racks de acuerdo con requisitos específicos.

Colector de líquido Dell PowerEdge XE9640

Colector de refrigeración líquida interior Dell PowerEdge XE9640

Dell ha recopilado una variedad de recursos para brindarles a los clientes una visión integral del PowerEdge XE9640. Esto incluye videos de unboxing y reseñas detalladas de productos. El vídeo de unboxing muestra el diseño y las características del servidor, ofreciendo a los clientes un recorrido visual de sus capacidades.

Para enfatizar aún más las ventajas del PowerEdge XE9640, Dell ha elaborado una infografía que lo compara con su homólogo refrigerado por aire, el PowerEdgeXE8640. Esta infografía destaca las distinciones notables del PowerEdge XE9640, particularmente su eficiencia en refrigeración líquida y su impresionante capacidad de GPU por rack.

Dell PowerEdge XE9640 trasero

Dell PowerEdge XE9640 trasero

Reflexiones Finales:

El PowerEdge XE9640 es parte integral de las crecientes soluciones de IA generativa de Dell, diseñadas para revolucionar las cargas de trabajo de IA y fomentar la innovación. La solución de IA generativa de Dell combina tecnología de vanguardia, innovación y servicios ofrecidos por Dell Technologies para ofrecer resultados más inteligentes y rápidos. Al aprovechar las capacidades de la IA generativa, las organizaciones pueden obtener nuevos conocimientos, acelerar sus esfuerzos de transformación y mejorar la eficiencia de la fuerza laboral.

Si bien el XE9680 puede seguir siendo nuestro favorito de los servidores GPU de Dell, el XE9640 se ha ganado un lugar en nuestros corazones únicamente desde una perspectiva de eficiencia y diseño. El chasis 2U incluye una enorme cantidad de ingeniería; Los centros de datos con refrigeración líquida claramente gravitarán hacia estas cajas de bajo consumo. Los cuatro módulos NVIDIA consumen 2800 W por sí solos, por lo que cualquier cosa que Dell pueda hacer para ayudar a que los centros de datos sean más eficientes en cuanto a rack y energía es un gran paso adelante.

Infografía

Interactuar con StorageReview

Boletín Informativo | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed