Los servidores GPU Lenovo ThinkSystem SR685a V3 y SR680a V3 son los últimos servidores GPU de 8 vías de la compañía, diseñados para satisfacer diversas necesidades empresariales de IA.
Los servidores GPU Lenovo ThinkSystem SR685a V3 y SR680a V3 son los últimos servidores GPU de 8 vías de la compañía, diseñados para satisfacer diversas necesidades empresariales de IA. A pesar de tener nombres de modelos distintos, comparten una base modular, lo que permite componentes intercambiables dentro de cada sistema.
Básicamente, estos servidores tienen tres o cuatro componentes principales, según cómo se cuenten. Primero, una carcasa exterior forma la carcasa del chasis con ventiladores integrados en la parte trasera. Hay rieles internos que sostienen un servidor modular de 2U en la parte superior. El 6U inferior alberga las GPU, los conmutadores y la estructura PCIe. Los servidores 2U tienen E/S que varían según las ofertas de AMD o Intel. Lenovo admite placas GPU NVIDIA y AMD hoy, con soporte futuro para Intel Guadi 3.
El Lenovo SR685a V3 (pequeño a para IA) utiliza procesadores AMD EPYC duales de cuarta generación y está específicamente optimizado para comunicaciones de GPU a GPU de alto ancho de banda, lo que lo hace ideal para aplicaciones de IA generativa. Por el contrario, el SR4a V680, equipado con procesadores escalables Intel Xeon de quinta generación, admite aplicaciones computacionales e IA versátiles, y se adapta a las GPU NVIDIA y AMD para diversas necesidades de la industria. Ambos modelos adoptan un enfoque innovador de la modularidad, lo que permite a los usuarios personalizar y escalar sus sistemas para alinearlos con precisión con demandas operativas específicas.
Estos servidores son muy buscados (aunque muy difíciles de conseguir en este momento) y generaron un gran revuelo en la conferencia de Lenovo el año pasado en Austin. Existe un gran entusiasmo en torno a estos servidores GPU y su potencial para mejorar las capacidades de IA.
Modelos configurables y personalización
Los sistemas Lenovo ThinkSystem SR685a V3 y SR680a V3 se ofrecen en varios modelos de configuración bajo pedido (CTO) que sirven como marco para la personalización. Tener la capacidad de personalizar los modelos de configuración se extiende a la selección detallada de GPU, donde los modelos se definen en función de las GPU específicas seleccionadas. Por ejemplo, los códigos de características básicos enumerados en el configurador de Lenovo permiten seleccionar entre AMD MI300X y NVIDIA H100/H200, cada uno de los cuales satisface diferentes necesidades computacionales y de rendimiento. El diseño de la plataforma brinda a Lenovo una mayor flexibilidad para integrar nuevos aceleradores a medida que salen al mercado.
Especificaciones de Lenovo ThinkSystem SR685a V3
Componentes de la bolsa de equipaje | Especificaciones |
Factor de forma | Rack 8U |
Procesador | Dos procesadores AMD EPYC serie 9004 (anteriormente con nombre en código “Genoa”). Admite procesadores de hasta 64 núcleos, velocidades de núcleo de hasta 3.1 GHz y clasificaciones de TDP de hasta 400 W. Admite PCIe 5.0 para E/S de alto rendimiento. |
GPU | Elección de:
|
Salud Cerebral | 24 ranuras DIMM con dos procesadores (12 ranuras DIMM por procesador). Cada procesador tiene 12 canales de memoria, con 1 DIMM por canal (DPC). Los RDIMM TruDDR5 de Lenovo son compatibles con hasta 4800 MHz. |
Máximo de memoria | Hasta 1.5 TB con 24 RDIMM de 64 GB Hasta 2.25 TB con 24 RDIMM de 96 GB |
Protección de la memoria | ECC, SDDC, depuración de patrulla/demanda, falla delimitada, paridad de comando de dirección de DRAM con reproducción, reintento de error de ECC no corregido de DRAM, ECC en matriz, verificación y depuración de errores de ECC (ECS), reparación posterior al paquete |
Bahías de unidad de disco | Hasta 16 bahías para unidades de intercambio en caliente de 2.5 pulgadas que admiten unidades PCIe 5.0 NVMe. |
unidades de arranque del sistema operativo | Soporte para un adaptador M.2 con RAID-1 integrado; soporte para 2 unidades NVMe M.2 para funciones de arranque del sistema operativo y almacenamiento de datos |
Almacenamiento interno máximo | 51.2 TB con 16 SSD NVMe de 3.2 TB y 2.5 pulgadas |
Controlador de almacenamiento | NVMe integrado (no RAID) |
Interfaces de red | Admite 8 adaptadores de red de alto rendimiento con conectividad de hasta 400 Gb/s con soporte GPU Direct. Admite un adaptador NVIDIA BlueField-3 de 2 puertos y 200 Gb para el plano de usuario/control y una opción de adaptador de red OCP para administración. La ranura OCP 3.0 tiene una interfaz de host PCIe 5.0 x16, con un puerto compartido opcionalmente con el procesador de gestión XClarity Controller 2 (XCC2) para compatibilidad con Wake-on-LAN y NC-SI. |
Ranuras de expansión PCI | 10 ranuras PCIe 5.0 x16:
|
Puertos | Frontal: 1x puerto USB 3.2 G1 (5 Gb/s), 1x puerto USB 2.0 (también para gestión local XCC), 1x puerto de vídeo VGA. Trasera: 3x puertos USB 3.2 G1 (5 Gb/s), 1x puerto de vídeo VGA, 1x puerto de gestión de sistemas RJ-45 1GbE para gestión remota de XCC. |
Enfriamiento | 5 ventiladores de doble rotor montados en el frente para la CPU y el subsistema de almacenamiento, N+1 redundantes. 10 ventiladores de doble rotor montados en la parte trasera para el subsistema GPU, N+1 redundante. En cada fuente de alimentación hay un ventilador integrado. Flujo de aire de adelante hacia atrás. |
Fuente de alimentación | Ocho fuentes de alimentación de CA redundantes de intercambio en caliente con redundancia de hasta N+N. Certificación 80 PLUS Titanio. Fuentes de alimentación de 2600 W CA que requieren alimentación de 220 V CA. |
Vídeo | Gráficos de vídeo integrados con 16 MB de memoria y un acelerador de hardware 2D están integrados en el controlador XClarity. No se pueden utilizar dos puertos de vídeo (VGA frontal y VGA trasero) simultáneamente; El uso del puerto VGA frontal desactiva el puerto VGA trasero. La resolución máxima es 1920×1200 32bpp a 60Hz. |
Piezas intercambiables en caliente | Unidades, fuentes de alimentación y ventiladores. |
Gestión de sistemas | Panel de diagnóstico integrado con LED de estado y pantalla LCD extraíble. Gestión integrada XClarity Controller 2 (XCC2) basada en el controlador de gestión de placa base (BMC) ASPEED AST2600. Puerto Ethernet trasero dedicado para acceso remoto XCC2 para administración. XClarity Administrator para administración centralizada de infraestructura, complementos XClarity Integrator y administración centralizada de energía del servidor XClarity Energy Manager. El XCC Platinum opcional permitirá funciones de control remoto y otras características. |
Características de seguridad | Contraseña de encendido, contraseña de administrador, módulo Root of Trust compatible con TPM 2.0 y resistencia del firmware de plataforma (PFR). |
Sistemas operativos compatibles | Servidor Ubuntu. |
Garantía limitada | Unidad reemplazable por el cliente de tres años o un año (según el modelo) y garantía limitada en el sitio con 9 × 5 al siguiente día hábil (NBD). |
Servicio y soporte | Las actualizaciones de servicio opcionales están disponibles a través de los servicios de Lenovo: tiempo de respuesta de 4 o 2 horas, tiempo de reparación de 6 horas, extensión de garantía de 1 o 2 años, soporte de software para hardware de Lenovo y algunas aplicaciones de terceros. |
Dimensiones | Ancho: 447 mm (17.6 pulg.), Alto: 351 mm (13.8 pulg.), Profundidad: 924 mm (36.3 pulg.). |
Ligero | Máximo: 108.9 kg (240 libras) |
Especificaciones de Lenovo ThinkSystem SR680a V3
Componentes de la bolsa de equipaje | Especificaciones |
Factor de forma | Rack 8U |
Procesador | Dos procesadores escalables Intel Xeon de quinta generación (anteriormente con el nombre en código “Emerald Rapids”). Admite un procesador con 5 núcleos, una velocidad central de 48 GHz y un TDP de 2.3 W. Admite PCIe 350 para E/S de alto rendimiento. |
chipset | Chipset Intel C741 “Emmitsburg”, parte de la plataforma con nombre en código “Eagle Stream” |
GPU | Elección de:
|
Salud Cerebral | 32 ranuras DIMM con dos procesadores (16 ranuras DIMM por procesador). Cada procesador tiene 8 canales de memoria, con 2 DIMM por canal (DPC). Se admiten RDIMM Lenovo TruDDR5. Los DIMM funcionan hasta 5600 MHz en 1 DPC y hasta 4400 MHz en 2 DPC. |
Máximo de memoria | Hasta 2 TB con 32 RDIMM de 64 GB |
Protección de la memoria | ECC, SDDC (para DIMM de memoria basados en x4), ADDDC (para DIMM de memoria basados en x4, excepto RDIMM de 9×4; requiere procesadores Platinum o Gold) y duplicación de memoria. |
Bahías de unidad de disco | Hasta 16 bahías para unidades de intercambio en caliente de 2.5 pulgadas que admiten unidades PCIe 5.0 NVMe. |
unidades de arranque del sistema operativo | Compatibilidad con dos unidades M.2 con compatibilidad Intel VROC NVMe RAID opcional para funciones de almacenamiento de datos y arranque del sistema operativo |
Almacenamiento interno máximo | 51.2 TB con 16 SSD NVMe de 3.2 TB y 2.5 pulgadas |
Controlador de almacenamiento | NVMe integrado (no RAID) |
Interfaces de red | Admite 8 adaptadores de red de alto rendimiento con conectividad de hasta 400 Gb/s con soporte GPU Direct. Admite un adaptador NVIDIA BlueField-3 de 2 puertos y 200 Gb para el plano de usuario/control y un adaptador Mellanox ConnectX-6 Lx de 2 puertos y 10/25 GbE para administración. |
Ranuras de expansión PCI | 10 ranuras PCIe 5.0 x16:
|
Puertos | Frontal: 1x puerto USB 3.2 G1 (5 Gb/s), 1x puerto USB 2.0 (también para gestión local XCC), 1x puerto de vídeo Mini DisplayPort. Trasera: 2x puertos USB 3.2 G1 (5 Gb/s), 1x puerto de vídeo VGA, 1x puerto de gestión de sistemas RJ-45 1GbE para gestión remota de XCC. |
Enfriamiento | 5 ventiladores de doble rotor montados en el frente para la CPU y el subsistema de almacenamiento, N+1 redundantes. 10 ventiladores de doble rotor montados en la parte trasera para el subsistema GPU, N+1 redundante. En cada fuente de alimentación hay un ventilador integrado. Flujo de aire de adelante hacia atrás. |
Fuente de alimentación | Ocho fuentes de alimentación de CA redundantes de intercambio en caliente con redundancia de hasta N+N. Certificación 80 PLUS Titanio. Fuentes de alimentación de 2600 W CA que requieren alimentación de 220 V CA. |
Vídeo | Los gráficos integrados con 16 MB de memoria y un acelerador de hardware 2D están integrados en el controlador de gestión XClarity Controller 2. Dos puertos de vídeo (Mini DisplayPort frontal y VGA trasero); ambos se pueden utilizar simultáneamente si se desea. La resolución máxima de ambos puertos es 1920×1200 a 60Hz. |
Piezas intercambiables en caliente | Unidades, fuentes de alimentación y ventiladores. |
Gestión de sistemas | Panel de diagnóstico integrado con LED de estado y pantalla LCD extraíble. Gestión integrada XClarity Controller 2 (XCC2) basada en el controlador de gestión de placa base (BMC) ASPEED AST2600. Puerto Ethernet trasero dedicado para acceso remoto XCC2 para administración. XClarity Administrator para administración centralizada de infraestructura, complementos XClarity Integrator y administración centralizada de energía del servidor XClarity Energy Manager. El XCC Platinum opcional permite funciones de control remoto y otras características. |
Características de seguridad | Contraseña de encendido, contraseña de administrador, módulo Root of Trust compatible con TPM 2.0 y resistencia del firmware de plataforma (PFR). |
Sistemas operativos compatibles | Servidor Ubuntu. |
Garantía limitada | Unidad reemplazable por el cliente de tres años o un año (según el modelo) y garantía limitada en el sitio con 9 × 5 al siguiente día hábil (NBD). |
Servicio y soporte | Las actualizaciones de servicio opcionales están disponibles a través de los servicios de Lenovo: tiempo de respuesta de 4 o 2 horas, tiempo de reparación de 6 horas, extensión de garantía de 1 o 2 años, soporte de software para hardware de Lenovo y algunas aplicaciones de terceros. |
Dimensiones | Ancho: 447 mm (17.6 pulg.), Alto: 351 mm (13.8 pulg.), Profundidad: 924 mm (36.3 pulg.). |
Ligero | Máximo: 108.7 kg (239.8 libras) |
Diseño y construcción de Lenovo ThinkSystem SR685a V3 y SR680a V3
La parte frontal del sistema admite hasta 16 bahías para unidades PCIe Gen5 NVMe intercambiables en caliente, una cantidad inusualmente generosa para servidores centrados en GPU, que normalmente ofrecen menos bahías y carriles para expansión. Debajo de los compartimientos para unidades se encuentran las ocho ranuras PCIe Gen5 FHHL (altura completa, longitud media) de acceso frontal y el complejo de conmutación PCIe. Estas ranuras están equipadas con tecnología GPU Direct (ocho adaptadores InfiniBand NDR de 400 Gb/s), lo que permite redes de alta velocidad y transferencias de datos para reducir la latencia y aumentar las velocidades de procesamiento de datos.
El sistema alberga cinco ventiladores intercambiables en caliente en la parte superior del chasis, diseñados para enfriar el servidor, que ocupa los 2U superiores, incluida la CPU, la memoria y las ranuras traseras. Se montan diez ventiladores adicionales en la parte posterior del chasis para enfriar los compartimientos de unidades, los adaptadores y las GPU.
El panel frontal también alberga puertos esenciales de conectividad y administración, incluidos tres puertos USB 3.2 Gen1 y una salida de video, lo que facilita la administración directa y las interacciones con la consola local.
La parte trasera está igualmente bien equipada, incluidas las capacidades de expansión del servidor 2U. La variante AMD ofrece una ranura PCIe Gen5 x16 FHHL junto con una ranura OCP 3.0 equipada con una interfaz PCIe Gen5 x16. Por el contrario, el modelo Intel tiene dos ranuras PCIe Gen5 x16 FHHL. Una ranura OCP 3.0 proporciona versatilidad en las opciones de conexión en red y aceleración al admitir varias tarjetas adaptadoras que cumplen con estándares abiertos. Se pueden instalar adaptadores DPU NVIDIA BlueField-3 para habilitar una infraestructura de TI acelerada por hardware y definida por software, optimizando diversas operaciones de TI, como las redes y la seguridad.
La parte trasera de la unidad GPU alberga ocho fuentes de alimentación de 2,600 W, cada una de las cuales está conectada a un tablero de distribución central. Esta configuración incluye conectores en la parte posterior de la placa, a los que Lenovo se refiere como "compañero ciego", que facilitan una conexión perfecta al transbordador de cómputo 2U.
Además, como se mencionó anteriormente, la vista posterior revela el extenso sistema de enfriamiento del servidor, que incluye diez ventiladores traseros intercambiables en caliente diseñados para mantener condiciones térmicas óptimas en las GPU, conmutadores y estructura PCIe. Este sistema de refrigeración es crucial para mantener la estabilidad y la longevidad del rendimiento del hardware, especialmente durante operaciones continuas de alta carga.
Alimentación, cableado y conmutación
Las versiones AMD e Intel de esta familia de servidores comparten un diseño de energía común, lo que permite una mayor modularidad, que es lo más destacado de estos sistemas.
La señalización PCIe fluye a través de cables planos que conectan el sled de cómputo al sled de conmutación PCIe. En el otro lado del trineo de cálculo, hay una conexión ciega. El trineo de cómputo se acopla a estos conectores, pasando la señalización PCIe al resto del chasis. El soporte en la parte posterior del trineo (etiquetado con su conexión PCIe designada) le permite cambiar entre los lanzaderas de cómputo sin alterar la parte inferior del servidor.
La placa de conmutación PCIe incluye cuatro conmutadores Broadcom rodeados por ranuras PCIe, lo que permite que el servidor se conecte a una estructura de red de alta velocidad. Además, hay ocho conectores de cable MCIO que se conectan a la placa base. Los conectores PCIe más pequeños en la parte superior están designados para las placas posteriores de las unidades SSD NVMe de montaje frontal.
Memoria y almacenamiento interno
La computadora AMD admite hasta 24 DIMM de memoria DDR5, y cada procesador interactúa con 12 DIMM a través de 12 canales de memoria, lo que permite una configuración de un DIMM por canal. Estos DIMM funcionan a una velocidad de 4800 MHz, lo que mejora el rendimiento y la eficiencia general de la memoria. Dependiendo de la configuración, el servidor puede admitir 1.5 TB de memoria del sistema usando 24 RDIMM de 64 GB o 2.25 TB usando 24 RDIMM de 96 GB, lo que proporciona una amplia capacidad incluso para las tareas que requieren más memoria.
La computadora Intel (SR680a V3) aprovecha la memoria Lenovo TruDDR5 que opera a velocidades de hasta 5600 MHz. También admite una capacidad mayor que AMD con hasta 32 DIMM en dos procesadores, utilizando 8 canales de memoria para admitir 2 DIMM por canal (DPC). Dependiendo de la configuración de la memoria, el servidor puede admitir hasta 2 TB de memoria del sistema utilizando 32 RDIMM de 64 GB.
Las velocidades de funcionamiento de los DIMM varían según la cantidad de DIMM por canal: con 1 DIMM por canal, la memoria puede alcanzar velocidades de hasta 5600 MHz, mientras que las configuraciones con 2 DIMM por canal funcionarán hasta 4400 MHz. Este ajuste de velocidad flexible ayuda a optimizar el rendimiento según la carga y configuración de memoria específicas.
Además, el servidor admite dos unidades NVMe M.2 en un adaptador M.2 con funcionalidad RAID integrada, lo cual es ideal para procesos de arranque del sistema operativo y acceso rápido a datos.
Placas GPU AMD y NVIDIA
La placa NVIDIA H100/H200 está equipada con ocho GPU NVIDIA y cuenta con un asa retráctil que facilita el transporte y la instalación de la placa. Una vez instalada, la manija se coloca perfectamente junto a las GPU para evitar obstrucciones. Los conectores entre las placas AMD y NVIDIA son idénticos. La placa Intel Gaudi 3 tendrá un conector diferente.
La placa AMD MI300 es similar a la placa NVIDIA pero tiene un asa estándar que sobresale significativamente. Si bien sigue siendo útil, no es tan elegante como el mango retráctil de la placa NVIDIA. A los clientes no les importará de ninguna manera, por lo que agregamos la nota al pie porque la diferencia de diseño nos llamó la atención.
Conclusión
Los servidores GPU Lenovo ThinkSystem SR685a V3 y SR680a V3 ofrecen una modularidad impresionante y admiten potentes GPU NVIDIA H100/H200 y AMD MI300X, así como AMD EPYC 9004 y 5.th CPU Intel de generación Xeon. Esta flexibilidad y un diseño refrigerado por aire facilitan su integración en los ecosistemas existentes. Los servidores también admiten más almacenamiento que los servidores GPU típicos (a través de 16 bahías de unidades PCIe Gen5 NVMe intercambiables en caliente), lo que mejora su utilidad para tareas con uso intensivo de datos. Además, incluir XClarity de Lenovo para la gestión garantiza operaciones y supervisión optimizadas, simplificando aún más la gestión de infraestructuras complejas.
A pesar de no haber realizado pruebas de rendimiento, el diseño de estos servidores es destacable. La arquitectura modular permite a Lenovo ofrecer fácilmente a sus clientes GPU AMD y NVIDIA hoy en día, con servidores informáticos Intel o AMD. Con más soporte de GPU, como Intel Guadi 3 y NVIDIA B200, Lenovo puede permitir a los clientes mezclar y combinar los componentes de cómputo y GPU para ajustar los servidores para aplicaciones específicas.
En general, estos servidores están muy bien pensados y esperamos poder probarlos; Jordan ha estado acariciando ansiosamente su barba con anticipación. Si bien actualmente estamos trabajando en un proyecto con Lenovo SR675 v3 con cuatro GPU NVIDIA L40S, estos servidores de 8 vías son un animal diferente y tienen una amplia gama de casos de uso de IA. Sin embargo, este es un buen recordatorio de que Lenovo ofrece una plataforma de inteligencia artificial para todos.
Interactuar con StorageReview
Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed