El Lenovo ThinkSystem SR665 es un dispositivo rico en funciones, AMD EPYC de segunda generación Servidor 2U de doble socket, compatible con PCIe Gen4 de extremo a extremo. Similar a su hermano menor de 1U, el SR635, también es compatible con una amplia gama de opciones de configuración de almacenamiento, incluidas las SSD Gen4 U.2 NVMe. Ser un servidor AMD EPYC tiene varias ventajas, incluido un rendimiento típicamente más alto, RAM más rápida, más DIMM y compatibilidad con PCIe Gen4. Este servidor es ideal para infraestructura de inferencia, virtualización, VDI, HPC e hiperconvergente.
El Lenovo ThinkSystem SR665 es un dispositivo rico en funciones, AMD EPYC de segunda generación Servidor 2U de doble socket, compatible con PCIe Gen4 de extremo a extremo. Similar a su hermano menor de 1U, el SR635, también es compatible con una amplia gama de opciones de configuración de almacenamiento, incluidas las SSD Gen4 U.2 NVMe. Ser un servidor AMD EPYC tiene varias ventajas, incluido un rendimiento típicamente más alto, RAM más rápida, más DIMM y compatibilidad con PCIe Gen4. Este servidor es ideal para infraestructura de inferencia, virtualización, VDI, HPC e hiperconvergente.
AMD EPYC 7002 trae varios beneficios sobre sus competidores. Desde el principio, tienden a tener más núcleos e hilos y brindan más rendimiento. Admiten más DRAM y más rápido y admiten la tecnología PCIe Gen4 (de extremo a extremo en este caso) que a su vez puede generar aumentos masivos de rendimiento. La gran cantidad de núcleos también puede ayudar a ahorrar costos para ciertos modelos de licencias, impulsando el rendimiento de un sistema de dos sockets con una sola CPU o una plataforma de cuatro sockets con dos CPU. El SR665 aprovecha al máximo todo lo anterior.
Específicamente, Lenovo ThinkSystem SR665 admite CPU de hasta 64 núcleos y 128 subprocesos con una velocidad de núcleo de hasta 3.7 GHz. Para la memoria, el SR665 admite hasta 32 DIMM de memoria TruDDR4, con 8 canales de memoria y 2 DIMM por canal. Con 1 DIMM instalado por canal (8 DIMM en total), la memoria funciona hasta a 3200 MHz. Con 2 DIMM por canal (32 DIMM en total), la memoria funciona hasta a 2933 MHz. El servidor puede admitir hasta 4 TB de DRAM. Para las GPU, el SR665 puede admitir hasta 3 GPU de ancho doble u 8 GPU de ancho simple.
El almacenamiento, y específicamente la capacidad de configuración del almacenamiento, es realmente interesante en el servidor Lenovo ThinkSystem SR665. Según Lenovo, el servidor ofrece 28 configuraciones diferentes de bahías de unidades en la parte delantera, media y trasera del servidor y 5 configuraciones diferentes de ranuras en la parte trasera del servidor.
Para unidades de 2.5 pulgadas, el servidor puede admitir hasta 40 a través de una combinación de frontal, medio y posterior. El servidor admite hasta 16 SSD NMVe sin sobresuscripción de carriles PCIe y hasta 32 con sobresuscripción 1:2. Por el contrario, el SR665 puede admitir hasta 20 unidades de 3.5 pulgadas para obtener la máxima capacidad de almacenamiento. Para M.2, el servidor admite una unidad o dos en RAID1 para arranque o almacenamiento de datos.
Para la gestión, el SR665 utiliza una combinación de Lenovo XClaridad administración, funciones de seguridad de ThinkShield y servicios de Lenovo. La idea es proporcionar una gestión potente, sencilla y segura. Hicimos una inmersión bastante profunda en XClarity vinculado anteriormente, para aquellos que buscan aprender un poco más.
Lenovo ThinkSystem SR665 Especificaciones
Factor de forma | Servidor en rack 2U |
TÉRMICO | Hasta dos (2) procesadores AMD EPYC 7002 Generation, hasta 64C, 280W |
Salud Cerebral | 32 ranuras de memoria DDR4; Máximo de 4 TB con RDIMM de 128 GB; hasta 1DPC a 3200MHz, 2DPC a 3200MHz |
compartimentos de unidad | Hasta 20 unidades de 3.5 pulgadas o 40 unidades de 2.5 pulgadas; Máximo de 32 unidades NVMe con conexión 1:2 |
Slots de expansión | Hasta 8 ranuras PCIe 4.0, 1 ranura para adaptador OCP 3.0 |
GPU | Hasta 8 GPU de ancho simple o 3 GPU de ancho doble |
Interfaz de red | Adaptador mezz OCP 3.0, adaptadores PCIe |
Potencia | Fuentes de alimentación duales redundantes (hasta 1800 W Platinum) |
Puertos | Frontal: 1x USB 3.0, 1x USB 2.0, 1x VGA (opcional) Trasero: 3x USB 3.1, 1x puerto serie (opcional), 1x RJ-45 (gestión) |
Gestión de sistemas | Controlador Lenovo XClarity |
Soporta Sistema operativo | Servidor Microsoft Windows, servidor empresarial SUSE Linux, Red Hat Enterprise Linux, VMware ESXi |
Garantía Limitada | Unidad reemplazable por el cliente de 1 y 3 años y servicios en el sitio, el siguiente día hábil 9 × 5, actualizaciones de servicio opcionales |
Lenovo Think System SR665 Diseño y construcción
El Lenovo ThinkSystem SR665 es un servidor de 2U que tiene el mismo aspecto general que toda la cartera de ThinkSystem o Lenovo en general, principalmente negro con reflejos rojos. En la parte frontal del servidor como los 24 compartimientos para unidades. El lado izquierdo tiene un puerto de diagnóstico externo y un puerto VGA opcional. El lado derecho tiene dos puertos USB 3.1, un puerto XXC, un botón de encendido y luces indicadoras.
La parte posterior del dispositivo admite hasta 8 ranuras PCIe en la parte superior. En la parte inferior está la ranura OCP 3.0, un LED de error, un puerto Ethernet de administración, un LED de ubicación, un puerto de administración XCC, un puerto de video, tres puertos Gen1 USB 3.1 más, una NMI y dos fuentes de alimentación intercambiables en caliente.
Debajo del capó, podemos ver la cubierta de flujo de aire sobre las dos CPU y los DIMM de RAM. Delante de ellos están los ventiladores y detrás de ellos están los elevadores para las ranuras PCIe. La tarjeta de arranque M.2 y la copia de seguridad de energía de la tarjeta RAID se conectan a la parte superior de la cubierta.
El módulo de arranque M.2 montado en el deflector de aire ofrece almacenamiento flash rápido para el almacenamiento del sistema, sin consumir una bahía de almacenamiento principal para tareas de baja prioridad.
Lenovo ThinkSystem SR665 Rendimiento
Configuración de Lenovo ThinkSystem SR665:
- 2 x AMD EPYC 7742
- 512 GB, 256 GB por CPU
- Almacenamiento de rendimiento VDbench: 8 x 3.84 TB Micron 9300 (Gen3) u 8 x 3.84 TB SK hynix PE8010 (Gen4)
- Almacenamiento de SQL Server y Sysbench: 8 x 3.84 Tb Micron 9300 (Gen3)
- CentOS 8 (2004)
- ESXi 6.7u3
Rendimiento de SQL Server
El protocolo de prueba OLTP de Microsoft SQL Server de StorageReview emplea el borrador actual del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark de procesamiento de transacciones en línea que simula las actividades que se encuentran en entornos de aplicaciones complejos. El punto de referencia TPC-C se acerca más que los puntos de referencia de rendimiento sintéticos para medir las fortalezas de rendimiento y los cuellos de botella de la infraestructura de almacenamiento en entornos de bases de datos.
Cada máquina virtual con SQL Server está configurada con dos discos virtuales: un volumen de 100 GB para el arranque y un volumen de 500 GB para la base de datos y los archivos de registro. Desde la perspectiva de los recursos del sistema, configuramos cada VM con 16 vCPU, 64 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI. Si bien nuestras cargas de trabajo de Sysbench probadas anteriormente saturaron la plataforma tanto en E/S de almacenamiento como en capacidad, la prueba de SQL busca el rendimiento de la latencia.
Esta prueba utiliza SQL Server 2014 ejecutándose en máquinas virtuales invitadas de Windows Server 2012 R2 y está destacada por Dell's Benchmark Factory for Databases. Si bien nuestro uso tradicional de este punto de referencia ha sido probar grandes bases de datos de escala 3,000 en almacenamiento local o compartido, en esta iteración nos enfocamos en distribuir cuatro bases de datos de escala 1,500 de manera uniforme en nuestros servidores.
Configuración de prueba de SQL Server (por VM)
- Windows Server 2012 R2
- Huella de almacenamiento: 600 GB asignados, 500 GB utilizados
- SQL Server 2014
-
- Tamaño de la base de datos: escala 1,500
- Carga de clientes virtuales: 15,000
- Búfer RAM: 48GB
- Duración de la prueba: 3 horas
- 2.5 horas de preacondicionamiento
- Período de muestra de 30 minutos
Para la latencia promedio de SQL Server, el SR665 no tuvo problemas para maximizar esta carga de trabajo, con un promedio agregado de 1 ms y máquinas virtuales individuales de 1 ms cada una.
Rendimiento Sysbench MySQL
Nuestro primer punto de referencia de la aplicación de almacenamiento local consiste en una base de datos OLTP MySQL de Percona medida a través de SysBench. Esta prueba mide el promedio de TPS (transacciones por segundo), la latencia promedio y también la latencia promedio del percentil 99.
Cada máquina virtual de Sysbench está configurada con tres discos virtuales: uno para arranque (~92 GB), uno con la base de datos preconstruida (~447 GB) y el tercero para la base de datos bajo prueba (270 GB). Desde la perspectiva de los recursos del sistema, configuramos cada VM con 16 vCPU, 60 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI.
Configuración de prueba de Sysbench (por VM)
- CentOS 6.3 de 64 bits
- Percona XtraDB 5.5.30-rel30.1
-
- Tablas de base de datos: 100
- Tamaño de la base de datos: 10,000,000
- Subprocesos de la base de datos: 32
- Búfer RAM: 24GB
- Duración de la prueba: 3 horas
- 2 horas preacondicionamiento 32 hilos
- 1 hora 32 hilos
Con Sysbench OLTP vimos una puntuación total de 17,238 8 TPS para 32,649 VM y 16 XNUMX TPS para XNUMX VM.
Con la latencia promedio de Sysbench, vimos puntajes agregados de 14.85 ms para 8 VM y 15.68 ms para 16 VM.
Para nuestra latencia en el peor de los casos (percentil 99), el SR665 obtuvo puntajes agregados de 30.27 ms para 8 VM y 30.12 ms para 16 VM.
Análisis de carga de trabajo de VDBench
Cuando se trata de comparar matrices de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no es una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de manzanas con manzanas entre las soluciones de la competencia.
Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, así como capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales.
perfiles:
- Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
- Escritura aleatoria 4K: 100 % de escritura, 64 subprocesos, 0-120 % de iorate
- Lectura secuencial de 64 K: 100 % de lectura, 16 subprocesos, 0-120 % de iorate
- Escritura secuencial de 64 K: 100 % de escritura, 8 subprocesos, 0-120 % de iorate
- Base de datos sintética: SQL y Oracle
- Trazas de clones vinculados y clones completos de VDI
Aquí hicimos una comparación de las unidades PCIe Gen3 y Gen4, Micras 9300 vs SKhynix PE8010. No tanto para ver cuál de las unidades es mejor, sino para ver cómo se desempeñará cada tipo de tecnología en el servidor. A continuación, se pueden ver nuestros ocho SSD Micron 9300 NVMe ubicados en las ranuras SR665 AnyBay, con un disco duro arriba como referencia.
Con una lectura aleatoria de 4K, el Lenovo ThinkSystem SR665 con la unidad SK Hynix Gen4 comenzó con una latencia de 75.9 µs y 412,428 3,851,738 IOPS antes de alcanzar un máximo de 170.2 9300 3 IOPS y una latencia de 4,076,949 µs. La unidad Micron 197.2 GenXNUMX alcanzó su punto máximo con XNUMX XNUMX XNUMX IOPS pero una latencia más alta de XNUMX µs.
La escritura aleatoria 4K hizo que la unidad Gen4 funcionara mucho mejor en el SR665 manteniéndose por debajo de los 100 µs hasta aproximadamente 2.6 millones de IOPS y llegó a un máximo de 2,898,564 154.4 3 IOPS con una latencia de 1.2 µs. Las unidades Gen200 alcanzaron un pico de alrededor de XNUMX millones de IOPS a aproximadamente XNUMX µs antes de dejar algunas.
Al cambiar al trabajo secuencial de 64K, las unidades Gen4 alcanzaron un máximo de 521,788 32.6 IOPS o 366.1 GB/s con una latencia de 3 µs. Las unidades Gen425,209 alcanzaron un máximo de 26.6 IOPS o 545 GB/s con una latencia de XNUMX µs.
64K de escritura para el SR665, las unidades Gen4 alcanzaron un máximo de 213,099 13.3 IOPS o 442.1 GB/s con una latencia de 3 µs antes de dejar algunas. Las unidades Gen123 alcanzaron un máximo de aproximadamente 7 460 IOPS o XNUMX GB/s con una latencia de aproximadamente XNUMX µs antes de dejar algunas.
Nuestro próximo conjunto de pruebas son nuestras cargas de trabajo de SQL: SQL, SQL 90-10 y SQL 80-20. Comenzando con SQL, la unidad SK hynix Gen4 se mantuvo por debajo de los 100 µs hasta alrededor de 1.75 millones de IOPS y alcanzó un máximo de 2,111,582 113.6 3 IOPS con una latencia de solo 1,602,112 µs. El Gen153.4 alcanzó un máximo de XNUMX XNUMX XNUMX IOPS con una latencia de XNUMX µs.
Para SQL 90-10, las unidades Gen4 comenzaron nuevamente y se mantuvieron por debajo de los 100 µs, esta vez hasta que rompieron alrededor de 1.2 millones de IOPS. Las unidades alcanzaron un máximo de 1,769,165 130.7 3 IOPS con una latencia de 1,441,311 µs antes de una ligera caída. A los SSD Gen156.8 también les fue bien con un pico de XNUMX XNUMX XNUMX IOPS y una latencia de XNUMX µs.
SQL 80-20 vio las unidades Gen4 en el pico SR665 a 1,657,107 141.9 3 IOPS con una latencia de 1,246,384 µs. Las unidades Gen168.9 pudieron alcanzar un pico de XNUMX XNUMX XNUMX IOPS con una latencia de XNUMX µs.
Lo siguiente son nuestras cargas de trabajo de Oracle: Oracle, Oracle 90-10 y Oracle 80-20. Comenzando con Oracle, el Lenovo ThinkSystem SR665 con SSD Gen4 comienza por debajo de los 100 µs y se mantuvo allí hasta que superó los 900 1,484,001 IOPS. Las unidades alcanzaron un máximo de 154.4 3 1,140,743 IOPS con una latencia de 178.8 µs. Para las unidades GenXNUMX, el servidor nos brindó un rendimiento máximo de XNUMX XNUMX XNUMX IOPS y una latencia de XNUMX µs.
Para Oracle 90-10, las unidades Gen4 tuvieron un pico de 1,511,538 110.5 3 IOPS con una latencia de 1,231,073 µs. Las unidades Gen134.8 también tuvieron una buena actuación con un pico de XNUMX XNUMX XNUMX IOPS y una latencia de XNUMX µs.
Oracle 80-20 vio el rendimiento máximo de las unidades Gen4 con 1,369,215 117.7 3 IOPS y una latencia de 1,089,788 µs. Los SSD Gen141.6 alcanzan XNUMX XNUMX XNUMX IOPS y una latencia de XNUMX µs.
A continuación, cambiamos a nuestra prueba de clonación de VDI, completa y vinculada. Para VDI Full Clone (FC) Boot, las unidades SK hynix en el SR665 comenzaron con un rendimiento de latencia inferior a 100 µs hasta 700 1,379,893 IOPS y alcanzaron un máximo de 174.6 3 1,185,395 IOPS y una latencia de 198.1 µs. Las unidades Micron GenXNUMX alcanzaron un máximo de XNUMX XNUMX XNUMX IOPS y una latencia de XNUMX µs antes de dejar algunas.
Con el inicio de sesión inicial de VDI FC, vemos una gran diferencia entre las dos generaciones de SSD PCIe. El Gen4 comenzó con una latencia inferior a 100 µs hasta aproximadamente 400 636,576 IOPS y alcanzó un máximo de 268.3 3 IOPS con una latencia de 324,073 µs. Gen356 alcanzó un máximo de XNUMX XNUMX IOPS con una latencia de XNUMX µs.
VDI FC Monday Login nuevamente vio una diferencia mayor con las unidades Gen4 alcanzando un máximo de 526,115 179.5 IOPS a una latencia de 3 µs y Gen293,012 alcanzando un máximo de 235.5 XNUMX IOPS a XNUMX µs de latencia.
Al cambiar al arranque VDI Linked Clone (LC), el SR665 cargado con las unidades Gen4 alcanzó un máximo de 684,910 149.6 IOPS con una latencia de 3 µs. Las unidades Gen538,330 alcanzaron un pico de 189 XNUMX IOPS con una latencia de XNUMX µs.
El inicio de sesión inicial de VDI LC nuevamente vio una mayor diferencia entre las dos generaciones con Gen4 alcanzando un máximo de 288,211 156 con una latencia de 3 µs y Gen161,852 alcanzando un máximo de 227.8 XNUMX IOPS y una latencia de XNUMX µs.
Finalmente, con VDI LC Monday Login vimos que las unidades Gen4 alcanzaron un pico de 386,865 237 IOPS y una latencia de 3 µs y las unidades Gen181,515 alcanzaron 309.3 XNUMX IOPS con una latencia de XNUMX µs.
Conclusión
Lenovo ThinkSystem SR665 es un servidor 2U que puede albergar y aprovechar dos CPU AMD EPYC Gen2. Ser un servidor basado en AMD EPYC brinda varios beneficios, como la capacidad de usar la tecnología PCIe Gen4 en almacenamiento, GPU y FPGA, así como una RAM más rápida. Desde una perspectiva de hardware, el servidor puede albergar hasta dos CPU AMD EPYC que admitan hasta 64 núcleos y 128 subprocesos con una velocidad de núcleo de hasta 3.7 GHz, hasta 4 TB de RAM (velocidades de hasta 3200 MHz) y tiene 9 ranuras para expansión. .
El SR665 también tiene mucha capacidad de configuración de almacenamiento. El servidor tiene capacidades de bahía de unidad delantera, media y trasera y puede admitir hasta 40 unidades de 2.5 pulgadas. El servidor admite unidades NVMe y SATA. Aprovechando XClarity para la gestión, el SR665 está dirigido a casos de uso de infraestructura de inferencia, virtualización, VDI, HPC e hiperconvergente.
Para probar el rendimiento, ejecutamos tanto nuestro Análisis de carga de trabajo de la aplicación como nuestro VDBench. En nuestro análisis de carga de trabajo de la aplicación, ejecutamos la latencia promedio de SQL Server y nuestras pruebas de Sysbench. En nuestra latencia promedio de SQL Server, el SR665 tenía una latencia agregada de 1 ms. En Sysbench ejecutamos 8VM y 16VM. En OLTP, vimos puntajes agregados de 17,238 8 TPS para 32,649 VM y 16 14.85 para 8 VM, 15.68 ms para 16 VM y 30.27 ms para 8 VM para la latencia promedio, y 30.12 ms para 16 VM y XNUMX ms para XNUMX VM para la latencia en el peor de los casos.
Lenovo ThinkSystem SR665 puede aprovechar los dispositivos PCIe Gen3 y Gen4. Esto significa que los usuarios que buscan implementar un SR665 en sus entornos pueden usar uno u otro. Para dar una mejor visión general de cómo funciona el servidor, pusimos ambos tipos de almacenamiento y lo probamos. Para ser claros, este no es un tipo de prueba de "cuál es mejor". Si bien el almacenamiento Gen4 aún no está saturado con ofertas, generalmente es más rápido que Gen3 en casi todos los casos. Entonces Gen4 será más rápido en la mayoría de los casos. Sin embargo, con ambas unidades probadas, los usuarios sabrán qué esperar con qué tipo de almacenamiento eligen aprovechar, por ejemplo, si están usando Gen3 ahora sabrán qué esperar y si cambian a Gen4 en el futuro sabrán qué los resultados deben ser.
Antes de sumergirse en la sección de rendimiento, es importante tener en cuenta que solo arañamos la superficie de lo que es posible con el SR665. Tenemos una configuración de 16 bahías, que solo admite 8 dispositivos NVMe. Lenovo ofrece muchas opciones de configuración, incluidas algunas que llegan hasta 16 bahías NVMe. Entonces, para un potencial aún mayor, puede especificar más este servidor más allá de lo que pudimos ver.
En nuestra lectura de 4K, vimos que los picos de Gen4 alcanzaron los 3.9 millones de IOPS y los de Gen3 alcanzaron los 4.1 millones de IOPS, con Gen4 a la cabeza con una reducción del 14 % en la latencia, para la escritura de 4K, los picos fueron 2.9 millones de IOPS en Gen4 y 1.2 millones de IOPS en Gen3 , para el trabajo secuencial vimos máximos de 32.6 GB/s para Gen4 y 26.6 GB/s de escritura en 64K de lectura, y en 64K de escritura los picos fueron de 13.3 GB/s para Gen4 y 7 GB/s para Gen3. Nuestra siguiente prueba es SQL, SQL 90-10 y SQL 80-20, donde el servidor nos proporcionó 2.1 millones de IOPS para Gen4 y 1.6 millones de IOPS para Gen3, 1.8 millones de IOPS para Gen4 y 1.4 millones de IOPS para Gen3 con SQL 90-10, y SQL 80-20 alcanzó 1.7 millones de IOPS para Gen4 y 1.2 millones para Gen3.
El siguiente lote de pruebas fueron Oracle, Oracle 90-10 y Oracle 80-20, donde el S665 alcanzó 1.5 millones de IOPS para Gen4 y 1.1 millones de IOPS para Gen3, Oracle 90-10 vio 1.5 millones de IOPS para Gen4 y 1.2 millones de IOPS para Gen3 y 1.4 millones de IOPS para Gen4 y 1.1 millones para Gen3 para Oracle 80-20. La última prueba en la que vimos romper la barrera del millón de IOPS fue el VDI FC Boot con Gen4 (1.4 millones de IOPS) y Gen3 (1.2 millones de IOPS).
El Lenovo ThinkSystem SR665 es un servidor 2U altamente configurable que realmente puede sacar a relucir las capacidades de rendimiento con las CPU AMD EPYC. Ya sea que los usuarios lo empaquen con PCIe Gen3 o Gen4, quedarán impresionados con sus capacidades.
Interactuar con StorageReview
Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed