Inicio Empresa Revisión de la tarjeta RAID Broadcom MegaRAID 9670W-16i

Revisión de la tarjeta RAID Broadcom MegaRAID 9670W-16i

by Brian Beeler

La serie MegaRAID 9600 es un adaptador de almacenamiento de tercera generación compatible con unidades SATA, SAS y NVMe, diseñado para ofrecer el mejor rendimiento y disponibilidad de datos posibles para los servidores de almacenamiento. En comparación con la generación anterior, la serie 9600 ofrece un aumento de 2 veces en el ancho de banda, un aumento de más de 4 veces en las IOP, una reducción de 25 veces en la latencia de escritura y un aumento de 60 veces en el rendimiento durante las reconstrucciones.

La serie MegaRAID 9600 es un adaptador de almacenamiento de tercera generación compatible con unidades SATA, SAS y NVMe, diseñado para ofrecer el mejor rendimiento y disponibilidad de datos posibles para los servidores de almacenamiento. En comparación con la generación anterior, la serie 9600 ofrece un aumento de 2 veces en el ancho de banda, un aumento de más de 4 veces en las IOP, una reducción de 25 veces en la latencia de escritura y un aumento de 60 veces en el rendimiento durante las reconstrucciones. Como es habitual, la familia de tarjetas 9600 incluye varias configuraciones. En esta revisión, analizamos el Broadcom MegaRAID 9670W-16i, que admite 16 puertos internos.

MegaRAID 9670W-16i se basa en SAS4116W RAID-on-Chip (RoC), que es un factor clave en las mejoras de rendimiento en todos los ámbitos. Los usuarios pueden conectar hasta 240 dispositivos SAS/SATA o 32 dispositivos NVMe por controlador con la interfaz x16 PCIe Gen 4.0.

La serie 9600 también cuenta con arranque seguro de hardware y atestación SPDM, protección de equilibrio y rendimiento para RAID 0, 1, 5, 6, 10, 50 y 60 y JBOD. La protección de caché flash de CacheVault es una opción para aquellos que desean más protección.

¿Por qué hardware RAID para NVMe?

RAID de hardware ha sido la opción preferida para ofrecer almacenamiento resistente desde antes de que los administradores de TI de hoy en día tuvieran canas. Pero a medida que el almacenamiento se ha vuelto más rápido, específicamente los SSD NVMe, las tarjetas RAID han tenido problemas para mantenerse al día. Entonces, cuando Broadcom nos presentó una revisión del MegaRAID 9670W-16i, teníamos algunas dudas. La verdad es que hay un costo de rendimiento para una tarjeta RAID y, como resultado, lo hemos evitado durante muchos años. Dicho esto, el valor de lo que ofrece RAID de hardware es innegable.

Para los entornos que no ofrecen opciones de software RAID, que incluyen VMware ESXi, los clientes no pueden agregar almacenamiento o proteger el almacenamiento fácilmente con RAID. Si bien vSAN se puede implementar fácilmente a nivel de clúster, no se puede usar para un nodo ESXi independiente en el perímetro. En este caso, los clientes pueden desear los beneficios de reunir varios SSD en RAID para obtener un almacén de datos más grande o cierta resiliencia de datos.

Incluso en Windows, que ofrece espacios de almacenamiento para servidores individuales, ciertos tipos de RAID de software, como RAID5/6, sufren un impacto significativo. En el pasado, el hardware RAID ha sido una solución eficaz para cerrar la brecha de rendimiento de los dispositivos SAS y SATA, el MegaRAID 9670W tiene como objetivo cambiar eso para los dispositivos NVMe.

Banco de pruebas Broadcom MegaRAID 9670W-16i

Para esta revisión, trabajamos con Micron, Supermicro y Broadcom para armar un banco de pruebas. El servidor es un sistema Supermicro AS-1114S-WN10RT 1U con CPU AMD Milan 7643 y 128 GB de DDR4. Dentro de ese sistema se encuentra el 9670W-16i, cableado a dos NVMe JBOD de 8 bahías. Dentro de cada uno hay 8 SSD x Micron 7450 formateados con una capacidad de 6.4 TB.

Para medir el rendimiento de las unidades a través del adaptador MegaRAID 9670W-16i, los puntos de referencia se dividieron en las siguientes configuraciones. El primero incluía una configuración JBOD que medía cada unidad fuera de RAID (pero aún a través de las configuraciones HBA), RAID10 y luego RAID5. Estas configuraciones se guiaron a través de un proceso de secuencias de comandos para preacondicionar el flash, ejecutar las pruebas para las que fueron acondicionadas y pasar a la siguiente combinación de preacondicionamiento/carga de trabajo. Este proceso, en total, midió alrededor de 16 horas.

  • Tiempo total de ejecución de la prueba de alrededor de 16 horas en este orden:
  • Preacondicionamiento secuencial (~2:15)
  • Pruebas secuenciales en 16x JBOD, 2x 8DR10, 2x 8DR5 (~2 horas)
  • Preacondicionamiento aleatorio: 2 partes (~4:30)
  • Pruebas aleatorias óptimas en 16x JBOD, 2x 8DR10, 2x 8DR5 (~3 horas)
  • Pruebas de reconstrucción aleatorias en 1x 16DR10, 1x 16DR5 (~2:30)
  • Latencia de escritura aleatoria para optimizar y reconstruir para 1x 16DR5 (~1:40)

La primera sección de métricas de rendimiento se centra en el ancho de banda a través de la tarjeta en los modos JBOD, RAID10 y RAID5. Con el MegaRAID 9670W-16i que ofrece un ancho de ranura x16 PCIe Gen4, su rendimiento máximo será de alrededor de 28 GB/s en una dirección, y ahí es donde la ranura Gen4 alcanza su punto máximo. En comparación, un SSD U.2 Gen4 se conecta a través de una conexión x4 y puede alcanzar un pico de alrededor de 7 GB/s, y aquí es donde la mayoría de las unidades empresariales pueden alcanzar el máximo para cargas de trabajo de lectura.

Dicho esto, el MegaRAID 9670W satura por completo la ranura a la que está conectado. Al observar el rendimiento de lectura, la configuración JBOD viene con 28.3 GB/s con RAID10, y RAID5 está un poco por debajo, midiendo 28 GB/s. Cuando cambiamos nuestro enfoque para escribir el rendimiento, la línea base de JBOD es 26.7 GB/s, mientras que la configuración RAID10 llegó con 10.1 GB/s y RAID5 con 13.2 GB/s. Cuando observamos una división 50:50 del tráfico simultáneo de lectura y escritura, la configuración JBOD midió 41.6 GB/s, RAID10 a 19.6 GB/s y RAID5 a 25.8 GB/s.

carga de trabajo JBOD (MB/s) RAID 10: óptimo (MB/s) RAID 5: óptimo (MB/s)
Lecturas secuenciales máximas 28,314 28,061 28,061
Escrituras secuenciales máximas 26,673 10,137 13,218
Máximo 50:50 lecturas secuenciales: escrituras 41,607 19,639 25,833

Cuando cambiamos nuestro enfoque a transferencias aleatorias de bloques pequeños, vemos que MegaRAID 9670W se mantuvo bastante bien en rendimiento de lectura en comparación con la cifra de referencia de JBOD de 7 millones de IOPS. Esta velocidad se redujo a aproximadamente la mitad (3.2 millones de IOPS) durante una operación de reconstrucción si un SSD fallaba en el grupo RAID. En cuanto al rendimiento de escritura aleatoria, la referencia de JBOD midió 6.3 millones de IOPS frente a 2.2 millones de RAID10 y 1 millón de RAID5. Esas cifras no experimentaron una caída considerable cuando un SSD del grupo falló y la tarjeta RAID se vio obligada a reconstruirse. En esa situación, RAID10 no cambió, aunque RAID5 cayó de 1M a 788k IOPS.

En la carga de trabajo 4K OLTP con una combinación de rendimiento de lectura y escritura, la línea base de JBOD midió 7.8 millones de IOPS frente a RAID10 con 5.6 millones de IOPS y RAID5 con 2.8 millones de IOPS. Durante una reconstrucción, RAID10 disminuyó de 5.6 millones a 2.4 millones de IOPS y RAID5 disminuyó de 2.8 millones a 1.8 millones de IOPS.

carga de trabajo JBOD RAID 10: óptimo RAID 5: óptimo RAID 10: reconstrucción RAID 5: reconstrucción
Lecturas aleatorias de 4 KB (IOP) 7,017,041 7,006,027 6,991,181 3,312,304 3,250,371
Escrituras aleatorias (IOP) de 4 KB 6,263,549 2,167,101 1,001,826 2,182,173 788,085
OLTP de 4 KB (IOP) 7,780,295 5,614,088 2,765,867 2,376,036 1,786,743

Otro aspecto importante del rendimiento de RAID es qué tan bien se comporta el almacenamiento entre las condiciones óptimas y reconstruir el rendimiento si falla una unidad. Si el rendimiento o la latencia tuvieran un impacto masivo, la capacidad de respuesta de la aplicación puede convertirse en un problema. Con ese fin, nos enfocamos en la latencia de escritura aleatoria de RAID5 4K en los modos óptimo y de reconstrucción. En todo el espectro, la latencia se mantuvo bastante similar, que es exactamente lo que desea ver en un sistema de almacenamiento de entorno de producción.

No solo evaluamos el rendimiento general de cada modo a través de métricas de rendimiento puntuales, que también incluyeron el rendimiento de la tarjeta RAID durante una operación de reconstrucción, sino que también realizamos pruebas para determinar el tiempo total que llevó la reconstrucción. Aquí, en RAID10, sacar una SSD de 6.4 TB del grupo RAID y volver a agregarla tomó 60.7 minutos para RAID10 con una velocidad de reconstrucción de 10.4 min/TB. El grupo RAID5 tardó 82.3 minutos con una velocidad de 14.1 Min/TB.

Consideraciones Finales:

Para ser honesto, llegamos a esta revisión con la cabeza ligeramente inclinada y una ceja levantada. Hace tiempo que no escuchamos una propuesta de tarjeta RAID para SSD NVMe, fuera de la clase emergente de soluciones diseñadas en torno a las GPU. Entonces, tuvimos que hacer la pregunta fundamental: ¿el RAID de hardware puede ser algo para los SSD NVMe?

La respuesta es claramente sí. El rendimiento de PCIe Gen4 permite que la tarjeta RAID MegaRAID 9670W-16i se mantenga al día con los SSD modernos en una variedad de cargas de trabajo. Sí, algunas áreas, como el ancho de banda, estarán limitadas con menos carriles PCIe, pero nuevamente, la mayoría de los entornos de producción no se encuentran en esos niveles.

En el ancho de banda máximo, vimos que MegaRAID 9670W-16i llevó las cosas hasta el límite x16 PCIe Gen4 de 28 GB/s en lectura y ofreció hasta 13 GB/s en RAID5 en ancho de banda de escritura. En cuanto al rendimiento, el rendimiento de lectura aleatoria de 4K alcanzó un máximo de 7 millones de IOPS con un rango de escritura de 1 a 2.1 millones de IOPS entre RAID5 y RAID10. Para implementaciones que buscan consolidar flash en volúmenes más grandes o sortear sistemas que no admiten software RAID, el MegaRAID 9670W tiene mucho que ofrecer.

Si le encantan los adaptadores de almacenamiento, está a punto de obtener más de este tipo de cobertura. Ya estamos explorando los servidores de última generación, como Dell PowerEdge R760, que ofrece una configuración de tarjeta RAID doble basada en el mismo silicio que esta tarjeta. En el caso del R760, Dell conecta 8 SSD NVMe a cada tarjeta, lo que nos brinda una solución empresarial más sólida que la que probamos aquí para la validación. Así que hay mucho más por venir ahora que parece que las tarjetas RAID están de vuelta en el menú para servidores con SSD NVMe.

Página del producto Broadcom 9670W-16i

Interactuar con StorageReview

BOLETÍN  | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed