StorageReview.com

Análisis del Micron 9550 MAX: Rendimiento equilibrado para IA, bases de datos y análisis

Empresa  ◇  SSD

En julio de 2024, Micron anunció la Familia de SSD NVMe 9550, una plataforma Gen5 diseñada para la próxima ola de implementaciones de almacenamiento empresarial. En ese momento, cubrimos el lanzamiento y destacamos los dos niveles de producto: el PRO para entornos de lectura intensiva y el MAX para cargas de trabajo de uso mixto. Desde entonces, Micron nos ha proporcionado una muestra del 9550 MAX, lo que nos permite someter a este miembro de la familia de mayor resistencia a nuestras exhaustivas pruebas de laboratorio empresarial.

Micron 9550 Max 12.8 TB frontal.

El 9550 MAX está diseñado específicamente para cargas de trabajo de uso mixto donde las lecturas y escrituras están equilibradas, lo que hace que la resistencia y el rendimiento sostenido sean tan importantes como el rendimiento bruto. Esto lo hace ideal para bases de datos, análisis, canales de entrenamiento de IA/ML y aplicaciones financieras que requieren tasas de transacciones altas y continuas.

Las capacidades varían de 3.2 TB a 25.6 TB, cubriendo una amplia gama de escenarios de implementación, desde unidades de aplicaciones más pequeñas hasta consolidación de alta capacidad en nodos de almacenamiento densos. El 9550 MAX está disponible en formatos U.2 y E3.S, lo que ofrece a las empresas flexibilidad en la transición de una infraestructura establecida de 2.5 pulgadas a plataformas EDSFF de última generación.

En comparación con la línea PRO, que prioriza el rendimiento de lectura con menor resistencia, la serie MAX ofrece hasta tres escrituras de unidad al día (DWPD), lo que la convierte en la opción ideal para entornos con cargas de trabajo de escritura intensiva o equilibradas. Las líneas Pro y Max se complementan con rendimiento PCIe Gen5, NVMe 2.0 y compatibilidad con OCP 2.0-2.5; los SSD de la serie 9550 destacan por su diseño para ofrecer velocidad y fiabilidad a gran escala.

Situado por encima de la Serie Micron 7600 Los SSD, que atienden cargas de trabajo de centros de datos convencionales con una latencia y eficiencia energética excepcionales, la serie 9550 ofrece mayor resistencia, opciones de capacidad más amplias y un rendimiento sostenido superior para entornos con uso intensivo de datos que requieren máxima consistencia y rendimiento bajo carga.

Especificaciones del Micron 9550 MAX

La siguiente tabla describe los SSD de la serie Micron 9550 MAX, destacando sus factores de forma, métricas de rendimiento, clasificaciones de resistencia y opciones de capacidad en los modelos U.2 y E3.S.

Especificaciones del Micron 9550 MAX (U.2 / E3.S)
Caso de uso Uso mixto (3 escrituras de unidad por día)
Interfaz / Protocolo PCIe Gen5 x4, NVMe v2.0b
NAND Micron 232 capas 3D TLC NAND
Cumplimiento de OCP OCP 2.0 (r21)
Fiabilidad MTTF: 2.0 millones de horas a 0–55 °C; 2.5 millones de horas a 0–50 °C | UBER < 1 sector por cada 1017 bits leídos | garantía de 5 años
Potencia (RMS promedio) ≤ 18 W lectura secuencial; ≤ 18 W escritura secuencial
Temperatura de Funcionamiento 0-70 ° C
Capacidades y rendimiento (9550 MAX)
de Carga Sec. Lectura (MB/s) Sec. Escritura (MB/s) Lectura de rands (K IOPS) Escritura aleatoria (K IOPS) 70/30 lectura/escritura (K IOPS)
3.2TB 14,000 10,000 3,000 540 640
6.4TB 14,000 10,000 3,300 640 720
12.8TB 14,000 10,000 3,300 820 1,000
25.6TB 14,000 10,000 3,300 1,200 1,300
Latencia típica (µs)
Leer 60
Escribe. 15
Resistencia (total de bytes escritos, TB)
de Carga RND TBW SEC TBW Notas
3.2TB 17,520 37,200 MÁXIMO (3 DWPD)
6.4TB 35,040 74,200 MÁXIMO (3 DWPD)
12.8TB 70,080 143,100 MÁXIMO (3 DWPD)
25.6TB 140,160 282,600 MÁXIMO (3 DWPD)

Diseño y construcción del Micron 9550 MAX

Micron posiciona el 9550 MAX como un SSD empresarial de uso mixto, diseñado para cargas de trabajo de lectura/escritura equilibradas a 3 DWPD. Combina una interfaz PCIe Gen5 x4 con compatibilidad con el protocolo NVMe 2.0b y la tecnología NAND 3D TLC de 232 capas de Micron para lograr una latencia constante bajo carga sostenida.

Físicamente, la familia de unidades abarca los formatos U.2 y E3.S, lo que ofrece a los operadores la flexibilidad de integrar las bahías NVMe de 2.5 pulgadas actuales o migrar a implementaciones EDSFF más densas sin cambiar de plataforma. Esta versatilidad se ve reforzada por la compatibilidad con OCP 2.0 y 2.5, lo que alinea al 9550 MAX con las expectativas mecánicas, térmicas y de gestión habituales en los servidores empresariales y de hiperescala modernos.

Micron 9550 Max trasero.

Desde el punto de vista energético y térmico, Micron especifica ≤18 W RMS promedio para operaciones secuenciales de lectura y escritura, lo que se ajusta perfectamente a los límites de refrigeración típicos de la bahía frontal para sistemas U.2 y E3.S y ayuda a mantener la consistencia del rendimiento durante cargas de trabajo prolongadas y mixtas. La temperatura de funcionamiento está entre 0 y 70 °C, lo que ofrece a los administradores un margen de maniobra cómodo en una variedad de diseños de flujo de aire del chasis.

Los objetivos de fiabilidad reflejan el enfoque de resistencia de la línea MAX: MTTF de hasta 2.5 millones de horas (2.0 millones de horas a temperatura ambiente más alta), UBER < 1e-17 y una garantía de cinco años. Las capacidades abarcan desde 3.2 TB hasta 25.6 TB, y Micron publica cifras de latencia típica bajas (60 µs de lectura / 15 µs de escritura), junto con índices de rendimiento Gen5 (hasta 14 GB/s de lectura / 10 GB/s de escritura) y cifras sustanciales de E/S mixtas. Estas características son más importantes que las especificaciones máximas en implementaciones reales de uso mixto.

Rendimiento máximo del Micron 9550

Plataforma de pruebas de conducción

Elegimos un Dell PowerEdge R760 con Ubuntu 22.04.02 LTS como plataforma de prueba para todas las cargas de trabajo en esta revisión. Equipado con Cables serie Gen5 JBOF, Ofrece amplia compatibilidad con SSD U.2, E1.S, E3.S y M.2. La configuración de nuestro sistema de prueba se describe a continuación.

  • 2 procesadores Intel Xeon Gold 6430 (32 núcleos, 2.1 GHz)
  • 16 x 64GB DDR5-4400
  • Unidad de estado sólido Dell BOSS de 480 GB
  • Cables seriales Gen5 JBOF
Comparación de unidades

Punto de referencia de puntos de control de DLIO

Para evaluar el rendimiento real de las unidades SSD en entornos de entrenamiento de IA, utilizamos la herramienta de referencia Entrada/Salida de Datos y Aprendizaje (DLIO). Desarrollada por el Laboratorio Nacional de Argonne, DLIO está diseñada específicamente para probar patrones de E/S en cargas de trabajo de aprendizaje profundo. Proporciona información sobre cómo los sistemas de almacenamiento gestionan desafíos como la creación de puntos de control, la ingesta de datos y el entrenamiento de modelos. El gráfico a continuación ilustra cómo ambas unidades gestionan el proceso en 36 puntos de control. Al entrenar modelos de aprendizaje automático, los puntos de control son esenciales para guardar periódicamente el estado del modelo, evitando la pérdida de progreso durante interrupciones o cortes de energía. Esta demanda de almacenamiento requiere un rendimiento robusto, especialmente bajo cargas de trabajo sostenidas o intensivas. Utilizamos la versión 2.0 de la prueba de referencia DLIO, publicada el 13 de agosto de 2024.

Para garantizar que nuestra evaluación comparativa reflejara escenarios reales, basamos nuestras pruebas en la arquitectura del modelo LLAMA 3.1 405B. Implementamos puntos de control mediante torch.save() para capturar los parámetros del modelo, los estados del optimizador y los estados de las capas. Nuestra configuración simuló un sistema de ocho GPU, implementando una estrategia de paralelismo híbrido con paralelismo tensorial de 4 vías y procesamiento paralelo de pipeline de 2 vías distribuido entre las ocho GPU. Esta configuración generó puntos de control de 1,636 GB, lo que refleja los requisitos para el entrenamiento de modelos de lenguajes modernos de gran tamaño.

En esta prueba de rendimiento, el Micron 9550 MAX de 12.8 TB se impuso como líder indiscutible. Durante la ejecución completa de 18 puntos de control, mantuvo los tiempos de finalización promedio más bajos, de entre 457 y 575 s. La unidad ofreció una estabilidad excepcional con una variación mínima entre los puntos de control, lo que indica un diseño de firmware equilibrado y optimizado para cargas de trabajo mixtas de lectura y escritura.

Muy de cerca, el Micron 7600 MAX de 6.4 TB registró tiempos de entre 459 y 586 s. Si bien su promedio se mantuvo competitivo, la unidad presentó una breve fluctuación de rendimiento entre los puntos de control 4 y 7 antes de estabilizarse hacia el final de la prueba. A pesar de ello, se mantuvo firme en el nivel superior, mostrando una excelente eficiencia para cargas de trabajo sostenidas de IA y HPC.

El Micron 9550 de 7.68 TB tuvo un rendimiento ligeramente inferior al de los dos modelos insignia, con resultados que oscilaron entre 458 y 582 Mbps. Mantuvo un escalamiento constante y se mantuvo competitivo frente a las unidades MAX de gama alta, lo que reforzó la solidez de la plataforma Micron 9550.

Entre los demás SSD empresariales probados, el Solidigm PS1010, el SanDisk SN861 y el Kingston DC3000ME ocuparon el rango medio, completando la mayoría de los puntos de control entre 450 y 610 segundos. El Pascari X200P mostró el rendimiento menos consistente, superando los 690 segundos a mitad de la ejecución antes de estabilizarse hacia el final.

En esta prueba de promedio de aprobados, la unidad Solidigm PS1010 de 7.68 TB lideró el grupo con los tiempos de finalización promedio más rápidos, con un rango de entre 458 y 564 segundos en las tres pasadas. La unidad mostró una excelente consistencia, manteniendo una baja variabilidad entre ejecuciones y demostrando una alta eficiencia con cargas de trabajo de E/S mixtas.

El SanDisk SN861 7.68TB le siguió de cerca, registrando resultados casi idénticos con promedios entre 461 s y 553 s, lo que confirma su capacidad para ofrecer un rendimiento de puntos de control confiable con una degradación mínima.

Le siguió el Micron 9550 de 7.68 TB, con un tiempo de respuesta entre 461 y 559 s en las mismas pasadas. Su rendimiento se mantuvo muy competitivo, situándose justo por detrás de los líderes, manteniendo un escalado estable y un rendimiento sólido en todas las iteraciones.

El Micron 9550 MAX de 12.8 TB y el Micron 7600 MAX de 6.4 TB completaron los cinco primeros puestos, registrando promedios ligeramente más altos de 462–555 s y 464–567 s, respectivamente. Ambos mantuvieron un comportamiento constante a lo largo del tiempo, pero quedaron por detrás del Micron de menor capacidad y de las dos unidades líderes de solidigma y SanDisk.

Entre el resto del grupo, destacan el Kingston DC3000ME y Pascari X200P registró los tiempos totales más altos, con un promedio de 580 s y 660 s, respectivamente. Estos resultados reflejan una mayor brecha de rendimiento en condiciones de puntos de control constantes, especialmente para cargas de trabajo que requieren escrituras frecuentes en almacenamiento persistente.

Punto de referencia de rendimiento de FIO

Para medir el rendimiento de almacenamiento de cada SSD según las métricas habituales del sector, utilizamos FIO. Cada unidad se somete al mismo proceso de prueba, que incluye un preacondicionamiento con dos llenados completos de la unidad con una carga de trabajo de escritura secuencial, seguido de una medición del rendimiento en estado estable. A medida que cambia el tipo de carga de trabajo medida, ejecutamos otro preacondicionamiento con ese nuevo tamaño de transferencia.

En esta sección nos centraremos en los siguientes puntos de referencia de FIO:

  • 128K secuencial
  • 64K aleatorio
  • 16K aleatorio
  • 4K aleatorio

Escritura secuencial de 128 K (Profundidad de E/S 16 / Número de trabajos 1)

Al pasar a la prueba de escritura secuencial de 128K, los resultados fueron casi idénticos a los observados durante el preacondicionamiento. El Micron 9550 Max (12.8 TB) volvió a liderar con un amplio margen, manteniendo 10 957,9 MB/s, manteniéndose firme en la cima del grupo. El Kingston DC3000ME (7.68 TB) le siguió en segundo lugar con 8,477.4 MB/s, seguido de cerca por el Pascari X200P (7.68 TB), con 8,369.7 MB/s.

Más atrás quedaron el Solidigm PS1010 (7,126.5 MB/s) y el SanDisk DC SN861 (7,116.5 MB/s), mientras que el Micron 7600 Max (6.4 TB) se ubicó en la parte inferior de la tabla con 6,960.6 MB/s.

Latencia de escritura secuencial de 128 K (Profundidad de E/S 16 / Número de trabajos 1)

En cuanto a la latencia, la prueba de escritura secuencial de 128K se ejecutó a una profundidad de E/S de 16 con un solo trabajo, en comparación con la profundidad de cola de 256 utilizada en el preacondicionamiento. Como era de esperar, la latencia se redujo significativamente en todas las unidades. El Micron 9550 Max (12.8 TB) volvió a liderar la clasificación con la latencia más baja, de 0.18 ms, lo que demuestra su capacidad para mantener un rendimiento máximo con un retraso mínimo.

El Kingston DC3000ME (7.68 TB) le siguió de cerca con 0.24 ms, seguido por el Pascari X200P (7.68 TB) con 0.24 ms. Por su parte, el Solidigm PS1010 (0.28 ms) y el SanDisk DC SN861 (0.28 ms) obtuvieron resultados similares, mientras que el Micron 7600 Max (6.4 TB) se ubicó en la parte final con 0.29 ms.

Lectura secuencial de 128 K (Profundidad de E/S 64 / Número de trabajos 1)

En cuanto a las lecturas, la prueba de lectura secuencial de 128K arrojó resultados mucho más similares entre las unidades de la competencia. La Pascari X200P (7.68 TB) se alzó con el primer puesto con 14 242,1 MB/s, justo por delante de la Solidigm PS1010 (7.68 TB) con 14 163,3 MB/s, y la Micron 9550 Max (12.8 TB) con 14 047,5 MB/s. Estas tres unidades se mantuvieron prácticamente dentro de un margen estrecho, mostrando mínimas diferencias reales en el rendimiento de lectura secuencial sostenida.

El Kingston DC3000ME (7.68 TB) se quedó ligeramente por detrás del trío líder, con 13 513,8 MB/s, mientras que el SanDisk DC SN861 (7.68 TB) alcanzó los 12 631,2 MB/s. En el extremo inferior, el Micron 7600 Max (6.4 TB) alcanzó los 11 240,5 MB/s, siendo el único disco del grupo que no superó los 12 GB/s.

Latencia de lectura secuencial de 128 K (Profundidad de E/S 64 / Número de trabajos 1)

En cuanto a la latencia, la prueba de lectura secuencial de 128K (IODepth 64 / NumJobs 1) puso de manifiesto la estrecha competencia entre los discos de mayor rendimiento. El Pascari X200P (7.68 TB) lideró con 0.56 ms, prácticamente igualado por el Solidigm PS1010 (0.56 ms) y el Micron 9550 Max (12.8 TB) con 0.57 ms. Estos tres discos duros estaban prácticamente empatados, lo que refleja la estrecha diferencia observada en el rendimiento.

El Kingston DC3000ME (7.68 TB) le siguió con 0.59 ms, mientras que el SanDisk DC SN861 (7.68 TB) alcanzó los 0.63 ms. El Micron 7600 Max (6.4 TB) quedó en último lugar con 0.71 ms, en consonancia con su menor ancho de banda de lectura secuencial.

Escritura aleatoria 64K

En la prueba de escritura aleatoria de 64K, el Micron 9550 Max (12.8 TB) demostró un amplio rango de rendimiento, desde mínimos de alrededor de 2.45 GB/s hasta un máximo de 10.6 GB/s, con un promedio de 7.34 GB/s en todo el rango. Esto no solo lo convirtió en el de mejor rendimiento, sino también en el único disco que superó consistentemente los 10 GB/s con mayor profundidad de cola. El Micron 7600 Max (6.4 TB) mostró una consistencia sólida, pero con un límite de rendimiento más bajo, que osciló entre 2.39 GB/s y 6.8 GB/s, con un promedio de 5.16 GB/s. Esto lo situó firmemente en el segundo puesto, por detrás del 9550 Max, pero por delante de la mayoría de sus competidores en la tabla.

En cuanto al resto del mercado, el Kingston DC3000ME (7.68 TB) y el SanDisk DC SN861 (7.68 TB) se situaron en el rango de 4-6 GB/s, generalmente competitivos, pero incapaces de alcanzar los niveles de Micron. El Solidigm PS1010 (7.68 TB) y el Pascari X200P (7.68 TB) se situaron en el nivel inferior, a menudo agrupados en el rango de 2-4 GB/s, muy por detrás de ambos discos Micron.

Latencia de escritura aleatoria de 64K

En términos de latencia, el Micron 9550 Max (12.8 TB) presentó los resultados más consistentes, con un promedio de tan solo 0.30 ms y picos inferiores a 1.71 ms, incluso con colas de mayor profundidad. El Micron 7600 Max (6.4 TB) le siguió con un promedio ligeramente superior de 0.41 ms y un máximo de 2.3 ms, manteniendo un control razonable bajo carga. El Kingston DC3000ME y el SanDisk DC SN861 se ubicaron en el rango medio, con latencias que generalmente oscilaban entre 0.05 ms y 2.7 ​​ms. Al mismo tiempo, el Pascari X200P y el Solidigm PS1010 mostraron la volatilidad más significativa, alcanzando 4.1 ms y 6.0 ms, respectivamente, con colas de mayor profundidad.

Lectura aleatoria 64K

En la prueba de lectura aleatoria de 64K, ambas unidades Micron obtuvieron resultados excelentes con promedios muy similares. El Micron 9550 Max (12.8 TB) varió de 0.49 GB/s en el extremo inferior a un máximo de 13.7 GB/s, con un promedio de 6.96 GB/s. El Micron 7600 Max (6.4 TB) mostró un perfil similar, comenzando ligeramente por encima de 0.61 GB/s, alcanzando un máximo de 11.0 GB/s y promediando 6.94 GB/s en todo el análisis.

En el gráfico general, observamos que unidades como la Solidigm PS1010 y la Pascari X200P alcanzaron velocidades de 13-14 GB/s con mayor profundidad de cola, lo que les otorga una ligera ventaja en rendimiento máximo sobre las Micron. La Kingston DC3000ME le siguió de cerca en el rango de 12-13 GB/s, mientras que la SanDisk DC SN861 se situó ligeramente por debajo, estabilizándose en torno a los 12.3 GB/s.

Latencia de lectura aleatoria de 64K

En la prueba de lectura aleatoria de 64K, el Micron 9550 Max (12.8 TB) mantuvo una latencia alta, con un promedio de 0.25 ms, con mínimos de 0.12 ms y picos de hasta 1.14 ms bajo cargas más pesadas. El Micron 7600 Max (6.4 TB) registró valores muy similares, con un promedio de 0.26 ms, con mínimos de 0.10 ms y un ligero aumento hasta un máximo de 1.42 ms. Ambos Micron ofrecieron una latencia estable en general, manteniéndose en un nivel muy similar al del resto de la gama durante gran parte de la prueba.

Al analizar la gráfica, el Solidigm PS1010 y el Pascari X200P mostraron latencias ligeramente superiores en ráfagas, generalmente entre 0.1 y 1.2 ms. Al mismo tiempo, el Kingston DC3000ME y el SanDisk DC SN861 les siguieron de cerca en el mismo rango, alcanzando un máximo de poco más de 1.2 ms. Entre todas las unidades probadas, los Micron se mantuvieron competitivos y consistentes, con solo pequeñas diferencias que los diferenciaban del resto de las unidades de gama alta.

Escritura secuencial de 16K

En la prueba de escritura secuencial de 16K, el Micron 9550 Max (12.8 TB) volvió a dominar, con un rendimiento que osciló entre 0.85 GB/s en el extremo inferior inicial y un pico de 10.7 GB/s, con un promedio de 7.75 GB/s en todo el rango. El Micron 7600 Max (6.4 TB) le siguió con un rendimiento más estrecho, que osciló entre 0.84 GB/s y 6.8 GB/s, con un promedio de 5.63 GB/s, situándose claramente por detrás del 9550, pero aún por delante de la mayoría de las demás unidades.

En el gráfico general, la Kingston DC3000ME y la Pascari X200P se agruparon en el rango de 6-8 GB/s con mayor profundidad de cola, intercambiando golpes, pero generalmente por detrás de la 9550 Max. La Micron 7600 Max también se mantuvo en este nivel, pero se inclinó hacia el extremo inferior del rango. La Solidigm PS1010 se ubicó ligeramente por debajo, en el rango de 5-6 GB/s, mientras que la SanDisk DC SN861 mostró el rendimiento más bajo en general, cayendo a menudo por debajo de los 4 GB/s e incluso llegando a 1 GB/s.

Latencia de escritura secuencial de 16 K

En la prueba de latencia de escritura secuencial de 16K, el Micron 9550 Max (12.8 TB) volvió a demostrar una excelente capacidad de respuesta, con una latencia promedio de 0.12 ms, que descendió a 0.018 ms y alcanzó un máximo de 0.75 ms bajo carga. El Micron 7600 Max (6.4 TB) le siguió con un promedio ligeramente superior de 0.18 ms, un mínimo similar de 0.018 ms y picos que alcanzaron los 1.15 ms.

En el gráfico, la Kingston DC3000ME y la Pascari X200P se mantuvieron en el rango medio, con una latencia general de entre 0.05 y 1.2 ms, mientras que la Solidigm PS1010 subió ligeramente, superando los 1.5 ms en las colas más profundas. La SanDisk DC SN861 mostró el perfil de latencia más bajo en general, superando los 2.0 ms bajo estrés.

Lectura secuencial de 16K

En la prueba de lectura secuencial de 16K, ambas unidades Micron ofrecieron un rendimiento sólido con perfiles ligeramente diferentes. El Micron 9550 Max (12.8 TB) varió de 1.02 GB/s en el extremo inferior a un pico de 12.5 GB/s, con un rendimiento promedio de 5.59 GB/s. El Micron 7600 Max (6.4 TB) comenzó de forma similar con 1.03 GB/s, alcanzó un máximo de 11.0 GB/s y promedió ligeramente más alto, 6.08 GB/s, lo que lo coloca ligeramente por delante del 9550 Max en términos de consistencia durante todo el ciclo de ejecución.

En la tabla general, la Kingston DC3000ME se impuso en la cima del grupo con mayor profundidad de cola, superando brevemente los 12.8 GB/s, mientras que la Pascari X200P y la Solidigm PS1010 también alcanzaron los 12 GB/s. La SanDisk DC SN861 se quedó ligeramente por debajo del grupo, situándose justo por debajo de los 10 GB/s en el extremo superior.

Latencia de lectura secuencial de 16 K

En la prueba de lectura secuencial de 16K, el Micron 9550 Max (12.8 TB) mostró un perfil de latencia que osciló entre 0.015 ms en el extremo inferior y un pico de 0.78 ms, con un promedio de 0.15 ms en todo el barrido. El Micron 7600 Max (6.4 TB) tuvo un rendimiento ligeramente más ajustado, comenzando con 0.014 ms, alcanzando un pico de 0.71 ms y promediando 0.13 ms, lo que le otorga una ligera ventaja en eficiencia sobre su hermano mayor.

Al observar el gráfico, la Kingston DC3000ME y la Pascari X200P siguieron un patrón similar en el rango medio, con un promedio de 0.1-0.2 ms y picos justo por encima de 0.8 ms. La Solidigm PS1010 fue ligeramente más errática, alcanzando 0.75 ms, mientras que la SanDisk DC SN861, en general, siguió de cerca a la Kingston, pero mostró mayor variabilidad a medida que aumentaba la profundidad de la cola.

Escritura aleatoria 16K

En la prueba de lectura aleatoria de 16 000 IOPS, el Micron 9550 Max (12.8 TB) alcanzó un pico de poco más de 900 000 IOPS, con mínimos de alrededor de 18 000 IOPS y un rendimiento promedio de aproximadamente 420 000 IOPS en todo el barrido. El Micron 7600 Max (6.4 TB) demostró mayor consistencia, pero su escalabilidad máxima fue ligeramente inferior, alcanzando un pico de aproximadamente 720 000 IOPS. Su rango de valores osciló entre 17 000 IOPS en el punto más bajo y aproximadamente 350 000 IOPS en total.

Según la tabla, tanto el Pascari X200P como el Solidigm PS1010 tuvieron una escalabilidad impresionante. El Pascari se acercó al Micron 9550 Max en el extremo superior, alcanzando un máximo justo por debajo de las 900 000 IOPS, mientras que el Solidigm se mantuvo en el rango de las 820 000-850 000 IOPS. El Kingston DC3000ME inicialmente siguió de cerca a los líderes, pero alcanzó un máximo de alrededor de las 620 000 IOPS a medida que avanzaba la escalabilidad. El SanDisk DC SN861 se quedó atrás, terminando justo por encima de las 500 000 IOPS.

Latencia de escritura aleatoria de 16K

En la prueba de escritura aleatoria de 16K, el Micron 9550 Max (12.8 TB) volvió a mostrar la mayor disciplina de latencia, manteniéndose entre 0.015 ms y 0.77 ms, con un promedio de 0.13 ms en todo el barrido. El Micron 7600 Max (6.4 TB) fue ligeramente menos agresivo, con un rango de 0.016 ms a 1.26 ms y un promedio de 0.21 ms. Esto posicionó al 9550 Max como el más eficiente bajo presión, mientras que el 7600 Max mantuvo un perfil competitivo en comparación con el resto del grupo.

Según el gráfico, la Kingston DC3000ME y la Pascari X200P se situaron en el nivel medio, con tiempos de ejecución típicos de entre 0.2 y 1.5 ms, mientras que la SanDisk DC SN861 experimentó picos de velocidad más pronunciados con colas de alta profundidad, superando los 1.8 ms. La Solidigm PS1010 fue la que más sufrió en esta prueba, alcanzando latencias muy superiores a 3 ms en sus peores momentos, lo que demostró dificultades para mantener la consistencia a gran escala.

Lectura aleatoria 16K

En la prueba de lectura aleatoria de 16 000 IOPS, el Micron 9550 Max (12.8 TB) ofreció un amplio rango de rendimiento, comenzando con aproximadamente 16 700 IOPS y escalando hasta un pico de 904 000 IOPS, con un rendimiento promedio de 433 000 IOPS en todo el barrido. El Micron 7600 Max (6.4 TB) mostró un escalamiento ligeramente menor, pero una alta consistencia, que osciló entre 17 100 IOPS y 720 000 IOPS, con un promedio general de 362 000 IOPS.

Al comparar competidores, el Pascari X200P igualó al Micron 9550 prácticamente a la par, alcanzando un pico de 900 000 IOPS casi idéntico. El Solidigm PS1010 se quedó ligeramente por detrás, alcanzando un máximo de 820 000-850 000 IOPS, mientras que el Kingston DC3000ME se estabilizó antes, alcanzando un máximo de alrededor de 620 000 IOPS. El SanDisk DC SN861 completó el grupo con poco más de 500 000 IOPS, mostrando un escalado más débil a mayor profundidad de cola.

Latencia de lectura aleatoria de 16K

En la prueba de lectura aleatoria de 16 000 MB, el Micron 9550 Max (12.8 TB) presentó un perfil de latencia que osciló entre 0.073 ms en el extremo inferior y 0.57 ms en el pico, con un promedio de 0.12 ms durante toda la ejecución. El Micron 7600 Max (6.4 TB) tuvo un rendimiento similar, pero alcanzó valores ligeramente superiores a escala, comenzando con 0.065 ms, alcanzando un máximo de 0.71 ms y con un promedio de 0.14 ms. Ambos Micron ofrecieron respuestas estables y de baja latencia, siendo el 9550 Max el que mostró una curva más cerrada a mayor profundidad de cola.

Del resto de la competencia, la Pascari X200P y la Kingston DC3000ME se mantuvieron competitivas en la banda media, generalmente entre 0.1 y 0.3 ms durante gran parte de la prueba, antes de acercarse a los 0.8 ms en el extremo superior. La SanDisk DC SN861 y la Solidigm PS1010 mostraron una mayor variabilidad, con Solidigm en particular mostrando picos cercanos a los 0.6 y 0.65 ms, lo que las coloca por detrás de las líderes Micron y Pascari.

Escritura aleatoria 4K

En la prueba de escritura aleatoria de 4K, el Micron 9550 Max (12.8 TB) lideró la clasificación, con entre 320 000 y 1.56 000 IOPS, con un escalado constante en todo el barrido y una gran consistencia a altas profundidades de cola. El Micron 7600 Max (6.4 TB) le siguió de cerca, mostrando una aceleración impresionante más allá del rango medio y alcanzando un pico ligeramente superior de 1.78 000 IOPS, lo que lo convierte en el escalador más agresivo de esta prueba. Ambas unidades Micron demostraron un control de clase empresarial bajo carga, con una progresión fluida y mínimas caídas entre combinaciones de subprocesos.

Entre sus competidores, el SanDisk DC SN861 y el Kingston DC3000ME tuvieron un buen rendimiento, pero quedaron por detrás de las unidades Micron, alcanzando máximos cercanos a 1.3 millones de IOPS y 960 000 IOPS, respectivamente. El Pascari X200P mostró una consistencia moderada, alcanzando cerca de 1.6 millones de IOPS en su punto máximo, mientras que el Solidigm PS1010 se quedó considerablemente atrás, sin lograr mantener la estabilidad por encima de 550 000 IOPS en la mayoría de los escenarios de alta profundidad.

Latencia de escritura aleatoria de 4K

En la prueba de escritura aleatoria 4K, el Micron 9550 Max (12.8 TB) mostró un excelente control de latencia, que osciló entre tan solo 0.013 ms en el extremo inferior y 0.37 ms en el pico, con un promedio de 0.06 ms en todo el barrido. El Micron 7600 Max (6.4 TB) le siguió de cerca, comenzando con 0.012 ms y subiendo hasta 0.29 ms, con un promedio general de 0.05 ms. Ambas unidades ofrecieron tiempos de respuesta consistentemente bajos, y el 9550 Max mostró una estabilidad ligeramente superior con mayores profundidades de cola.

Según el gráfico, la Kingston DC3000ME y la Pascari X200P mostraron una mayor variabilidad, manteniéndose frecuentemente en el rango de 0.1-0.5 ms y alcanzando picos superiores a 0.5 ms en el extremo superior. La SanDisk DC SN861 se mantuvo en un rango similar, con algunos picos a mitad de carrera. Al mismo tiempo, la Solidigm PS1010 fue la que más sufrió, mostrando volatilidad y picos superiores a 0.7 ms, lo que la situó por detrás del resto del grupo en cuanto a capacidad de respuesta.

Lectura aleatoria 4K

En la prueba de lectura aleatoria 4K, el Micron 9550 Max (12.8 TB) alcanzó 2.2 millones de IOPS, con un promedio de aproximadamente 1.3 millones de IOPS en todo el barrido. El Micron 7600 Max (6.4 TB) le siguió de cerca, alcanzando un máximo de poco más de 2.0 millones de IOPS y un promedio de 1.4 millones de IOPS, mostrando un excelente escalamiento bajo carga. Ambas unidades Micron se mostraron muy competitivas, compitiendo por el liderato según la profundidad de la cola y el número de subprocesos.

El gráfico muestra que la SanDisk DC SN861 alcanzó su máximo rendimiento, superando los 2.5 millones de IOPS, pero también mostró una variabilidad significativa, con caídas bajo cargas pesadas. Tanto la Pascari X200P como la Kingston DC3000ME se mantuvieron en el rango de los 2.0 millones de IOPS en su punto máximo, ofreciendo resultados sólidos, pero menos consistentes que los de Micron. La Solidigm PS1010 mostró un buen escalamiento en el rango medio, pero se estancó antes, cerrando cerca de los 2.1 millones de IOPS.

Latencia de lectura aleatoria de 4K

En los resultados de latencia de escritura aleatoria 4K, el Micron 9550 Max (12.8 TB) mantuvo uno de los tiempos de respuesta más bajos bajo carga, con un promedio de 0.03-0.05 ms al inicio del barrido y un aumento gradual hasta alcanzar los 0.35-0.38 ms en condiciones de máxima presión. El Micron 7600 Max (6.4 TB) le siguió de cerca, con una variación ligeramente mayor, pero aún competitivo, alcanzando un máximo de poco menos de 0.30 ms en su rendimiento máximo.

En comparación, la SanDisk DC SN861 y la Pascari X200P mostraron picos de latencia más pronunciados a medida que aumentaba el rendimiento, con SanDisk superando los 0.40 ms y Pascari superando los 0.50 ms en las profundidades de cola más altas. La Kingston DC3000ME se quedó atrás, alcanzando un pico ligeramente superior a los 0.50 ms, pero manteniéndose relativamente constante con cargas de trabajo más bajas. La Solidigm PS1010 fue la que más se retrasó, con subidas iniciales ya superiores a los 0.10 ms y un pico de 0.73 ms, lo que refleja inestabilidad bajo una mayor presión de escritura aleatoria.

Almacenamiento directo de GPU

Una de las pruebas que realizamos en este banco de pruebas fue la prueba Magnum IO GPU Direct Storage (GDS). GDS es una función desarrollada por NVIDIA que permite a las GPU ignorar la CPU al acceder a datos almacenados en unidades NVMe u otros dispositivos de almacenamiento de alta velocidad. En lugar de enrutar los datos a través de la CPU y la memoria del sistema, GDS permite la comunicación directa entre la GPU y el dispositivo de almacenamiento, lo que reduce significativamente la latencia y mejora el rendimiento de los datos.

Cómo funciona el almacenamiento directo en GPU

Tradicionalmente, cuando una GPU procesa datos almacenados en una unidad NVMe, estos deben pasar primero por la CPU y la memoria del sistema antes de llegar a la GPU. Este proceso genera cuellos de botella, ya que la CPU actúa como intermediaria, lo que aumenta la latencia y consume valiosos recursos del sistema. El almacenamiento directo en la GPU elimina esta ineficiencia al permitir que la GPU acceda a los datos directamente desde el dispositivo de almacenamiento a través del bus PCIe. Esta ruta directa reduce la sobrecarga del movimiento de datos, lo que permite transferencias más rápidas y eficientes.

Las cargas de trabajo de IA, especialmente las que implican aprendizaje profundo, requieren un uso intensivo de datos. El entrenamiento de redes neuronales de gran tamaño requiere el procesamiento de terabytes de datos, y cualquier retraso en la transferencia de datos puede provocar que las GPU se subutilicen y que los tiempos de entrenamiento sean más prolongados. El almacenamiento directo en la GPU aborda este desafío al garantizar que los datos se entreguen a la GPU lo más rápido posible, lo que minimiza el tiempo de inactividad y maximiza la eficiencia computacional.

Además, GDS es particularmente beneficioso para cargas de trabajo que implican la transmisión de grandes conjuntos de datos, como el procesamiento de video, el procesamiento de lenguaje natural o la inferencia en tiempo real. Al reducir la dependencia de la CPU, GDS acelera el movimiento de datos y libera recursos de la CPU para otras tareas, lo que mejora aún más el rendimiento general del sistema.

Lectura secuencial GDSIO completa

En nuestras pruebas de lectura secuencial GDSIO, comenzando con transferencias de bloques pequeños a 16 K, el rendimiento del Micron 9550 Max comenzó en torno a 0.5 GiB/s con profundidades de cola bajas y aumentó gradualmente hasta aproximadamente 1.9 GiB/s en QD128. El paso a tamaños de bloque de 128 K aumentó considerablemente el rendimiento, alcanzando 1.4 GiB/s en QD1 y alcanzando un máximo de alrededor de 5.3 GiB/s en QD64.–128. En las pruebas de bloque de 1 M, la unidad mostró sus resultados más sólidos, escalando de 2.0 GiB/s en colas poco profundas a 6.1 GiB/s en QD128, mostrando un crecimiento consistente y una eficiencia sólida en todas las profundidades.

En comparación con el Micron 7600 Max, el 9550 Max siguió una trayectoria similar, con un rendimiento máximo ligeramente superior. El 7600 Max comenzó sus pruebas de 16 000 rpm con alrededor de 0.5 GiB/s y alcanzó un máximo cercano a los 1.9 GiB/s, prácticamente idéntico al del 9550 Max con cargas de trabajo de bloques pequeños. A 128 000 rpm, comenzó con mayor potencia, con 2.2 GiB/s, pero alcanzó un máximo cercano a los 5.0 GiB/s, mientras que sus resultados de bloques de 1 millón alcanzaron alrededor de los 5.6 GiB/s. En resumen, ambas unidades ofrecieron un escalado predecible y un sólido rendimiento secuencial, con el 9550 Max manteniendo una ligera pero constante ventaja con mayores profundidades de cola y tamaños de bloque más grandes.

Al observar otras unidades empresariales probadas, incluidas las Pascari X200P, Kingston DC3000ME, solidigma Los resultados de rendimiento de PS1010 y SanDisk DC SN861 oscilaron generalmente entre 5.0 GiB/s y 6.1 GiB/s en el extremo superior. El rango en todos los modelos se mantuvo relativamente estrecho, lo que demuestra la eficiencia con la que los SSD empresariales actuales gestionan las cargas de trabajo directas de la GPU. En este grupo, las unidades Micron se posicionaron consistentemente entre las de mejor rendimiento, con el 9550 Max manteniendo una ligera ventaja con mayor profundidad de cola. En cambio, los demás les siguieron de cerca, con una diferencia de apenas unas décimas de GiB/s, dependiendo de la intensidad de la carga de trabajo.

Latencia de lectura secuencial GDSIO

En pruebas de latencia de lectura secuencial, ambas unidades Micron demostraron tiempos de respuesta ajustados y consistentes en todos los tamaños de bloque y profundidades de cola. El Micron 9550 Max comenzó con una latencia muy baja en tamaños de bloque más pequeños, con alrededor de 31 µs en QD1 para transferencias de 16 K, que aumentaron gradualmente hasta aproximadamente 1.0 ms en QD128. En tamaños de bloque de 128 K, la latencia osciló entre 86 µs y 3.0 ms, mientras que en cargas de trabajo de 1 M aumentó de 482 µs en colas poco profundas a 20.6 ms en QD128.

El Micron 7600 Max mostró un patrón similar, comenzando ligeramente más rápido en los bloques más pequeños, con 27 µs en QD1, y terminando aproximadamente en 1.0 ms en QD128. En bloques de 128 000, la latencia osciló entre 54 µs y 3.1 ms, y en bloques de 1 000 000, entre 391 µs en QD1 y 22.3 ms en QD128.

Al analizar el grupo de prueba completo, todas las unidades mantuvieron una paridad cercana en tamaños de bloque pequeños y medianos antes de aumentar de forma natural a cargas de trabajo de 1 millón a medida que aumentaba la profundidad de la cola. Los Micron 9550 Max y 7600 Max se mantuvieron agrupados de forma compacta, lo que refleja un escalado de latencia estable y una variación mínima en comparación con sus pares. Pascari X200P, Kingston DC3000ME y solidigma PS1010.

Escritura secuencial continua GDSIO

En las pruebas de escritura secuencial GDSIO, el Micron 9550 Max ofreció un rendimiento consistentemente alto en todas las cargas de trabajo. Con tamaños de bloque más pequeños de 16 000 bytes, el rendimiento comenzó alrededor de 0.5 GiB/s y ascendió a aproximadamente 1.5 GiB/s en QD32, antes de disminuir ligeramente en la profundidad de cola más alta. Con bloques de 128 000 bytes, el rendimiento mejoró significativamente, pasando de 2.3 GiB/s en QD1 a un pico de 5.3 GiB/s alrededor de QD32.–64. Los resultados del bloque de 1M se mantuvieron en el mismo rango de alto rendimiento, comenzando cerca de 4.7 GiB/s y manteniéndose entre 5.0 GiB/s y 5.4 GiB/s en profundidades de cola moderadas, para luego descender ligeramente en QD128.

El Micron 7600 Max siguió una curva prácticamente idéntica, comenzando con 0.5 GiB/s a 16 000 rpm y alcanzando un máximo de 1.5 GiB/s para transferencias más pequeñas. A 128 000 rpm, mostró un ascenso constante de 2.2 GiB/s a 5.2 GiB/s, mientras que las cargas de trabajo de bloques de 1 M mantuvieron un rendimiento entre 4.1 GiB/s y 5.4 GiB/s en colas de profundidad media. Ambas unidades mostraron una excelente consistencia, con mínimas variaciones de rendimiento incluso al aumentar la profundidad de la cola, lo que pone de manifiesto la eficiencia del ajuste del firmware de Micron en cargas de trabajo directas a la GPU.

Al analizar el conjunto de datos más amplio, el rendimiento general de todas las unidades empresariales probadas convergió dentro de un estrecho rango de 4.0 a 5.4 GiB/s en carga máxima. Unidades como la Pascari X200P y la Micron 7600 Max se mantuvieron cerca del rango superior, mientras que otras, como la Kingston DC3000ME, la Solidigm PS1010 y la SanDisk DC SN861, les siguieron de cerca.

Latencia de escritura secuencial GDSIO

En pruebas de latencia de escritura secuencial, ambas unidades Micron demostraron tiempos de respuesta estables y predecibles que escalaban linealmente con la profundidad de la cola y el tamaño del bloque. El Micron 9550 Max comenzó con un rendimiento de baja latencia casi idéntico al del 7600 Max en transferencias más pequeñas, registrando 30 µs en QD1 para bloques de 16 K y escalando a 2.7µs en QD128. En bloques de 128 K, la latencia aumentó gradualmente de 52µs a 3.2µs, mientras que las cargas de trabajo de bloques de 1 M mostraron 207µs en QD1 y alcanzaron aproximadamente 40µs en la profundidad de cola más profunda.

El Micron 7600 Max mostró el mismo comportamiento con una ligera variación. Registró 30 µs en QD1 para bloques de 16 K y alcanzó un máximo de 1.5 ms en QD128. A 128 K, la latencia osciló entre 54 µs y 3.0 ms, y para transferencias de 1 M, aumentó de 237 µs en QD1 a 40.7 ms en QD128.

En la comparación de grupos, todas las unidades mostraron un comportamiento consistente al aumentar la profundidad de la cola, manteniendo patrones de escalado similares. Las unidades Micron se alinearon estrechamente con las Pascari X200P y Kingston DC3000ME en la mayor parte de la gama, y ​​ambos exhibieron excelentes características de baja latencia en tamaños de bloques más pequeños, al tiempo que mantuvieron aumentos predecibles en condiciones de escritura secuencial más pesadas.

Conclusión

El Micron 9550 Max continúa la sólida trayectoria de Micron en el sector de los SSD empresariales, ofreciendo un equilibrio perfecto entre resistencia, rendimiento y eficiencia para las cargas de trabajo actuales con uso intensivo de datos. Diseñado para entornos de uso mixto, demostró su capacidad para mantener un alto rendimiento tanto en operaciones secuenciales como aleatorias, con estabilidad de latencia y resistencia de escritura de hasta 3 DWPD.

Durante nuestras pruebas, el 9550 Max demostró su capacidad para gestionar pipelines empresariales y de IA/ML con facilidad, ofreciendo un escalado predecible tanto en entornos de almacenamiento directo por GPU, FIO como DLIO. Su perfil de rendimiento se mantiene constante en diversas cargas de trabajo y profundidades de cola, lo que refleja la madurez de la plataforma Gen5 de Micron y la optimización del firmware. En comparación con el 7600 Max, el 9550 Max ofrece una mejora pequeña pero apreciable en rendimiento y capacidad de respuesta, especialmente a mayores profundidades, manteniendo las mismas características de baja latencia que hacen de ambos modelos fuertes competidores en sus respectivos niveles.

Micron 9550 Max vista trasera lateral y plana.

Desde la perspectiva de la implementación, la flexibilidad de los formatos U.2 y E3.S garantiza una adopción fluida en infraestructuras tanto heredadas como de nueva generación. La eficiencia energética y la conformidad con OCP mejoran aún más su idoneidad para implementaciones de centros de datos densos.

En general, el Micron 9550 Max destaca como un SSD empresarial integral que combina un rendimiento sostenido en cargas de trabajo mixtas con eficiencia operativa y fiabilidad. Representa un claro avance para las organizaciones que buscan compatibilidad con PCIe Gen5 sin sacrificar la estabilidad ni la longevidad, lo que lo convierte en uno de los SSD de uso mixto más potentes. NVMe Soluciones actualmente disponibles.

Página de Producto

Interactuar con StorageReview

Boletín informativo | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed

Dylan Dougherty

Administrador de redes K-12 con experiencia en redes Cisco, seguridad IP y soluciones NAC. Entusiasta de UniFi y laboratorio doméstico, que prueba y revisa productos de redes y seguridad.