La línea Pascari Serie X de Phison está diseñada para satisfacer diversas necesidades de almacenamiento empresarial, ofreciendo soluciones personalizadas para cargas de trabajo con uso intensivo de lectura y escritura. El X200P es el modelo de alta capacidad, con soporte para hasta 30.72 TB con una DWPD (escrituras diarias en la unidad). Utiliza PCIe Gen5, TLC NAND y está disponible en formatos U.3, U.2 y E3.S. El X200P está diseñado para una amplia gama de casos de uso, incluyendo la distribución de contenido a gran escala, la inferencia de IA y el archivado de datos fríos.
Phison también ofrece los modelos X200E de alta resistencia, que están optimizados para cargas de trabajo de escritura intensiva, admiten hasta tres DWPD y capacidades que van desde 1.6 TB a 25.6 TB, lo que los hace ideales para bases de datos transaccionales, análisis en tiempo real y procesamiento de registros.
Para esta revisión, Phison envió el modelo X7.68P U.200 de 2 TB. Lo sometimos a nuestro conjunto completo de pruebas de rendimiento empresarial para evaluar su rendimiento bajo presión.
Phison Pascari X200P de grado comercial Especificaciones
| Especificaciones Phison Pascari Serie X200P | 1.92TB | 3.84TB | 7.68TB | 15.36TB | 30.72TB |
|---|---|---|---|---|---|
| Factor de forma | U.2 | ||||
| Fácil de usar | PCIe 5.0 x4, 2×2 | ||||
| NVMe | 2.0 | ||||
| flash NAND | 3D TLC | ||||
| Lectura secuencial (MB / s) | 14,800 | 14,800 | 14,800 | 14,800 | 14,000 (estimado) |
| Escritura secuencial (MB / s) | 4,300 | 8,600 | 8,700 | 8,350 | 7,500 (estimado) |
| Lectura aleatoria de 4K (IOPS) | 2,400K | 3,000K | 3,000K | 3,000K | 2,300 mil (estimado) |
| Escritura aleatoria de 4K (IOPS) | 170K | 380K | 500K | 500K | 283 mil (estimado) |
| Latencia de lectura (μs) | 60 | ||||
| Latencia de escritura (μs) | 10 | ||||
| Potencia activa (W) | <25 | ||||
| Potencia en reposo (W) | 5 | ||||
| Departamento de Policía de Washington (7) | 1 | ||||
| UBER | <1 sector por 1018 lectura de bits | ||||
| MTBF (millones de horas) | 2.5 | ||||
| Garantía limitada (años) | 5 | ||||
| Temperatura de funcionamiento (° C) | 0 a 70 | ||||
| Temperatura de inactividad (°C) | -40 a 85 | ||||
| Dimensiones (mm) | 100.10 (largo) x 69.85 (ancho) x 15.00 (alto) | ||||
| Peso (g) | 188 | 199 | 201 | 168 | <250 |
Construcción y diseño de Pascari X200P de 7.68 TB
Nuestra unidad de prueba es la versión U.7.68 de 2″ de 2.5 TB del X200P, diseñada para aplicaciones de almacenamiento empresarial de alto rendimiento. Utiliza una interfaz PCIe 5.0, totalmente compatible con la especificación NVMe 2.0. La unidad está construida con NAND 3D TLC de alta resistencia y admite capacidades de hasta 30.72 TB.
Físicamente, la X200P presenta un formato U.2.5 estándar de 2″, con medidas de 100.10 mm de largo, 69.85 mm de ancho y 15.00 mm de alto, y un peso de 201 gramos. Todo el conjunto está alojado en una elegante carcasa de aluminio negro con refrigeración pasiva integrada, diseñada para gestionar eficazmente la temperatura bajo cargas de trabajo intensas y sostenidas. La unidad también admite configuraciones E3.S para mayor flexibilidad en entornos de almacenamiento densos.
En cuanto al rendimiento, está clasificado para hasta 14,800 8,700 MB/s de lectura secuencial, 3 MB/s de escritura secuencial y hasta 500 millones de IOPS de lectura aleatoria y 25 5 IOPS de escritura aleatoria. La unidad mantiene un consumo de energía activo inferior a XNUMX W, y en reposo a tan solo XNUMX W, lo que la convierte en una opción eficiente para operaciones sostenidas de alto rendimiento.
Su resistencia es de 1 DWPD, con un MTBF de 2.5 millones de horas y una garantía limitada de 5 años. Está diseñado para cargas de trabajo empresariales 24/7 con un rango de temperatura de funcionamiento de 0 °C a 70 °C.
Phison incluye un conjunto integral de funciones de gestión y protección de datos de nivel empresarial:
- Protección contra pérdida de potencia (PLP)
- ISE (Borrado seguro instantáneo), compatibilidad con TCG Opal 2.0
- Cifrado AES-XTS de 256 bits
- Protección de ruta de datos de extremo a extremo
- Protección de metadatos
- SECDED (Corrección de error único, detección de doble error)
- Desinfectar las operaciones
- NVMe-MI (Interfaz de administración)
- Compatibilidad SMBus
- Admite hasta 128 espacios de nombres
En conjunto, la línea Pascari X200P combina una calidad de construcción robusta de grado industrial con un rendimiento de vanguardia y una confiabilidad de nivel empresarial, lo que la convierte en un candidato sólido para entornos de almacenamiento exigentes como la nube, AI/ML e infraestructuras virtualizadas.
Test de rendimiento
Plataforma de pruebas de conducción
Utilizamos un Dell PowerEdge R760 con Ubuntu 22.04.02 LTS como plataforma de prueba para todas las cargas de trabajo de esta revisión. Equipado con un Cables seriales Gen5 JBOFOfrece una amplia compatibilidad con SSD U.2, E1.S, E3.S y M.2. Nuestra configuración del sistema se describe a continuación:
- 2 procesadores Intel Xeon Gold 6430 (32 núcleos, 2.1 GHz)
- 16 x 64GB DDR5-4400
- Unidad de estado sólido Dell BOSS de 480 GB
- Cables seriales Gen5 JBOF
Comparación de unidades
- Pascari X200P 7.68 TB
- Micron 9550 de 7.68 TB
- SanDisk SN861 de 7.68 TB
- Solidigm PS1010 7.68TB
- Kingston DC3000ME de 7.68 TB
Comparamos el Pascari X200P con un grupo de SSD NVMe PCIe Gen7.68 de 5 TB de tamaño similar que utilizaban memoria flash TLC NAND. La comparación incluyó los modelos Micron 9550, SanDisk SN861, Solidigm PS1010 y Kingston DC3000ME. Estas unidades representan soluciones empresariales de capacidad media diseñadas para entornos de alto rendimiento. Las pruebas se realizaron utilizando una variedad de benchmarks reales y sintéticos, como CDN, FIO y GDSIO, para medir el rendimiento en rendimiento sostenido, latencia, patrones de E/S mixtos y cargas de trabajo aceleradas por GPU. Al estandarizar la capacidad, la interfaz y el tipo de NAND, esta evaluación ofrece una comparación clara del rendimiento del Pascari X200P frente a sus competidores en condiciones exigentes.
Rendimiento de CDN
Para simular una carga de trabajo realista de CDN con contenido mixto, los SSD se sometieron a una secuencia de evaluación comparativa multifase diseñada para replicar los patrones de E/S de servidores perimetrales con alto contenido. El procedimiento de prueba abarca una variedad de tamaños de bloque, tanto grandes como pequeños, distribuidos en operaciones aleatorias y secuenciales, con distintos niveles de concurrencia.
Antes de las pruebas principales de rendimiento, cada SSD completó un llenado total del dispositivo con una escritura secuencial del 100% utilizando bloques de 1 MB. Este proceso utilizó E/S síncrona y una profundidad de cola de cuatro, lo que permitió cuatro trabajos simultáneos. Esta fase garantiza que la unidad alcance un estado estable representativo del uso real. Tras el llenado secuencial, se ejecutó una segunda etapa de saturación de escritura aleatoria de tres horas utilizando una distribución de división por tamaño de bloque ponderada (tamaño de bloque/porcentaje), con una marcada preferencia por las transferencias de 128 K (98.51 %), con contribuciones menores de bloques inferiores a 128 K hasta 8 K. Este paso emula los patrones de escritura fragmentados e irregulares que suelen observarse en entornos de caché distribuida.
El conjunto principal de pruebas se centró en operaciones de lectura y escritura aleatorias a escala para medir el comportamiento de la unidad con profundidades de cola variables y concurrencia de trabajos. Cada prueba se ejecutó durante cinco minutos (300 segundos) y fue seguida por un periodo de inactividad de tres minutos, lo que permitió que los mecanismos de recuperación internos estabilizaran las métricas de rendimiento.
- Se ejecutó con una distribución de tamaño de bloque fija, priorizando 128 K (98.51 %), y el 1.49 % restante de las operaciones se componía de transferencias más pequeñas, de entre 64 K y 8 K. Cada configuración varió entre 1, 2 y 4 trabajos simultáneos, con profundidades de cola de 1, 2, 4, 8, 16 y 32, para perfilar la escalabilidad y la latencia del rendimiento en condiciones típicas de escritura en el borde.
- Se utilizó un perfil de tamaño de bloque muy mixto, que imita la recuperación de contenido de CDN. Este perfil comenzó con un componente dominante de 128K (83.21%), seguido de una cola larga de más de 30 bloques de menor tamaño, desde 4K hasta 124K, cada uno con representación de frecuencia fraccionaria. Esta distribución refleja los diversos patrones de solicitud encontrados durante la obtención de segmentos de vídeo, el acceso a miniaturas y la búsqueda de metadatos. Estas pruebas también se ejecutaron en la matriz completa de recuentos de trabajos y profundidades de cola.
Esta combinación de preacondicionamiento, saturación y pruebas de acceso aleatorio de tamaño mixto está diseñada para revelar cómo los SSD manejan entornos sostenidos similares a CDN, enfatizando la capacidad de respuesta y la eficiencia en escenarios altamente paralelizados y de gran ancho de banda.
Carga de trabajo de CDN Lectura 1
En esta prueba de lectura de un solo trabajo que simula un tráfico de entrega de contenido ligero, el Pascari X200P comienza en la parte baja de la tabla en QD1 con 765 MB/s y en QD2 con 1,403 MB/s. A medida que aumenta la profundidad de la cola, la unidad escala eficientemente, situándose en la mitad de la tabla a través de QD8 y QD16. En QD32, el X200P alcanza los 13,516.8 3000 MB/s, ocupando el tercer lugar en la clasificación general, detrás del Kingston DC9550ME y el Micron 861, y superando al SanDisk SN1010 y al Solidigm PSXNUMX en la parte superior.
Carga de trabajo de CDN Lectura 2
Con dos trabajos aplicados, el Pascari X200P comienza en la parte baja de la clasificación en QD1 con 1,519 MB/s, pero aumenta de forma constante a medida que aumenta la profundidad de la cola. La unidad continúa mejorando en QD2 y QD4, y en QD8, acorta la distancia con los líderes. En QD32, el Pascari X200P termina primero con 15,257.6 9550 MB/s, por delante del Micron 3000, el Kingston DC1010ME, el Solidigm PS861 y el SanDisk SNXNUMX.
Carga de trabajo de CDN Lectura 4
Con cuatro trabajos aplicados, el Pascari X200P vuelve a mostrar un sólido escalamiento en las profundidades de cola. La unidad alcanza una velocidad máxima de 2,982 MB/s en QD1, por debajo de todas las unidades probadas, pero gana terreno de forma constante en QD2 y QD4. En QD8, el X200P empieza a liderar el grupo y mantiene este liderazgo en QD16 y QD32. El Pascari X200P termina primero en la clasificación general en QD32 con 15,257.6 9550 MB/s, por delante del Micron 3000 y el Kingston DCXNUMXME.
Escritura de carga de trabajo de CDN 1
En cuanto a la escritura en CDN, con una tarea aplicada, la Pascari X200P se queda atrás en esta prueba de escritura. La unidad alcanza una velocidad máxima de 1,885 MB/s en QD1 y escala gradualmente hasta QD32, quedando finalmente en cuarto lugar con 5,913 MB/s. La SanDisk SN861 y la Micron 9550 lideran este grupo, seguidas por la Kingston DC3000ME. La Pascari X200P se mantiene estable en cuarto lugar, con un escalado constante, pero muestra un rendimiento de escritura menos agresivo en este escenario de pocos subprocesos.
Con dos tareas aplicadas, la Pascari X200P ocupa el cuarto lugar en esta prueba de escritura de CDN. La unidad alcanza una velocidad máxima de 2,762 MB/s en QD1 y escala hasta QD16, pero presenta cierta disminución en QD32, donde finalmente alcanza una velocidad máxima de 4,585 MB/s. La Micron 9550 y la SanDisk SN861 lideran en este aspecto, seguidas por la Kingston DC3000ME. La X200P mantiene un rendimiento estable en colas intermedias, pero se queda atrás de los líderes en esta carga de trabajo de escritura de dos subprocesos.
Con cuatro tareas aplicadas, el Pascari X200P mantiene un rendimiento intermedio durante la mayor parte de esta prueba de escritura en CDN. La unidad alcanza un rendimiento máximo de 2,845 MB/s en QD1 y se mantiene competitiva con el Kingston DC3000ME y el Solidigm PS1010 en profundidades de cola medias. En QD32, el X200P disminuye ligeramente, terminando en quinto lugar con 3,613 MB/s. El Micron 9550 y el SanDisk SN861 lideran el sector, mientras que el Kingston DC3000ME se mantiene en tercer lugar. En toda la gama, el X200P ofrece un escalado de escritura consistente con cargas moderadas, pero presenta algunas limitaciones con profundidades de cola mayores en esta carga de trabajo de cuatro subprocesos.
Punto de referencia de puntos de control de DLIO
Para evaluar el rendimiento real de las unidades SSD en entornos de entrenamiento de IA, utilizamos la herramienta de referencia Data and Learning Input/Output (DLIO). Desarrollada por el Laboratorio Nacional de Argonne, DLIO está diseñada específicamente para probar patrones de E/S en cargas de trabajo de aprendizaje profundo. Proporciona información sobre cómo los sistemas de almacenamiento gestionan desafíos como la creación de puntos de control, la ingesta de datos y el entrenamiento de modelos. El gráfico a continuación ilustra cómo ambas unidades gestionan el proceso en 36 puntos de control. Al entrenar modelos de aprendizaje automático, los puntos de control son esenciales para guardar el estado del modelo periódicamente, evitando la pérdida de progreso durante interrupciones o cortes de energía. Esta demanda de almacenamiento requiere un rendimiento robusto, especialmente bajo cargas de trabajo sostenidas o intensivas. Utilizamos la versión 2.0 de la prueba de referencia DLIO, publicada el 13 de agosto de 2024.
Para garantizar que nuestra evaluación comparativa reflejara escenarios reales, basamos nuestras pruebas en la arquitectura del modelo LLAMA 3.1 405B. Implementamos puntos de control mediante torch.save() para capturar los parámetros del modelo, los estados del optimizador y los estados de las capas. Nuestra configuración simuló un sistema de ocho GPU, implementando una estrategia de paralelismo híbrido con paralelismo tensorial de 4 vías y procesamiento paralelo de pipeline de 2 vías distribuido entre las ocho GPU. Esta configuración resultó en tamaños de puntos de control de 1,636 GB, representativos de los requisitos de entrenamiento de modelos de lenguaje modernos y de gran tamaño.
En la prueba de referencia DLIO Checkpoint, el SSD Pascari X200P demuestra una excelente capacidad de respuesta inicial, pero presenta tiempos de punto de control más largos a medida que aumenta la carga de trabajo. En las primeras pasadas (puntos de control 1-4), el X200P se mantiene cerca del resto, con un promedio de 467 segundos, a la par de unidades como Solidigm PS1010 y Micron 9550.
Sin embargo, hacia la mitad de la prueba de referencia (puntos de control 5-9), el rendimiento del X200P comienza a divergir. Los tiempos de punto de control de la unidad aumentan drásticamente, alcanzando un máximo de 689.68 segundos en el punto de control 12, el más alto del grupo. En los tres puntos de control finales, el X200P promedia 672 segundos, aproximadamente un 19.3 % más lento que la siguiente unidad más lenta (Kingston DC3000ME) y un 23 % más lento que el promedio del grupo.
Al analizar los promedios de pases, el X200P muestra una clara trayectoria de degradación del rendimiento con el tiempo. En el primer pase, la unidad promedió 1 segundos, situándose ligeramente por detrás del resto de la competencia, pero aún dentro de un margen competitivo.
En la segunda pasada, la X2P se desvió notablemente del grupo, registrando 200 segundos, un 662.04 % más lento que la siguiente unidad más lenta (Kingston DC14.5ME) y un 3000 % más lento que el promedio del grupo en esa pasada. Esta tendencia continuó en la tercera pasada, donde registró 17.4 segundos, manteniéndose como la unidad más lenta. En comparación con el promedio de las otras cuatro unidades (aprox. 3 segundos), la X674.48P fue un 567 % más lenta.
Punto de referencia de rendimiento de FIO
Para medir el rendimiento de almacenamiento de cada SSD según las métricas habituales del sector, utilizamos FIO. Cada unidad se somete al mismo proceso de prueba, que incluye un preacondicionamiento con dos llenados completos de la unidad con una carga de trabajo de escritura secuencial, seguido de la medición del rendimiento en estado estable. A medida que cambia el tipo de carga de trabajo que se mide, realizamos otro preacondicionamiento con ese nuevo tamaño de transferencia.
En esta sección nos centraremos en los siguientes puntos de referencia de FIO:
- 128K secuencial
- 64K aleatorio
- 16K aleatorio
- 4K aleatorio
Precondición secuencial de 128 K (Profundidad de E/S 256 / Número de trabajos 1)
En la prueba de precondición de escritura secuencial de 128K, la X200P obtuvo el tercer puesto, con un ancho de banda promedio de 8,371 MB/s. Si bien mantiene un rendimiento sólido, la unidad presenta una ligera fluctuación recurrente en el ancho de banda, lo que indica una menor consistencia en comparación con las líneas más planas y estables de la Micron 9550 y la Kingston DC3000ME, que la superan.
Latencia de precondición secuencial de 128 K (Profundidad de E/S 256 / Número de trabajos 1)
En la prueba de latencia de precondición de escritura secuencial de 128K, el X200P obtuvo una latencia media de 3.822 ms, lo que lo coloca en tercer lugar. Se sitúa detrás del Micron 9550 y el Kingston DC3000ME. Al igual que su patrón de ancho de banda, el Pascari presenta ligeras fluctuaciones de latencia, lo que indica cierta variabilidad durante las escrituras sostenidas, a la vez que mantiene una sólida posición en el nivel superior.
Escritura secuencial de 128 K (Profundidad de E/S 16 / Número de trabajos 1)
En la prueba de escritura secuencial de 128K, la X200P alcanzó un ancho de banda promedio de 8369.7 MB/s, lo que la coloca en tercer lugar. Se sitúa por detrás de la Micron 9550 y la Kingston DC3000ME, pero por delante de la Solidigm PS1010 y la SanDisk SN861.
Latencia de escritura secuencial de 128 K (Profundidad de E/S 16 / Número de trabajos 1)
En la gráfica de latencia de la prueba de escritura secuencial de 128K, el X200P registró una latencia promedio de 0.238 ms. Esto lo coloca en cuarto lugar, justo detrás del Kingston DC3000ME (0.235 ms) y por delante del Solidigm PS1010 y el SanDisk SN861. Si bien su latencia es inferior a la de la mayoría, aún se encuentra por detrás del mejor rendimiento, el Micron 9550.
Lectura secuencial de 128 K (Profundidad de E/S 64 / Número de trabajos 1)
En la prueba de lectura secuencial de 128K, el X200P obtuvo el primer puesto con un ancho de banda de 14,242.1 1010 MB/s, superando por poco al Solidigm PS9550 y al Micron XNUMX. Lidera el rendimiento de lectura, mostrando un excelente rendimiento con una profundidad de cola alta.
Latencia de lectura secuencial de 128 K (Profundidad de E/S 64 / Número de trabajos 1)
En la gráfica de latencia de la prueba de lectura secuencial de 128K, el X200P registró una latencia promedio de 561.4 ms, lo que lo coloca en segundo lugar en términos de latencia general. Se sitúa ligeramente por detrás del Solidigm PS1010 y supera al Micron 9550, al Kingston DC3000ME y al SanDisk SN861.
Escritura aleatoria 64K
En la prueba de escritura aleatoria de 64K, el X200P muestra un rendimiento general promedio, con cierta fluctuación según la profundidad de cola y la combinación de subprocesos. La unidad no ofrece resultados dentro de un rango específico, pero mantiene un rendimiento generalmente estable entre 2,500 MB/s y 3,600 MB/s en la mayor parte del conjunto de pruebas. Su ancho de banda máximo alcanza los 6,625.92 MB/s con la combinación 32/8 IODepth/NumJobs, lo que lo sitúa entre los puntos más altos de la prueba y le otorga un buen resultado.
Si bien no tiene el rendimiento más consistente en todos los aspectos, la unidad Pascari se mantiene firme en cargas de subprocesos más pesadas y funciona mejor en profundidades de cola más altas.
Latencia de escritura aleatoria de 64K
En la prueba de latencia de escritura aleatoria de 64K, el X200P generalmente muestra una latencia baja con profundidades de cola de ligeras a moderadas, con valores destacados de 0.023 ms a 1/1 y 0.041 ms a 2/1. Sin embargo, con combinaciones de hilos y colas más pesadas, como 16/8 y 8/8, la latencia se dispara significativamente, alcanzando hasta 4.045 ms y 3.019 ms, respectivamente.
Lectura aleatoria 64K
En la prueba de lectura aleatoria de 64K, el X200P ofrece un rendimiento consistentemente bueno en todo el rango de profundidades de cola y número de subprocesos, siguiendo de cerca a las unidades de mayor rendimiento. Si bien no se alza con el primer puesto inicialmente, lidera en QD 16/8 y 32/8, alcanzando un ancho de banda máximo de 14,232 XNUMX MB/s, igualando o superando a la competencia en los niveles de carga más altos. Esto demuestra la capacidad de la unidad para escalar con acceso paralelo intensivo.
Latencia de lectura aleatoria de 64K
En la prueba de latencia de lectura aleatoria de 64K, el X200P mantiene una latencia baja de forma constante en colas con una profundidad y un número de subprocesos de bajos a moderados, manteniéndose típicamente por debajo de 0.2 milisegundos. La latencia comienza a aumentar de forma más notable en QD16/4, alcanzando 0.285 ms, y luego aumenta aún más en QD32/4, alcanzando 0.563 ms. El aumento más significativo se produce en QD32/8, donde la latencia alcanza un máximo de 1.135 ms.
Escritura aleatoria 16K
En la prueba de escritura aleatoria de 16 200 IOPS, el X170P mantiene una sólida posición intermedia en la mayoría de las combinaciones de colas e hilos, ofreciendo entre 190 4 y 4 8 IOPS en configuraciones típicas como 4/4, 8/221 y 32/8. El rendimiento comienza a escalar significativamente con cargas más pesadas, alcanzando 413 32 IOPS en 16/3000 y alcanzando un máximo de 428 XNUMX IOPS en XNUMX/XNUMX. En ese punto, termina justo por debajo del Kingston DCXNUMXME (XNUMX XNUMX IOPS), que lidera por un ligero margen. Este sólido resultado demuestra la capacidad de Pascari para escalar eficazmente bajo la máxima presión de escritura, incluso sin alcanzar el primer puesto.
En la prueba de latencia de escritura aleatoria de 16K, el X200P mantiene una latencia muy baja en la mayoría de las configuraciones, manteniéndose típicamente por debajo de 0.2 ms en configuraciones como 4/4, 8/4 y 2/8. Comienza a subir moderadamente en QD16/4, alcanzando 0.343 ms, y de forma más pronunciada en QD32/4, donde alcanza 0.687 ms. Con las cargas más altas, QD16/16 y QD32/8 muestran mayores aumentos de latencia, hasta 1.068 ms y 1.155 ms, respectivamente. Su latencia máxima se alcanza en QD16/16 con 2.045 ms, justo antes de estabilizarse ligeramente en QD32/16 con 1.238 ms. En general, el Pascari no presenta la curva de latencia más plana, pero mantiene un control razonable, situándose justo detrás de Kingston en la cima de la tabla.
En la prueba de lectura aleatoria de 16 200 lecturas, el X906P ofrece un rendimiento sólido, escalando con fluidez en todas las profundidades de cola y conteos de hilos. Alcanza un máximo de 16 16 IOPS en QD905.9/32, con un resultado casi idéntico de 8 32 IOPS en QD16/902.4. También mantiene un rendimiento sólido en QDXNUMX/XNUMX con XNUMX XNUMX IOPS, lo que lo posiciona firmemente en el grupo de los mejores. Si bien no lidera en profundidades de cola más bajas, Pascari asciende de forma constante y se mantiene entre los mejores bajo presión de lectura sostenida, demostrando un alto rendimiento y un escalado eficaz.
Latencia de lectura aleatoria de 16K
En la prueba de latencia de lectura aleatoria de 16K, la X200P mantuvo una latencia baja y constante en la mayoría de las profundidades de cola y el número de subprocesos. Comenzó con tan solo 0.082 ms en QD1/1 y se mantuvo por debajo de 0.1 ms en muchas combinaciones de rango medio, incluyendo 0.091 ms en QD4/1 y QD4/4, y 0.093 ms en QD2/8. A medida que aumentaba la carga, la latencia comenzó a aumentar ligeramente, alcanzando 0.114 ms en QD16/4 y 0.148 ms en QD16/8. La latencia más alta se observó en QD32/16, con 0.568 ms, donde la unidad mantuvo 902 XNUMX IOPS.
Escritura aleatoria 4K
En nuestras pruebas de escritura aleatoria a 4K, la X200P ofreció resultados estables a partir de la profundidad/Trabajos 1/1. La unidad alcanzó 91.9 IOPS; se ubicó generalmente entre la mitad y la parte baja del grupo en la mayoría de las profundidades de cola y combinaciones de subprocesos. Su rendimiento máximo alcanzó 1.64 millones de IOPS a 32/16, lo cual fue competitivo, pero estuvo por debajo de los mejores resultados de SanDisk y Micron en ciertos puntos.
Latencia de escritura aleatoria de 4K
En latencia de escritura aleatoria 4K, el X200P ofrece un buen rendimiento con cargas de trabajo ligeras, igualando a las unidades de mayor rendimiento con tan solo 0.010 ms. Sin embargo, la latencia aumentó rápidamente con la carga más pesada, alcanzando 0.247 ms en 8/16 y un máximo de 0.541 ms en 16/16, el segundo valor más alto del grupo.
Lectura aleatoria 4K
En la curva de rendimiento de lectura aleatoria de 4K, el X200P comienza en el extremo inferior con 16.6 IOPS a 1/1, pero escala de forma predecible en el rango medio, registrando 365 IOPS a 8/4 y 707 IOPS a 8/8. Demuestra una aceleración constante hacia profundidades de cola más altas, alcanzando 1.2 millones de IOPS a 16/8 y continuando hasta 2 millones de IOPS a 16/16. Cabe destacar que Pascari se sitúa justo por debajo de Kingston con 32/16 y 1.98 millones de IOPS, lo que lo sitúa en la mitad del grupo. La unidad mantiene un fuerte impulso ascendente desde alrededor de 8/16, ascendiendo gradualmente hasta el nivel de millones de IOPS y ofreciendo un rendimiento consistente en las cargas de trabajo más exigentes.
Latencia de lectura aleatoria de 4K
En la prueba de latencia de lectura aleatoria 4K, el X200P mantiene un rendimiento competitivo en toda la curva de carga de trabajo. Comienza con tan solo 0.059 ms a 1/1 y continúa eficientemente con 0.060 ms a 1/4, 0.064 ms a 1/8 y 0.067 ms a 2/8. A medida que aumenta la profundidad de la cola, Pascari se mantiene al nivel de otras unidades empresariales, registrando 0.075 ms a 4/4, 0.089 ms a 8/4 y 0.109 ms a 16/8. Con cargas de trabajo más pesadas, como 32/4, alcanzó 0.136 ms y 0.163 ms a 32/1. La latencia máxima llega a 32/16 con 0.258 ms, ligeramente por encima de Solidigm, pero similar a Kingston y Micron.
Almacenamiento directo de GPU
Una de las pruebas que realizamos en este banco de pruebas fue la prueba Magnum IO GPU Direct Storage (GDS). GDS es una función desarrollada por NVIDIA que permite a las GPU ignorar la CPU al acceder a datos almacenados en unidades NVMe u otros dispositivos de almacenamiento de alta velocidad. En lugar de enrutar los datos a través de la CPU y la memoria del sistema, GDS permite la comunicación directa entre la GPU y el dispositivo de almacenamiento, lo que reduce significativamente la latencia y mejora el rendimiento de los datos.
Cómo funciona el almacenamiento directo en GPU
Tradicionalmente, cuando una GPU procesa datos almacenados en una unidad NVMe, los datos primero deben pasar por la CPU y la memoria del sistema antes de llegar a la GPU. Este proceso genera cuellos de botella, ya que la CPU se convierte en un intermediario, lo que agrega latencia y consume valiosos recursos del sistema. El almacenamiento directo en la GPU elimina esta ineficiencia al permitir que la GPU acceda a los datos directamente desde el dispositivo de almacenamiento a través del bus PCIe. Esta ruta directa reduce la sobrecarga asociada con el movimiento de datos, lo que permite transferencias de datos más rápidas y eficientes.
Las cargas de trabajo de IA, especialmente las que implican aprendizaje profundo, requieren un uso intensivo de datos. El entrenamiento de redes neuronales de gran tamaño requiere el procesamiento de terabytes de datos, y cualquier retraso en la transferencia de datos puede provocar que las GPU se subutilicen y que los tiempos de entrenamiento sean más prolongados. El almacenamiento directo en la GPU aborda este desafío al garantizar que los datos se entreguen a la GPU lo más rápido posible, lo que minimiza el tiempo de inactividad y maximiza la eficiencia computacional.
Además, GDS es particularmente beneficioso para cargas de trabajo que implican la transmisión de grandes conjuntos de datos, como el procesamiento de video, el procesamiento de lenguaje natural o la inferencia en tiempo real. Al reducir la dependencia de la CPU, GDS acelera el movimiento de datos y libera recursos de la CPU para otras tareas, lo que mejora aún más el rendimiento general del sistema.
El rendimiento comienza en 0.56 GiB/s (QD1) y aumenta a 1.80 GiB/s en QD128. El escalamiento es moderado pero constante, lo que refleja un rendimiento aceptable con tamaños de transferencia más pequeños.
El rendimiento mejora notablemente, pasando de 2.39 GiB/s en QD1 a 5.10 GiB/s en QD128. Esto demuestra una mayor eficiencia de escalado y un mayor uso, ya que la unidad gestiona lecturas de mayor tamaño.
El rendimiento comienza en 3.63 GiB/s y aumenta hasta 6.15 GiB/s en QD128. Las ganancias son menos significativas en este rango, pero la unidad ofrece su mayor ancho de banda de lectura absoluto en este rango, lo que la hace ideal para grandes transferencias secuenciales.
Los resultados de latencia de lectura GDSIO del Pascari X200P muestran una clara relación entre el tamaño del bloque, el número de subprocesos y la latencia. Con un tamaño de bloque menor de 16 K y un solo subproceso, la unidad alcanza una latencia promedio de tan solo 0.026 ms. Sin embargo, al escalar a 128 subprocesos con el mismo tamaño de bloque, la latencia aumenta significativamente hasta 1.076 ms. Con bloques de 128 K, la latencia es de 0.050 ms con un solo subproceso y alcanza 3.056 ms con 128 subprocesos. Para bloques mayores de 1 M, la latencia comienza en 0.268 ms con un solo subproceso y alcanza un pico de 20.324 ms con el máximo paralelismo.
Con un tamaño de bloque de 16K, el rendimiento de X200P comienza en 0.58 GiB/s (latencia de 25.17 µs) en QD1 y aumenta a 1.22 GiB/s (latencia de 1.59 ms) en QD128. Esto representa una modesta ganancia de ancho de banda, pero con un aumento pronunciado de la latencia, lo que sugiere una saturación temprana con este pequeño tamaño de E/S.
A 128K, el rendimiento escala mejor, comenzando en 2.63 GiB/s (45.55 µs) y aumentando hasta 4.94 GiB/s (3.16 ms) en QD128. Esto representa un aumento considerable del rendimiento, pero, nuevamente, la latencia escala considerablemente, lo que indica una sobrecarga creciente en condiciones de alta profundidad de cola.
Con un tamaño de bloque de 1 M, la unidad arranca con una velocidad de 4.52 GiB/s (215 µs) y alcanza un máximo de 5.02 GiB/s (24.9 ms) en QD128. La ganancia de rendimiento es mínima en comparación con 128 K, y la latencia en QD128 alcanza la más alta de todas las pruebas, lo que indica una ganancia de eficiencia limitada en transferencias mayores de 128 K en colas profundas.
Los resultados de latencia de escritura GDSIO para el Pascari X200P muestran un patrón de escalado consistente, con una latencia que aumenta a medida que aumenta el tamaño del bloque y el número de subprocesos. Con un tamaño de bloque de 16 K y un solo subproceso, la unidad registra una latencia promedio de 0.025 ms, que asciende hasta 1.595 ms con 128 subprocesos. Con bloques de 128 K, la latencia pasa de 0.046 ms a 3.159 ms en las mismas condiciones. Con el tamaño de bloque más grande, de 1 M, la latencia comienza en 0.215 ms y alcanza los 24.917 ms con la profundidad máxima del subproceso. A pesar del aumento esperado de la latencia, el Pascari X200P lidera el grupo con tamaños de bloque y subprocesos más altos, manteniendo la latencia más baja bajo cargas de trabajo de escritura paralelas intensas.
Conclusión
El SSD Phison Pascari X200P de 7.68 TB es una unidad de nivel empresarial con TLC NAND y optimizada para rendimiento PCIe Gen5, ideal para cargas de trabajo de propósito general y con gran cantidad de contenido. Está diseñado para entornos donde el alto rendimiento, la alta escalabilidad y la flexibilidad de implementación son prioritarios sobre la optimización específica para hiperescala. Compatible con los formatos U.2, U.3 y E3.S, junto con funciones como protección contra cortes de energía, cifrado AES-XTS de 256 bits y gestión NVMe-MI, el X200P proporciona una base sólida para la infraestructura de almacenamiento.
En términos de rendimiento, el X200P destaca en escenarios secuenciales y de lectura intensiva, situándose constantemente entre los mejores en pruebas de 128 K y 64 K, y escalando eficazmente con cargas de trabajo de CDN. Las pruebas FIO confirman su solidez en lecturas secuenciales y muestran un rendimiento competitivo en cargas de trabajo de lectura aleatoria. Si bien se sitúa por detrás de unidades de gama alta como Micron y SanDisk en condiciones de escritura intensiva y alta concurrencia, su comportamiento de escritura predecible y eficiente lo hace ideal para una amplia gama de implementaciones empresariales de nivel medio.
Las pruebas GDSIO resaltan aún más las fortalezas de la unidad en aplicaciones orientadas al rendimiento. La X200P mantiene una excelente latencia con tamaños de bloque más pequeños y es líder en accesos paralelos intensivos con transferencias de bloques grandes. Si bien la latencia aumenta con colas más profundas, el ajuste de Phison garantiza que la unidad se mantenga estable y responda con rapidez bajo presión constante.
En general, el Pascari X200P es un SSD empresarial completo con un rendimiento sólido y un conjunto de características adaptadas a las cargas de trabajo del mundo real. Será interesante ver si Phison logra evolucionar de una empresa centrada en el controlador a una que ofrezca una amplia gama de soluciones de unidades integradas. Hasta el momento, el X200P parece ser un inicio prometedor en esa dirección.







Amazon