StorageReview.com

Controlador SSD Phison E28: Velocidades excepcionales de Gen5 y gestión de energía mejorada

SSD cliente  ◇  Consumidor

El nuevo controlador PS5028-E28 (“E28”) de Phison es la plataforma SSD cliente PCIe Gen5 de segunda generación de la compañía, diseñada para extraer el máximo rendimiento de la interfaz x32 de 4 GT/s. Fabricado con un proceso de 6 nm, el E28 combina la memoria NAND KIOXIA BiCS8 (hasta 2,400 MT/s por canal) con una arquitectura de tres núcleos que incluye dos procesadores Phison CoX dedicados que gestionan la memoria flash y la calidad de servicio (QoS).

Marca Phison PS5028-E28

La muestra que tenemos es un modelo preliminar. Phison nos envió una unidad de diseño de referencia con firmware beta avanzado, casi listo para producción. Según nuestra experiencia, las unidades con firmware inicial ya funcionan a un pequeño porcentaje de su velocidad final; sin embargo, podemos esperar una ligera mejora una vez que Phison ajuste la recolección de elementos no utilizados y la limitación térmica. El objetivo de Phison es proporcionarnos algo concreto para probar mientras finalizan y ajustan todo. Por lo tanto, este artículo es un... primera vista en lugar de un veredicto completo.

Rendimiento potencial y eficiencia energética del Phison PS5028-E28

Phison anuncia impresionantes velocidades máximas de 14.9 GB/s de lectura y 14 GB/s de escritura, con un rendimiento aleatorio que alcanza hasta 2.6 millones de IOPS de lectura y 3.0 millones de IOPS de escritura. Las capacidades abarcarán 1 TB, 2 TB y 4 TB en el conocido formato M.2 2280 de una sola cara. El controlador es compatible con todas las funciones de NVMe 2.0, además de una granularidad del estado de energía hasta un estado de reposo L1.2 inferior a 5 mW.

El año pasado, Gen4 E26 Se alcanzaron velocidades máximas de lectura de aproximadamente 12 GB/s, velocidades de escritura de 11 GB/s y entre 1.5 y 2.0 millones de IOPS en un proceso de 12 nm. La transición de Phison a Gen5 mediante un proceso de 6 nm, un paralelismo de canal más amplio y una lógica de estado de energía renovada permite al E28 ofrecer velocidades secuenciales entre un 25 % y un 30 % más altas y un rendimiento de E/S aleatoria hasta un 50 % superior, a la vez que reduce el consumo de energía tanto en activo como en reposo. Según las pruebas de rendimiento internas de Phison, el E28 supera al SM2508 en eficiencia energética, lo que podría ser crucial para entornos con restricciones térmicas, como ordenadores de sobremesa compactos o portátiles.

Ranura M.28 instalada en Phison E2

Si bien no validamos estas cifras de forma independiente en nuestras pruebas de potencia, Phison ha compartido datos internos que comparan su diseño de referencia E28 con el que denominan "Competidor S" (posiblemente el SM2508 de SMI). Según los gráficos de Phison, el E28 consume considerablemente menos energía durante cargas de trabajo secuenciales y aleatorias. Por ejemplo, en lecturas y escrituras secuenciales sostenidas en QD8/T1, Phison informa de ventajas en el consumo de energía de aproximadamente 1 vatio con respecto al controlador de la competencia.

También se observan márgenes similares en cargas de trabajo aleatorias QD32/T16, donde el E28 mantiene una potencia inferior en todos los casos. Phison busca cerrar la brecha de eficiencia generada durante el auge del SM2508 y, a juzgar por sus cifras, parece estar logrando un progreso significativo.

Los portátiles de los clientes se beneficiarán de estas mejoras en la eficiencia energética. Phison afirma que aproximadamente la mitad de los portátiles que se enviarán este año contarán con una ranura compatible con Gen5, a pesar de que la mayoría de los fabricantes de equipos originales (OEM) aún utilizan unidades Gen4 para gestionar los costes y la gestión térmica. Dado que la potencia en reposo del E28 se especifica por debajo de los 5 mW en L1.2, finalmente parece posible instalar una unidad de 14 GB/s en estaciones de trabajo móviles sin sobrecargar la batería.

Construcción de diseño de referencia Phision E28

En general, el E28 cuenta con una típica construcción de SSD Gen5 de alto rendimiento, optimizada para el ancho de banda y la eficiencia térmica. Como puede ver a continuación, un controlador Gen5 integrado en un nodo de 6 nm está emparejado con un único módulo DRAM SK hynix (H5AG46C8Y8R), lo cual es crucial para mantener un rendimiento constante bajo carga, especialmente con cargas de trabajo de alta capacidad o cargas de trabajo aleatorias.

Parte trasera del Phison E28

Junto a la DRAM se encuentran dos paquetes de memoria flash NAND denominados "TBi08G1BSA2", cada uno con una matriz NAND TLC KIOXIA BiCS1 de 8 TB, lo que suma un total de 2 TB. Estos chips pueden alcanzar velocidades de hasta 2400 MT/s. El diseño de PCB de una sola cara hace que la unidad sea ideal para sistemas con espacio limitado, como portátiles y ordenadores de sobremesa compactos. Phison también ha indicado que los próximos diseños serán compatibles con LPDDR5, lo que ayudará a reducir aún más el consumo de energía. Este diseño también beneficia la gestión térmica, permitiendo soluciones de refrigeración pasiva o activa más eficaces.

Familia Phision E28

Phison también está posicionando el E28 como una familia de controladores en lugar de un componente individual para el cliente. Además del impulso hacia el consumidor que estamos probando, un E28 CC Se está desarrollando una variante para cargas de trabajo empresariales, mientras que un modelo de IA E28 integrará ganchos de inferencia integrados para el framework aiDAPTIV+ de Phison. Esto es similar a cómo E26 incorporó el E26-DC y, con el tiempo, impulsó algunas tarjetas aceleradoras de IA; sin embargo, el mayor límite del E28 debería ofrecer a los desarrolladores de sistemas mayor margen para escenarios de E/S mixtas y sostenidas.

Dicho todo esto, ahora someteremos al E28 a nuestro conjunto completo de pruebas de rendimiento en el mundo real para ver cómo funciona.

Especificaciones preliminares del Phison PS5028-E28 “E28”

Especificaciones Detail
Capacidades* 1 TB (1,000 GB), 2 TB (2,000 GB), 4 TB (4,000 GB)
Factor de forma M.2 2280-S3-M – módulo de una sola cara
Controlador y proceso Phison PS5028-E28 (6 nm, 3 núcleos + 2 coprocesadores CoX)
flash NAND KIOXIA BiCS8 TLC; Alternancia 5.2 a 2400 MT/s; hasta 2 paquetes BGA308 (32 CE)
Interfaz / Protocolo PCIe 5.0 ×4, NVMe 2.0 (compatible con versiones anteriores Gen4/3/2/1)
Rendimiento secuencial
  • 1 TB – 14,900 13,500 MB/s / XNUMX XNUMX MB/s (lectura/escritura)
  • 2 TB – 14,900 14,000 MB/s / XNUMX XNUMX MB/s (lectura/escritura)
  • 4 TB – 14,900 14,000 MB/s / XNUMX XNUMX MB/s (lectura/escritura)
Rendimiento aleatorio (4 KB, QD 128)
  • 1 TB – 1.3 M / 2.8 M IOPS (lectura/escritura)
  • 2 TB – 2.5 M / 3.0 M IOPS (lectura/escritura)
  • 4 B – 2.6 M / 3.0 M IOPS (lectura/escritura)
Fiabilidad MTBF 1.5 millones de horas | UBER < 1 × 1016
Temperatura de Funcionamiento 0 °C – 70 °C (unidad) | –40 °C – 85 °C (almacenamiento)
Administración de energía PS0–PS4, APST, ASPM, PCIe L1.2
Inactivo (L1.2) < 5 mW | Consumo activo – Por determinar
Características de integridad de datos LDPC + RAID ECC, SRAM ECC, SmartRefresh, protección de ruta de extremo a extremo
Seguridad TCG Pyrite 1.0, desinfección de NVMe, actualización de firmware firmada
Otras características Nivelación dinámica del desgaste, gestión de bloques defectuosos, SMART, TRIM, estrangulamiento térmico

Rendimiento del Phison PS5028-E28

comparables

Antes de sumergirnos en los puntos de referencia, aquí hay una lista de unidades Gen5 comparables probadas junto con un diseño de referencia Phison PS2-E5028 (E28) de 28 TB, junto con algunos SSD Gen4:

Sometimos estas unidades a diversas pruebas para evaluar su rendimiento en situaciones reales y sintéticas. Esto incluye tiempos de carga LLM para medir la rapidez con la que gestionan grandes modelos de IA, pruebas DirectStorage para evaluar la velocidad con la que cargan recursos del juego y procesan datos del juego, y pruebas de Blackmagic Design para evaluar las velocidades de lectura y escritura para la edición de vídeo de alta resolución. También ejecutaremos PCMark 10 para evaluar la capacidad de respuesta general del sistema, 3DMark Storage para evaluar el rendimiento en juegos y pruebas FIO para medir las velocidades máximas de lectura/escritura secuencial y aleatoria bajo cargas de trabajo intensas.

Aquí está el equipo de pruebas de alto rendimiento que utilizamos para la evaluación comparativa:

  • UPC: AMD Ryzen 7 9800X3D
  • Placa base: Asus ROG Crosshair X870E Hero
  • RAM: G.SKILL Trident Z5 Royal Series DDR5-6000 (2 x 16 GB)
  • GPU: NVIDIA GeForce RTX 4090
  • Sistema operativo: Windows 11 Pro, Ubuntu 24.10 Desktop

Máximo rendimiento sintético

La prueba FIO es una herramienta de evaluación comparativa potente y flexible que se utiliza para medir el rendimiento de los dispositivos de almacenamiento, incluidos los SSD y los HDD. Evalúa métricas como el ancho de banda, las IOPS (operaciones de entrada/salida por segundo) y la latencia en diferentes cargas de trabajo, como las operaciones de lectura/escritura secuenciales y aleatorias. Esta prueba ayuda a evaluar el rendimiento máximo de los sistemas de almacenamiento, lo que la hace útil para comparar diferentes dispositivos o configuraciones. Medimos el rendimiento máximo en ráfagas para esta prueba, limitando la carga de trabajo a una huella de 10 GB en ambos SSD.

En general, el SSD de referencia Phison E28 ofrece resultados de rendimiento impresionantes en nuestras pruebas sintéticas FIO, especialmente en cargas de trabajo aleatorias. Si bien su rendimiento secuencial alcanza los 14,000 8100 MB/s tanto en lectura como en escritura (ligeramente por debajo de los mejores, como el SN5 y el Renegade G4), destaca en operaciones aleatorias 2.559K. En este caso, alcanzó 3.288 millones de IOPS en lecturas aleatorias y unos impresionantes XNUMX millones de IOPS en escrituras aleatorias, superando ampliamente a la competencia. La latencia se mantiene competitiva en todos los ámbitos, especialmente con cargas de escritura intensas, donde incluso cae por debajo de su latencia de lectura. En resumen, esta muestra de referencia sugiere que el controlador de nueva generación de Phison supondrá una mejora significativa para cualquier SSD una vez que llegue al mercado minorista.

Prueba FIO (cuanto mayor sea el número de MB/s/IOPS, mejor) Lectura secuencial de 128K (1T/64Q) Escritura secuencial de 128K (1T/64Q) Lectura aleatoria 4K (16T/32Q) Escritura aleatoria 4K (16T/32Q)
SanDisk SN8100 15,000 MB/s (latencia promedio de 0.56 ms) 14,100 MB/s (latencia promedio de 0.59 ms) 2.312 millones de IOPS (latencia promedio de 0.22 ms) 2.144 millones de IOPS (latencia promedio de 0.24 ms)
Kingston FURY Renegade G5 14,600 MB/s (latencia promedio de 0.57 ms) 14,100 MB/s (latencia promedio de 0.59 ms) 2.028 millones de IOPS (latencia promedio de 0.25 ms) 2.028 millones de IOPS (latencia promedio de 0.25 ms)
Samsung 9100 Pro 14,600 MB/s (latencia promedio de 0.57 ms) 13,300 MB/s (latencia promedio de 0.63 ms) 2.734 millones de IOPS (latencia promedio de 0.18 ms) 2.734 millones de IOPS (latencia promedio de 0.19 ms)
SK hynix platino P51 14,500 MB/s (latencia promedio de 0.58 ms) 13,500 MB/s (latencia promedio de 0.62 ms) 2.369 millones de IOPS (latencia promedio de 0.22 ms) 2.669 millones de IOPS (latencia promedio de 0.19 ms)
Crucial T705 14,400 MB/s (latencia promedio de 0.58 ms) 12,300 MB/s (latencia promedio de 0.68 ms) 1.585 millones de IOPS (latencia promedio de 0.32 ms) 2.703 millones de IOPS (latencia promedio de 0.19 ms)
Phison PS5028-E28 14,000 MB/s (latencia promedio de 0.60 ms) 14,000 MB/s (latencia promedio de 0.57 ms) 2.559 millones de IOPS (latencia promedio de 0.32 ms) 3.288 millones de IOPS (latencia promedio de 0.32 ms)
Lexar Professional NM1090 PRO 13,800 GB/s (latencia media de 0.61 ms) 13,600 MB/s (latencia promedio de 0.62 ms) 2.073 millones de IOPS (latencia promedio de 0.32 ms) 2.215 millones de IOPS (latencia promedio de 0.23 ms)
PNY CS2150 10,400 GB/s (latencia media de 0.80 ms) 8,801 MB/s (latencia promedio de 0.95 ms) 1.379 millones de IOPS (latencia promedio de 0.371 ms) 1.623 IOPS (latencia promedio de 0.32 ms)
P510 crucial 8,835 MiB/s (latencia promedio de 0.90 ms) 9,961 MB/s (latencia promedio de 0.80 ms) 1.163 millones de IOPS (latencia promedio de 0.44 ms) 1.196 millones de IOPS (latencia promedio de 0.51 ms)
Samsung 990 Pro 7,483 MB/s (latencia promedio de 1.12 ms) 7,197 MB/s (latencia promedio de 1.16 ms) 1.400 millones de IOPS (latencia promedio de 0.36 ms) 1.403 millones de IOPS (latencia promedio de 0.36 ms)
Disco duro externo WD SN850X de 2 TB 6,632 MB/s (latencia promedio de 0.76 ms) 7,235 MB/s (latencia promedio de 0.92 ms) 1.2 millones de IOPS (latencia promedio de 0.43 ms) 825 0.62 IOPS (latencia media de XNUMX ms)

Tiempo promedio de carga del LLM

La prueba de Tiempo Promedio de Carga de LLM evaluó los tiempos de carga de tres LLM diferentes: DeepSeek R1 7B, Meta Llama 3.2 11B y DeepSeek R1 32B. Cada modelo se probó 10 veces y se calculó el tiempo de carga promedio. Esta prueba mide la capacidad de la unidad para cargar rápidamente modelos de lenguaje grandes (LLM) en memoria. Los tiempos de carga de LLM son cruciales para las tareas relacionadas con la IA, especialmente para la inferencia en tiempo real y el procesamiento de conjuntos de datos extensos. Una carga más rápida permite que el modelo procese los datos rápidamente, mejorando así la capacidad de respuesta de la IA y reduciendo el tiempo de espera.

En este aspecto, el Phison E28 destaca entre los mejores. Cargar el DeepSeek R1 7B tardó solo 2.57 segundos de media, seguido del Meta Llama 3.2 11B con 3.64 segundos, y el modelo más grande, el DeepSeek R1 32B, en 4.34 segundos. Si bien no fue el más rápido en general (ese título corresponde al SK hynix P51 y al SN8100), el E28 se sitúa en la cima. Estos resultados indican que el E28 puede gestionar tareas con mucha IA sin lag.

Tiempo promedio de carga de LLM (cuanto menor, mejor) Búsqueda profunda R1 7B Meta Llama 3.2 11B Visión Búsqueda profunda R1 32B
SK hynix platino P51 Miles Miles Miles
SanDisk SN8100 Miles Miles Miles
Phison PS5028-E28 Miles Miles Miles
Samsung 9100 Pro de 4 TB Miles Miles Miles
PNY CS2150 Miles Miles Miles
CrucialT705 2TB Miles Miles Miles
Samsung 990 Pro de 2 TB Miles Miles Miles
Crucial P510 1TB Miles Miles Miles
Disco duro externo WD SN850X de 2 TB Miles Miles Miles
Kingston FURY Renegade G5 Miles Miles Miles
Lexar Professional NM1090 PRO Miles Miles Miles

Almacenamiento directo 3DMark

La prueba de características DirectStorage de 3DMark evalúa cómo DirectStorage de Microsoft optimiza la carga de recursos de juegos en SSD PCIe. Al reducir la sobrecarga de la CPU y mejorar las velocidades de transferencia de datos, DirectStorage mejora los tiempos de carga, especialmente cuando se combina con la compresión GDeflate y BypassIO de Windows 11. Esta prueba aísla el rendimiento del almacenamiento para destacar las posibles mejoras del ancho de banda cuando DirectStorage está habilitado.

En este caso, el SSD de referencia Phison E28 demuestra un rendimiento sólido y consistente en todas las categorías. Con 26.22 GB/s en transferencias de archivos comprimidos (GDeflate), se sitúa muy por detrás del SK hynix P51 y a la altura de otras unidades de gama alta como la SN8100. Su rendimiento se mantiene sólido, incluso en transferencias sin comprimir, alcanzando 10.89 GB/s con DirectStorage activado y 7.46 GB/s con él desactivado. El rendimiento de descompresión con GDeflate fue particularmente alto, con 65.58 GB/s, lo que significa que el E28 está bien equipado para gestionar futuras cargas de trabajo de juegos y títulos con uso intensivo de streaming. Sin embargo, en última instancia, las unidades de gama alta tienen márgenes muy estrechos.

Almacenamiento directo 3DMark (GB/s, cuanto mayor sea, mejor) Almacenamiento en VRAM (compresión GDeflate) Almacenamiento en VRAM (DirectStorage activado, sin comprimir) Almacenamiento en VRAM (DirectStorage desactivado, sin comprimir) Almacenamiento en RAM (DirectStorage activado, sin comprimir) Almacenamiento en RAM (DirectStorage desactivado, sin comprimir) Ancho de banda de descompresión de GDeflate
SK hynix platino P51 26.32 11.20 7.75 12.85 9.46 64.68
Phison PS5028-E28 26.22 10.89 7.46 11.15 9.86 65.58
SanDisk SN8100 26.11 12.94 7.63 12.94 9.78 64.51
CrucialT705 2TB 25.75 10.71 8.79 12.03 8.83 66.36
Lexar Professional NM1090 PRO 24.03 11.23 7.57 12.18 8.72 63.15
Samsung 9100 Pro de 4 TB 23.77 11.26 8.92 11.62 9.48 66.61
Kingston FURY Renegade G5 23.29 10.03 7.44 11.81 9.63 65.79
PNY CS2150 19.49 8.60 6.98 9.22 7.70 62.43
Disco duro externo WD SN850X de 2 TB 15.28 11.11 8.93 6.78 6.27 64.96
Samsung 990 Pro de 2 TB 14.18 11.28 8.84 6.57 6.20 65.71
Crucial P510 1TB 19.63 8.33 6.92 9.06 7.49 66.22

Prueba de velocidad de disco de Blackmagic

La prueba de velocidad de disco de Blackmagic evalúa la velocidad de lectura y escritura de una unidad y estima su rendimiento, especialmente para tareas de edición de video. Ayuda a los usuarios a garantizar que su almacenamiento sea lo suficientemente rápido para contenido de alta resolución, como videos 4K u 8K.

El SSD de referencia Phison E28 se ubicó en la cima de la tabla, con velocidades de lectura de 11,216 10,571 MB/s y de escritura de 8100 5 MB/s. Esto marca una clara ventaja en lectura sobre sus competidores más cercanos, como el SanDisk SN4 y el Kingston Fury Renegade G8. Estos resultados indican que el controlador ya está bien optimizado para cargas de trabajo de video con alto ancho de banda, como la edición de video XNUMXK/XNUMXK o la reproducción de material sin procesar.

Prueba del Phison E28 Blackmagic

Aquí está nuestra tabla de clasificación actual de velocidad de disco Blackmagic:

Velocidad del disco Blackmagic (MB/s, cuanto mayor sea, mejor) Leer MB/s Escribir MB / s
Phison PS5028-E28 11,216.1 10,570.7
SanDisk SN8100 10,005.2 10,581.0
Kingston FURY Renegade G5 9,665.0 10,831.0
Samsung 9100 Pro de 4 TB 9,542.3 9,907.9
SK hynix platino P51 9,241.0 9,109.0
Lexar Professional NM1090 PRO 9,149.2 10,466.6
CrucialT705 2TB 8,464.2 10,256.4
Crucial P510 1TB 7,853.9 7,939.6
PNY CS2150 6,625.5 7,299.5
Disco duro externo WD SN850X de 2 TB 5,862.6 5,894.8
Samsung 990 Pro de 2 TB 5,769.5 5,842.9

Almacenamiento PCMark10

Los benchmarks de almacenamiento PCMark 10 evalúan el rendimiento real del almacenamiento mediante rastreos basados ​​en aplicaciones. Prueban el sistema y las unidades de datos, midiendo el ancho de banda, los tiempos de acceso y la consistencia bajo carga. Estos benchmarks ofrecen información práctica que va más allá de las pruebas sintéticas, permitiendo a los usuarios comparar eficazmente las soluciones de almacenamiento modernas.

El SSD de referencia Phison PS5028-E28 volvió a liderar el mercado con una impresionante puntuación de 9,347, superando a todas las demás unidades de nuestro grupo de comparación. Con un ancho de banda de 1,333 MB/s y un tiempo de acceso promedio de tan solo 16 µs, el E28 demuestra una gran capacidad de respuesta en cargas de trabajo reales. Esto augura un futuro prometedor para el controlador en los próximos SSD Gen5 para consumidores y fabricantes de equipos originales (OEM).

Unidad de datos PCMark 10 (cuanto más alto, mejor) Puntuación Global
Phison PS5028-E28 9,347
CrucialT705 2TB 8,783
SK hynix platino P51 8,665
SanDisk SN8100 8,644
Lexar Professional NM1090 PRO 8,247
Kingston FURY Renegade G5 8,062
Samsung 9100 Pro de 4 TB 7,552
Samsung 990 Pro de 2 TB 7,173
Crucial P310 2TB 6,436
PNY CS2150 6,070
Disco duro externo WD SN850X de 2 TB 4,988

Almacenamiento 3DMark

El benchmark de almacenamiento 3DMark evalúa el rendimiento de tu SSD en juegos midiendo tareas como cargar juegos, guardar progreso, instalar archivos de juegos y grabar partidas. Evalúa la capacidad de tu almacenamiento para juegos reales y es compatible con las últimas tecnologías de almacenamiento para obtener información precisa sobre el rendimiento.

El Phison PS5028-E28 tuvo un rendimiento excepcional, con una puntuación de 5,879, solo superado por el SanDisk SN8100. Esto sitúa al E28 con una cómoda ventaja sobre varios competidores de gama alta de la Gen5 por varios cientos de puntos. Este buen rendimiento del E28 indica que es ideal para cargas de trabajo de juegos, especialmente para aquellas que aprovechan la tecnología DirectStorage de Microsoft.

Prueba de referencia de almacenamiento 3DMark (cuanto más alto, mejor) Puntuación Global
SanDisk SN8100 6,047
Phison PS5028-E28 5,879
Kingston FURY Renegade G5 5,670
CrucialT705 2TB 5,100
SK hynix platino P51 5,082
Lexar Professional NM1090 PRO 4,828
Samsung 9100 Pro de 4 TB 4,779
Crucial P510 1TB 4,148
PNY CS2150 4,193
Samsung 990 Pro de 2 TB 4,128
Disco duro externo WD SN850X de 2 TB 3,962
Crucial P310 2TB 3,848

Almacenamiento directo de GPU

Una de las pruebas que realizamos en este banco de pruebas fue la prueba Magnum IO GPU Direct Storage (GDS). GDS es una función desarrollada por NVIDIA que permite a las GPU ignorar la CPU al acceder a datos almacenados en unidades NVMe u otros dispositivos de almacenamiento de alta velocidad. En lugar de enrutar los datos a través de la CPU y la memoria del sistema, GDS permite la comunicación directa entre la GPU y el dispositivo de almacenamiento, lo que reduce significativamente la latencia y mejora el rendimiento de los datos.

Cómo funciona el almacenamiento directo en GPU

Tradicionalmente, cuando una GPU procesa datos almacenados en una unidad NVMe, los datos primero deben pasar por la CPU y la memoria del sistema antes de llegar a la GPU. Este proceso genera cuellos de botella, ya que la CPU se convierte en un intermediario, lo que agrega latencia y consume valiosos recursos del sistema. El almacenamiento directo en la GPU elimina esta ineficiencia al permitir que la GPU acceda a los datos directamente desde el dispositivo de almacenamiento a través del bus PCIe. Esta ruta directa reduce la sobrecarga asociada con el movimiento de datos, lo que permite transferencias de datos más rápidas y eficientes.

Las cargas de trabajo de IA, especialmente las que implican aprendizaje profundo, requieren un uso intensivo de datos. El entrenamiento de redes neuronales de gran tamaño requiere el procesamiento de terabytes de datos, y cualquier retraso en la transferencia de datos puede provocar que las GPU se subutilicen y que los tiempos de entrenamiento sean más prolongados. El almacenamiento directo en la GPU aborda este desafío al garantizar que los datos se entreguen a la GPU lo más rápido posible, lo que minimiza el tiempo de inactividad y maximiza la eficiencia computacional.

Además, GDS es particularmente beneficioso para cargas de trabajo que implican la transmisión de grandes conjuntos de datos, como el procesamiento de video, el procesamiento de lenguaje natural o la inferencia en tiempo real. Al reducir la dependencia de la CPU, GDS acelera el movimiento de datos y libera recursos de la CPU para otras tareas, lo que mejora aún más el rendimiento general del sistema.

Resultados

En nuestra prueba de rendimiento de almacenamiento directo de GPU (GDS), la unidad de referencia Phison PS5028-E28 obtuvo resultados muy competitivos. Con un tamaño de bloque de 16 128 y una profundidad de cola de 3.7, alcanza velocidades de lectura de 2.4 GiB/s y de escritura de 5 GiB/s, comparables a las mejores unidades de este segmento, como la Kingston Renegade G0.519. La latencia también es sólida, con 0.824 ms en lectura y 245.1 ms en escritura, lo que se traduce en 154.7 XNUMX y XNUMX XNUMX IOPS, respectivamente.

A nivel de bloque de 128K, el E28 mantiene una posición sólida, alcanzando 5.9 GiB/s tanto en lectura como en escritura, con latencias ligeramente superiores a 2.6 ms, lo que produce aproximadamente 48,000 5 IOPS. Estos resultados lo sitúan a la altura de las unidades Gen8100 de gama alta, como la SanDisk SN5 y la Kingston GXNUMX, pero con una latencia de escritura ligeramente mejor que la mayoría.

El rendimiento se mantiene impresionante incluso con el exigente tamaño de bloque de 1 M, donde el E28 alcanza 6.4 GiB/s de lectura y 6.2 GiB/s de escritura. La latencia en este nivel ronda los 20 ms, con IOPS de 6.5 y 6.4, nuevamente entre las más altas de su clase. En general, el E28 no solo iguala a los líderes en rendimiento, sino que también destaca por mantener baja latencia y altas IOPS en diversos tamaños de bloque, lo que lo convierte en una opción sólida para sistemas con GDS que priorizan la velocidad y la consistencia.

He aquí un resumen completo:

Gráfico GDSIO (promedios de tamaño de bloque de 16 128, 1 XNUMX y XNUMX XNUMX) (Tamaño de bloque de 16 K, profundidad de 128 E/S) Lectura promedio (Tamaño de bloque de 16 K, profundidad de E/S de 128) Escritura promedio (Tamaño de bloque de 128 K, profundidad de 128 E/S) Lectura promedio (Tamaño de bloque de 128 K, profundidad de E/S de 128) Escritura promedio (Tamaño de bloque de 1 M, profundidad de 128 E/S) Lectura promedio (Tamaño de bloque de 1 M, profundidad de E/S de 128) Escritura promedio
Phison PS5028-E28 3.7 GiB/s (0.519 ms)
IOPS: 245.1K
2.4 GiB/s (0.824 ms) IOPS: 154.7 K 5.9 GiB/s (2.647 ms) IOPS: 48.2 K 5.9 GiB/s (2.650 ms)
IOPS: 48.31K
6.4 GiB/s (19.650 ms)
IOPS: 6.5K
6.2 GiB/s (20.033 ms) IOPS: 6.4 K
Kingston FURY Renegade G5 3.7 GiB/s (0.526 ms) IOPS: 242.1 K 2.4 GiB/s (0.824 ms) IOPS: 154.7 K 5.9 GiB/s (2.704 ms) IOPS: 48.5 K 5.8 GiB/s (0.564 ms) IOPS: 47.3 K 6.5 GiB/s (19.356 ms) IOPS: 6.6 K 6.3 GiB/s (19.690 ms) IOPS: 6.5 K
Lexar Professional NM1090 PRO 3.6 GiB/s (0.533 ms) IOPS: 238.7 K 2.3 GiB/s (0.845 ms) IOPS: 150.8 K 5.9 GiB/s (2.639 ms) IOPS: 48.4 K 4.2 GiB/s (3.714 ms) IOPS: 34.4 K 6.5 GiB/s (19.274 ms) IOPS: 6.6 K 6.2 GiB/s (20.127 ms) IOPS: 6.4 K
SanDisk SN8100 3.4 GiB/s (0.564 ms) IOPS: 225.9 K 2.1 GiB/s (0.907 ms) IOPS: 140.6 K 5.9 GiB/s (2.626 ms) IOPS: 48.7 K 5.8 GiB/s (2.668 ms) IOPS: 47.9 K 6.5 GiB/s (19.264 ms) IOPS: 6.6 K 5.9 GiB/s (21.063 ms) IOPS: 6.1 K
Samsung 9100 Pro de 4 TB 3.4 GiB/s (0.565 ms) IOPS: 226.4 K 2.3 GiB/s (0.839 ms) IOPS: 161.7 K 5.2 GiB/s (3.001 ms) IOPS: 44.9 K 5.9 GiB/s (2.662 ms) IOPS: 47.3 K 6.3 GiB/s (19.877 ms) IOPS: 6.4 K 6.1 GiB/s (20.579 ms) IOPS: 6.2 K
CrucialT705 2TB 3.3 GiB/s (0.587 ms) IOPS: 217.0 K 2.3 GiB/s (0.836 ms) IOPS: 152.6 K 5.5 GiB/s (2.863 ms) IOPS: 44.7 K 5.6 GiB/s (2.799 ms) IOPS: 45.7 K 6.0 GiB/s (20.738 ms) IOPS: 6.2 K 6.0 GiB/s (20.855 ms) IOPS: 6.1 K
SK hynix platino P51 3.1 GiB/s (0.634 ms) IOPS: 200.9 K 1.5 GiB/s (1.314 ms) IOPS: 97.2 K 5.6 GiB/s (2.781 ms) IOPS: 46.0 K 3.9 GiB/s (4.014 ms) IOPS: 31.9 K 6.2 GiB/s (20.126ms) IOPS: 6.4K 4.2 GiB/s (29.576 ms) IOPS: 4.3 K
Samsung 990 Pro de 2 TB 2.7 GiB/s (0.731 ms) IOPS: 174.4 K 2.2 GiB/s (0.903 ms) IOPS: 141.2 K 4.0 GiB/s (3.944 ms) IOPS: 32.4 K 4.1 GiB/s (3.849 ms) IOPS: 33.2 K 3.9 GiB/s (32.415 ms) IOPS: 3.9 K 4.2 GiB/s (29.520 ms) IOPS: 4.3 K
PNY CS2150 2.5 GiB/s (0.779 ms) IOPS: 163.5 K 1.8 GiB/s 1.107 ms) IOPS: 115.3 K 4.5 GiB/s (3.473 ms) IOPS: 36.8 K 4.7 GiB/s (3.357 ms) IOPS: 38.1 K 4.6 GiB/s (27.157 ms) IOPS: 174.4 K 4.9 GiB/s (25.682 ms) IOPS: 5.0
P510 crucial 2.3 GiB/s (0.837 ms) IOPS: 152.2 K 2.3 GiB/s (0.842 ms) IOPS: 151.5 K 4.5 GiB/s (3.450 ms) IOPS: 37.1 K 4.8 GiB/s (3.262 ms) IOPS: 39.2 K 4.8 GiB/s (26.2181 ms) IOPS: 4.9 K 5.0 GiB/s (25.121 ms) IOPS: 5.1 K
WD SN850X 2.3 GiB/s (0.736 ms) IOPS: 173.2 K 2.0 GiB/s (0.989 ms) IOPS: 129.0 K 4.1 GiB/s (3.878 ms) IOPS: 33.3 K 4.0 GiB/s (3.958 ms) IOPS: 33.0 K 4.4 GiB/s (30.501 ms) IOPS: 4.5 K 4.1 GiB/s (30.782 ms) IOPS: 4.2 K

Conclusión

El Phison PS5028-E28 se incorpora con seguridad al mercado de controladores SSD Gen5, ideal para cargas de trabajo que exigen baja latencia y alto rendimiento, como edición de video, inferencia de IA o juegos de alto rendimiento. Durante nuestras exhaustivas pruebas, el SSD con procesador E28 mantuvo un rendimiento consistentemente similar, o incluso superior, al de las unidades Gen5 de gama alta, especialmente en cargas de trabajo secuenciales y aleatorias 4K. Su IOPS de escritura aleatoria alcanzó la inigualable cifra de 3.29 millones, y su latencia de lectura a menudo supera a la de competidores como el SN8100 y el Renegade G5, lo que demuestra el gran trabajo de optimización que Phison ha realizado.

phison e28

Por supuesto, probamos una unidad de referencia con firmware prelanzamiento, por lo que esperamos algunos ajustes finales antes de su lanzamiento (lo que podría resultar en un rendimiento aún mejor). Sin embargo, incluso ahora, el E28 demuestra ser un digno sucesor del E26 y un rival legítimo del SM2508 de Silicon Motion. Con una excelente consistencia en todos los tamaños de bloque, tiempos de carga rápidos en cargas de trabajo LLM y DirectStorage, y compatibilidad con las próximas variantes centradas en IA, el E28 proporciona a Phison la plataforma que necesita para mantenerse competitivo en la siguiente fase de adopción del almacenamiento Gen5.

Este controlador también parece ser muy eficiente energéticamente, un factor crucial en entornos móviles y con limitaciones térmicas. Si bien no verificamos de forma independiente los datos de energía internos de Phison, el ahorro declarado de hasta un vatio durante cargas de trabajo exigentes sugiere un avance significativo con respecto a los diseños Gen5 anteriores. Combinado con su bajo consumo en reposo (<5 mW en L1.2), el E28 se perfila como una opción excepcional de alto rendimiento que no se ralentizará ni se sobrecalentará en sistemas más delgados. No obstante, estamos ansiosos por ver su rendimiento una vez que comience a distribuirse en SSD comerciales totalmente optimizados.

Interactuar con StorageReview

Boletín informativo | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed

lyle smith

Lyle es un redactor de StorageReview desde hace mucho tiempo y cubre un amplio conjunto de temas de TI empresariales y de usuarios finales.