El nuevo DC3000ME de Kingston es el SSD NVMe de nivel empresarial más reciente de la compañía en formato U.2 de 2.5″, diseñado para cargas de trabajo de centros de datos y servidores. Basado en la interfaz PCIe 5.0 x4, combina un alto rendimiento de ancho de banda con 3D eTLC NAND para una fiabilidad robusta y escalabilidad de capacidad. Disponible en configuraciones de 3.84 TB, 7.68 TB y 15.36 TB, el disco está diseñado para entornos de alta demanda, como infraestructuras de hiperescala, clústeres de IA y HPC, servicios en la nube y sistemas transaccionales.
Kingston DC3000ME Perfil de rendimiento
El DC3000ME mantiene un rendimiento de lectura secuencial idéntico en todas las capacidades, con cada SKU alcanzando hasta 14,000 3.84 MB/s. Esta velocidad es ideal para cargas de trabajo que requieren un acceso rápido a los datos, independientemente de la capacidad elegida. Sin embargo, las velocidades de escritura secuencial varían considerablemente. El modelo de 5,800 TB está limitado a 7.68 MB/s, mientras que la variante de 10,000 TB alcanza un aumento sustancial, alcanzando los 15.36 9,700 MB/s. El modelo de XNUMX TB se queda ligeramente por detrás, con XNUMX MB/s.
En cuanto al rendimiento, el modelo de 7.68 TB es el más rápido de todos, con un máximo de 2.8 millones de IOPS en lectura y 500,000 3.84 IOPS en escritura. Esto supera a las unidades de 15.36 TB y 2.7 TB, que tienen un límite de 3.84 millones de IOPS en lectura. En cuanto a la escritura, el modelo de 300,000 TB se queda atrás con 15.36 400,000 IOPS, mientras que el de 7.68 TB alcanza las XNUMX XNUMX IOPS. La versión de XNUMX TB es la más capaz de gestionar tareas exigentes.
En cuanto al rendimiento por capacidad, el modelo de 7.68 TB también ofrece la combinación más equilibrada de rendimiento e IOPS, lo que lo hace ideal para aplicaciones con uso intensivo de escritura, como registros, bases de datos OLTP o entrenamiento activo de modelos de IA. El modelo de 3.84 TB probablemente sea más adecuado para cargas de trabajo con alta carga de lectura o mixtas, donde la capacidad no es una prioridad, y la versión de 15.36 TB sacrifica el pico de IOPS de escritura por la densidad de almacenamiento sin procesar.
Kingston DC3000ME Características empresariales
El DC3000ME incorpora prácticas funciones de nivel empresarial, esenciales para sistemas de producción. La protección contra pérdida de energía (PLP) está integrada para proteger los datos en caso de una interrupción repentina. También incluye cifrado AES-256 compatible con TCG Opal para la seguridad de los datos en reposo. El DC3000ME admite hasta 128 espacios de nombres, lo cual resulta especialmente útil para casos de uso virtualizados o en contenedores. Este nivel de compatibilidad con espacios de nombres es comparable al de los SSD U.2 avanzados y resulta especialmente valioso para entornos virtualizados a gran escala. Kingston también integra herramientas de telemetría para monitorizar el estado de la unidad, el desgaste de los medios y la temperatura de funcionamiento, lo que proporciona a los administradores visibilidad sobre la fiabilidad a largo plazo.
El consumo de energía varía desde 8 W en reposo hasta un máximo de 24 W durante la escritura completa, lo cual parece típico para SSD U.2 densos sometidos a cargas de trabajo elevadas. Kingston especifica una potencia máxima de lectura de 8.2 W, que coincide estrechamente con la cifra en reposo, mostrando una delta de potencia estrecha bajo cargas de trabajo de lectura intensivas. Las clasificaciones de resistencia coinciden con lo esperado para una unidad empresarial, con capacidad para una escritura completa al día durante un período de cinco años. Esto equivale a entre 7,008 TBW y 28,032 XNUMX TBW, según la capacidad.
La Kingston DC3000ME está respaldada por una clasificación MTBF de dos millones de horas y la garantía limitada de cinco años de Kingston, además de soporte técnico gratuito.
Especificaciones de la Kingston DC3000ME
| Especificaciones | Detalles |
| Factor de forma | U.2, 2.5″ x 15 mm |
| Fácil de usar | PCIe NVMe Gen5 x4 (compatible con versiones anteriores de Gen4) |
| Capacidades | 3.84 TB, 7.68 TB, 15.36 TB |
| Tipo NAND | NAND 3D eTLC |
| Lectura / escritura secuencial (MB / s) | 3.84 TB – 14,000 / 5,800 7.68 TB – 14,000 / 10,000 15.36 TB – 14,000 / 9,700 |
| IOPS de lectura/escritura aleatorias (4K) | 3.84 TB – 2,700,000 / 300,000 7.68 TB – 2,800,000 / 500,000 15.36 TB – 2,700,000 / 400,000 |
| Calidad de servicio de latencia (99%) | Lectura: <10µs, Escritura: <70µs |
| Nivelación de desgaste estático y dinámico | Sí |
| Protección de pérdida de potencia | Sí (Capacidades de potencia) |
| Cifrado | TCG Opal 2.0, cifrado AES de 256 bits |
| Gestión de espacios de nombres | Se admiten hasta 128 espacios de nombres |
| Diagnóstico empresarial | Telemetría, desgaste de medios, temperatura, salud, etc. |
| Resistencia (TBW/DWPD, 5 años) | 3.84 TB – 7,008 TBW, 1 DWPD 7.68 TB – 14,016 TBW, 1 DWPD 15.36 TB – 28,032 TBW, 1 DWPD |
| Consumo de energía | Inactivo: 8 W, Lectura máxima: 8.2 W, Escritura máxima: 24 W |
| Temperatura de Funcionamiento | 0 ° C a 70 ° C |
| Dimensiones | 100.50mm x x 69.8mm 14.8mm |
| Peso | 3.84 TB - 146.2 g 7.68 TB - 151.3 g 15.36 TB - 152.3 g |
| Vibración (sin funcionamiento) | 10G Pico (10–1000Hz) |
| MTBF | 2 millón de horas |
| Garantía y soporte | Garantía limitada de 5 años con soporte técnico gratuito. |
Pruebas de rendimiento de la Kingston DC3000ME
Plataforma de pruebas de conducción
Utilizamos un Dell PowerEdge R760 con Ubuntu 22.04.02 LTS como plataforma de prueba para todas las cargas de trabajo de esta revisión. Equipado con un Cables seriales Gen5 JBOFOfrece amplia compatibilidad con SSD U.2, E1.S, E3.S y M.2. La configuración de nuestro sistema se describe a continuación:
-
-
- 2 procesadores Intel Xeon Gold 6430 (32 núcleos, 2.1 GHz)
- 16 x 64GB DDR5-4400
- Unidad de estado sólido Dell BOSS de 480 GB
- Cables seriales Gen5 JBOF
-
Comparación de unidades
Rendimiento de CDN
Para simular una carga de trabajo realista de CDN con contenido mixto, los SSD se sometieron a una secuencia de evaluación comparativa multifase diseñada para replicar los patrones de E/S de servidores perimetrales con alto contenido. El procedimiento de prueba abarca una variedad de tamaños de bloque, tanto grandes como pequeños, distribuidos en operaciones aleatorias y secuenciales, con distintos niveles de concurrencia.
Antes de las pruebas principales de rendimiento, cada SSD completó un llenado total del dispositivo con una escritura secuencial del 100% utilizando bloques de 1 MB. Este proceso utilizó E/S síncrona y una profundidad de cola de cuatro, lo que permitió cuatro trabajos simultáneos. Esta fase garantiza que la unidad alcance un estado estable representativo del uso real. Tras el llenado secuencial, se ejecutó una segunda etapa de saturación de escritura aleatoria de tres horas utilizando una distribución de división por tamaño de bloque ponderado (tamaño de bloque/porcentaje), con una marcada preferencia por las transferencias de 128 K (98.51 %), seguida de contribuciones menores de bloques inferiores a 128 K hasta 8 K. Este paso emula los patrones de escritura fragmentados e irregulares que suelen observarse en entornos de caché distribuida.
El conjunto principal de pruebas se centró en operaciones de lectura y escritura aleatorias a escala para medir el comportamiento de la unidad con profundidades de cola variables y concurrencia de trabajos. Cada prueba se ejecutó durante cinco minutos (300 segundos) y fue seguida por un periodo de inactividad de tres minutos, lo que permitió que los mecanismos de recuperación internos estabilizaran las métricas de rendimiento.
- Se ejecutó con una distribución de tamaño de bloque fija, priorizando 128 K (98.51 %), y el 1.49 % restante de las operaciones se componía de transferencias más pequeñas, de entre 64 K y 8 K. Cada configuración varió entre 1, 2 y 4 trabajos simultáneos, con profundidades de cola de 1, 2, 4, 8, 16 y 32, para perfilar la escalabilidad y la latencia del rendimiento en condiciones típicas de escritura en el borde.
- Se utilizó un perfil de tamaño de bloque muy mixto, que imita la recuperación de contenido de CDN. Este perfil comenzó con un componente dominante de 128K (83.21%), seguido de una cola larga de más de 30 bloques de menor tamaño, desde 4K hasta 124K, cada uno con representación de frecuencia fraccionaria. Esta distribución refleja los diversos patrones de solicitud encontrados durante la obtención de segmentos de vídeo, el acceso a miniaturas y la búsqueda de metadatos. Estas pruebas también se ejecutaron en la matriz completa de recuentos de trabajos y profundidades de cola.
Esta combinación de preacondicionamiento, saturación y pruebas de acceso aleatorio de tamaño mixto está diseñada para revelar cómo los SSD manejan entornos sostenidos similares a CDN, enfatizando la capacidad de respuesta y la eficiencia en escenarios altamente paralelizados y de gran ancho de banda.
Carga de trabajo de CDN Lectura 1
En nuestras pruebas de lectura de carga de trabajo de CDN (1 trabajo), la unidad Kingston DC3000ME ofreció un rendimiento sólido que escaló eficientemente al aumentar la profundidad de la cola. En QD1, alcanzó una velocidad de 940 MB/s, aproximadamente un 861 % por detrás de la SanDisk SN26. Sin embargo, al aumentar la profundidad de la cola, la DC3000ME redujo la diferencia y superó a varias unidades Gen5. En QD4, la Kingston DC3000ME alcanzó 3,390 MB/s, aproximadamente un 42 % más rápida que la Micron 9550, un 40 % más que la Pascari X200P y aproximadamente un 25 % más rápida que la Solidigm PS1010, aunque se encuentra ligeramente por detrás de la SanDisk SN861, con un 2.6 % de diferencia. En QD16, la DC3000ME alcanzó 9,645 MB/s, superando a la Solidigm PS1010 en aproximadamente un 13 % y a la Micron 9550 en aproximadamente un 20 %. En la profundidad de prueba máxima de QD32, Kingston obtuvo un rendimiento de 14,131 MB/s, igualando con creces a la Micron 9550 y superando a la Solidigm PS1010 en aproximadamente un 15 % y a la SanDisk SN861 en casi un 10 %.
Carga de trabajo de CDN Lectura 2
En la carga de trabajo de lectura de CDN de 2 trabajos, la Kingston DC3000ME mantuvo un excelente rendimiento en todas las profundidades de cola. En QD1, registró 1,854 MB/s. Esto superó en un 9550 % a la Micron 1,548 (20 MB/s), en un 200 % a la Pascari X1,519P (22 MB/s) y en aproximadamente un 1010 % a la Solidigm PS2,011 (8 MB/s), aunque quedó por detrás de la SanDisk SN861 (2,487 MB/s) en un 34 %.
En QD4, Kingston alcanzó 6,335 MB/s, notablemente mejor que Micron (5,337 MB/s), Pascari (5,249 MB/s) y Solidigm (5,609 MB/s). Sin embargo, seguía estando por detrás de SanDisk, que se alzó con el primer puesto con 6,996 MB/s.
Para el QD16, Kingston alcanzó los 14,131 32 MB/s, liderando el grupo en ese momento. En el último punto de prueba, el QD14,336, logró un ligero aumento a 15,257 15,052 MB/s, superando a Pascari (6 5 MB/s) y Micron (13,619 13,721 MB/s) en aproximadamente un XNUMX % y un XNUMX %, respectivamente, manteniendo una sólida ventaja sobre SanDisk (XNUMX XNUMX MB/s) y Solidigm (XNUMX XNUMX MB/s).
Carga de trabajo de CDN Lectura 4
Con cuatro trabajos activos, la Kingston DC3000ME mantuvo su buen rendimiento de lectura en CDN. En el QD1, alcanzó 3,639 MB/s, superando al Micron 9550 (3,070 MB/s) y al Pascari X200P (2,982 MB/s), pero aún un 22 % por debajo del SanDisk SN861, que lideró este nivel con 4,443 MB/s. En el QD4, Kingston alcanzó 10,854 MB/s, lo que representó una mejora del 15 % respecto a Micron (9,427 MB/s), un 20 % por encima de Pascari (9,070 MB/s) y ligeramente por encima de Solidigm (9,627 MB/s). Sin embargo, aún se encontraba por debajo de los 11,161 MB/s de SanDisk.
Para el QD8, Kingston registró 13,926 MB/s, casi idéntico a Micron y prácticamente en línea con SanDisk (13,619 MB/s) y Solidigm (12,800 MB/s). En los QD16 y QD32, el rendimiento se estancó en torno a los 14,131-14,233 MB/s para Kingston, ligeramente por detrás de Micron y Pascari (ambos con entre 15,052 y 15,257 MB/s), pero aún muy por delante de SanDisk (13,619 MB/s) y Solidigm (13,721 MB/s).
Escritura de carga de trabajo de CDN 1
En nuestra carga de trabajo de escritura en CDN (1 tarea), la Kingston DC3000ME mostró un escalamiento consistente en todas las profundidades de cola. En QD1, alcanzó 2,118 MB/s, superando a la Micron 9550 (2,004 MB/s), la Pascari X200P (1,885 MB/s) y la Solidigm PS1010 (1,718 MB/s), quedando ligeramente por detrás de la SanDisk SN861 (2,164 MB/s). En QD4, Kingston registró 4,318 MB/s, un 55 % más rápido que la Solidigm (2,789 MB/s), un 26 % más rápido que la Pascari (3,437 MB/s), pero un 10 % más lento que la Micron (4,807 MB/s) y un 19 % por detrás de la SanDisk (5,353 MB/s).
En el QD16, alcanzó una velocidad de 5,880 MB/s, superando a Pascari (4,921 MB/s) en un 20 % y más del doble que Solidigm (2,664 MB/s), pero aún un 11 % por detrás de Micron (6,686 MB/s) y un 15 % por detrás de SanDisk (6,939 MB/s). En el QD32, Kingston alcanzó una velocidad de 5,987 MB/s, de nuevo cerca de Pascari (5,913 MB/s), pero a un 7,422 % y un 7,521 % por detrás de Micron (20 MB/s) y SanDisk (25 MB/s), respectivamente.
Escritura de carga de trabajo de CDN 2
En la carga de trabajo de escritura CDN de 2 trabajos, el Kingston DC3000ME demostró un rendimiento consistente, aunque en general quedó por debajo de los SSD Gen5 de clase empresarial más rápidos. En QD1, registró 2,651 MB/s, ligeramente por debajo del Micron 9550 (2,813 MB/s) y el Pascari X200P (2,762 MB/s), y aproximadamente un 33 % por debajo del SanDisk SN861 (3,972 MB/s).
A medida que aumentaba la profundidad de la cola, la DC3000ME seguía el ritmo. En QD4, alcanzó 4,807 MB/s, aproximadamente un 23 % más lento que la Micron 9550 (5,902 MB/s) y un 13 % menos que la SanDisk SN861 (5,508 MB/s), pero por delante de la Solidigm PS1010, con 3,154 MB/s.
En el QD16, Kingston alcanzó 5,772 MB/s, aún por detrás de Micron (7,896 MB/s) y SanDisk (6,709 MB/s), pero superando a productos de menor rendimiento, como el Solidigm PS1010 (3,820 MB/s) y el Pascari X200P (5,417 MB/s). En el QD32, el DC3000ME alcanzó un máximo de 5,870 MB/s, aproximadamente un 32 % por debajo del Micron 9550 (8,670 MB/s) y un 22 % por debajo del SanDisk SN861 (7,537 MB/s), pero aún por delante del Solidigm PS1010 (2,817 MB/s) y el Pascari (4,585 MB/s).
Escritura de carga de trabajo de CDN 4
En la carga de escritura de CDN de 4 trabajos, la unidad Kingston DC3000ME escaló de forma constante en todas las profundidades de cola, aunque, en general, quedó por detrás de las dos unidades Gen5 más potentes. En QD1, alcanzó 2,202 MB/s, situándose por detrás de la Pascari X200P (2,845 MB/s), la Micron 9550 (2,703 MB/s) y la SanDisk SN861 (3,544 MB/s), pero por delante de la Solidigm PS1010 (2,020 MB/s). En QD2, Kingston alcanzó 3,165 MB/s, situándose, de nuevo, por detrás de la SanDisk (4,863 MB/s) y la Micron (4,457 MB/s), pero manteniendo la ventaja sobre la Solidigm (2,872 MB/s).
En profundidades de cola medias, la Kingston DC3000ME alcanzó 3,647 MB/s en QD4 y 4,410 MB/s en QD8. Si bien esto mostró un escalamiento decente, se mantuvo por debajo de la unidad Micron (5,539 MB/s y 6,478 MB/s) y la unidad SanDisk (5,177 MB/s y 5,575 MB/s) en ambos puntos de prueba. En QD16, Kingston alcanzó 4,865 MB/s, una ligera mejora respecto a QD8, pero aún por debajo de la unidad SanDisk (6,011 MB/s) y la unidad Micron (7,474 MB/s). En QD32, la DC3000ME alcanzó su velocidad máxima de 5,307 MB/s, manteniéndose muy por delante de Solidigm (3,894 MB/s), pero significativamente por detrás de Micron (7,941 MB/s) y SanDisk (7,212 MB/s). Si bien no fue líder en rendimiento, la unidad Kingston mantuvo un escalado y una eficiencia consistentes.
Punto de referencia de puntos de control de DLIO
Para evaluar el rendimiento real de las unidades SSD en entornos de entrenamiento de IA, utilizamos la herramienta de referencia Data and Learning Input/Output (DLIO). Desarrollada por el Laboratorio Nacional de Argonne, DLIO está diseñada específicamente para probar patrones de E/S en cargas de trabajo de aprendizaje profundo. Proporciona información sobre cómo los sistemas de almacenamiento gestionan desafíos como la creación de puntos de control, la ingesta de datos y el entrenamiento de modelos. El gráfico a continuación ilustra cómo ambas unidades gestionan el proceso en 36 puntos de control. Al entrenar modelos de aprendizaje automático, los puntos de control son esenciales para guardar el estado del modelo periódicamente, evitando la pérdida de progreso durante interrupciones o cortes de energía. Esta demanda de almacenamiento requiere un rendimiento robusto, especialmente bajo cargas de trabajo sostenidas o intensivas. Utilizamos la versión 2.0 de la prueba de referencia DLIO, publicada el 13 de agosto de 2024.
Para garantizar que nuestra evaluación comparativa reflejara escenarios reales, basamos nuestras pruebas en la arquitectura del modelo LLAMA 3.1 405B. Implementamos puntos de control mediante torch.save() para capturar los parámetros del modelo, los estados del optimizador y los estados de las capas. Nuestra configuración simuló un sistema de ocho GPU, implementando una estrategia de paralelismo híbrido con paralelismo tensorial de 4 vías y procesamiento paralelo de pipeline de 2 vías distribuido entre las ocho GPU. Esta configuración resultó en tamaños de puntos de control de 1,636 GB, representativos de los requisitos de entrenamiento de modelos de lenguaje modernos de gran tamaño.
En los resultados promedio de las pasadas de DLIO, la Kingston DC3000ME de 7.68 TB quedó ligeramente por detrás de los principales contendientes, ubicándose en la mitad del grupo de cinco unidades. Los tiempos de punto de control promediaron 465.04 segundos en la primera pasada, 584.38 segundos en la segunda y 590.30 segundos en la tercera. Si bien fue consistentemente más rápido que la Pascari X200P de 7.68 TB, que registró los tiempos más altos en las tres pasadas (alcanzando 674.48 segundos en la tercera pasada), la Kingston DC3ME quedó por detrás de la Micron 3000 de 9550 TB y la Solidigm PS7.68 de 1010 TB, que se mantuvieron por debajo de los 7.68 segundos en la última pasada.
Como se muestra en la gráfica a continuación, la Kingston DC3000ME tuvo un comienzo sólido, con tiempos en los primeros puntos de control muy similares a los de sus competidores de primera línea. En el punto de control 1, registró 469.27 segundos, justo por detrás del Micron 9550 con 464.01 segundos y por delante del Pascari X200P con 472.65 segundos. Del punto de control 2 al 4, se mantuvo estable entre 461.92 y 465.44 segundos, manteniéndose cerca del Micron 9550 y el Solidigm PS1010, ambos entre 453 y 465 segundos.
Hacia la mitad de la prueba (puntos de control 5 a 8), la Kingston DC3000ME experimentó un aumento en los tiempos de los puntos de control, alcanzando un máximo de 613.01 segundos durante el punto de control 7. Este tiempo fue superior al del Micron 9550 (570.42 s) y el SanDisk SN861 de 7.68 TB (559.56 s), aunque significativamente mejor que el del Pascari X200P, que alcanzó los 694.38 segundos durante el mismo intervalo. Hacia el final de la prueba, la Kingston DC3000ME se estabilizó ligeramente, terminando en 571.36 segundos para el punto de control 12, aproximadamente 28 segundos más lento que el del Micron 9550, pero aún superando al del Pascari X200P, que cerró en 689.68 segundos. En general, el Kingston DC3000ME 7.68TB demostró un rendimiento constante y se mantuvo dentro de un rango competitivo durante toda la carga de trabajo de puntos de control, lo que lo colocó en el medio del grupo.
Punto de referencia de rendimiento de FIO
Para medir el rendimiento de almacenamiento de cada SSD según las métricas habituales del sector, utilizamos FIO. Cada unidad se somete al mismo proceso de prueba, que incluye un preacondicionamiento con dos llenados completos de la unidad con una carga de trabajo de escritura secuencial, seguido de la medición del rendimiento en estado estable. A medida que cambia el tipo de carga de trabajo que se mide, realizamos otro preacondicionamiento con ese nuevo tamaño de transferencia.
En esta sección nos centraremos en los siguientes puntos de referencia de FIO:
- 128K secuencial
- 64K aleatorio
- 16K aleatorio
- 4K aleatorio
Con SSD QLC de alta capacidad, diseñados para grandes volúmenes de transferencia, nuestras pruebas de velocidad de escritura se limitan a 16K de velocidad aleatoria. Para 4K, aprovechamos el estado precargado de la carga de trabajo de 16K para medir únicamente el rendimiento de lectura aleatoria de 4K.
Precondición secuencial de 128 K (Profundidad de E/S 256 / Número de trabajos 1)
En esta prueba de preacondicionamiento de alta profundidad de cola, la Kingston DC3000ME mantuvo un ancho de banda de escritura constante de 8,944.9 MB/s durante los 1,000 segundos de ejecución (aunque terminó la prueba justo después de los 800 segundos). Si bien no fue la más rápida (ligeramente por detrás de la Micron 9550, que alcanzó un pico de 10.3 GB/s), la Kingston DC3000ME demostró un rendimiento constante con mínima variación.
Latencia de precondición secuencial de 128 K (Profundidad de E/S 256 / Número de trabajos 1)
En la prueba de latencia de condición previa de escritura secuencial de 128 K, la unidad Kingston DC3000ME mostró una latencia promedio de 3.577 ms (que se mantuvo estable a lo largo del tiempo con una fluctuación mínima), lo que la colocó en segundo lugar detrás de la unidad Micron.
Escritura secuencial de 128 K (Profundidad de E/S 16 / Número de trabajos 1)
En la prueba de escritura secuencial de 128K, la Kingston DC3000ME alcanzó 8,477.4 MB/s, situándose justo detrás de la Micron 9550, que lideró el grupo con 10,354.6 3000 MB/s. La Kingston DC200ME superó a la Pascari X1010P y mantuvo una sólida ventaja sobre la Solidigm PS861 y la SanDisk SN7,100, ambas rondando los XNUMX MB/s. El rendimiento de Kingston demuestra un excelente equilibrio entre velocidad y consistencia.
Latencia de escritura secuencial de 128 K (Profundidad de E/S 16 / Número de trabajos 1)
En la prueba de latencia de escritura secuencial de 128K, la Kingston DC3000ME obtuvo un resultado sólido con una latencia promedio de 235.6 µs. Esto la coloca por delante de la SanDisk SN861 y la Solidigm PS1010, que registraron latencias de 280.7 µs y 280.3 µs, respectivamente. Si bien no fue tan rápida como la Micron 9550, que lideró con 192.9 µs, la Kingston DC3000ME se mantuvo competitiva y también superó ligeramente a la Pascari X200P con 238.6 µs.
Lectura secuencial de 128 K (Profundidad de E/S 64 / Número de trabajos 1)
En la prueba de lectura secuencial de 128K con una profundidad de cola de 64 y un solo trabajo, la Kingston DC3000ME alcanzó 13,513.8 200 MB/s. Si bien esto la coloca en cuarto lugar entre las unidades probadas, aun así ofreció un excelente rendimiento (con mínimas diferencias en condiciones reales). Quedó un 14,242.1 % por detrás de la Pascari X5.1P (1010 14,163.3 MB/s), un 4.6 % por detrás de la Solidigm PS9550 (14,050.1 3.8 MB/s) y un 861 % por detrás de la Micron 12,631.2 (3000 XNUMX MB/s). También superó ampliamente al SanDisk SNXNUMX, que alcanzó una velocidad inferior de XNUMX XNUMX MB/s. No obstante, los resultados de la Kingston DCXNUMXME fueron excelentes, con una mínima disminución en comparación con las unidades mejor probadas.
Latencia de lectura secuencial de 128 K (Profundidad de E/S 64 / Número de trabajos 1)
En cuanto a latencia, la Kingston DC3000ME registró una latencia promedio de 591.6 µs, lo que la situó en la mitad del grupo. Este resultado fue un 5.4 % superior al del Micron 9550 (569.0 µs) y un 5.4 % inferior al del Solidigm PS1010 (564.5 µs). La Pascari X200P lideró ligeramente con 561.4 µs, mientras que la SanDisk SN861 mostró la respuesta más lenta, con 633.0 µs. En definitiva, la Kingston DC3000ME mantuvo una latencia relativamente baja en condiciones de lectura con alta profundidad de cola.
Escritura aleatoria 64K
En la prueba de escritura aleatoria de 64K, la unidad Kingston DC3000ME ofreció un alto rendimiento de forma consistente en diversas profundidades de cola y combinaciones de subprocesos, alcanzando un máximo de 6,649 MB/s en la configuración de 32 (profundidad de E/S)/8 (número de trabajos). Este resultado se encuentra entre los más altos en todas las cargas de trabajo y puntos de prueba.
A lo largo del gráfico, la Kingston DC3000ME mantuvo una tendencia estable de ancho de banda entre 4,000 y 5,000 MB/s, con resultados especialmente sólidos en configuraciones de concurrencia media-alta, como 32/4 (5,380 MB/s) y 16/8 (5,017 MB/s). Incluso en condiciones más ligeras, como 1/4 y 2/4, se mantuvo por encima de los 4200 MB/s. En comparación con otras unidades, la Kingston DC3000ME lideró o se mantuvo cerca de la cima del grupo en la mayoría de los puntos de prueba, ofreciendo un alto rendimiento máximo y un rendimiento constante durante toda la prueba.
Latencia de escritura aleatoria de 64K
En la prueba de latencia de escritura aleatoria de 64K, la unidad Kingston DC3000ME ofreció tiempos de respuesta bajos de forma consistente en la mayoría de las profundidades de cola y combinaciones de trabajos, demostrando una alta eficiencia de escritura incluso con cargas de trabajo elevadas. Por ejemplo:
- En 4/1, mostró 49µs
- A las 8/1, la latencia se mantuvo baja en 102 µs.
- A 16/4, midió 1,486 µs.
- Y en la carga más alta probada, 32/8, alcanzó 2,402 µs.
Estos resultados indican que la unidad Kingston DC3000ME escaló de manera predecible, evitando los picos de latencia severos observados en otras unidades, especialmente las unidades Pascari y Solidigm, que exhibieron saltos erráticos por encima de 3,000–6,000 µs (más notablemente a 16/8).
Lectura aleatoria 64K
En la prueba de lectura aleatoria de 64K, la Kingston DC3000ME ofreció un rendimiento sólido y consistente en toda la matriz de profundidad de E/S/NumJobs, quedando en cuarto lugar al final de la prueba (por un pequeño margen). El ancho de banda máximo alcanzó los 13,515 32 MB/s a 4/16, con un rendimiento similarmente alto a 4/13,482 (32 8 MB/s) y 13,512/1 (4 2 MB/s), demostrando una excelente escalabilidad con cargas de trabajo de lectura paralelas intensas. Con cargas más bajas, como 2/3000 y 2,298/2,234, la Kingston DCXNUMXME registró XNUMX MB/s y XNUMX MB/s, respectivamente.
Latencia de lectura aleatoria de 64K
La latencia de la Kingston DC3000ME 64K se mantuvo relativamente baja en todos los puntos de prueba. Todas las unidades tuvieron un rendimiento similar, aunque la SanDisk SN861 alcanzó un pico notablemente superior al de las demás unidades probadas al final de la prueba. A partir de 1/2, la Kingston DC3000ME registró 106 µs, seguida de 108 µs a 1/4, 131 µs a 8/1, 133 µs a 4/4 y 177 µs a 8/4. Con mayor concurrencia, aumentó a 305 µs a 16/4, 174 µs a 32/1, 301 µs a 32/2 y alcanzó un pico de 1,184 µs por debajo de 32/8, igualando al resto del grupo. En general, el perfil de latencia del Kingston DC3000ME estuvo en estrecha relación con los de mejor rendimiento, con un mínimo jitter o picos atípicos (que fue el caso de todas las unidades probadas).
Escritura aleatoria 16K
En la prueba de escritura aleatoria de 16K, la unidad Kingston DC3000ME ofreció un excelente ancho de banda en todo el rango de profundidades de cola y conteos de subprocesos, quedando en segundo lugar entre las unidades de la competencia. Alcanzó un máximo de 427,592 IOPS con la configuración 32/16. Otros puntos de alto rendimiento incluyeron 338,521 IOPS con 32/8, 251,428 IOPS con 16/4 y 226,606 IOPS con 1/8, todos mostrando una excelente eficiencia del controlador bajo cargas paralelas variables. Incluso en configuraciones de carga moderada, como 2/16 y 1/4, la unidad alcanzó 218,300 IOPS y 204,867 IOPS, respectivamente. En general, la unidad Kingston DC3000ME logró consistentemente IOPS superiores a 160,000 en toda la matriz de prueba (excepto en algunas áreas), lo que la convierte en una de las unidades más equilibradas en esta carga de trabajo.
Latencia de escritura aleatoria de 16K
El rendimiento de latencia de escritura de la Kingston DC3000ME a 16K fue muy sólido, terminando la prueba en la cima de la clasificación (con la unidad Pascari muy por detrás). Los resultados más destacados de la Kingston DC3000ME incluyeron 14 µs a 1/1, 18 µs a 2/1, 19 µs a 1/4 y 29 µs a 1/2. A medida que aumentaba la carga, Kingston mantuvo un perfil de latencia sólido: 126 µs a 8/4, 146 µs a 2/16, 254 µs a 16/4 y 575 µs a 16/8. Incluso con la configuración más pesada, 32/16, la latencia se mantuvo bajo control en 1,197 µs.
16K Lectura aleatoria
En condiciones de lectura aleatoria de 16 3000 MB/s, la Kingston DC8ME demostró un rendimiento consistentemente sólido hasta alcanzar 8/800, momento en el que comenzó a rezagarse ligeramente. El pico de IOPS se situó en poco menos de 648,686 32 (641 4) en QD16 con cuatro trabajos, seguido de 623 16 IOPS en QD3000 con XNUMX trabajos y XNUMX XNUMX en QDXNUMX con cuatro trabajos. Desafortunadamente, la Kingston DCXNUMXME terminó la prueba cerca del final de la clasificación, junto con la unidad SanDisk.
Latencia de lectura aleatoria de 16 K
En el rendimiento máximo (QD8/8), la latencia de la Kingston DC3000ME fue de tan solo 99 µs, manteniéndose dentro de un rango estrecho y de baja latencia en la mayoría de las configuraciones hasta aproximadamente 16/8, cuando comenzó a fallar. La mejor latencia se observó en QD1/4 (74 µs), con varios resultados inferiores a 80 µs en profundidades de cola bajas a moderadas. Con cargas más pesadas, como QD32/16, la Kingston DC3000ME registró 826 µs, significativamente superior a la de las demás unidades probadas (excepto la SanDisk).
Lectura aleatoria 4K
En la prueba de lectura aleatoria 4K, la Kingston DC3000ME mostró un excelente escalamiento en todo el rango de prueba, alcanzando un máximo de 1,957.92 mil IOPS en la configuración 16/16. Mantuvo un alto rendimiento con 1,923.42 mil IOPS en 32/8, 1,361.32 mil IOPS en 8/16 y 1326.03 mil IOPS en 16/8, manteniéndose constantemente en la cima de la clasificación junto con Solidigm y Micron.
Latencia de lectura aleatoria de 4K
La Kingston DC3000ME mantuvo una baja latencia durante la prueba de lectura aleatoria 4K, comenzando con 60 µs en la configuración 1/1. A 1/4, mejoró ligeramente hasta los 61 µs, y a 1/8, se mantuvo estable en 63 µs. A medida que aumentaba la concurrencia, la latencia se incrementó de forma previsible con la Kingston DC3000ME: 66 µs a 2/4, 67 µs a 2/16, 71 µs a 4/4 y 80 µs a 8/4. Las configuraciones más pesadas experimentaron aumentos moderados, con 94 µs a 16/4, 99 µs a 16/8, 135 µs a 32/8 y un pico de 266 µs a 32/16.
Escritura aleatoria 4K
En escritura aleatoria 4K, el Kingston DC3000ME tuvo un excelente desempeño con un máximo de 979,636 IOPS a 32/16 y 979.173 IOPS a 32/8, ubicándose muy por detrás del Pascari X200P, el modelo de mayor rendimiento, que superó los 1.6 millones de IOPS en su pico. Sin embargo, el Kingston DC3000ME registró cifras decentes en cargas de rango medio, como 879 IOPS a 8/16, 944 IOPS a 16/16 y 745 IOPS a 16/4.
Latencia de escritura aleatoria de 4K
En cuanto a la latencia de escritura aleatoria, la Kingston DC3000ME comenzó con 11 µs por debajo de 1/1, se mantuvo entre 20 y 50 µs hasta alcanzar la profundidad de 8/8 y escaló a 261 µs a 32/8 y a 522 µs a 32/16. Si bien no es la latencia más baja, la Kingston DC3000ME mantuvo un escalamiento predecible y moderado, sin los picos observados en unidades como Solidigm y Pasarci, que mostraron mayor volatilidad por encima de 16 hilos.
Almacenamiento directo de GPU
Una de las pruebas que realizamos en este banco de pruebas fue la prueba Magnum IO GPU Direct Storage (GDS). GDS es una función desarrollada por NVIDIA que permite a las GPU ignorar la CPU al acceder a datos almacenados en unidades NVMe u otros dispositivos de almacenamiento de alta velocidad. En lugar de enrutar los datos a través de la CPU y la memoria del sistema, GDS permite la comunicación directa entre la GPU y el dispositivo de almacenamiento, lo que reduce significativamente la latencia y mejora el rendimiento de los datos.
Cómo funciona el almacenamiento directo en GPU
Tradicionalmente, cuando una GPU procesa datos almacenados en una unidad NVMe, los datos primero deben pasar por la CPU y la memoria del sistema antes de llegar a la GPU. Este proceso genera cuellos de botella, ya que la CPU se convierte en un intermediario, lo que agrega latencia y consume valiosos recursos del sistema. El almacenamiento directo en la GPU elimina esta ineficiencia al permitir que la GPU acceda a los datos directamente desde el dispositivo de almacenamiento a través del bus PCIe. Esta ruta directa reduce la sobrecarga asociada con el movimiento de datos, lo que permite transferencias de datos más rápidas y eficientes.
Las cargas de trabajo de IA, especialmente las que implican aprendizaje profundo, requieren un uso intensivo de datos. El entrenamiento de redes neuronales de gran tamaño requiere el procesamiento de terabytes de datos, y cualquier retraso en la transferencia de datos puede provocar que las GPU se subutilicen y que los tiempos de entrenamiento sean más prolongados. El almacenamiento directo en la GPU aborda este desafío al garantizar que los datos se entreguen a la GPU lo más rápido posible, lo que minimiza el tiempo de inactividad y maximiza la eficiencia computacional.
Además, GDS es particularmente beneficioso para cargas de trabajo que implican la transmisión de grandes conjuntos de datos, como el procesamiento de video, el procesamiento de lenguaje natural o la inferencia en tiempo real. Al reducir la dependencia de la CPU, GDS acelera el movimiento de datos y libera recursos de la CPU para otras tareas, lo que mejora aún más el rendimiento general del sistema.
Rendimiento de lectura
En nuestras pruebas de lectura secuencial GDSIO, la unidad Kingston DC3000ME demostró un escalado de rendimiento consistente y eficiente en bloques de 16 K, 128 K y 1 MB, aunque las tendencias de rendimiento variaron ligeramente según el tamaño de la transferencia. Con bloques de 16 K, el rendimiento aumentó de forma constante al aumentar el número de subprocesos, alcanzando la Kingston DC3000ME un máximo de 3.70 GiB/s con 32 subprocesos, antes de disminuir gradualmente hasta 3.41 GiB/s con 128 subprocesos. En transferencias de 128 K, la unidad alcanzó su mejor resultado de 5.88 GiB/s con 16 subprocesos y lo mantuvo durante 32 subprocesos, antes de descender a aproximadamente 5.35 GiB/s con 128 subprocesos. Con un tamaño de 1 MB, el rendimiento del Kingston DC3000ME se estancó antes, alcanzando 6.54 GiB/s con 16 subprocesos y disminuyendo modestamente a 5.91 GiB/s con 128 subprocesos.
Leer latencia
En términos de latencia, la DC3000ME mostró un escalamiento predecible (al igual que en todas las unidades probadas): un menor número de subprocesos resultó en tiempos de respuesta más bajos en todos los tamaños de bloque, y la latencia aumentó a medida que los subprocesos escalaban. A 16K, la latencia comenzó en 504 µs y aumentó gradualmente hasta 582 µs con 128 subprocesos. A 128K, la latencia de la Kingston DC3000ME comenzó en 2,60 µs y aumentó hasta 3,228 µs con el mayor número de subprocesos. Con bloques de 1 MB, la latencia mostró un aumento mayor debido a la mayor carga útil, comenzando en 2,609 µs con un subproceso y aumentando hasta 2,703 µs con 128 subprocesos.
Rendimiento de escritura
Para operaciones de lectura, la latencia promedio con bloques de 16 K comenzó en 2,247µs con un solo hilo y disminuyó a 504µs con 128 hilos, lo que demuestra un escalado eficiente en concurrencia. Para bloques de 128 K, la latencia comenzó en 4,035µs y disminuyó gradualmente a 2,601µs con 128 hilos. Con bloques de 1 M, la Kingston DC3000ME presentó la latencia general más baja, comenzando en 2,609µs con un solo hilo y manteniéndose en el rango de 2,500-2,700µs con 128 hilos, lo que demuestra una capacidad de respuesta consistente para lecturas secuenciales de gran tamaño.
Escribir latencia
La latencia promedio se mantuvo relativamente estable en los subprocesos de 1 a 16, oscilando entre 12,234 14,247 y 32 15,559 µs. Con 20,944 subprocesos, la latencia aumentó ligeramente a 64 128 µs y ascendió a 3000 28,725 µs con XNUMX subprocesos. Se observó un pico notable con XNUMX subprocesos, donde la latencia de la Kingston DCXNUMXME alcanzó los XNUMX XNUMX µs, más del doble del nivel anterior.
Conclusión
La Kingston DC3000ME se posiciona como una solución práctica para implementaciones empresariales y de centros de datos de alto rendimiento, donde la fiabilidad, el rendimiento constante y un sólido conjunto de funciones empresariales son requisitos clave. Esta unidad satisface las necesidades de integradores de sistemas, distribuidores de valor añadido (VAR) y equipos de TI en entornos de pymes que construyen y gestionan su infraestructura. Su formato U.2 y su compatibilidad con PCIe Gen5 ofrecen una amplia compatibilidad y un ancho de banda preparado para el futuro, lo que la convierte en una excelente opción para implementaciones orientadas al canal.
En cuanto al rendimiento, el DC3000ME ofrece un rendimiento y una eficiencia competitivos en diversas cargas de trabajo. Sus puntos fuertes residen en lecturas secuenciales sólidas, buena consistencia de escritura y un escalado de latencia consistente en cargas de trabajo mixtas y aleatorias. Si bien ocasionalmente se queda atrás de los mejores Gen5, como Micron y SanDisk, en ciertas pruebas de referencia de CDN o puntos de control de alto rendimiento, se mantiene competitivo, especialmente en escenarios de carga mixta sostenida y concurrencia moderada.
En general, el DC3000ME es ideal para cargas de trabajo empresariales de propósito general, satisfaciendo las necesidades de las organizaciones que buscan implementar almacenamiento de alto rendimiento sin depender de soluciones OEM altamente personalizadas. Los distribuidores de valor añadido (VAR) y los desarrolladores de sistemas encontrarán mucho que valorar, especialmente al equilibrar costo, rendimiento y escalabilidad en implementaciones de infraestructura prácticas.


Carga de trabajo de CDN Lectura 2
Latencia de lectura aleatoria de 4K

Amazon