El Dapustor Haishen3 H3200 es un SSD NVMe de bajo consumo diseñado para una variedad de aplicaciones diferentes. Hoy, veremos la iteración de la regla (E1.S) de la línea H3200 (específicamente etiquetada como H3201), que viene en dos capacidades con KIOXIA 112D NAND empresarial de 3 capas y un controlador Marvell. Anteriormente revisamos la Dapustor H3200—el modelo de factor de forma U.2. Si bien el factor de forma U.2 está diseñado más para un uso intensivo, como en centros de datos, videovigilancia e informática perimetral, la versión E1.S está diseñada principalmente para brindarles a los escaladores hiperescaladores cierta flexibilidad con respecto al rendimiento y la densidad, todo dentro de un espacio pequeño (es decir, solo un poco más grande que una unidad M.2) factor de forma.
El Dapustor Haishen3 H3200 es un SSD NVMe de bajo consumo diseñado para una variedad de aplicaciones diferentes. Hoy, veremos la iteración de la regla (E1.S) de la línea H3200 (específicamente etiquetada como H3201), que viene en dos capacidades con KIOXIA 112D NAND empresarial de 3 capas y un controlador Marvell. Anteriormente revisamos la Dapustor H3200—el modelo de factor de forma U.2. Si bien el factor de forma U.2 está diseñado más para un uso intensivo, como en centros de datos, videovigilancia e informática perimetral, la versión E1.S está diseñada principalmente para brindarles a los escaladores hiperescaladores cierta flexibilidad con respecto al rendimiento y la densidad, todo dentro de un espacio pequeño (es decir, , solo un poco más grande que una unidad M.2) factor de forma.
Dapustor H3201
En cuanto a su huella física, los beneficios de E1.S son sustanciales. Con la versión U.2 del H3200, realmente solo puede colocar 10-12 de ellos dentro de un chasis de servidor de 1U (sin tener que usar midplanes u otros métodos que consumen mucho tiempo). Con el H3200 E1.S, puede colocar 24 unidades de montaje frontal en el mismo sistema de 1U, todas las cuales son intercambiables en caliente con características de nivel empresarial. Esto es muy importante tanto para OEM como para hiperescala. Como resultado, el modelo E1.S permitirá a las organizaciones crear un servidor 1U significativamente más denso.
El DapuStor H3201 se destaca por las funciones de seguridad, como la protección de datos de extremo a extremo tanto en la ruta del firmware como del hardware, que incluye DDR ECC, LDPC, protección contra pérdida de energía. En cuanto al rendimiento, se dice que el DapuStor H3.84 de 3201 TB alcanzará velocidades secuenciales de hasta 3,400 MB/s de lectura y 2,500 MB/s de escritura, mientras que se espera que el rendimiento aleatorio de 4k llegue a 720,000 105,000 IOPS de lectura y XNUMX XNUMX IOPS de escritura.
Para mayor confiabilidad, el H3201 cuenta con una calificación de resistencia de 1 DWPD. DapuStor ofrece otro modelo E1.S con un punto de capacidad de 3.2 TB, denominado "H3101". Esta versión es el modelo de mayor resistencia, que ofrece un mejor rendimiento de escritura aleatoria (220 3 IOPS) y una vida útil mucho más prolongada con XNUMX escrituras de disco por día.
Todos los modelos de la línea DapuStor H3200 están respaldados por una garantía de 5 años.
DapuStor H3201 E1.S Especificaciones
N º de Modelo. | Tienda Dapu H3201 |
Capacidad (TB1) | 3.84TB |
Esquema | E1.S |
Protocolo de interfaz | PCle3.0×4 NVMe 1.3, puerto doble |
Tipo de flash | KIOXIA 3D NAND, TLC empresarial de 112 capas y 2 planos |
Ancho de banda de lectura (128 KB) MB/s | 3,400MB / s |
Ancho de banda de escritura (128 KB) MB/s | 2,500MB / s |
Lectura aleatoria (4KB) KIOPS | 720,000 IOPS |
Escritura aleatoria (4KB) KIOPS | 105,000 IOPS |
Consumo de energía | 8.0 W típico / 10.5 W máximo |
Latencia aleatoria 4K (típ.) R/R | <85 μs |
Latencia secuencial 4K (típ.) R/W μs | <15 μs |
Vida útil | 1 DWPD |
Tasa de error de bit incorregible (UBER) | 1 sector por 10^17 bits leídos |
Tiempo medio entre fallos (MTBF) | 2 millón de horas |
Garantía | 5 años |
DapuStor H3201 E1.S Rendimiento
Banco de pruebas
Nuestras revisiones de PCIe Gen4 Enterprise SSD aprovechan un Lenovo Think System SR635 para pruebas de aplicación y benchmarks sintéticos. El ThinkSystem SR635 es una plataforma AMD de una sola CPU bien equipada que ofrece una potencia de CPU muy por encima de lo que se necesita para hacer hincapié en el almacenamiento local de alto rendimiento. También es la única plataforma en nuestro laboratorio (y una de las pocas en el mercado actualmente) con bahías PCIe Gen4 U.2. Las pruebas sintéticas no requieren muchos recursos de CPU, pero aún aprovechan la misma plataforma de Lenovo. En ambos casos, la intención es mostrar el almacenamiento local de la mejor manera posible que se alinee con las especificaciones máximas de la unidad del proveedor de almacenamiento.
Antecedentes de prueba y comparables
La Laboratorio de pruebas de StorageReview Enterprise proporciona una arquitectura flexible para realizar pruebas comparativas de dispositivos de almacenamiento empresarial en un entorno comparable al que encuentran los administradores en implementaciones reales. El Enterprise Test Lab incorpora una variedad de servidores, redes, acondicionamiento de energía y otra infraestructura de red que permite a nuestro personal establecer condiciones del mundo real para medir con precisión el rendimiento durante nuestras revisiones.
Incorporamos estos detalles sobre el entorno de laboratorio y los protocolos en las revisiones para que los profesionales de TI y los responsables de la adquisición de almacenamiento puedan comprender las condiciones en las que hemos logrado los siguientes resultados. El fabricante del equipo que estamos probando no paga ni supervisa ninguna de nuestras revisiones. Detalles adicionales sobre el Laboratorio de pruebas de StorageReview Enterprise y una descripción general de sus capacidades de red están disponibles en esas páginas respectivas.
Análisis de la carga de trabajo de la aplicación
Para comprender las características de rendimiento de los dispositivos de almacenamiento empresarial, es esencial modelar la infraestructura y las cargas de trabajo de las aplicaciones que se encuentran en los entornos de producción en vivo. Nuestros puntos de referencia para el DapuStor H3200 son, por lo tanto, el Rendimiento de MySQL OLTP a través de SysBench y Rendimiento de OLTP de Microsoft SQL Server con una carga de trabajo de TCP-C simulada. Para nuestras cargas de trabajo de aplicaciones, cada unidad ejecutará de 2 a 4 máquinas virtuales configuradas de manera idéntica.
Rendimiento de SQL Server
Cada máquina virtual con SQL Server está configurada con dos discos virtuales: un volumen de 100 GB para el arranque y un volumen de 500 GB para la base de datos y los archivos de registro. Desde la perspectiva de los recursos del sistema, configuramos cada VM con 16 vCPU, 64 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI. Si bien nuestras cargas de trabajo de Sysbench probadas anteriormente saturaron la plataforma tanto en E/S de almacenamiento como en capacidad, la prueba de SQL busca el rendimiento de la latencia.
Esta prueba usa SQL Server 2014 ejecutándose en máquinas virtuales invitadas de Windows Server 2012 R2 y está destacada por Benchmark Factory for Databases de Quest. Reseñas de almacenamiento Protocolo de prueba OLTP de Microsoft SQL Server emplea el borrador actual del Benchmark C (TPC-C) del Transaction Processing Performance Council, un benchmark de procesamiento de transacciones en línea que simula las actividades que se encuentran en entornos de aplicaciones complejos. El punto de referencia TPC-C se acerca más que los puntos de referencia de rendimiento sintéticos para medir las fortalezas de rendimiento y los cuellos de botella de la infraestructura de almacenamiento en entornos de bases de datos. Cada instancia de nuestra VM de SQL Server para esta revisión utiliza una base de datos de SQL Server de 333 GB (escala 1,500) y mide el rendimiento transaccional y la latencia bajo una carga de 15,000 XNUMX usuarios virtuales.
Configuración de prueba de SQL Server (por VM)
- Windows Server 2012 R2
- Huella de almacenamiento: 600 GB asignados, 500 GB utilizados
- SQL Server 2014
-
- Tamaño de la base de datos: escala 1,500
- Carga de clientes virtuales: 15,000
- Búfer RAM: 48GB
- Duración de la prueba: 3 horas
-
- 2.5 horas de preacondicionamiento
- Período de muestra de 30 minutos
Para nuestro punto de referencia transaccional de SQL Server, el DapuStor H3201 E1.S obtuvo una puntuación promedio de 12,650 4 TPS en 2 VM, que fue una puntuación sólida. La versión U.12,646 tuvo una media de XNUMX TPS.
En latencia promedio, el DapuStor H3200 mostró otro resultado sólido con 2.5 ms, mientras que la versión U.2 mostró un promedio significativamente más alto de 126.5 ms.
Rendimiento de Sysbench
El siguiente punto de referencia de la aplicación consiste en un Base de datos OLTP MySQL de Percona medido a través de SysBench. Esta prueba mide el promedio de TPS (transacciones por segundo), la latencia promedio y también la latencia promedio del percentil 99.
Cada banco de sistema La máquina virtual está configurada con tres discos virtuales: uno para arranque (~92 GB), uno con la base de datos preconstruida (~447 GB) y el tercero para la base de datos bajo prueba (270 GB). Desde la perspectiva de los recursos del sistema, configuramos cada máquina virtual con 16 vCPU, 60 GB de DRAM y aprovechamos el controlador LSI Logic SAS SCSI.
Configuración de prueba de Sysbench (por VM)
- CentOS 6.3 de 64 bits
- Percona XtraDB 5.5.30-rel30.1
-
- Tablas de base de datos: 100
- Tamaño de la base de datos: 10,000,000
- Subprocesos de la base de datos: 32
- Búfer RAM: 24GB
- Duración de la prueba: 3 horas
-
- 2 horas preacondicionamiento 32 hilos
- 1 hora 32 hilos
En cuanto a nuestro punto de referencia transaccional Sysbench, el DapuStor H3200 E1.S registró una sólida puntuación total de 8,646, que fue mucho mejor que el promedio de 3200 TPS del modelo H2 U.7,879.
El E1.S H3200 continuó con su buen desempeño con una latencia promedio de Sysbench de 14.8 ms. El modelo H3200 U.2 se quedó atrás nuevamente con un promedio de 23.3 ms.
Para nuestra latencia en el peor de los casos (percentil 99), el H3200 tuvo una latencia impresionante de 27.61 ms, mientras que la versión H3200 U.2 tuvo 31.18 ms.
Análisis de carga de trabajo de VDBench
Cuando se trata de comparar dispositivos de almacenamiento, las pruebas de aplicaciones son las mejores y las pruebas sintéticas ocupan el segundo lugar. Si bien no es una representación perfecta de las cargas de trabajo reales, las pruebas sintéticas ayudan a los dispositivos de almacenamiento de referencia con un factor de repetibilidad que facilita la comparación de manzanas con manzanas entre las soluciones de la competencia. Estas cargas de trabajo ofrecen una gama de diferentes perfiles de prueba que van desde pruebas de "cuatro esquinas", pruebas comunes de tamaño de transferencia de bases de datos, hasta capturas de seguimiento de diferentes entornos VDI. Todas estas pruebas aprovechan el generador de cargas de trabajo vdBench común, con un motor de secuencias de comandos para automatizar y capturar resultados en un gran clúster de pruebas informáticas. Esto nos permite repetir las mismas cargas de trabajo en una amplia gama de dispositivos de almacenamiento, incluidos arreglos flash y dispositivos de almacenamiento individuales. Nuestro proceso de prueba para estos puntos de referencia llena toda la superficie del disco con datos, luego divide una sección del disco equivalente al 25% de la capacidad del disco para simular cómo el disco podría responder a las cargas de trabajo de la aplicación. Esto es diferente a las pruebas de entropía completa que usan el 100% del impulso y lo llevan a un estado estable. Como resultado, estas cifras reflejarán velocidades de escritura más altas.
perfiles:
- Lectura aleatoria 4K: 100 % de lectura, 128 subprocesos, 0-120 % de iorate
- Escritura aleatoria 4K: 100 % de escritura, 64 subprocesos, 0-120 % de iorate
- Lectura secuencial de 64 K: 100 % de lectura, 16 subprocesos, 0-120 % de iorate
- Escritura secuencial de 64 K: 100 % de escritura, 8 subprocesos, 0-120 % de iorate
- Base de datos sintética: SQL y Oracle
- Trazas de clones vinculados y clones completos de VDI
Comparables:
Nuestro primer análisis de carga de trabajo de VDBench es una lectura aleatoria de 4K. Aquí, el H3201 E1.S registró una puntuación máxima de 719,236 709.2 IOPS leídos a 3200 µs. En comparación, la versión H2 U.788,774 alcanzó un máximo de 161 XNUMX IOPS con una latencia mucho más baja de XNUMX µs.
Para escritura aleatoria 4K, el H3201 E1.S alcanzó 312,913 1,623.4 IOPS a 3200 µs, mientras que el modelo H2 U.274,362 alcanzó 463 XNUMX IOPS a una latencia de XNUMX µs.
Al cambiar a cargas de trabajo secuenciales de 64k, el H3201 mostró excelentes resultados con un rendimiento máximo de 50,344 3.15 IOPS (o 1,269.6 GB/s) con una latencia de 3200 µs, mientras que el modelo H2 U.52,860 alcanzó un máximo de 3.3 301.8 IOPS (o XNUMX GB/s). ) con una latencia de XNUMX µs.
En escritura de 64k, el modelo DapuStor H3201 ES.1 alcanzó un máximo de 20,251 1.27 IOPS (o 3,147.5 GB/s); sin embargo, tuvo un gran impacto en la latencia al final de la prueba, que finalizó en 3200 µs. La versión H2 U.22,654 alcanzó 1.42 IOPS (o 699.3 GB/s) y XNUMX ms.
Nuestro próximo conjunto de pruebas son nuestras cargas de trabajo de SQL: SQL, SQL 90-10 y SQL 80-20. Comenzando con SQL, y como era de esperar, el modelo DapuStor H3200 U.2 mostró resultados notablemente mejores, donde alcanzó un máximo de 281,512 113.2 IOPS con una latencia de solo 3201 µs. El modelo H1 E219,870.S alcanzó un máximo de 144.1 XNUMX IOPS con una latencia de XNUMX µs.
En SQL 90-10, el H3201 E1.S mostró un pico de 200,283 158.3 IOPS a 3200 µs, mientras que el modelo H2 U.259,351 registró 118.3 XNUMX IOPS y XNUMX µs.
Con SQL 80-20, el H3201 E1.S alcanzó un máximo de 182,944 173.2 a 3200 µs, mientras que el modelo H2 U.247,053 mostró 129 XNUMX IOPS con una latencia de XNUMX µs.
Lo siguiente son nuestras cargas de trabajo de Oracle: Oracle, Oracle 90-10 y Oracle 80-20. Comenzando con Oracle, el DapuStor H3201 E1.S alcanzó un máximo de 174,220 204.1 IOPS con una latencia de 3200 µs. El modelo H2 U.263,217 alcanzó 132.8 IOPS con una latencia de XNUMX µs.
En cuanto a Oracle 90-10, el modelo DapuStor H3201 E1.S alcanzó un máximo de 164,870 131 IOPS con 3200 µs de latencia, mientras que el modelo H2 U.218,213 alcanzó 100.4 XNUMX IOPS a XNUMX µs.
Con Oracle 80-20, el H3201 E1.S alcanzó un máximo de 155,614 139.7 a 3200 µs, mientras que el modelo H2 U.212,157 alcanzó un máximo de 103.1 XNUMX IOPS con una latencia de XNUMX µs.
A continuación, cambiamos a nuestra prueba de clonación de VDI, completa y vinculada. Para VDI Full Clone (FC) Boot, el DapuStor H3201 E1.S tuvo un pico de 135,628 255 IOPS a 3200 µs, mientras que el modelo H2 U.191,069 alcanzó 179.1 XNUMX IOPS a una latencia de XNUMX µs.
El inicio de sesión inicial de VDI FC vio el pico de DapuStor H3201 E1.S en 68,248 439.1 IOPS a 3200 µs, mientras que el modelo H2 U.115,354 alcanzó 259.2 XNUMX IOPS con una latencia de XNUMX µs.
Para VDI FC Monday Login, el H3201 alcanzó un máximo de 53,529 293.9 IOPS a 3200 µs, mientras que el modelo H2 U.87,136 alcanzó 182.6 XNUMX IOPS a una latencia de XNUMX µs.
Para el arranque VDI Linked Clone (LC), el H3201 E1.S alcanzó un máximo de 69,288 229.7 IOPS a 3200 µs, mientras que la unidad H2 U.95,726 pudo alcanzar los 166.5 XNUMX IOPS con una latencia de XNUMX µs.
El inicio de sesión inicial de VDI LC mostró una puntuación máxima de 17,926 443.1 IOPS a 3200 µs, mientras que el modelo H2 U.50,750 alcanzó un máximo de 154.9 XNUMX IOPS con una latencia de XNUMX µs.
Por último, con VDI LC Monday Login, DapuStor H3201 E1.S mostró un rendimiento muy inestable a medida que se acercaba a 20 40 IOPS, con picos que terminaron en un máximo de poco menos de 400 3200 y cerca de la marca de 2 µs. El modelo H66,846 U.236.9 mostró un rendimiento muy estable, con un máximo de XNUMX XNUMX IOPS a XNUMX µs.
Conclusión
El DapuStor H3201 es una solución Gen3 NVMe SSD que cuenta con 112D NAND de 3 capas de KIOXIA y un controlador Marvell. Viene solo en el factor de forma E1.S en una capacidad (3.84 TB), lo que lo convierte principalmente en una unidad para entornos de hiperescala en este momento. Aquellos que buscan una mayor resistencia tienen la opción del modelo H3201, que presenta un rendimiento de escritura mejorado y una clasificación DWPD más alta.
Durante nuestras pruebas, comparamos la unidad con el H3200, la versión U.2 de la línea DapuStor Haishen3. Para el análisis de la carga de trabajo de la aplicación, el DapuStor H3201 nos brindó algunos resultados bastante sólidos, alcanzando 12,646 4 TPS a 2.5 VM y 8,646 ms de latencia promedio. Para Sysbench, la unidad alcanzó los 14.8 TPS, 27.61 ms de latencia media y XNUMX ms de latencia en el peor de los casos, todo ello con un rendimiento de nivel superior.
Durante nuestra prueba VDbench, el rendimiento disminuyó en comparación con el modelo U.2. Aspectos destacados incluidos: 719,236 IOPS en lectura 4K, 312,913 IOPS en escritura 4K, 3.15 GB/s en lectura 64K y 1.27 GB/s en escritura 64K. En las cargas de trabajo de SQL, alcanzó 219,870 200,283 IOPS mientras alcanzaba 90 10 IOPS para SQL 182,944-80 y 20 174,220 IOPS para SQL 164,870-90. Para nuestras cargas de trabajo de Oracle, alcanzó un máximo de 10 155,614 IOPS, 80 20 IOPS en Oracle 3200-135,628 y 68,248 53,529 IOPS en Oracle 69,288-17,926. En nuestras pruebas VDI Full Clone, el H40 alcanzó XNUMX XNUMX (arranque), XNUMX XNUMX IOPS (inicio de sesión inicial), XNUMX XNUMX IOPS (inicio de sesión del lunes), mientras que Linked Clone registró XNUMX XNUMX IOPS (inicio), XNUMX XNUMX IOPS (inicio de sesión inicial) y un pico muy inestable de ~XNUMX XNUMX IOPS (inicio de sesión el lunes).
Aunque los casos de uso de aplicaciones para la regla son bastante limitados en este momento (por ejemplo, hiperescala), especialmente para estas unidades delgadas sin sincronización de calor, Servidores E1.S están a punto de convertirse en la corriente principal. Esto aumentará significativamente la cantidad de ranuras de unidades disponibles para los servidores empresariales y, a su vez, dará como resultado nuevos servidores y sistemas de almacenamiento impulsados por IOPS de alta densidad que marcan la pauta con un gran enfoque en la capacidad de servicio. El DapuStor H3201 utiliza una interfaz Gen3 más antigua, pero el rendimiento es prometedor y esta debería ser una buena plataforma para que DapuStor avance hacia los SSD Gen4 y Gen5 E1.S.
Interactuar con StorageReview
Boletín | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS Feed