Inicio Empresa Revisión de Micron RealSSD P320h Enterprise PCIe

Revisión de Micron RealSSD P320h Enterprise PCIe

by kevin obrien

El Micron RealSSD P320h es un acelerador de aplicaciones de media altura, media longitud (HHHL) que aprovecha SLC NAND y una interfaz PCIe Gen 2 x8 para impulsar el rendimiento cotizado de 3.2 GB/s de lectura secuencial y hasta 785,000 320 IOPS de lectura aleatoria. La arquitectura P700h es una desviación de muchos de los otros aceleradores de aplicaciones recientes que hemos revisado que generalmente RAID juntan varias unidades flash. La oferta de Micron es diferente; en su lugar, utiliza RAIN (matriz redundante de NAND independientes) con un controlador personalizado, que es similar al enfoque adoptado por Fusion-io y Virident. Esta arquitectura le permite a Micron presumir de una velocidad vertiginosa y latencia mientras ofrece un alto nivel de seguridad de datos en el disco. En esta revisión, probamos un par de tarjetas de 320 GB y veremos no solo qué tan rápido funcionan por sí solas, sino también cómo escala la P2012h en Windows Server XNUMX.


El Micron RealSSD P320h es un acelerador de aplicaciones de media altura, media longitud (HHHL) que aprovecha SLC NAND y una interfaz PCIe Gen 2 x8 para impulsar el rendimiento cotizado de 3.2 GB/s de lectura secuencial y hasta 785,000 320 IOPS de lectura aleatoria. La arquitectura P700h es una desviación de muchos de los otros aceleradores de aplicaciones recientes que hemos revisado que generalmente RAID juntan varias unidades flash. La oferta de Micron es diferente; en su lugar, utiliza RAIN (matriz redundante de NAND independientes) con un controlador personalizado, que es similar al enfoque adoptado por Fusion-io y Virident. Esta arquitectura le permite a Micron presumir de una velocidad vertiginosa y latencia mientras ofrece un alto nivel de seguridad de datos en el disco. En esta revisión, probamos un par de tarjetas de 320 GB y veremos no solo qué tan rápido funcionan por sí solas, sino también cómo escala la P2012h en Windows Server XNUMX.

Como se señaló, la arquitectura de la unidad y las políticas de administración de NAND desempeñan un papel fundamental en términos del rendimiento del dispositivo visto desde la perspectiva del rendimiento y la latencia. Con el P320h, Micron fusiona su propia IP con el diseño y fabricación ASIC de IDT. El resultado neto es un controlador ASIC que incluye inteligencia patentada de Micron en torno a la gestión y el control NAND, que incluye RAIN. El enfoque RAIN de Micron es muy eficiente en la forma en que maneja NAND y esa eficiencia es, en última instancia, lo que impulsa el rendimiento y la protección de datos del P320h. Micron utiliza lo que equivale a una arquitectura 7+1P RAID5 dentro de RAIN. Con el uso de bandas en el nivel 7+1, Micron puede ofrecer el mismo rendimiento que una unidad sin paridad, al mismo tiempo que proporciona la protección de datos que requieren las empresas.

Si bien el P320h es interesante gracias a las técnicas de gestión Micron NAND, físicamente también es interesante. El PCB HHHL está lleno de piezas de Micron, incluidas SLC NAND y DDR, por supuesto, y no requiere una conexión de alimentación externa para alcanzar el máximo rendimiento. Nuestras unidades de 700 GB tienen 64 piezas NAND intercaladas en la placa que se destaca por el disipador de calor pasivo en el único controlador. El diseño de controlador único permite un mejor rendimiento y confiabilidad que las soluciones de la competencia que se basan en la combinación de múltiples controladores a través de hardware y software. El uso de un controlador diseñado específicamente para Micron NAND le da a Micron otra ventaja cuando se trata de interoperabilidad, rendimiento y soporte de la unidad. Al contrario de lo que se ha informado en otros lugares, la unidad no es compatible con NVMe, sin embargo, Micron definitivamente se dirige en esa dirección con productos futuros.

Micron ofrece el P320h en dos capacidades solo para SLC, 350 GB y 700 GB utilizables. Una unidad de 350 GB comienza como 512 GB RAW, pero después de restar el 12.5 % por RAIN y luego el 22 % por exceso de aprovisionamiento, la unidad tiene 350 GB. El P320h ofrece hasta 25 PB de resistencia para el modelo de 350 GB y 50 PB para el de 700 GB y viene con herramientas de software para la gestión de unidades y la generación de informes de estado.

Micron RealSSD P320h Especificaciones

  • Capacidades
    • 350 GB (MTFDGAR350SAH-1N1AB)
      • Lectura secuencial: 3.2 GB/s (128 KB, estado estable)
      • Escritura secuencial: 1.9 GB/s (128 KB, estado estable)
      • Lectura aleatoria: 785,000 4 IOPS (XNUMX KB, estado estable)
      • Escritura aleatoria: 175,000 4 IOPS (XNUMX KB, estado estable)
    • 700 GB (MTFDGAR700SAH-1N1AB)
      • Lectura secuencial: 3.2 GB/s (128 KB, estado estable)
      • Escritura secuencial: 1.9 GB/s (128 KB, estado estable)
      • Lectura aleatoria: 785,000 4 IOPS (XNUMX KB, estado estable)
      • Escritura aleatoria: 205,000 4 IOPS (XNUMX KB, estado estable)
  • Listo Latencia: <42 µs (512 bytes)
  • Latencia de escritura: <9 µs
  • Interfaz: PCIe Gen2 x8
  • Potencia: 25W máximo, 10W inactivo
  • Factor de forma: HHHL
  • Cola de comandos nativos hasta 256 comandos
  • Resistencia: 350 GB - 25 PB, 700 GB - 50 PB
  • Dimensiones: 68.90mm x 167.65mm x 18.71mm
  • Temperatura de funcionamiento: 0°C a +50°C
  • Compatibilidad con SO
    • Microsoft: Windows Server 2008 R2 SP1 (x86-64), Windows Server 2008 R2 SP1 Hyper-V (x86-64), Windows Server 2012 (x86-64) SP128, Windows Server 2012 Hyper-V (x64)
    • Linux: RHEL Linux 5.5, 5.6, 5.7, 5.8 (SP128), 6.1, 6.2 (x86-64), SLES Linux 11 SP1 y SP2 (x86-64)
    • GPL de código abierto (Kernel Rev. 2.6.25+)
  • Retención de datos al final de la vida útil 1 año

Descripción general del video

Construcción y Diseño

La Micron RealSSD P320h es una tarjeta PCI-Express x8 de media altura y media longitud que presenta el diseño PCIe AA más básico del mercado en términos de diseño. Con un solo controlador y dos tarjetas secundarias pequeñas, es más delgado que cualquier otra solución que hayamos revisado hasta la fecha y, con mucho, la menos compleja. Esto funciona a favor de Micron de múltiples maneras. En primer lugar, la tarjeta se adapta automáticamente a casi todos los servidores del mercado que admiten tarjetas de expansión PCIe, pero también entra en juego cuando se compara la confiabilidad general en soluciones empresariales. Con un solo controlador y ni siquiera un conmutador PCIe como se encuentra en las ofertas Fusion-io "Duo", hay menos piezas que pueden fallar. Esto contrasta marcadamente con las configuraciones de múltiples controladores que se encuentran en algunas soluciones de la competencia que RAID juntan múltiples controladores SandForce. En un mercado que odia apagar las plataformas una vez que están en producción, excepto por el eventual reemplazo en el futuro, saber que el dispositivo que instaló hoy funcionará durante años sin causar problemas es una gran ventaja.

En el corazón de Micron RealSSD P320h se encuentra un controlador Micron/IDT ASIC personalizado que es exclusivo de esta solución. En nuestras dos muestras de 700 GB, este controlador se vincula a un grupo de 1 TB de Micron SLC NAND y se almacena en búfer con 2.25 GB de Micron DDR RAM. Dependiendo de cómo se mire, esos artículos ofrecen una gran ventaja de Micron, ya que tienen un conocimiento muy detallado de cómo funcionan todos esos componentes a nivel central al tenerlos internamente.

El Micron RealSSD P320h es muy ágil en lo que respecta al consumo de energía, ya que consume menos de 25 vatios de un bus PCIe 2.0 x8; sin necesidad de conexión de alimentación externa. Esto le da al P320h más flexibilidad cuando se trata de encontrar plataformas adecuadas para instalar, sin necesidad de cables de alimentación adicionales o servidores de prueba para suministrar energía a través de la especificación PCIe.

Software de gestión

Si bien la mayoría de los aceleradores de aplicaciones vienen con algún software, la facilidad de uso y la efectividad de esas herramientas varían de excelentes a deficientes. Micron proporciona sus herramientas RealSSD Manager diseñadas para que la gestión del P320h sea más eficaz, incluidas una CLI y una GUI. Estas herramientas son compatibles con Windows y Linux y ofrecen una amplia gama de funciones. Los usuarios pueden aprovechar estas herramientas de software para actualizar el firmware de la unidad, verificar el estado del PCIe AA e iniciar un formato de dispositivo. En el nivel más avanzado, puede monitorear el uso y la temperatura actuales de la unidad, con capacidades de registro integradas.

En comparación con las utilidades incluidas por el fabricante que hemos visto hasta la fecha, Micron se encuentra justo debajo de Fusion-io en términos de conjunto de funciones y diseño general. Si bien escatima un poco en diseño en comparación con ioSphere, Micron RealSSD Manager ofrece muchas de las mismas capacidades de administración y monitoreo, aunque solo a nivel local. Actualmente no es compatible con el monitoreo de dispositivos en sistemas remotos, pero en general ofrece un gran avance en las funciones en comparación con las herramientas de administración LSI u OCZ.

Antecedentes de prueba y comparables

Cuando se trata de probar hardware empresarial, el entorno es tan importante como los procesos de prueba utilizados para evaluarlo. En StorageReview, ofrecemos el mismo hardware e infraestructura que se encuentran en muchos centros de datos a los que, en última instancia, estarían destinados los dispositivos que probamos. Esto incluye solo pruebas con servidores empresariales, así como equipos de infraestructura adecuados, como redes empresariales, espacio de rack, acondicionamiento/supervisión de energía y hardware comparable de la misma clase para evaluar correctamente el rendimiento de un dispositivo. Ninguna de nuestras revisiones está pagada o controlada por el fabricante del equipo que estamos probando; con comparables relevantes seleccionados a nuestra discreción de productos que tenemos en nuestro laboratorio.

Plataforma de prueba empresarial StorageReview:

Lenovo Think Server RD240

  • 2 x Intel Xeon X5650 (2.66 GHz, caché de 12 MB)
  • Windows Server 2008 Standard Edition R2 SP1 de 64 bits y CentOS 6.2 de 64 bits
  • Conjunto de chips Intel 5500+ ICH10R
  • Memoria: 8 GB (2 x 4 GB) 1333 Mhz DDR3 RDIMM registrados

Cuando se trataba de elegir comparables para esta revisión, elegimos a los favoritos de cada fabricante, pero solo en áreas que tenían sentido frente al Micron RealSSD P320h equipado con SLC. Por esa razón, descartamos el LSI WarpDrive de primera generación, ya que fue reemplazado por el Nytro WarpDrive de segunda generación, así como el OCZ Z-Drive R4, que quedó demasiado fuera de la curva de latencia para las necesidades del mercado de almacenamiento empresarial de rendimiento. .

640GB Fusion-io ioDrive Duo

  • Lanzamiento: 1S2009
  • Tipo NAND: MLC
  • Controlador: 2 x propietario
  • Visibilidad del dispositivo: JBOD, software RAID según el sistema operativo
  • Fusion-io VSL Windows: 3.1.1
  • Fusion-io VSL Linux 3.1.1

200GB LSI Nytro WarpDrive WLP4-200

  • Lanzamiento: 1S2012
  • Tipo NAND: SLC
  • Controlador: 4 x LSI SandForce SF-2500 a través de LSI SAS2008 PCIe a SAS Bridge
  • Visibilidad del dispositivo: hardware fijo RAID0
  • Windows LSI: 2.10.51.0
  • LSI Linux: Controlador nativo CentOS 6.2

SSD Real P700h de 320 GB

  • Lanzamiento: 2S2011
  • Tipo NAND: SLC
  • Controlador: 1 x propietario
  • Visibilidad del dispositivo: dispositivo único
  • Micron Windows: 7.03.3452.00
  • Micron Linux: 1.3.7-1

Análisis de carga de trabajo sintética empresarial (configuración de stock)

La forma en que vemos las soluciones de almacenamiento PCIe es más profunda que solo observar el rendimiento tradicional en ráfagas o en estado estable. Al observar el rendimiento promedio durante un largo período de tiempo, pierde de vista los detalles detrás del rendimiento del dispositivo durante todo ese período. Dado que el rendimiento de flash varía mucho a medida que pasa el tiempo, nuestro nuevo proceso de evaluación comparativa analiza el rendimiento en áreas que incluyen el rendimiento total, la latencia promedio, la latencia máxima y la desviación estándar durante toda la fase de preacondicionamiento de cada dispositivo. Con los productos empresariales de gama alta, la latencia suele ser más importante que el rendimiento. Por esta razón, hacemos todo lo posible para mostrar las características de rendimiento completo de cada dispositivo que ponemos a prueba. Laboratorio de pruebas empresarial.

También agregamos comparaciones de rendimiento para mostrar el rendimiento de cada dispositivo con un conjunto de controladores diferente en los sistemas operativos Windows y Linux mediante el generador de carga de trabajo Fio. Para Windows, usamos los controladores más recientes en el momento de la revisión original, y luego cada dispositivo se prueba en un entorno de Windows Server 64 R2008 de 2 bits. Para Linux, usamos el entorno CentOS 64 de 6.2 bits, que es compatible con cada Acelerador de aplicaciones Enterprise PCIe. Nuestro principal objetivo con esta prueba es mostrar cómo difiere el rendimiento del sistema operativo, ya que tener un sistema operativo que figura como compatible en una hoja de producto no siempre significa que el rendimiento en todos ellos sea igual.

Todos los dispositivos probados se someten a la misma política de prueba de principio a fin. Actualmente, para cada carga de trabajo individual, los dispositivos se borran de forma segura utilizando las herramientas proporcionadas por el proveedor, preacondicionados en estado estable con la carga de trabajo idéntica con la que se probará el dispositivo bajo una carga pesada de 16 subprocesos con una cola pendiente de 16 por subproceso, y luego se prueba en intervalos establecidos en múltiples perfiles de profundidad de subprocesos/colas para mostrar el rendimiento con un uso ligero y pesado. Para las pruebas con 100 % de actividad de lectura, el preacondicionamiento es con la misma carga de trabajo, aunque cambia a 100 % de escritura.

Pruebas de preacondicionamiento y de estado estacionario primario:

  • Rendimiento (lectura+escritura de IOPS agregado)
  • Latencia promedio (latencia de lectura y escritura promediadas juntas)
  • Latencia máxima (máxima latencia de lectura o escritura)
  • Desviación estándar de latencia (desviación estándar de lectura+escritura promediada)

En este momento, Enterprise Synthetic Workload Analysis incluye cuatro perfiles comunes, que pueden intentar reflejar la actividad del mundo real. Estos se eligieron para tener cierta similitud con nuestros puntos de referencia anteriores, así como un terreno común para compararlos con valores ampliamente publicados, como la velocidad máxima de lectura y escritura de 4K, así como 8K 70/30 comúnmente utilizados para unidades empresariales. También incluimos dos cargas de trabajo mixtas heredadas, incluido el servidor de archivos tradicional y el servidor web que ofrece una amplia combinación de tamaños de transferencia. Estos dos últimos se eliminarán gradualmente con los puntos de referencia de la aplicación en esas categorías a medida que se introduzcan en nuestro sitio y se reemplazarán con nuevas cargas de trabajo sintéticas.

  • 4K
    • 100 % de lectura o 100 % de escritura
    • 100% 4K
  • 8K 70/30
    • 70% lectura, 30% escritura
  • servidor de archivos
    • 80% lectura, 20% escritura
    • 10% 512b, 5% 1k, 5% 2k, 60% 4k, 2% 8k, 4% 16k, 4% 32k, 10% 64k
  • Servidor Web
    • 100% Leer
    • 22% 512b, 15% 1k, 8% 2k, 23% 4k, 15% 8k, 2% 16k, 6% 32k, 7% 64k, 1% 128k, 1% 512k

Pasando a nuestra primera prueba que cubre una carga de trabajo de preacondicionamiento de escritura aleatoria de 4K, Micron RealSSD P320h comienza alto, con velocidades de ráfaga apenas por debajo de 400k IOPS en nuestro Lenovo ThinkServer. El rendimiento se estabilizó por encima de 200k IOPS alrededor de la marca de los 80 minutos, con un rendimiento muy similar entre nuestros entornos de prueba de CentOS 6.2 y Windows Server 2008.

En cuanto a la latencia promedio durante la duración de nuestra prueba de preacondicionamiento 4K, el P320h se instaló rápidamente en poco más de 1 ms de latencia con una carga de 16T/16Q, muy por debajo del LSI Nytro WarpDrive equipado con SLC.

Al comparar la latencia máxima de Windows y Linux durante la duración de nuestra carga de trabajo de preacondicionamiento, descubrimos que el entorno de Linux ofrecía la menor cantidad de picos de latencia alta, mientras que el conjunto de controladores de Windows fluctuó a veces a 1,000 ms.

Si bien los picos de 1,000 ms pueden ser desconcertantes, la comparación de la desviación estándar brinda una mejor imagen general de la latencia general durante la prueba. En el caso del P320h, incluso con sus picos más altos en Windows Server 2008, logró quedar en segundo lugar después de sí mismo en Linux.

Después de salir de la fase de preacondicionamiento, tomamos una muestra más larga de cada acelerador de aplicaciones en la carga de trabajo de 4K con una carga de 16T/16Q. El Micron RealSSD P320h ofreció el rendimiento más alto con diferencia, tanto en lectura aleatoria 4K como en escritura aleatoria, con la ventaja otorgada a su conjunto de controladores Linux. En CentOS, medimos 417 378 IOPS de lectura frente a "solo" 4 202 IOPS en Windows. La velocidad de escritura aleatoria de XNUMXK fue consistente en ambas plataformas, midiendo más de XNUMXk IOPS.

Con el rendimiento casi increíble, no fue una sorpresa ver el P320h con la latencia promedio más baja. La latencia de lectura promedio estuvo ligeramente por encima de los 0.6 ms, con una latencia de escritura de 1.26 ms.

Al comparar la latencia máxima en nuestra muestra final de rendimiento de lectura y escritura aleatoria de 4K, Micron RealSSD P320h tuvo algunos de los puntos de lectura aleatoria de 4K más altos del grupo tanto en Windows como en Linux. El rendimiento de escritura aleatoria estuvo más dividido, con una latencia máxima más alta en el lado de Windows y una latencia máxima más baja en el segmento de Linux.

Al profundizar más en la latencia general, Micron realSSD P320h ofreció el rendimiento 4K aleatorio más consistente en Linux con diferencia, y un poco menos con sus controladores de Windows.

Nuestra próxima prueba cambia el enfoque a nuestra carga de trabajo 8K 70/30, donde el Micron P320h nuevamente lidera al grupo por un amplio margen en rendimiento. En este segmento, las velocidades de ráfaga cambiaron en 30 minutos en la prueba y luego se estabilizaron en un estado estable alrededor de la marca de 120 minutos.

El P320h ofreció una latencia promedio muy baja en nuestra carga de trabajo de 8K 70/30, midiendo alrededor de 1.5 ms durante la duración del proceso de preacondicionamiento. El conjunto de controladores de Linux ofreció una ligera ventaja, pero en el esquema general de las cosas sería difícil notar esa diferencia.

Cambiando el enfoque de la latencia media a la máxima, hay una diferencia notable entre el comportamiento en Windows y en Linux. Los controladores de Windows tenían tiempos de respuesta máximos que oscilaban entre 1,000 y 1,200 ms, mientras que el lado de Linux fue más bajo, alrededor de 200 ms.

Si bien la latencia máxima muestra los peores tiempos de respuesta individuales, nuestra siguiente sección analiza la desviación estándar para ver cómo se desarrolló la imagen general de la latencia durante nuestra etapa de preacondicionamiento. En Linux, el Micron P320h ofreció un nivel de consistencia mucho mayor en comparación con el lado de Windows. Si bien el rendimiento de Windows fue menos consistente, todavía se ubicó en el medio del paquete.

En comparación con la carga de trabajo máxima fija de 16 subprocesos y 16 colas que realizamos en la prueba de escritura 100 % 4K, nuestros perfiles de carga de trabajo mixtos escalan el rendimiento en una amplia gama de combinaciones de subprocesos/colas. En estas pruebas, ampliamos la intensidad de nuestra carga de trabajo desde 2 subprocesos y 2 colas hasta 16 subprocesos y 16 colas. El Micron P320h ofreció una ventaja dominante en profundidades de cola más altas sobre los comparables en este grupo, mientras que cedió solo un rendimiento mínimo en el nivel 2T/2Q. En todo el espectro, el conjunto de controladores de Linux ofreció un mayor rendimiento en la mayoría de las áreas por un pequeño margen.

El Micron RealSSD P320h ofreció los mejores tiempos de respuesta del grupo en todos los segmentos, excepto en el de 2T/2Q, y se mantuvo por debajo de 1 ms en todos los segmentos, excepto en el de 16T/16Q.

Los tiempos de respuesta más altos comenzaron a aparecer en el P320h en Windows hacia la mitad de la prueba, con más de 4 subprocesos simultáneos. Los controladores de Linux mantuvieron esos errores contenidos en todas las pruebas, excepto en las pruebas QD128 y QD256 más efectivas, en las que se acercaron a los 200 ms.

Comparando la desviación estándar, Micron RealSSD P320h ofreció su rendimiento más consistente bajo Linux y se ubicó en el medio del paquete para su conjunto de controladores de Windows.

La carga de trabajo del servidor de archivos representa un espectro de tamaño de transferencia más grande que afecta a cada dispositivo en particular, por lo que en lugar de conformarse con una carga de trabajo estática de 4k u 8k, la unidad debe hacer frente a solicitudes que van desde 512b a 64K. La prueba de preacondicionamiento del servidor de archivos fue la primera área en la que el Micron P320h no superó a los otros modelos en velocidades de ráfaga, aunque solo continuó acelerándose desde su estado de borrado seguro a medida que se realizaba la prueba. Si bien comenzó por debajo de 80 100 IOPS, después de 120 minutos superó los XNUMX XNUMX IOPS en estado estable. Este superó con creces a los modelos existentes en este segmento.

En cuanto a la latencia promedio, a medida que Micron RealSSD P320h se acercaba al estado estable a una profundidad de cola efectiva de 256, se deslizó a un promedio de 2 ms con sus tiempos de respuesta.

Cambiando nuestro enfoque a los tiempos máximos de respuesta, el conjunto de controladores de Windows nuevamente mostró tiempos máximos de respuesta más altos, rondando los 1,000 ms a lo largo de nuestra prueba. Esto se comparó con el conjunto de controladores de Linux que mantuvo un nivel máximo que no superaba los 50 ms.

Si bien los tiempos de respuesta máximos no necesariamente se ven bien, cambiamos nuestro enfoque hacia la desviación estándar para obtener una imagen más clara de la latencia general del Micron P320h. En esta área, puede ver algunos puntos durante la prueba del P320h en Windows, pero aún mantiene un nivel que es uno de los más bajos del grupo.

Después de terminar nuestra fase de preacondicionamiento, pasamos a nuestras pruebas primarias con una carga que varía entre 16T/16Q y 2T/2Q. El Micron RealSSD P320h comenzó rápido y lideró el grupo con una ventaja sustancial a medida que aumentaba la profundidad efectiva de la cola. Finalmente, el rendimiento superó los 130 XNUMX IOPS en nuestro servidor de dos procesadores.

Comparando la latencia promedio, el P320h ofreció su rendimiento superior de 130k IOPS a 16T/4Q con una latencia promedio de alrededor de 0.5ms, aumentando hasta 1-2ms en los niveles EQD128 y EQD256.

La imagen de latencia máxima durante el segmento principal de nuestra prueba de servidor de archivos tuvo los mismos destellos de 1,000 ms durante el segmento de Windows de nuestra prueba que las pruebas anteriores, con los controladores de Linux ofreciendo tiempos de respuesta máximos mucho más bajos.

Comparando la desviación estándar de la latencia, Micron RealSSD P320h ofreció la mejor latencia distribuida del grupo en Linux y se ubicó en la mitad del grupo en Windows.

En nuestra última carga de trabajo sintética que cubre un perfil de servidor web, que tradicionalmente es una prueba de lectura del 100 %, aplicamos una actividad de escritura del 100 % para preacondicionar completamente cada unidad antes de nuestras pruebas principales. En esta prueba, Micron RealSSD P320h resultó con el rendimiento de estado estable más rápido, pero la novedad de esta prueba fue la clara diferencia en el rendimiento entre los controladores de Windows y Linux. El rendimiento de Linux fue mucho más alto, además de ofrecer un mejor rendimiento de ráfaga.

Cambiando el enfoque a la latencia promedio, el Micron P320h ofreció una curva plana a partir de poco más de 20 minutos en la prueba, con el rendimiento de Linux con una ventaja de casi 2 ms.

En comparación con las cargas de trabajo mixtas de lectura/escritura en pruebas anteriores que mostraban frecuentes parpadeos de 1,000 ms del P320h, la prueba de preacondicionamiento del servidor web fue mucho más tranquila en comparación. Dicho esto, el lado de Linux estaba aún más tranquilo, sin mostrar interrupciones en la latencia durante el proceso de preacondicionamiento.

En comparación con la desviación estándar de la latencia en nuestra fase de preacondicionamiento del servidor web, Micron RealSSD P320h ofreció la latencia más consistente con diferencia, incluso cuando incluimos las señales intermitentes observadas por los controladores de Windows. Al observar la rampa de latencia muy leve a medida que la unidad se acercaba al estado estable, vemos que el rendimiento se estabilizó por completo entre 60 y 80 minutos.

Cambiando al segmento principal de nuestra prueba de servidor web con un perfil de lectura del 100 %, el Micron P320h sigue liderando el grupo en todas las categorías, excepto el rendimiento de Windows en la sección 2T/2Q de nuestra prueba. Un aspecto interesante que compara su rendimiento es que, mientras que el lado de Linux ofrecía un mayor rendimiento de escritura, el conjunto de controladores de Windows ofrecía un mayor rendimiento de lectura. Esto dio como resultado un mayor rendimiento de Windows en todas las secciones con una mayor profundidad de cola y una velocidad máxima mucho mayor (152k frente a 170k IOPS)

La latencia promedio de Micron RealSSD P320h se mantuvo por debajo de 1 ms en todas las etapas, excepto cuando la profundidad de cola efectiva fue de 256. Al comparar su rendimiento máximo con la latencia promedio, encontramos que el punto óptimo de esta tarjeta en nuestro seguimiento del servidor web está entre una profundidad de cola efectiva de 64 y 128.

A pesar de que los controladores de Windows finalmente obtuvieron la ventaja en términos de rendimiento y latencia promedio, los tiempos de respuesta máximos se mantuvieron cerca de los 1,000 ms en la mayoría de las secciones de la prueba; el rendimiento de Linux no tuvo picos de latencia altos

Al comparar la desviación estándar de latencia entre las unidades de este grupo, Micron RealSSD en Linux ofreció la mejor distribución de latencia, mientras que los controladores de Windows se ubicaron en el medio del grupo.

Análisis de carga de trabajo sintético empresarial (varias unidades/red)

Equipados con dos aceleradores de aplicaciones PCIe Micron RealSSD P700h de 320 GB, configuramos un entorno de prueba que consiste en un servidor Supermicro de alto rendimiento que ejecuta Windows Server 2012. Esta plataforma de prueba se conectó a través de dos adaptadores PCIe 3.0 Mellanox InfiniBand separados a nuestro conmutador SX6036 IB, a dos Servidores HP Proliant DL380p Gen8 que también ejecutan Windows Server 2012. En el servidor de almacenamiento Supermicro de alto rendimiento, creamos una matriz de almacenamiento simple utilizando Storage Spaces, que luego se compartió a través de SMB. A diferencia de nuestros puntos de referencia principales que prueban toda la superficie LBA de las unidades, estas pruebas hicieron hincapié en dos segmentos de 50 GB repartidos en el volumen fraccionado, evaluados localmente y en la red InfiniBand.

Hemos incluido un video de descripción general de nuestras pruebas de InfiniBand a continuación:

Plataforma de prueba empresarial StorageReview de 56 Gb/s:

Super micro computadora SuperServidor 7047R-TXRF

  • Súper microordenador X9DRX+-F
  • CPU doble Intel E5-2670 (2.6 GHz, caché de 20 MB)
  • Centro de datos de Windows Server 2012
  • 128 GB de RAM (8 GB x 16 Hynix DDR3, 64 GB por CPU)

(2) HP Proliant DL380p Gen8

  • Intel Xeon E5-2640 (6 núcleos, 2.50 GHz, 15 MB, 95 W)
  • Windows Server Standard 2012
  • Chipset Intel C600
  • RDIMM registrados DDR64 de 8 GB (8 x 16 GB) y 4 GB (4 x 1333 GB) de 3 MHz

Hardware y conmutador InfiniBand de 6036 Gb/s Mellanox SX56

  • 36 puertos FDR de 56 Gb/s
  • Cables de cobre QSFP pasivos
  • Adaptador Mellanox ConnectX-3 VPI PCIe 3.0 Twin 56Gb/s InfiniBand

Nuestra infraestructura actual de pruebas de interconexión de alto rendimiento InfiniBand consta de dos servidores HP Proliant DL380p Gen8 equipados con adaptadores Mellanox ConnectX-3 VPI PCIe conectados a través del conmutador IB de 36 puertos y 56 Gb/s de Mellanox. Este entorno permite que el dispositivo de almacenamiento que estamos probando sea el cuello de botella de E/S, en lugar del propio equipo de red.

En nuestra sección local de prueba de espacio simple e InfiniBand, nos limitamos a una selección limitada de pruebas, en lugar de nuestra suite completa. Para facilitar la comparación, usamos nuestra carga de trabajo 8K 70/30 para mostrar la diferencia de rendimiento entre el acceso local y cuando se comparte a través de la red.

Usando un espacio total más pequeño para probar nuestras pruebas primarias, encontramos que el rendimiento escala extremadamente bien en un entorno de tarjeta dual. Localmente, con dos sesiones del generador de cargas de trabajo que se ejecutan simultáneamente para imitar los dos servidores que se ejecutan en la red, medimos un rendimiento superior a 490 8 IOPS en nuestra carga de trabajo de 70 30 380/8. Al presentar ese arreglo de una sola banda en dos recursos compartidos y acceder a él desde nuestros dos servidores HP Proliant DL402p GenXNUMX, el rendimiento se redujo a XNUMXk IOPS. Pudimos duplicar con creces el rendimiento en ambos escenarios y aun así mantener un excelente rendimiento por servidor.

En cuanto a la latencia promedio en nuestro entorno de dos P320h, hubo alguna diferencia en la latencia promedio al comparar el acceso local con el acceso remoto a través de InfiniBand, pero la latencia aún fue más baja que la que medimos con un P320h en nuestro banco de pruebas principal. Dado que hubo un impacto de latencia mínimo al compartir este dispositivo de E/S alta entre múltiples sistemas, realmente abre la puerta para compartir recursos costosos de alto rendimiento con más de un sistema.

Realmente no hubo una diferencia medible en la latencia máxima al comparar el acceso local con el remoto, lo cual es importante sabiendo que la red InfiniBand no está aumentando significativamente la latencia en dispositivos como los aceleradores de aplicaciones PCIe.

Al igual que con la latencia máxima, no vimos ninguna diferencia perceptible entre la desviación estándar de latencia observada localmente en un entorno rayado o en nuestra red InfiniBand.

Después de ver que el rendimiento de 8K 70/30 con dos cargas simultáneas con una profundidad de cola efectiva de 256 cada una tuvo una pequeña caída en el rendimiento en la red en comparación con el local, cambiamos nuestro enfoque a una carga de trabajo variable que va desde 2T/2Q hasta 16T/16Q . Dado que esto sucedió en dos servidores o dos generadores de carga de trabajo locales al mismo tiempo, la carga total sería de 4T/2T hasta 32T/16T. Tanto el acceso local como el de red al arreglo P320h seccionado ofrecieron la misma capacidad de respuesta a una carga cada vez mayor. Ambas pruebas mostraron patrones casi idénticos en todo el espectro, y el acceso local ofreció el mayor rendimiento.

La latencia promedio en la sección principal de nuestra carga de trabajo 8K 70/30 en la configuración P320h seccionado ofreció un excelente rendimiento localmente y en nuestra red. Los más impresionantes son los resultados de InfiniBand, donde cada servidor vio menos de 0.8 ms de latencia para más de 400,000 XNUMX IOPS en la red.

La comparación de la latencia máxima en la carga de trabajo de 8K 70/30 con nuestra configuración dual-P320h mostró resultados similares a nivel local frente a remoto, y ambos tuvieron destellos de más de 1,000 ms durante la prueba.

De manera similar a nuestros resultados de latencia máxima de arriba, hubo muy poca diferencia entre el acceso local a la matriz P320h o si se compartió a través de Windows Storage Space a través de nuestra red InfiniBand.

Conclusión

El Micron RealSSD P320h es simplemente un gran ejemplo de ingeniería bien ejecutada. Todo, desde el diseño y la disposición de la placa hasta el controlador personalizado, hacen que el P320h sea una verdadera unidad integrada, algo que no siempre es así, incluso en el espacio de almacenamiento empresarial. Micron encuentra formas de agregar valor a lo largo de la unidad, desde IP de administración NAND en el ASIC personalizado hasta la caracterización NAND más profunda posible que conduce al máximo rendimiento y resistencia de los componentes flash SLC.

Cuando evaluamos el rendimiento de la P320h, la unidad grita, manteniendo casi la paridad entre nuestros entornos de prueba de CentOS y Windows Server. En términos de su mejor entorno, Linux siempre tuvo la ventaja, especialmente cuando se trataba de una latencia óptima. Sin embargo, decir que el Micron P320h es rápido es quedarse corto. Superó con creces cualquier otra solución que hayamos probado hasta la fecha, con mayores velocidades de ráfaga que la mayoría y un rendimiento de estado estable mucho mayor que las soluciones de la competencia. Al analizar su capacidad de respuesta, la latencia promedio fue impecable, pero lo que es aún más impresionante fue su nuevo rendimiento impecable de Linux, con una latencia máxima y una desviación estándar de latencia muy bajas. El lado de Windows no estaba demasiado lejos, aunque su latencia máxima y su desviación estándar de latencia se ubicaron en el medio del grupo en comparación.

Cuando se trata de compatibilidad, encontramos que Micron RealSSD P320h funciona sin problemas en un entorno empresarial. Para nosotros, no tiene sentido probar esta oferta empresarial de primer nivel en una plataforma de consumo, ya que nunca se incorporaría a un entorno de producción que se ejecute en una. Con ese fin, en los servidores de primer nivel en los que lo probamos, funcionó sin contratiempos en múltiples sistemas operativos. El P320h tampoco tuvo problemas para trabajar en configuración de disco dual en nuestro Supermicro SuperServer 7047R con Windows Server 2012, como se puede ver en nuestro video.

Si nos vamos a quejar mucho, es que el entorno de Windows dejó algunas áreas menores que necesitan mejoras, especialmente cuando comparamos la latencia máxima y la desviación estándar en todas nuestras cargas de trabajo. Incluso con esa latencia más alta, superó a muchos, si no a todos, los aceleradores de aplicaciones PCIe que probamos, pero creemos que aún podría quedar algo de rendimiento por exprimir con controladores más refinados. Otra área de queja menor es la oferta de productos exclusivos de SLC en solo dos capacidades. Los competidores ofrecen unidades en MLC o eMLC, lo que permite un punto de entrada más bajo en costos, así como capacidades mucho mayores; más de 2 TB en una sola tarjeta en algunos casos. Por supuesto, el mercado empresarial de entrada que se lee intensamente no es el objetivo del P320h, pero una mayor variedad para abordar más necesidades podría hacer que la familia P320h sea más versátil.

Ventajas

  • El acelerador de aplicaciones PCIe más rápido que hemos probado hasta la fecha
  • Latencia media y máxima muy baja
  • Excelente paridad de rendimiento en entornos Windows y Linux

Contras

  • Limitado a SLC NAND
  • Alcanza los 700GB

Resumen Final

El Micron RealSSD P320h es una oferta completa y bien ejecutada para empresas que quieren lo mejor que el almacenamiento PCIe tiene para ofrecer. El P320h es el mejor en su clase, impulsando un rendimiento excelente y consistente de múltiples sistemas operativos gracias a los componentes Micron y la propiedad intelectual superior de gestión NAND integrada en el controlador.

Página de Producto

Discutir esta revisión