Inicio Consumidores TCQ, RAID, SCSI y SATA

TCQ, RAID, SCSI y SATA

by revisión de almacenamiento

StorageReview toma la primera de varias miradas exhaustivas a la cola de comandos etiquetados y sus implicaciones para el escritorio y el mundo del servidor. ¿TCQ califica? ¿Cómo se relaciona con las matrices RAID? ¿Es SATA TCQ tan efectivo como SCSI TCQ? ¡Encuentre las respuestas a estas preguntas y más en lo último de SR!

Vea también Cómo probamos las unidades
Vea también Revisión de Western Digital Raptor WD740GD
Vea también Reseña del Seagate Cheetah 10K.6

 

Introducción

En los últimos años, Western Digital ha mantenido un bloqueo virtual en los mercados entusiastas y de escritorio de alto rendimiento y alta capacidad. La venerable serie WD Caviar ha combinado velocidad y capacidad envidiables con precios razonables. Sin embargo, aparte de una línea SCSI relativamente oscura y de corta duración, cuando se trataba del lucrativo ámbito empresarial, la empresa simplemente observaba desde la distancia cómo titanes como Seagate, Maxtor e Hitachi luchaban por la cuota de mercado.

Hace poco más de un año, WD probó las aguas empresariales con la presentación del primer disco ATA de 10,000 RPM del mundo, el Raptor WD360GD. El Raptor combinó la mecánica de clase SCSI con la interfaz Serial ATA nueva y relativamente económica en un intento de socavar las primas bastante altas que exigían los subsistemas SCSI. Sin embargo, los resultados de rendimiento de StorageReview revelaron que, si bien el WD360GD brindó resultados de clase mundial para un solo usuario, su rendimiento multiusuario siguió siendo poco impresionante en comparación con las unidades SCSI de 10k RPM existentes.

El WD360GD carecía de un elemento clave que el mundo SCSI ha disfrutado durante años: la cola de comandos etiquetados (TCQ), una característica que reordena de manera inteligente las solicitudes para minimizar el movimiento del actuador. En septiembre de 2003, Western Digital anunció la continuación de la Raptor WD740GD, una unidad de segunda generación que trajo una gran cantidad de mejoras a la línea. Aunque la duplicación de la capacidad del Raptor a 74 gigabytes es la mejora más visible, la más intrigante, sin duda, es la implementación de TCQ.

 

TCQ en breve

No debe confundirse con el reordenamiento y la optimización del sistema operativo, la cola de comandos etiquetados es un proceso a nivel de hardware diseñado para optimizar la entrega de datos en accesos altamente aleatorios bajo cargas pesadas. Sin TCQ, una unidad solo puede aceptar un solo comando a la vez. Por lo tanto, opera por orden de llegada, completando las solicitudes en el orden en que se reciben. Esta no siempre es la forma más efectiva de atender las solicitudes de datos, especialmente en un entorno intensivo y no localizado.

A través del proceso de puesta en cola de comandos etiquetados, un adaptador de host agrega etiquetas especiales a los comandos individuales. El propio disco, al tanto de su propio diseño físico de sectores en tres dimensiones, puede tener en cuenta la rotación y buscar distancias y reordenar los comandos para servirlos de manera más eficiente. Por lo tanto, los datos solicitados se devuelven al controlador de una manera más ágil; luego puede usar la información adicional que agregó anteriormente para devolver de manera transparente los datos al sistema operativo.

Considere el diagrama a la izquierda. En un paradigma tradicional sin colas, la unidad aceptaría la solicitud de la parte de datos A, movería el actuador y la recuperaría, aceptaría la solicitud de B, la recuperaría y luego se movería a la parte C. Una unidad que puede almacenar en búfer y poner en cola las solicitudes , sin embargo, podría recuperar A, luego optar por recuperar C primero, seguido de B, lo que resultaría en un ahorro neto de tiempo al completar estas tres solicitudes.

TCQ debe ser compatible tanto con el controlador como con el propio disco duro. Se introdujo en el mundo SCSI ya en 1990 y se codificó formalmente en el estándar SCSI-2 en 1994. La característica rápidamente demostró ser invaluable en el mundo de los servidores multiusuario y hoy en día se implementa de manera constante en prácticamente todos los discos y adaptadores host. . Asimismo, TCQ se implementó formalmente en el estándar ATA-1998 de 4. Sin embargo, a diferencia de los dispositivos SCSI, las unidades ATA simplemente no se usaban en aplicaciones empresariales donde las características como la capacidad de intercambio en caliente y los tiempos de acceso reducidos eran primordiales. Además, el bastión tradicional de ATA, las máquinas de un solo usuario, simplemente no se beneficiaron de TCQ; de hecho, en muchos casos, la sobrecarga adicional impuesta en realidad redujo en lugar de mejorar el rendimiento en estas áreas. Como resultado, la característica fue ignorada en gran medida por la industria.

Hoy, sin embargo, la llegada de Serial ATA, sus características de intercambio en caliente asociadas y su prometida interoperabilidad con el próximo estándar Serial Attached SCSI (SAS) ha dado como resultado un futuro brillante para ATA en la empresa. El próximo estándar SATA II incluye disposiciones para incorporar colas de comandos etiquetados al estilo del estándar ATA-4. Las arquitecturas de unidades SATA nativas, como Seagate Barracuda 7200.8 y Maxtor MaXline III, promocionan la inclusión de la cola de comandos etiquetada como "SATA nativa", o "Cola de comandos nativa" (NCQ) para abreviar. El paradigma fundamental de NCQ es idéntico al de la cola de comandos etiquetados; el apodo NCQ simplemente diferencia el estándar SATA II del modelo ATA-4 existente.

Con sus bolsillos profundos de investigación y desarrollo, Seagate fue el único fabricante que evitó un puente PATA-a-SATA menos costoso y de comercialización más rápida para sus primeros productos SATA. Por razones financieras y temporales, otros fabricantes como Western Digital introdujeron sus primeros productos con operación puenteada. El Raptor WD740GD es uno de estos diseños. Si bien las ramificaciones prácticas son insignificantes (¡después de todo, lo que cuenta es el rendimiento final!), el puente del Raptor evita que use el estándar SATA II NCQ. Por lo tanto, para implementar la cola de comandos etiquetados en su incipiente línea orientada a la empresa de manera oportuna, Western Digital optó por incluir TCQ estilo ATA-4 en el Raptor. Afortunadamente para WD, la empresa ha recibido una respuesta entusiasta de muchos fabricantes de controladores. La mayoría de las empresas que diseñan adaptadores de host SATA habilitados para NCQ también están incorporando colas estilo Raptor. Uno de esos fabricantes es Promise Technology.

 

Los exámenes

En este primero de lo que serán varios artículos que examinan los efectos de la cola de comandos etiquetados de SATA, veremos cómo se compara el próximo Promise FastTrak TX4200 con el FastTrak S150 TX4 no habilitado para TCQ que se envía actualmente. La relación entre estos dos controladores es especialmente interesante ya que el TX4200 es simplemente un FastTrak S150 TX4 con código TCQ agregado. El S150 TX4, a su vez, es simplemente un SATA150TX4 habilitado para RAID, el controlador SATA de referencia de SR Testbed desde hace mucho tiempo. Un contraste directo entre los dos controladores Promise RAID puede aislar los efectos de TCQ de otras variables.

Las características de Promise FastTrak TX4200:

  • 4 puertos Serial ATA para hasta 4 unidades
  • RAID 0/1/10 y JBOD
  • Operación PCI de 32 bits / 33-66 MHz
  • Compatibilidad con NCQ y SATA TCQ

TCQ, por supuesto, ha existido durante algún tiempo en el mundo SCSI: todos los adaptadores de host, controladores RAID y discos duros actuales admiten una implementación muy madura. Para descubrir qué desventajas, si las hay, sufre SATA TCQ cuando se compara con soluciones SCSI más establecidas, se han incluido en estas pruebas los resultados de un controlador RAID Mylex AcceleRaid 170 emparejado con hasta cuatro unidades Seagate Cheetah 73K.10 de 6 GB.

Las características de Mylex AcceleRaid 170:

  • 1 puerto LVD de 68 pines para hasta 15 unidades
  • Niveles RAID 0, 1, 0+1, 3, 5, 10, 30, 50, JBOD
  • Caché SDRAM ECC de 32 MB
  • Operación PCI de 32 bits / 33 MHz

Aunque TCQ confiere beneficios incluso cuando una sola unidad opera bajo cargas aleatorias pesadas, su verdadero potencial brilla cuando también hay múltiples actuadores con los que trabajar. Por lo tanto, las pruebas que siguen también analizan detenidamente la escala proporcionada por los arreglos en escenarios de múltiples usuarios y de un solo usuario: nuestra primera versión formal de RAID en más de dos años.

En las siguientes pruebas, el hardware y los puntos de referencia de Testbed3 clasifican las múltiples dimensiones de los posibles controladores de rendimiento:

  • ¿Cómo beneficia TCQ al rendimiento multiusuario y monousuario?
  • ¿Cómo afecta TCQ la capacidad de una matriz RAID para aumentar el rendimiento a medida que se agregan más unidades?
  • ¿Cómo se compara SATA TCQ con la implementación de SCSI?
  • ¿Cómo se escala una matriz RAID con E/S aleatorias cada vez más pesadas?
  • ¿Qué beneficios ofrece una matriz RAID a las E/S altamente localizadas que dominan el uso que no es de servidor (usuario único)?

Dado que estas pruebas aprovechan el banco de pruebas SR estándar, tomemos un momento para considerar una posible limitación del hardware de la máquina, la ranura PCI de 33 bits y 32 MHz.

 

Limitaciones del Bus PCI

El límite de 133 MB/seg del bus PCI estándar de 32 bits y 33 MHz puede ser motivo de preocupación para algunos, especialmente para aquellos que, por diversas razones, buscan maximizar las tasas de transferencia secuencial. El límite práctico del mundo real permanece ligeramente por debajo de ese umbral: las pruebas STR asociadas con los resultados a continuación superan los 126 MB/seg. Un solo Raptor en su zona exterior puede impulsar casi 72 MB/seg mientras que un Cheetah 10K.6 puede hacer 69 MB/seg; solo se necesitan dos para saturar el bus PCI.

Sin embargo, echemos un vistazo más de cerca a la importancia de STR en la mayoría de las aplicaciones. El Servidor de archivos StorageReview DriveMark genera un tamaño de transferencia promedio de 22 kilobytes. En otras palabras, la operación de E/S promedio generada en la suite consiste en reposicionar el actuador en la ubicación deseada seguido de la lectura o escritura de 22 KB de datos. Del mismo modo, el tamaño de transferencia promedio de SR Office DriveMark es de 23 KB. El SR High-End DriveMark, basado en un conjunto de aplicaciones que incluye edición de video y audio, es la única prueba que va mucho más allá de estos tamaños, generando una transferencia relativamente alta de 69.5 KB por IO.

Un solo Raptor WD740GD, con su tasa de transferencia máxima de 72 MB/seg, puede transferir 22 KB en:

72 MB/seg * 1024 KB/MB / 22 KB = 3351 veces/segundo o 0.298 milisegundos cada uno
Por lo tanto, la solicitud de E/S promedio en el servidor de archivos SR DriveMark concluye con una lectura o escritura en el plato que tarda un promedio de 0.3 ms en completarse.

Una matriz RAID0 regulada por PCI puede transferir 22 KB de datos en:

126 MB/seg * 1024 KB/MB / 22 KB = 5865 veces/segundo, o 0.170 milisegundos cada uno
En un patrón de acceso típico que presenta una localización significativa, como Office DriveMark, una unidad experta como la WD740GD puede lograr alrededor de 600 E/S por segundo. Dicho a la inversa, cada E/S (que, de nuevo, consiste en posicionamiento + transferencia) tarda unos 1.7 milisegundos. En un escenario altamente localizado de una sola unidad, el Raptor promedia 1.7 milisegundos por E/S. De estos 1.7 ms, 0.3 ms, o el 18 %, es la transferencia de datos hacia o desde el plato. El otro 82% de la operación consiste en mover el actuador o esperar a que el plato gire hacia la ubicación deseada. La situación se polariza aún más a medida que aumentan las tasas de transferencia. A 126 MB/s, las transferencias representan solo el 11 % del tiempo total del servicio. En efecto, las tasas de transferencia secuencial que van desde 50 MB/seg a 130 MB/seg y superiores “se excluyen de la ecuación” al trivializar el tiempo que se tarda en leer y escribir datos en comparación con el tiempo que se tarda en posicionar el lector/ escriba las cabezas en la ubicación deseada.

El diagrama de la derecha ilustra la relación entre el posicionamiento y las transferencias en escenarios típicos de uno o varios usuarios. Observe cómo el tiempo dedicado a posicionar el actuador y el plato (rojo) domina la cantidad relativamente pequeña de tiempo dedicado a leer/escribir los datos en sí (amarillo). Incluso un caso asintótico de una tasa de transferencia infinita desencadenada a través de un bus infinitamente rápido solo eliminaría la parte amarilla del tiempo total que lleva atender una solicitud.

Por lo tanto, mientras que el bus PCI puede limitar las tasas de transferencia secuencial, su efecto práctico al limitar la velocidad del mundo real en el uso típico no es tan significativo como podría creerse a primera vista. Como resultado, la escala demostrada en este artículo también representa los aumentos que se obtendrán con los arreglos que operan en buses de mayor velocidad.

 

Nuestra tercera muestra Raptor WD740GD

La muestra de evaluación proporcionada a SR por Western Digital para nuestro reseña publicada el pasado mes de enero fue fabricado el 4 de diciembre de 2003. Para esta revisión, WD nos envió cuatro muestras más, todas con fecha del 4 de marzo de 2004. Aunque gran parte del enfoque de este artículo se basa en matrices de unidades múltiples, para fines de control, fue necesario volver a probar una unidad única de este nuevo lote en nuestro controlador Promise SATA150TX4 de referencia. Surgen algunas diferencias:

Son evidentes pequeñas reducciones en el rendimiento: alrededor del 3% en Office DriveMark, por ejemplo. Lo más notable es la caída del 8% en Bootup DriveMark. Los representantes de Western Digital atribuyen la diferencia al firmware revisado. Una mirada más cercana a las dos muestras diferentes revela los siguientes números de modelo extendidos:

 

 

Tenga en cuenta las diferencias en el dígito final de la designación MDL extendida al comparar nuestras muestras segunda y tercera. La unidad de diciembre termina con un cero mientras que la unidad de marzo concluye con un 1. ¿Por qué el cambio? En primer lugar, debemos señalar que todos los fabricantes actualizan silenciosa y periódicamente el firmware de todas sus unidades después del lanzamiento inicial, ya sea para corregir errores o ajustar el rendimiento a medida que se acumula la experiencia de configuración.

En segundo lugar, como ha sido dolorosamente obvio en los últimos meses, la cola de comandos SATA ha demostrado ser un objetivo en constante movimiento, mientras que los fabricantes de unidades y controladores continúan modificando sus productos. A medida que los fabricantes de controladores como Pacific Digital, Silicon Image y Promise Technology continúan desarrollando muestras de adaptadores preliminares, los fabricantes de unidades como Western Digital se ven obligados a volver a optimizar el firmware para obtener los mejores resultados. Asimismo, lo mismo ha ocurrido en sentido contrario. Aunque Western Digital anunció el WD740GD en septiembre de 2003 y aunque las unidades ampliamente disponibles a través del canal desde diciembre pasado cuentan con la funcionalidad TCQ, el equipo de Raptor está obligado a reevaluar regularmente los posibles adaptadores de host complementarios de la unidad y reajustar el firmware en consecuencia. Un resultado es la revisión "00FLA1", una unidad más adecuada para el estado actual de los adaptadores de host habilitados para TCQ, aunque con una caída muy leve en ciertas medidas de rendimiento.

Echar un vistazo a las cifras anteriores revela que, si bien existen diferencias, son triviales a todos los efectos. Uno simplemente no notará la diferencia de velocidad en el uso subjetivo. Los intentos de obtener específicamente la revisión anterior de 00FLA0 probablemente resulten frustrantes e infructuosos. No nos preocuparíamos por la diferencia.

 

Una palabra sobre la organización

Presentar los siguientes resultados puede ser bastante desalentador. Muchas dimensiones diferentes de desempeño emergen cuando uno intenta formar el “panorama general”. ¿Cómo aumenta el rendimiento cuando todas las demás variables guardan la profundidad de la cola permanecen constantes? ¿Qué tipo de beneficios resultan de agregar más unidades a una matriz? ¿Cómo afecta al rendimiento la elección de la duplicación en lugar de la creación de bandas? La lista de preguntas continúa. Como resultado, hemos evitado el uso de nuestros gráficos estándar "generados en HTML" en favor de los gráficos estáticos. Con suerte, transmiten con precisión la gran cantidad de información que se debe recopilar.

Sin más preámbulos, ¡echemos un vistazo a algunos resultados!

 

 

 

Rendimiento multiusuario a medida que aumenta la profundidad de la cola

En primer lugar, observe cómo se escala el rendimiento con el servidor de archivos StorageReview DriveMark altamente aleatorio a medida que aumenta la profundidad de la cola (carga). Para obtener información sobre FS DriveMark, revise esta explicación. Con fines comparativos, los resultados del controlador SATA3TX150 SATA estándar de Testbed4 y el controlador SCSI AHA-29160 de Adaptec se han incluido en el escenario de una sola unidad. Los resultados de RAID0 que se presentan a continuación presentan un tamaño de banda de 64 KB.

 

El Raptor que funciona tanto con Promise SATA150TX4 como con FastTrak S150 TX4 comienza con unas impresionantes 129 E/S por segundo a una profundidad de cola de 1. El Cheetah emparejado con AcceleRaid también tiene un rendimiento respetable de 125 E/S por segundo. Los combos Promise TX4200/Raptor y Adaptec 29160/Cheetah, sin embargo, tropiezan con sus inicios de 112 E/S por segundo y 117 E/S por segundo respectivamente. Sin embargo, a medida que aumentan las profundidades, la imagen comienza a cambiar.

Cuando la carga llega a 4 E/S sobresalientes, el 29160 llega a la cabeza del paquete, superando al AcceleRaid. El FastTrak S150 TX4 y el SATA150TX4 continúan funcionando de manera idéntica, mientras que el TX4200, que sigue en la parte trasera, logra cerrar parte de la brecha.

Una profundidad de 16 produce cambios considerables. Adaptec salta al frente del grupo con unas impresionantes 237 E/S por segundo. Mylex continúa escalando bien, pero la implementación de TCQ del par TX4200/Raptor comienza a hacer sentir su presencia y se ubica ligeramente atrás.

Cuando finalmente alcanzamos una carga pesada de 64 solicitudes pendientes, surge una jerarquía clara. Los adaptadores host SCSI de Adaptec siempre han sido opciones populares y confiables. El 29160 también demuestra tener un gran rendimiento al dejar a los otros controladores en el polvo bajo una carga pesada. Aunque el TX4200 y AcceleRaid no logran alcanzar alturas tan elevadas, ofrecen el escalado bajo carga que uno esperaría de los subsistemas que cuentan con TCQ. Por el contrario, los dos controladores ATA que no son TCQ ocupan la parte trasera del paquete, un marcado contraste con su rápido rendimiento cuando solo queda una solicitud pendiente.

 

Cuando se configura con dos unidades en un formato seccionado, los tres controladores RAID comienzan de manera similar: el FastTrak S150 TX4, que carece de la sobrecarga impuesta por TCQ, disfruta de una ligera ventaja. La brecha se borra virtualmente cuando la cola llega a 4.

Cuando las profundidades alcanzan los 16, la pendiente del S150 TX4 se nivela, lo que indica una tasa de escalado más baja que la del AcceleRaid y el TX4200. Finalmente, con 64 E/S, AcceleRaid y TX4200 disfrutan de una ventaja significativa sobre el S150 TX4 con el TX4200 logrando un máximo de 385 E/S por segundo.

 

Los efectos de escala relativos siguen siendo similares en una configuración RAID0 de tres unidades. Los resultados de los tres controladores, sin embargo, exhiben pendientes más pronunciadas, lo que indica que el mayor número de actuadores en sí genera beneficios a medida que aumenta la profundidad de la cola.

El S150 TX4 que no es TCQ se queda atrás de los otros dos adaptadores cuando las colas llegan a 16. Cuando las profundidades alcanzan las 64 E/S pendientes, el TX4200 vuelve a colocarse por delante de los demás.

 

Finalmente, en una configuración RAID0 de cuatro unidades, el modesto S150 TX4 logra escalar tan bien como los arreglos habilitados para TCQ hasta 16 solicitudes pendientes. Es solo cuando llegamos a los 64 años que surgen las diferencias. El S150 TX4 se nivela mientras el AcceleRAID continúa escalando a lo largo de la misma pendiente. El TX4200 en realidad se escala un poco mejor en este tramo final, lo que abre una brecha significativa entre él y el arreglo basado en SCSI.

 

 

 

Rendimiento multiusuario a medida que aumenta el número de unidades

El rendimiento contrastante entre los controladores a medida que aumenta el número de unidades de una matriz RAID0 también arroja resultados reveladores. Los gráficos que siguen demuestran los efectos de agregar más discos mientras se mantienen constantes todas las demás variables. Los resultados que se presentan a continuación presentan un tamaño de banda de 64 KB.

 

Las pendientes siguen siendo bastante planas cuando comparamos las operaciones de E/S entregadas por segundo con la cantidad de unidades en una matriz seccionada con solo una E/S pendiente. Sin solicitudes respaldadas y en espera, un mayor número de actuadores simplemente no se puede sentir. Con cargas tan livianas, el diseño más simple, el S150 TX4 de Promise, brinda el mejor rendimiento, independientemente de la cantidad de unidades en el arreglo.

 

La situación cambia notablemente cuando la carga pendiente aumenta hasta cuatro solicitudes. Los tres controladores ofrecen más E/S por segundo a medida que se agregan unidades al arreglo. Con un solo disco, AcceleRaid disfruta de una ventaja de 154 E/S por segundo, mientras que ambos controladores Promise obtienen una puntuación similar de aproximadamente 135 E/S por segundo.

Sin embargo, cuando se agrega una segunda unidad a la matriz, AcceleRaid escala un poco menos que los controladores ATA; los tres lugar muy cerca uno del otro.

En el momento en que alcanzamos un conteo de unidades de tres y cuatro, la suave pendiente de AcceleRaid lo mantiene detrás de ambos controladores Promise. El mayor número de actuadores permite que el S150 TX4 supere su falta de funcionalidad TCQ y supere al AcceleRaid y al TX4200, aunque por márgenes relativamente pequeños.

 

Con una profundidad de cola de 16, la falta de TCQ del S150 TX4 lo coloca en desventaja. Aunque todavía disfruta de aumentos en el rendimiento a medida que se agregan unidades a la matriz, se queda atrás del TX4200 y AcceleRaid en casi todos los puntos. La única excepción es en el nivel de 4 discos: el modesto aumento de AcceleRaid cuando se agrega la cuarta unidad permite que el S150 TX4 relativamente consistente cierre la brecha.

 

Aunque el S150 TX4 continúa mostrando un escalado casi lineal bajo una carga constante de 64 solicitudes pendientes, la adición de más unidades al arreglo simplemente no es suficiente para mantenerlo en la lucha con las alternativas habilitadas para TCQ.

El SCSI AcceleRaid ofrece un mejor rendimiento que el SATA TX4200 con una sola unidad. Sin embargo, a medida que se agregan más discos a la matriz, el TX4200 escala mejor; su mayor pendiente culmina con una ventaja del 13% sobre el AcceleRaid en un arreglo de 4 unidades.

 

 

 

Duplicación multiusuario

Los resultados seleccionados de las matrices RAID0 a medida que aumenta el número de unidades son interesantes desde un punto de vista académico, principalmente debido a la naturaleza lineal en la que se pueden agregar actuadores independientes. Es cierto, sin embargo, que el uso práctico de RAID0 en servidores de producción es bastante limitado: las ganancias de rendimiento se ven más que compensadas por el aumento significativo del riesgo. Si uno falla en una matriz seccionada de cuatro unidades, se perderán todos los datos.

La duplicación (RAID1) es un escenario mucho más probable. En una matriz de este tipo, cada pieza de datos se escribe en al menos dos discos. Si bien las escrituras deben ocurrir al unísono, las lecturas no; como resultado, los controladores RAID diseñados de forma inteligente ofrecen un aumento del rendimiento mediante la implementación de lecturas independientes cuando se utilizan varios actuadores. RAID1 ofrece los beneficios de la redundancia en caso de que falle una unidad y, al mismo tiempo, ofrece un rendimiento mejorado a través de dos mecanismos de lectura independientes. RAID01 ofrece redundancia en dos conjuntos de arreglos RAID0: si falla un arreglo, los datos se conservan en el otro. RAID10 refleja los datos en dos unidades, luego divide la matriz resultante con otra matriz. Tanto RAID01 como RAID10 mejoran el rendimiento con dos mecanismos de escritura y hasta cuatro de lectura. El controlador Mylex ofrece tanto RAID01 como RAID10, mientras que las unidades Promise incorporan RAID10.

 

Al duplicar dos unidades, los tres controladores exhiben un aumento apreciable en las E/S entregadas por segundo hasta una carga moderadamente pesada de 16 solicitudes pendientes. Sin embargo, en un giro extraño, el rendimiento del Promise TX4200 en realidad disminuye cuando se pasa de una carga de 16 a 64. Tanto el S150 TX4 como el AcceleRaid, por otro lado, continúan escalando como se esperaba. El AcceleRaid se convierte fácilmente en el mejor rendimiento general de RAID1.

Como era de esperar, dividir un par de arreglos duplicados (RAID10) ofrece beneficios de rendimiento aún mayores. Aquí, el modesto S150 TX4 en realidad salta a una ventaja inicial significativa con una carga relativamente ligera de 4 solicitudes pendientes. Las cosas prácticamente se nivelan cuando la carga llega a 16; por 64, las mejoras más suaves del S150 TX4 lo llevan a quedarse un poco atrás. En una configuración RAID10, el TX4200 no muestra la misma caída extraña entre 16 y 64. Más bien, escala como se esperaba.

 

 

 

Rendimiento de un solo usuario

Frente a se ha presentado prueba en contrario, una combinación de marketing demasiado entusiasta y falta de conocimiento general ha dado como resultado la proliferación de RAID entre los usuarios avanzados que ejecutan estaciones de trabajo de un solo usuario. Si bien se puede presentar un argumento considerable a favor de la redundancia proporcionada por RAID1, el aumento en las tasas de transferencia y el alto rendimiento de acceso aleatorio de E/S que brinda RAID0 simplemente no benefician a la mayoría de los usos que no son de servidor.

Del mismo modo, aunque el último Raptor ofrece un rendimiento excepcional para un solo usuario, Western Digital ha trabajado para incorporar la funcionalidad TCQ en el impulso no para ampliar su ventaja de un solo usuario sobre la competencia, sino para garantizar que el Raptor se presente como una alternativa viable en el mundo de los servidores tradicionalmente basados ​​en SCSI.

Aun así, nos damos cuenta de que muchos lectores de todo el mundo han estado esperando ansiosamente los resultados del Raptor acoplado con un controlador TCQ apropiado. Reseñas de almacenamiento Marcas de unidad de escritorio ofrecen una oportunidad inigualable para evaluar la diferencia que hacen las matrices RAID cuando se trata de aplicaciones de un solo usuario que no son de servidor. Aquí veremos cómo RAID, TCQ, SCSI y SATA afectan el rendimiento. Los resultados de RAID0 que se presentan a continuación presentan un tamaño de banda de 64 KB.

 

Las similitudes entre el controlador Promise SATA150TX4 estándar estrechamente relacionado (no RAID) y el controlador Promise S150 TX4 (no RAID TCQ) son bastante evidentes, ya que ambos obtienen puntajes similares en las cuatro pruebas. Sin embargo, el Promise TX4200 habilitado para TCQ produce resultados reveladores. Cuando un controlador ATA compatible con TCQ finalmente se encuentra con una unidad ATA compatible con TCQ, la complejidad adicional y la sobrecarga en realidad reducen el rendimiento. Recuerde que no importa cuán sofisticadas sean las tareas múltiples y los subprocesos múltiples en una máquina de un solo usuario, los patrones de acceso (altamente localizados versus altamente aleatorios) y las profundidades de la cola (en su mayoría bajas con una ráfaga ocasional versus consistentemente más altas) siguen siendo fundamentalmente diferentes desde un servidor multiusuario. De hecho, es evidente que la misma madurez y la implementación uniforme y generalizada de TCQ en el mundo SCSI es en realidad uno de los factores que hacen que las unidades SCSI mecánicamente superiores tropiecen en escenarios de un solo usuario.

En el lado SCSI de las cosas, Adaptec AHA-29160 y Mylex AcceleRaid 170 cambian de lugar. Mientras que el 29160 demuestra tener un rendimiento superior en escenarios de múltiples usuarios de una sola unidad, AcceleRaid ofrece mejores puntajes de un solo usuario en todos los ámbitos. Tenga en cuenta, sin embargo, que incluso cuando se ve perjudicado por la operación TCQ, el Raptor logra mantener su ventaja sobre el Cheetah en tres de las cuatro pruebas de un solo usuario. La experiencia de Western Digital en el diseño de excelentes estrategias de búfer de lectura anticipada y reescritura para un solo usuario continúa brillando.

Avancemos y examinemos cómo escalan los controladores RAID en cada patrón de acceso a medida que aumenta el número de unidades.

 

Al pasar de una configuración de una sola unidad a una matriz en bandas de dos unidades, el rendimiento de los tres controladores aumenta en un margen del 9 % al 13 % en SR Office DriveMark. Es importante distinguir, sin embargo, que parte de este aumento surge a través de la duplicación de la capacidad de la unidad lógica de 74 GB (1 unidad) a 146 GB (2 unidades). Recuerda que el AlmacenamientoReview Desktop DriveMarks son la representación definitiva y repetible del rendimiento del mundo real. En consecuencia, se solicitan direcciones de sector LBA reales a lo largo de las pruebas. Las unidades y matrices de mayor capacidad, por definición, abarrotarán estas ubicaciones más juntas físicamente y, por lo tanto, disfrutarán de una ventaja (como lo hacen en el uso real).

Actualizar a tres unidades revela una disminución significativa en los rendimientos. Pasar a cuatro discos en realidad provoca una regresión en las puntuaciones. Si bien algunos pueden argumentar que el bus PCI de 32 bits y 33 MHz del banco de pruebas limita las ganancias logradas mediante la creación de bandas, los lectores deben recordar que, especialmente en estos niveles de E/S, dichos límites no son significativos. Independientemente del número de unidades, la operación más simple y optimizada del S150 TX4 le otorga una ventaja de rendimiento considerable sobre los otros dos controladores.

 

Debido a sus tamaños de transferencia promedio más altos, SR High-End DriveMark se beneficia un poco más que la suite de Office a medida que aumenta el número de unidades. Las ganancias oscilan entre el 9 % y el 19 % aquí y, a diferencia del caso de la prueba de Office, nunca se nivelan por completo con el recuento de unidades. Una vez más, el S150 TX4 ofrece un mejor rendimiento que los controladores habilitados para TCQ.

 

El SR Bootup DriveMark captura el proceso de arranque de Windows XP de Microsoft. La secuencia de arranque de XP es inusual en el sentido de que reordena los datos en el disco para imitar la secuencia de solicitudes (lo que permite más transferencias secuenciales) y también intenta generar la mayor profundidad posible en la cola llenando el subsistema de almacenamiento con solicitudes (un promedio de 2.39 E/S pendientes, sin embargo, sigue siendo bastante modesto en comparación con la mayoría de los escenarios multiusuario). El resultado neto es el único patrón DriveMark de escritorio que se beneficia significativamente de un aumento en el número de unidades. El rendimiento aumenta constantemente a medida que se agrega otra unidad a la matriz. Los beneficios prácticos, sin embargo, siguen siendo dudosos. Los aumentos en el proceso de arranque de XP tendrían que superar la mayor sobrecarga generada durante el proceso de encendido POST por la matriz RAID y sus unidades asociadas. Incluso en el arranque, el número de unidades DriveMark sigue siendo mucho más importante que TCQ: el S150 TX4 mantiene una ventaja constante y considerable sobre los demás controladores.

 

Finalmente, llegamos a SR Gaming DriveMark, un promedio ponderado de los accesos a unidades generados por cinco juegos de PC populares. Las pendientes planas indican que los usos de los juegos se benefician menos tanto de RAID como de la cola de comandos. De hecho, a 677 E/S por segundo, un arreglo Cheetah de 4 unidades que funciona con Acceleraid 170 va a la zaga de un solo Raptor que se ejecuta en el "más tonto" de los controladores SATA por un margen del 9 %.

 

 

Duplicación de un solo usuario

 

Duplicar datos en dos unidades (RAID1) y fragmentar dos espejos (RAID10) da como resultado un cambio de rendimiento significativo solo en Bootup DriveMark. Los tres controladores ofrecen un aumento cuando se pasa de una sola unidad a un par duplicado y nuevamente cuando se pasa de un par duplicado a RAID10.

En todos los demás patrones de acceso, los tres controladores exhiben cambios muy leves aquí y allá, sin que se pueda discernir una tendencia significativa. Tenga en cuenta que, una vez más, el humilde S150 TX4 sin TCQ ofrece el mejor rendimiento en todas las combinaciones duplicadas.

 

 

 

Conclusiones

De la plétora de datos presentados anteriormente, podemos sacar varias conclusiones:

1. SATA TCQ y SATA RAID tienen el potencial de brindar beneficios al mercado de servidores tan grandes como los de SCSI TCQ y SCSI RAID. Promise FastTrak TX4200 y Mylex AcceleRaid 170 son, respectivamente, controladores RAID básicos para las interfaces SATA y SCSI. El primero, de hecho, es poco más que el actual controlador FastTrak S150 TX4 de Promise con funcionalidad SATA TCQ (y NCQ) añadida.

A diferencia de otros importantes reproductores de disco duro, Western Digital no tiene una línea de productos establecida basada en SCSI que proteger. Como resultado, la empresa busca una ventaja competitiva al ofrecer funcionalidad y mecánica de estilo SCSI a precios asociados con la interfaz ATA más consciente de los costos. Una verificación rápida en el momento de escribir este artículo con el patrocinador de StorageReview hipermicro cuesta 73 GB Cheetah 10K.6s a $ 339 cada uno, Raptor WD740GD a $ 219 cada uno y AcceleRaid 170 a $ 379. Cuando se lance en agosto, el precio del Promise TX4200 estará a la par con el del S150 TX4 que está destinado a desplazar. Cuesta $ 159 en HyperMicro.

Por lo tanto, surge el siguiente precio (excluyendo cables y accesorios):

$1356 ($339 x 4 Cheetahs) + $379 (AcceleRaid 170) = $1735 (matriz SCSI RAID de 4 unidades)
$876 ($219 x 4 Raptors) + $159 (FastTrak TX4200) = $1035 (matriz SATA RAID de 4 unidades)
La diferencia de costo entre las dos matrices es del 40%, de hecho significativa. ¿Qué sacrifica uno al optar por la solución SATA menos costosa? Después de todo, se ha demostrado que el rendimiento de SATA es competitivo y, en algunos casos, supera al de una solución SCSI comparable.

Si bien WD ha brindado una solución que puede igualar la velocidad y la escalabilidad de una solución basada en SCSI, también se deben tener en cuenta los factores clave de infraestructura y confiabilidad. Al igual que con el propio TCQ, el hardware de soporte de SATA, como backplanes, soluciones todo en uno y similares, se encuentran en su infancia en comparación con la madurez y la longevidad del hardware SCSI. También tenga en cuenta que, si bien Western Digital reclama una especificación MTTF de 1.2 millones de horas de clase empresarial y respalda a los Raptors con una garantía de 5 años, la línea aún es nueva y aún no ha sido probada en comparación con soluciones establecidas como la serie Cheetah de Seagate. Finalmente, recuerde que los precios enumerados anteriormente representan solo el costo del subsistema de almacenamiento; tener en cuenta el costo total del hardware del servidor cuando se consideran las placas base, la CPU y la RAM puede diluir la diferencia significativamente.

Al final, el potencial de SATA para invadir el mercado de servidores de nivel básico y medio está ahí. El rendimiento definitivamente está ahí. Si la confiabilidad del Raptor resulta comparable a la de la competencia y si la infraestructura/hardware de soporte emerge, WD tendrá un competidor viable.

2. La cola de comandos está destinada a ayudar en situaciones de múltiples usuarios, no en configuraciones de un solo usuario. Con el reciente lanzamiento de los conjuntos de chips 9xx de Intel, los expertos y entusiastas de todo el mundo han proclamado que la cola de comandos es el próximo gran avance para el escritorio. Equivocado. Como lo demuestran las disparidades entre FastTrak S150 TX4 y TX4200 (por lo demás, idénticos excepto por la funcionalidad TCQ agregada de este último), la cola de comandos presenta una sobrecarga significativa que no se paga por sí misma en términos de rendimiento en instancias altamente localizadas y de menor profundidad que incluso genera la multitarea de un solo usuario más pesada. Cada vez es más claro, de hecho, que la madurez y la implementación generalizada de TCQ en el mundo SCSI es una de las razones principales por las que las unidades SCSI mecánicamente superiores tropiezan en comparación con las unidades ATA. Considere que de las 24 combinaciones obtenidas de los cuatro patrones de acceso de un solo usuario, matrices RAID0 de una a cuatro unidades y matrices duplicadas RAID1/10 presentadas anteriormente, el S150 TX4 que no es TCQ se destaca en cada caso por un large margen. TCQ solo está destinado a servidores, al igual que la tecnología que se menciona a continuación.

3. RAID ayuda mucho más a las aplicaciones multiusuario que a los escenarios de un solo usuario. El entusiasmo de la comunidad de usuarios avanzados combinado con el aparato de marketing de las empresas que atienden a tales multitudes ha llevado a la creencia extraordinariamente errónea de que dividir los datos en dos o más unidades produce beneficios de rendimiento significativos para la mayoría de los usos que no son de servidor. ¡Esto no podría estar más lejos de la verdad! El uso fuera del servidor, incluso en situaciones de muchas tareas múltiples, genera patrones de acceso altamente localizados y de menor profundidad donde dominan las estrategias de lectura anticipada y escritura diferida. La teoría les ha dicho a aquellos dispuestos a escuchar que la creación de bandas no produce beneficios de rendimiento significativos. Hace tiempo, una prueba empírica controlada respaldó lo que la teoría sugería. Las dudas aún persistían; irracionalmente, muchos creían que los resultados serían diferentes si la matriz se basara en una interfaz SATA o SCSI. Como se muestra arriba, los resultados son los mismos. Ahorre tiempo, dinero y datos: ¡deje RAID para los servidores!

¡Estamos lejos de terminar aquí! Los productos SATA TCQ de la competencia de Pacific Digital Corp. y Highpoint Technologies están actualmente disponibles, mientras que Silicon Image tiene un conjunto de chips que aún no se ha incorporado a un producto de envío. Continuaremos trabajando con otros fabricantes de controladores para ofrecer a los lectores los resultados de Raptor TCQ combinados con una variedad de productos. SATA NCQ también acaba de ingresar al horario de máxima audiencia. Como siempre, StorageReview estará allí.


Discusión de revisión