Casa Consumatori TCQ, RAID, SCSI e SATA

TCQ, RAID, SCSI e SATA

by storagereview

StorageReview offre il primo di numerosi approfondimenti completi sull'accodamento dei comandi contrassegnati e sulle sue implicazioni per il mondo desktop e server. Il TCQ è valutato? Come si integra con gli array RAID? Il TCQ SATA è efficace quanto il TCQ SCSI? Trova le risposte a queste domande e altro ancora nelle ultime novità di SR!

Vedi anche Come testiamo le unità
Vedi anche Recensione del Western Digital Raptor WD740GD
Vedi anche Recensione Seagate Cheetah 10K.6

 

Introduzione

Negli ultimi anni, Western Digital ha mantenuto un virtuale blocco sui mercati dei desktop e degli appassionati ad alte prestazioni e ad alta capacità. La venerabile serie WD Caviar ha combinato velocità e capacità invidiabili con prezzi ragionevoli. Tuttavia, a parte una linea SCSI relativamente oscura e di breve durata, quando si trattava di entrare nell'arena delle imprese lucrative l'azienda semplicemente osservava da lontano mentre titani come Seagate, Maxtor e Hitachi combattevano per le quote di mercato.

Poco più di un anno fa WD ha testato le acque aziendali con l'introduzione del primo disco ATA da 10,000 RPM al mondo, il Raptor WD360GD. Il Raptor abbinava la meccanica di classe SCSI alla nuova e relativamente economica interfaccia Serial ATA nel tentativo di ridurre i costi piuttosto elevati richiesti dai sottosistemi SCSI. I risultati delle prestazioni di StorageReview, tuttavia, hanno rivelato che mentre il WD360GD ha fornito risultati di livello mondiale per utente singolo, le sue prestazioni multiutente sono rimaste insignificanti se confrontate con le unità SCSI da 10 RPM esistenti.

Al WD360GD mancava un elemento chiave di cui il mondo SCSI ha goduto per anni: il tagged command queuing (TCQ), una funzionalità che riordina in modo intelligente le richieste per ridurre al minimo il movimento dell'attuatore. Nel settembre del 2003, Western Digital annunciò il successivo Raptor WD740GD, un'unità di seconda generazione che apportò una serie di miglioramenti alla linea. Sebbene il raddoppio della capacità del Raptor a 74 gigabyte sia il miglioramento più visibile, il più intrigante è senza dubbio l’implementazione del TCQ.

 

TCQ in breve

Da non confondere con il riordino e l'ottimizzazione del sistema operativo, l'accodamento dei comandi con tag è un processo a livello hardware progettato per semplificare la consegna dei dati in accessi altamente casuali con carichi pesanti. Senza TCQ, un azionamento può accettare solo un singolo comando alla volta. Funziona quindi in base al principio "primo arrivato, primo servito", completando le richieste nell'ordine in cui vengono ricevute. Questo non è sempre il modo più efficace per soddisfare le richieste di dati, soprattutto in un ambiente intensivo e non localizzato.

Attraverso il processo di accodamento dei comandi contrassegnati, un adattatore host aggiunge tag speciali ai singoli comandi. L'unità stessa, a conoscenza della propria disposizione fisica dei settori in tre dimensioni, può tenere conto della rotazione, ricercare le distanze e riordinare i comandi per servirli in modo più efficiente. I dati richiesti vengono così restituiti al titolare in maniera più snella; può quindi utilizzare le informazioni aggiuntive aggiunte in precedenza per restituire in modo trasparente i dati al sistema operativo.

Considera il diagramma a sinistra. In un paradigma tradizionale, senza code, l'unità accetterebbe la richiesta per il pezzo di dati A, sposterebbe l'attuatore e lo recupererebbe, accetterebbe la richiesta per B, lo recupererebbe, quindi si sposterebbe al pezzo C. Un'unità in grado di bufferizzare e accodare le richieste , tuttavia, sarebbe in grado di recuperare A, quindi scegliere di recuperare prima C, seguito da B, con un conseguente risparmio netto di tempo nel completamento di queste tre richieste.

Il TCQ deve essere supportato sia dal controller che dal disco rigido stesso. È stata introdotta nel mondo SCSI già nel 1990 ed è stata formalmente codificata nello standard SCSI-2 nel 1994. La funzionalità si è rivelata rapidamente preziosa nel mondo dei server multiutente ed è oggi costantemente implementata praticamente su tutti gli adattatori e dischi host. . Allo stesso modo, il TCQ è stato formalmente implementato nello standard ATA-1998 del 4. A differenza dei dispositivi SCSI, tuttavia, le unità ATA semplicemente non venivano utilizzate nelle applicazioni aziendali in cui funzionalità come la possibilità di hot-swap e tempi di accesso ridotti erano fondamentali. Inoltre, la tradizionale roccaforte ATA, le macchine monoutente, semplicemente non ha beneficiato del TCQ; infatti, in molti casi le spese generali aggiuntive imposte hanno effettivamente ridotto, anziché migliorare, la prestazione in questi settori. Di conseguenza, la funzionalità è stata ampiamente ignorata dal settore.

Oggi, tuttavia, l'avvento di Serial ATA, le funzionalità hot swap ad esso associate e la promessa interoperabilità con l'imminente standard Serial attached SCSI (SAS) hanno portato a un futuro luminoso per ATA nelle aziende. Il prossimo standard SATA II include disposizioni per incorporare l'accodamento di comandi contrassegnati secondo lo standard ATA-4. Le architetture di unità SATA native come Seagate Barracuda 7200.8 e Maxtor MaXLine III promuovono l'inclusione dell'accodamento dei comandi con tag "Native SATA", o "Native Command Queuing" (NCQ) in breve. Il paradigma fondamentale di NCQ è identico a quello dell’accodamento dei comandi con tag; il soprannome NCQ differenzia semplicemente lo standard SATA II dal modello ATA-4 esistente.

Con le sue profonde risorse in ricerca e sviluppo, Seagate è stato l'unico produttore a evitare un bridge PATA-SATA meno costoso e più veloce da commercializzare per i suoi primi prodotti SATA. Per ragioni finanziarie e temporali altri produttori come Western Digital hanno introdotto i loro primi prodotti con funzionamento a ponte. Il Raptor WD740GD è uno di questi modelli. Anche se le implicazioni pratiche sono trascurabili (dopo tutto, sono le prestazioni che contano!), il bridge del Raptor gli impedisce di utilizzare lo standard SATA II NCQ. Pertanto, per implementare tempestivamente l'accodamento di comandi contrassegnati nella sua linea in erba orientata all'impresa, Western Digital ha deciso di includere TCQ in stile ATA-4 nel Raptor. Fortunatamente per WD, l'azienda ha ricevuto una risposta entusiasta da molti produttori di controller. La maggior parte delle aziende che progettano adattatori host SATA abilitati per NCQ stanno incorporando anche code in stile Raptor. Uno di questi produttori è Promise Technology.

 

I test

In questo primo di quelli che saranno numerosi articoli che esamineranno gli effetti dell'accodamento dei comandi con tag di SATA, daremo un'occhiata a come il prossimo Promise FastTrak TX4200 si confronta con il FastTrak S150 TX4 attualmente in vendita e non abilitato per TCQ. La relazione tra questi due controller è particolarmente interessante in quanto il TX4200 è semplicemente un FastTrak S150 TX4 con codice TCQ aggiunto. L'S150 TX4, a sua volta, è semplicemente un SATA150TX4 abilitato per RAID, il controller SATA di riferimento di lunga data di SR Testbed. Un contrasto diretto tra i due controller RAID Promise può quindi isolare gli effetti del TCQ da altre variabili.

Caratteristiche di Promise FastTrak TX4200:

  • 4 porte Serial ATA per un massimo di 4 unità
  • RAID 0/1/10 e JBOD
  • Funzionamento PCI a 32 bit/33-66 MHz
  • Supporto NCQ e SATA TCQ

TCQ, ovviamente, esiste da qualche tempo nel mondo SCSI: tutti gli attuali adattatori host, controller RAID e dischi rigidi supportano un'implementazione molto matura. Per scoprire quali eventuali svantaggi soffre il SATA TCQ rispetto alle soluzioni SCSI più consolidate, in questi test sono stati inclusi i risultati di un controller RAID Mylex AcceleRaid 170 abbinato a un massimo di quattro unità Seagate Cheetah 73K.10 da 6 GB.

Le caratteristiche del Mylex AcceleRaid 170:

  • 1 porta LVD a 68 pin per un massimo di 15 unità
  • Livelli RAID 0, 1, 0+1, 3, 5, 10, 30, 50, JBOD
  • Cache SDRAM ECC da 32 MB
  • Funzionamento PCI a 32 bit/33 MHz

Sebbene il TCQ offra vantaggi anche quando un singolo azionamento funziona con carichi casuali pesanti, il suo vero potenziale emerge quando sono presenti anche più attuatori con cui lavorare. Pertanto, i test che seguono esaminano attentamente la scalabilità fornita dagli array sia in scenari multiutente che monoutente: il nostro primo approccio formale al RAID in oltre due anni.

Nei seguenti test, l'hardware e i benchmark di Testbed3 risolvono le molteplici dimensioni dei potenziali driver delle prestazioni:

  • In che modo TCQ apporta vantaggi alle prestazioni multiutente e utente singolo?
  • In che modo il TCQ influisce sulla capacità di un array RAID di aumentare le prestazioni man mano che vengono aggiunte più unità?
  • Come si confronta il SATA TCQ con l'implementazione di SCSI?
  • Come si ridimensiona un array RAID con I/O casuali sempre più pesanti?
  • Quali vantaggi offre un array RAID all'I/O altamente localizzato che domina l'uso non server (utente singolo)?

Poiché questi test sfruttano il banco di prova SR standard, prendiamoci un momento per considerare una potenziale limitazione dell'hardware della macchina, lo slot PCI a 33 MHz e 32 bit.

 

Limitazioni del bus PCI

Il limite di 133 MB/sec del bus PCI standard a 32 bit e 33 MHz potrebbe preoccupare alcuni, soprattutto coloro che cercano, per vari motivi, di massimizzare le velocità di trasferimento sequenziale. Il limite pratico nel mondo reale rimane leggermente al di sotto di tale soglia: i test STR associati ai risultati riportati di seguito raggiungono il massimo a 126 MB/sec. Un singolo Raptor nella sua zona esterna può arrivare a quasi 72 MB/sec mentre un Cheetah 10K.6 può arrivare a 69 MB/sec: ne bastano solo due per saturare il bus PCI.

Diamo uno sguardo più da vicino, tuttavia, a quanto sia importante STR nella maggior parte delle applicazioni. IL StorageReview File Server DriveMark genera una dimensione di trasferimento media di 22 kilobyte. In altre parole, l'operazione I/O media generata nella suite consiste nel riposizionamento dell'attuatore nella posizione desiderata seguito dalla lettura o scrittura di 22 KB di dati. Allo stesso modo, la dimensione media di trasferimento dell'SR Office DriveMark è di 23 KB. L'SR High-End DriveMark, basato su una suite di applicazioni che include editing video e audio, è l'unico test che va ben oltre queste dimensioni, generando un trasferimento relativamente elevato di 69.5 KB per IO.

Un singolo Raptor WD740GD, con una velocità di trasferimento massima di 72 MB/sec, può trasferire 22 KB in:

72 MB/sec * 1024 KB/MB / 22 KB = 3351 volte/secondo o 0.298 millisecondi ciascuno
Pertanto, la richiesta IO media nel file server SR DriveMark si conclude con una lettura o scrittura sul piatto che richiede in media 0.3 ms per essere completata.

Un array RAID0 con limitazione PCI può trasferire 22 KB di dati in:

126 MB/sec * 1024 KB/MB / 22 KB = 5865 volte/secondo o 0.170 millisecondi ciascuno
In un modello di accesso tipico che prevede una localizzazione significativa come Office DriveMark, un'unità esperta come il WD740GD può raggiungere circa 600 I/O al secondo. Detto al contrario, ogni I/O (che, ancora una volta, consiste in posizionamento + trasferimento) impiega circa 1.7 millisecondi. In uno scenario a unità singola e altamente localizzato, il Raptor impiega in media 1.7 millisecondi per I/O. Di questi 1.7 ms, 0.3 ms, ovvero il 18%, rappresentano il trasferimento di dati da o verso il piatto. Il restante 82% dell'operazione consiste nello spostare l'attuatore o nell'attesa che il piatto ruoti nella posizione desiderata. La situazione si polarizza ulteriormente con l’aumento dei tassi di trasferimento. A 126 MB/sec, i trasferimenti rappresentano solo l'11% del tempo totale del servizio. In effetti, velocità di trasferimento sequenziali che vanno da 50 MB/sec a 130 MB/sec e superiori “si cancellano dall'equazione” banalizzando il tempo necessario per leggere e scrivere i dati rispetto al tempo necessario per posizionare la lettura/scrittura. scrivere le teste nella posizione desiderata.

Il diagramma a destra illustra la relazione tra posizionamento e trasferimenti in tipici scenari monoutente e multiutente. Osservare come il tempo impiegato per posizionare l'attuatore e il piatto (rosso) prevalga sul tempo relativamente piccolo impiegato per leggere/scrivere i dati stessi (giallo). Anche un caso asintotico di una velocità di trasferimento infinita scatenata attraverso un bus infinitamente veloce eliminerebbe solo la parte gialla del tempo totale necessario per soddisfare una richiesta.

Pertanto, sebbene il bus PCI possa limitare le velocità di trasferimento sequenziali, il suo effetto pratico nel limitare la velocità reale nell'uso tipico non è così significativo come si potrebbe credere a prima vista. Di conseguenza, il ridimensionamento dimostrato in questo articolo rappresenta anche gli incrementi che si otterranno dagli array che operano su autobus a velocità più elevata.

 

Il nostro terzo campione Raptor WD740GD

Il campione di valutazione fornito a SR da Western Digital per il ns recensione pubblicata lo scorso gennaio è stato prodotto il 4 dicembre 2003. Per questa recensione, WD ci ha inviato altri quattro campioni, tutti datati 4 marzo 2004. Sebbene gran parte dell'attenzione di questo articolo si concentri sugli array multi-drive, per scopi di controllo è stato necessario testare nuovamente un singola unità di questo nuovo lotto sul nostro controller Promise SATA150TX4 di riferimento. Emergono alcune differenze:

Sono evidenti piccole riduzioni delle prestazioni, ad esempio circa il 3% nell'Office DriveMark. Degno di nota è il calo dell'8% nel Bootup DriveMark. I rappresentanti di Western Digital attribuiscono la differenza al firmware rivisto. Uno sguardo più attento ai due diversi campioni rivela i seguenti numeri di modello estesi:

 

 

Notare le differenze nella cifra finale della designazione MDL estesa quando si confrontano il nostro secondo e terzo campione. L'unità di dicembre termina con uno zero mentre l'unità di marzo termina con un 1. Perché questo cambiamento? Innanzitutto, dovremmo sottolineare che tutti i produttori aggiornano silenziosamente e regolarmente il firmware su tutte le loro unità dopo il rilascio iniziale, sia per correggere bug che per ottimizzare le prestazioni man mano che si accumulano pile di esperienze di configurazione.

In secondo luogo, come è stato dolorosamente ovvio negli ultimi mesi, l'accodamento dei comandi SATA ha dimostrato di essere un obiettivo in costante movimento mentre i produttori di unità e controller continuano a modificare i loro prodotti. Poiché i produttori di controller come Pacific Digital, Silicon Image e Promise Technology continuano a sviluppare campioni di adattatori pre-release, i produttori di unità come Western Digital sono costretti a riottimizzare il firmware per ottenere i migliori risultati. Allo stesso modo, lo stesso è avvenuto nella direzione opposta. Sebbene Western Digital abbia annunciato il WD740GD nel settembre del 2003 e sebbene le unità ampiamente disponibili attraverso il canale dallo scorso dicembre presentino la funzionalità TCQ, il team Raptor è comunque spinto a rivalutare regolarmente i potenziali adattatori host associati all'unità e a risintonizzare il firmware di conseguenza. Il risultato è la revisione "00FLA1", un'unità più adatta allo stato degli odierni adattatori host abilitati TCQ, anche se con un leggero calo in alcune misurazioni delle prestazioni.

Uno sguardo alle cifre sopra riportate rivela che, sebbene esistano differenze, sono a tutti gli effetti banali. Semplicemente non si noterà la differenza di velocità nell'uso soggettivo. I tentativi di ottenere specificamente la precedente revisione 00FLA0 si rivelerebbero probabilmente frustranti e infruttuosi. Non ci preoccuperemmo della differenza.

 

Una parola sull'organizzazione

Presentare i seguenti risultati può essere piuttosto scoraggiante. Molte dimensioni diverse della performance emergono quando si tenta di formare il “quadro generale”. In che modo le prestazioni aumentano quando tutte le altre variabili, salvo la profondità della coda, rimangono costanti? Che tipo di vantaggi derivano dall'aggiunta di più unità a un array? In che modo la scelta del mirroring rispetto allo striping influisce sulle prestazioni? L'elenco delle domande continua. Di conseguenza, abbiamo evitato l'uso dei nostri grafici standard “generati da HTML” a favore di grafici statici. Si spera che trasmettano accuratamente la miriade di informazioni da raccogliere.

Senza ulteriori indugi, diamo un’occhiata ad alcuni risultati!

 

 

 

Prestazioni multiutente con l'aumento della profondità della coda

Innanzitutto, uno sguardo a come le prestazioni scalano nel DriveMark del file server StorageReview altamente casuale all'aumentare della profondità della coda (carico). Per informazioni su FS DriveMark, consultare questa spiegazione. A scopo di confronto, i risultati per il controller SATA Promise SATA3TX150 standard di Testbed4 e il controller SCSI Adaptec AHA-29160 sono stati inclusi nello scenario a unità singola. I risultati RAID0 presentati di seguito presentano una dimensione di striping di 64 KB.

 

Il Raptor che funziona sia con Promise SATA150TX4 che con FastTrak S150 TX4 inizia con ben 129 I/O al secondo con una profondità di coda di 1. Anche il Cheetah abbinato ad AcceleRaid si comporta rispettabilmente a 125 I/O al secondo. Le combinazioni Promise TX4200/Raptor e Adaptec 29160/Cheetah, tuttavia, inciampano con i loro avviamenti di 112 I/O al secondo e 117 I/O al secondo rispettivamente. Con l’aumento della profondità, tuttavia, il quadro inizia a cambiare.

Quando il carico raggiunge i 4 I/O eccezionali, il 29160 si posiziona in testa al gruppo, superando l'AcceleRaid. Il FastTrak S150 TX4 e il SATA150TX4 continuano a funzionare in modo identico mentre il TX4200, ancora in fondo alla classifica, riesce a colmare parte del divario.

Una profondità di 16 produce notevoli cambiamenti. L'Adaptec balza in testa alla classifica con l'impressionante cifra di 237 I/O al secondo. Il Mylex continua a scalare bene, ma l'implementazione del TCQ della coppia TX4200/Raptor inizia a far sentire la sua presenza e si posiziona leggermente indietro.

Quando finalmente raggiungiamo il pesante carico di 64 richieste in sospeso, emerge una chiara gerarchia. Gli adattatori host SCSI Adaptec sono sempre stati scelte popolari e affidabili. Il 29160 si dimostra anche un ottimo rendimento lasciando gli altri controller nella polvere sotto carico pesante. Anche se il TX4200 e l'AcceleRaid non riescono a raggiungere livelli così elevati, forniscono comunque la scalabilità sotto carico che ci si aspetterebbe dai sottosistemi che dispongono di TCQ. Al contrario, i due controller non TCQ ATA sono in fondo alla classifica, in netto contrasto con le loro prestazioni veloci quando rimane una sola richiesta in sospeso.

 

Se configurati con due unità in formato striped, tutti e tre i controller RAID si avviano in modo simile: il FastTrak S150 TX4, privo del sovraccarico imposto dal TCQ, gode di un leggero vantaggio. Il divario viene praticamente cancellato nel momento in cui la coda raggiunge 4.

Quando la profondità raggiunge 16, la pendenza dell'S150 TX4 si livella, indicando un tasso di ridimensionamento inferiore rispetto ad AcceleRaid e TX4200. Infine, con 64 I/O l'AcceleRaid e il TX4200 godono di un vantaggio significativo rispetto all'S150 TX4 con il TX4200 che raggiunge un massimo di 385 I/O al secondo.

 

Gli effetti di scaling relativi rimangono simili con una configurazione RAID0 a tre unità. I risultati di tutti e tre i controller, tuttavia, mostrano pendenze più ripide, indicando che l'aumento del conteggio degli attuatori produce vantaggi all'aumentare della profondità della coda.

Il non-TCQ S150 TX4 resta indietro rispetto agli altri due adattatori quando le code raggiungono 16. Quando la profondità raggiunge 64 I/O eccezionali, il TX4200 si pone ancora una volta davanti agli altri.

 

Infine, in una configurazione RAID0 a quattro unità, il modesto S150 TX4 riesce a scalare così come gli array abilitati TCQ fino a 16 richieste in sospeso. È solo quando raggiungiamo i 64 che le differenze emergono. L'S150 TX4 si livella mentre l'AcceleRAID continua a scalare lungo la stessa pendenza. Il TX4200 in realtà scala leggermente meglio sotto quest'ultima fase, aprendo un divario significativo tra se stesso e l'array basato su SCSI.

 

 

 

Prestazioni multiutente all'aumentare del numero di unità

Anche il contrasto delle prestazioni tra i controller man mano che aumenta il numero di unità di un array RAID0 produce risultati significativi. I grafici che seguono dimostrano gli effetti dell'aggiunta di più dischi mantenendo costanti tutte le altre variabili. I risultati presentati di seguito presentano una dimensione di stripe di 64 KB.

 

Le pendenze rimangono piuttosto stabili se confrontiamo le operazioni di I/O fornite al secondo con il numero di unità in un array con striping con un solo I/O eccezionale. Senza richieste supportate e in attesa, un aumento del numero di attuatori semplicemente non può farsi sentire. Con carichi così leggeri, il design più semplice, S150 TX4 di Promise, offre le migliori prestazioni indipendentemente dal numero di unità nell'array.

 

La situazione cambia notevolmente quando il carico in sospeso arriva fino a quattro richieste. Tutti e tre i controller forniscono un numero maggiore di I/O al secondo man mano che le unità vengono aggiunte all'array. Con un solo disco, l'AcceleRaid gode di un vantaggio con 154 I/O al secondo mentre entrambi i controller Promise ottengono un punteggio simile con circa 135 I/O al secondo.

Quando viene aggiunta una seconda unità all'array, tuttavia, l'AcceleRaid scala leggermente meno dei controller ATA; tutti e tre sono molto vicini l'uno all'altro.

Quando raggiungiamo un conteggio di tre e quattro unità, la leggera pendenza di AcceleRaid lo mantiene dietro entrambi i controller Promise. L'aumento del numero di attuatori consente all'S150 TX4 di superare la mancanza di funzionalità TCQ e superare AcceleRaid e TX4200, anche se con margini relativamente piccoli.

 

Con una profondità di coda di 16, la mancanza di TCQ dell'S150 TX4 lo pone in una posizione di svantaggio. Sebbene goda ancora di aumenti di prestazioni man mano che le unità vengono aggiunte all'array, resta indietro rispetto al TX4200 e all'AcceleRaid in quasi tutti i punti. L'unica eccezione è a livello di 4 dischi: il modesto aumento di AcceleRaid quando viene aggiunto il quarto disco consente al relativamente coerente S150 TX4 di colmare il divario.

 

Sebbene l'S150 TX4 continui a mostrare una scalabilità quasi lineare sotto un carico costantemente elevato di 64 richieste in sospeso, l'aggiunta di più unità all'array semplicemente non è sufficiente per mantenerlo nella mischia con alternative abilitate TCQ.

SCSI AcceleRaid offre prestazioni migliori rispetto a SATA TX4200 con una sola unità. Tuttavia, man mano che vengono aggiunti più dischi all'array, il TX4200 scala meglio; la sua maggiore pendenza culmina con un vantaggio del 13% rispetto all'AcceleRaid in un array a 4 unità.

 

 

 

Mirroring multiutente

I risultati ottenuti dagli array RAID0 man mano che aumenta il numero di unità sono interessanti da un punto di vista accademico principalmente a causa della natura lineare in cui è possibile aggiungere attuatori indipendenti. È vero, tuttavia, che l'uso pratico di RAID0 nei server di produzione è piuttosto limitato: i miglioramenti delle prestazioni sono più che compensati dal significativo aumento del rischio. In caso di guasto in un array con striping a quattro unità, tutti i dati andrebbero persi.

Il mirroring (RAID1) è uno scenario molto più probabile. In un array di questo tipo, ogni dato viene scritto su almeno due dischi. Mentre le scritture devono avvenire all'unisono, le letture no; di conseguenza, i controller RAID progettati in modo intelligente offrono un aumento delle prestazioni attraverso l'implementazione di letture indipendenti quando si utilizzano più attuatori. RAID1 offre i vantaggi della ridondanza in caso di guasto di un'unità offrendo allo stesso tempo prestazioni migliorate attraverso due meccanismi di lettura separati. RAID01 offre ridondanza su due set di array RAID0: in caso di guasto di un array, i dati rimangono conservati sull'altro. RAID10 esegue il mirroring dei dati su due unità, quindi esegue lo striping dell'array risultante con un altro array. Sia RAID01 che RAID10 migliorano le prestazioni con due meccanismi di scrittura e fino a quattro di lettura. Il controller Mylex offre sia RAID01 che RAID10 mentre le unità Promise incorporano RAID10.

 

Durante il mirroring di due unità, tutti e tre i controller mostrano un aumento apprezzabile degli I/O forniti al secondo fino ad un carico moderatamente pesante di 16 richieste in sospeso. Stranamente, tuttavia, le prestazioni del Promise TX4200 diminuiscono quando si passa da un carico di 16 a 64. Sia l'S150 TX4 che l'AcceleRaid, d'altro canto, continuano a crescere come previsto. AcceleRaid offre facilmente le migliori prestazioni RAID1 complessive.

Come ci si aspetterebbe, lo striping di una coppia di array con mirroring (RAID10) offre vantaggi in termini di prestazioni ancora maggiori. Qui il modesto S150 TX4 balza ad un significativo vantaggio iniziale con un carico relativamente leggero di 4 richieste in sospeso. Le cose si sono praticamente stabilizzate quando il carico raggiunge 16; a 64, i miglioramenti più lievi dell'S150 TX4 lo portano a rimanere un po' indietro. In una configurazione RAID10, il TX4200 non mostra lo stesso strano calo tra 16 e 64. Piuttosto, scala come previsto.

 

 

 

Prestazioni per utente singolo

Anche se è stata presentata la prova contraria, una combinazione di marketing troppo zelante e di generale mancanza di conoscenza ha portato alla proliferazione del RAID tra gli utenti esperti che utilizzano workstation monoutente. Sebbene si possano sostenere notevoli argomentazioni a favore della ridondanza fornita da RAID1, l'aumento delle velocità di trasferimento e le prestazioni di accesso casuale I/O elevate fornite da RAID0 semplicemente non apportano vantaggi alla maggior parte degli usi non server.

Allo stesso modo, sebbene l'ultimo Raptor offra eccezionali prestazioni per utente singolo, Western Digital ha lavorato per incorporare la funzionalità TCQ nell'unità non per ampliare il proprio vantaggio per utente singolo rispetto alla concorrenza, ma piuttosto per garantire che il Raptor rivendichi la sua pretesa come valida alternativa in il mondo dei server tradizionalmente basato su SCSI.

Anche così, ci rendiamo conto che molti lettori in tutto il mondo attendono con impazienza i risultati per il Raptor accoppiato con un controller TCQ appropriato. StorageReview DriveMarks per desktop offrono un'impareggiabile opportunità per valutare quanta differenza fanno gli array RAID quando si tratta di applicazioni non server e per utente singolo. Qui daremo uno sguardo a come RAID, TCQ, SCSI e SATA influiscono sulle prestazioni. I risultati RAID0 presentati di seguito presentano una dimensione di striping di 64 KB.

 

Le somiglianze tra il controller Promise SATA150TX4 standard strettamente correlato (non RAID) e il controller Promise S150 TX4 (non RAID TCQ) sono abbastanza evidenti poiché entrambi ottengono punteggi simili in tutti e quattro i test. Il Promise TX4200 abilitato per TCQ, tuttavia, produce risultati significativi. Quando un controller ATA compatibile con TCQ incontra finalmente un'unità ATA compatibile con TCQ, la complessità aggiuntiva e il sovraccarico riducono effettivamente le prestazioni! Ricorda che non importa quanto siano sofisticati il ​​multitasking e il multithreading in una macchina monoutente, i modelli di accesso (altamente localizzati vs. altamente casuali) e le profondità della coda (per lo più basse con un burst occasionale vs. costantemente più alte) rimangono fondamentalmente diverse da un server multiutente. In effetti, è evidente che proprio la maturità e l'implementazione coerente del TCQ nel mondo SCSI sono in realtà uno dei fattori che fanno inciampare le unità SCSI meccanicamente superiori negli scenari a utente singolo.

Per quanto riguarda SCSI, Adaptec AHA-29160 e Mylex AcceleRaid 170 si scambiano di posto. Sebbene il 29160 si dimostri superiore nelle prestazioni in scenari multiutente con unità singola, AcceleRaid offre punteggi migliori per utente singolo su tutta la linea. Si noti, tuttavia, che anche se ostacolato dal funzionamento del TCQ, il Raptor riesce a mantenere il vantaggio sul Cheetah in tre dei quattro test per utente singolo. L’esperienza di Western Digital nella progettazione di ottime strategie di buffer di read-ahead e write-back per utente singolo continua a brillare.

Andiamo avanti ed esaminiamo il modo in cui i controller RAID si ridimensionano in ciascun modello di accesso man mano che aumenta il numero di unità.

 

Passando da una configurazione a unità singola a uno striped array a doppia unità, le prestazioni per tutti e tre i controller aumentano con un margine del 9%-13% in SR Office DriveMark. È importante notare, tuttavia, che una parte di questo aumento emerge attraverso il raddoppio della capacità del disco logico da 74 GB (1 unità) a 146 GB (2 unità). Ricorda che il StorageReview Desktop DriveMarks sono la rappresentazione definitiva e ripetibile delle prestazioni del mondo reale. Di conseguenza, durante i test vengono richiesti indirizzi reali del settore LBA. Per definizione, unità e array di capacità maggiore stimoleranno fisicamente queste posizioni più vicine tra loro e quindi godranno di un vantaggio (come accade nell'uso reale).

L'aggiornamento a tre unità rivela una significativa diminuzione dei rendimenti. Passare a quattro dischi provoca effettivamente una regressione nei punteggi. Anche se alcuni potrebbero obiettare che il bus PCI a 32 bit e 33 MHz del banco di prova limita i guadagni ottenuti dallo striping, i lettori dovrebbero ricordare che, soprattutto a questi livelli di I/O, tali limiti non sono significativi. Indipendentemente dal numero di unità, il funzionamento più semplice e ottimizzato dell'S150 TX4 gli garantisce un notevole vantaggio in termini di prestazioni rispetto agli altri due controller.

 

Grazie alle sue dimensioni di trasferimento medie più elevate, l'SR High-End DriveMark beneficia leggermente di più rispetto alla suite Office quando aumenta il numero di unità. I guadagni vanno dal 9% al 19% qui e, a differenza del caso del test Office, non si livellano mai completamente con il conteggio delle unità. Anche in questo caso l'S150 TX4 offre prestazioni migliori rispetto ai controller abilitati TCQ.

 

SR Bootup DriveMark cattura il processo di avvio di Windows XP di Microsoft. La sequenza di avvio di XP è insolita in quanto riordina i dati sull'unità per imitare la sequenza delle richieste (permettendo quindi più trasferimenti sequenziali) e tenta anche di generare una profondità di coda quanto più elevata possibile inondando il sottosistema di archiviazione di richieste (una media di 2.39 I/O in sospeso, tuttavia, rimane piuttosto modesto rispetto alla maggior parte degli scenari multiutente). Il risultato netto è l'unico modello Desktop DriveMark che beneficia in modo significativo di un aumento del numero di unità. Le prestazioni aumentano costantemente quando un'altra unità viene aggiunta all'array. I vantaggi pratici, tuttavia, rimangono dubbi. Gli aumenti nel processo di avvio di XP dovrebbero superare il maggiore sovraccarico generato durante il processo di accensione POST dall'array RAID e dalle unità associate. Anche nel conteggio delle unità DriveMark di avvio rimane molto più importante del TCQ: l'S150 TX4 mantiene un vantaggio costante e considerevole rispetto agli altri controller.

 

Infine arriviamo all'SR Gaming DriveMark, una media ponderata degli accessi al disco generati da cinque popolari giochi per PC. Le pendenze piatte indicano che gli usi di gioco beneficiano meno sia del RAID che dell'accodamento dei comandi. Infatti, a 677 I/O al secondo, un array Cheetah a 4 unità che funziona con Acceleraid 170 ritarda di un singolo Raptor in esecuzione sul "più stupido" dei controller SATA con un margine del 9%.

 

 

Mirroring per utente singolo

 

Il mirroring dei dati su due unità (RAID1) e lo striping di due mirror (RAID10) comportano un cambiamento significativo delle prestazioni solo nel Bootup DriveMark. Tutti e tre i controller offrono un aumento quando si passa da una singola unità a una coppia in mirroring e di nuovo quando si passa da una coppia in mirroring a RAID10.

In tutti gli altri modelli di accesso, i tre controllori mostrano lievi cambiamenti qua e là, senza che si possa individuare alcuna tendenza significativa. Da notare che ancora una volta il modesto S150 TX4 non TCQ offre le migliori prestazioni in tutte le combinazioni mirrorate.

 

 

 

Conclusioni

Dalla pletora di dati sopra presentati, possiamo trarre diverse conclusioni:

1. SATA TCQ e SATA RAID hanno il potenziale per offrire vantaggi al mercato dei server altrettanto grandi di quelli di SCSI TCQ e SCSI RAID. Il Promise FastTrak TX4200 e il Mylex AcceleRaid 170 sono rispettivamente controller RAID entry-level per le interfacce SATA e SCSI. Il primo, infatti, è poco più dell'attuale controller FastTrak S150 TX4 di Promise con l'aggiunta della funzionalità SATA TCQ (e NCQ).

A differenza di altri importanti lettori di dischi rigidi, Western Digital non dispone di una linea di prodotti consolidata basata su SCSI da proteggere. Di conseguenza, l'azienda cerca un vantaggio competitivo offrendo meccaniche e funzionalità in stile SCSI a prezzi associati all'interfaccia ATA più attenta ai costi. Un rapido controllo al momento in cui scriviamo con lo sponsor StorageReview IperMicro prezzi Cheetah 73K.10 da 6 GB a $ 339 ciascuno, Raptor WD740GD a $ 219 ciascuno e AcceleRaid 170 a $ 379. Quando verrà rilasciato questo agosto, il prezzo del Promise TX4200 sarà alla pari con quello dell'S150 TX4 che dovrebbe sostituire. Costa $ 159 su HyperMicro.

Ne derivano i seguenti prezzi (esclusi cavi e accessori):

$ 1356 ($ 339 x 4 Cheetah) + $ 379 (AcceleRaid 170) = $ 1735 (array RAID SCSI a 4 unità)
$ 876 ($ 219 x 4 Raptors) + $ 159 (FastTrak TX4200) = $ 1035 (array RAID SATA a 4 unità)
La differenza di costo tra i due array è pari al 40%, davvero significativa. Cosa si sacrifica optando per la soluzione SATA meno costosa? Dopotutto, è stato dimostrato che le prestazioni di SATA sono competitive e in alcuni casi superano quelle di una soluzione SCSI comparabile.

Sebbene WD abbia fornito una soluzione in grado di eguagliare la velocità e la scalabilità di una soluzione basata su SCSI, è necessario tenere presenti anche i fattori chiave dell'infrastruttura e dell'affidabilità. Come nel caso dello stesso TCQ, l'hardware di supporto SATA come backplane, soluzioni all-in-one e simili rimangono agli inizi se confrontati con la maturità e la longevità dell'hardware SCSI. Tieni inoltre presente che mentre Western Digital rivendica una specifica MTTF di classe enterprise da 1.2 milioni di ore e supporta i Raptors con una garanzia di 5 anni, la linea è ancora nuova e rimane relativamente non provata rispetto a soluzioni consolidate come la serie Cheetah di Seagate. Infine, ricorda che i prezzi sopra elencati rappresentano solo il costo del sottosistema di archiviazione: tenere conto del costo totale dell'hardware del server quando si considerano schede madri, CPU e RAM può diluire la differenza in modo significativo.

Alla fine, esiste il potenziale per SATA di invadere il mercato dei server entry-level e di medio livello. La performance c'è sicuramente. Se l’affidabilità del Raptor si dimostrerà paragonabile a quella della concorrenza e se l’infrastruttura/hardware di supporto emergerà, WD avrà un valido concorrente.

2. L'accodamento dei comandi ha lo scopo di assistere le situazioni multiutente, non le configurazioni per utente singolo. Con il recente rilascio dei chipset Intel 9xx, esperti e appassionati di tutto il mondo hanno proclamato che l'accodamento dei comandi è la prossima grande novità per il desktop. Sbagliato. Come evidenziato dalle disparità tra FastTrak S150 TX4 e TX4200 (per il resto identico tranne che per la funzionalità TCQ aggiunta di quest'ultimo), l'accodamento dei comandi introduce un sovraccarico significativo che non riesce a ripagarsi in termini di prestazioni nelle istanze altamente localizzate e di minore profondità che anche genera il multitasking per utente singolo più pesante. Sta diventando chiaro, infatti, che la maturità e l'implementazione completa del TCQ nel mondo SCSI è uno dei motivi principali per cui le unità SCSI, altrimenti meccanicamente superiori, inciampano rispetto alle unità ATA. Considerare che delle 24 combinazioni ottenute dai quattro modelli di accesso per utente singolo, dagli array RAID0 da una a quattro unità e dagli array con mirroring RAID1/10 presentati sopra, il non-TCQ S150 TX4 è il migliore ogni caso di a grandi margine. TCQ è pensato solo per i server, proprio come la tecnologia menzionata appena sotto.

3. Il RAID aiuta le applicazioni multiutente molto più degli scenari per utente singolo. L'entusiasmo della comunità degli utenti esperti combinato con l'apparato di marketing delle aziende che si rivolgono a tali folle ha portato a una convinzione straordinariamente errata che lo striping dei dati su due o più unità produca vantaggi significativi in ​​termini di prestazioni per la maggior parte degli usi non server. Questo non potrebbe essere più lontano dalla verità! L'utilizzo non server, anche in situazioni di multitasking intenso, genera modelli di accesso meno profondi e altamente localizzati in cui dominano le strategie di read-ahead e write-back. La teoria ha detto a coloro che sono disposti ad ascoltare che lo striping non produce vantaggi significativi in ​​termini di prestazioni. Qualche tempo fa, un test controllato ed empirico sostenuto ciò che la teoria suggeriva. I dubbi persistevano ancora: irrazionalmente, molti credevano che i risultati sarebbero stati in qualche modo diversi se l'array fosse stato basato su un'interfaccia SATA o SCSI. Come mostrato sopra, i risultati sono gli stessi. Risparmia tempo, denaro e dati: lascia il RAID per i server!

Siamo ben lungi dall’essere finiti qui! Sono attualmente disponibili prodotti SATA TCQ concorrenti di Pacific Digital Corp. e Highpoint Technologies, mentre Silicon Image ha un chipset ancora da incorporare in un prodotto di spedizione. Continueremo a collaborare con altri produttori di controller per fornire ai lettori i risultati del Raptor TCQ abbinati a una varietà di prodotti. Anche SATA NCQ sta entrando proprio adesso in prima serata. Come sempre, StorageReview sarà presente.


Rivedere la discussione