Der Fusion-io ioDrive2 Duo ist ein Anwendungsbeschleuniger voller Höhe und halber Länge, der in Kombination mit SLC NAND 1.2 TB Speicher mit geringer Latenz und hoher Ausdauer für die anspruchsvollsten Anwendungen von heute bietet. Obwohl es sich um ein Produkt der zweiten Generation handelt, ist der Name etwas irreführend, da Fusion-io mit seinen verschiedenen ioMemory-Produkten seit langem ein Pionier im Bereich Speicher als Speicher ist. Diese Erfahrung zeigt sich nicht nur in der Produktentwicklung und den Highlights in den technischen Datenblättern, sondern auch bis hin zum Management. Fusion-io verfügt mit ioSphere über die robusteste Laufwerksverwaltungssoftware-Suite auf dem Markt. Dennoch sind hübsche Software und bewährtes Antriebsdesign nur ein Teil der Gleichung. Unternehmen setzen diese Produkte mit einem Ziel vor Augen ein: Reduzieren Sie die Reaktionszeiten von Anwendungen, indem Sie die Latenz des Speichersystems angreifen. Die SLC-Iteration des ioDrive2 legt den Fokus auf dieses Problem und bietet eine Lesezugriffslatenz von 47 µs und eine Schreibzugriffslatenz von 15 µs. Dies steht im Vergleich zu einer Lesezugriffslatenz von 68 µs beim MLC-basierten ioDrive2 (sie haben die gleiche Schreiblatenz), und obwohl etwa 20 µs nicht viel klingen, kann es für Anwendungen, die für die Verwendung mit Flash-Speicher optimiert wurden, eine virtuelle Ewigkeit sein .
Der Fusion-io ioDrive2 Duo ist ein Anwendungsbeschleuniger voller Höhe und halber Länge, der in Kombination mit SLC NAND 1.2 TB Speicher mit geringer Latenz und hoher Ausdauer für die anspruchsvollsten Anwendungen von heute bietet. Obwohl es sich um ein Produkt der zweiten Generation handelt, ist der Name etwas irreführend, da Fusion-io mit seinen verschiedenen ioMemory-Produkten seit langem ein Pionier im Bereich Speicher als Speicher ist. Diese Erfahrung zeigt sich nicht nur in der Produktentwicklung und den Highlights in den technischen Datenblättern, sondern auch bis hin zum Management. Fusion-io verfügt mit ioSphere über die robusteste Laufwerksverwaltungssoftware-Suite auf dem Markt. Dennoch sind hübsche Software und bewährtes Antriebsdesign nur ein Teil der Gleichung. Unternehmen setzen diese Produkte mit einem Ziel vor Augen ein: Reduzieren Sie die Reaktionszeiten von Anwendungen, indem Sie die Latenz des Speichersystems angreifen. Die SLC-Iteration des ioDrive2 legt den Fokus auf dieses Problem und bietet eine Lesezugriffslatenz von 47 µs und eine Schreibzugriffslatenz von 15 µs. Dies steht im Vergleich zu einer Lesezugriffslatenz von 68 µs beim MLC-basierten ioDrive2 (sie haben die gleiche Schreiblatenz), und obwohl etwa 20 µs nicht viel klingen, kann es für Anwendungen, die für die Verwendung mit Flash-Speicher optimiert wurden, eine virtuelle Ewigkeit sein .
Über die im Datenblatt angegebenen Verbesserungen bei Latenz und Durchsatzleistung hinaus hat Fusion-io hart daran gearbeitet, mehrere weitere wesentliche Verbesserungen an der Plattform dieser neuesten Generation vorzunehmen. Die ioDrive-Geräte der vorherigen Generation verfügten über eine Funktion namens FlashBack, die es dem Laufwerk ermöglichte, im Falle eines NAND-Fehlers weiterzuarbeiten, und ioDrive2-Anwendungsbeschleuniger haben mit der neuen Version namens Adaptive FlashBack auf dieser Eigenschaft aufgebaut. Adaptive FlashBack erhöht die Ausfalltoleranz von NAND-Chips und sorgt dafür, dass das Laufwerk online und die Daten sicher bleiben, auch im unwahrscheinlichen Fall mehrerer NAND-Ausfälle. In einem solchen Fall kann das ioDrive2 neu zugeordnet und wiederhergestellt werden, ohne offline zu gehen.
Fusion-io hat außerdem einen neuen NAND-Controller und eine neue Firmware-Version für die ioDrive2-Familie herausgebracht. Die Vorteile hier sind größtenteils leistungsbezogen, besserer Durchsatz und verbesserte Latenz, aber es gibt auch einen NAND-Kompatibilitätsvorteil. Fusion-io hat außerdem seine VSL-Software auf 3.2.x aktualisiert, was in Kombination mit dem neuen NAND-Controller dem ioDrive2 eine verbesserte Leistung bei kleineren Blockgrößen verleiht. Apropos NAND: Fusion-io hat eine Änderung an der Hardware-Architektur vorgenommen, die das NAND in eigene, vom NAND-Controller getrennte Module unterbringt, was für ein einfacheres Design sorgt. Der Nettovorteil besteht darin, dass Fusion-io schneller ein neues NAND oder NAND-Gehäuse unterstützen kann und dabei das gleiche PCB-Layout nutzt.
Während wir uns im Design-Abschnitt weiter unten eingehender mit der Hardware-Übersicht befassen, ist es aufschlussreich, hier einen kurzen Überblick über die Fusion-io-Architektur zu geben. Wie Virident FlashMAX II Wie wir zuvor besprochen haben, nutzt das ioDrive2-Design ein FPGA, das die meisten NAND-Verwaltungsaufgaben auf die Host-CPU verlagert. Während andere Designs mögen Microns P320h Während Fusion-io für die meisten dieser Aufgaben einen integrierten Controller nutzt, nutzt er lieber die leistungsstarke und oft nicht ausgelastete CPU im Hostsystem. Dieses Design bietet tendenziell auch einen direkteren Pfad zum Speicher, wodurch die Speicherlatenz verringert wird. Das Design des Duo nutzt zwei Controller wie der FlashMAX II, unterscheidet sich jedoch dadurch, dass es sechs Tochterplatinen verwendet, die nur NAND enthalten, anstatt NAND und Controller auf einzelnen Leiterplatten zu kombinieren. Im Gegensatz zur Virident-Lösung stellt Fusion-io mit VSL 3.2.2 dem System jedoch vier 300-GB-Laufwerke statt des einen Volumes zur Verfügung, das Virident bereitstellt. Benutzer können sich dafür entscheiden, jedes Volume einzeln anzusprechen, aber um ein einzelnes Volume zu erhalten, müssen sie in ein Software-RAID eingefügt werden. Erwähnenswert ist auch, dass die Fusion-io Duo-Karten volle Höhe und halbe Länge haben und damit größer sind als die allgemein universellen Karten mit halber Höhe und halber Länge, die Virident, Micron und andere anbieten. Allerdings nehmen die meisten 1U- und 1U-Server der Stufe 2 auf dem heutigen Markt problemlos die FHHL-Karten auf, sodass die Kartenform nur in Randfällen relevant ist.
Fusion-io liefert das ioDrive2 Duo sowohl in MLC- als auch in SLC-Konfigurationen aus. Der MLC verfügt über eine Kapazität von 2.4 TB, der SLC über 1.2 TB. Auf die Laufwerke gibt es eine Garantie von fünf Jahren.
Fusion ioDrive2 Duo-Spezifikationen
- ioDrive2 Duo Kapazität 1.2 TB SLC
- Lesebandbreite (1 MB): 3.0 GB/s
- Schreibbandbreite (1 MB): 2.5 GB/s
- Ran. Lese-IOPS (512B) 700,000
- Ran. Schreiben Sie IOPS (512B) 1,100,000
- Ran. Lese-IOPS (4K) 580,000
- Ran. Schreiben Sie IOPS (4K) 535,000
- Lesezugriffslatenz 47 µs
- Schreibzugriffslatenz 15 µs
- 2xnm NAND-Flash-Speicher Single-Level-Zelle (SLC)
- Busschnittstelle PCI-Express 2.0 x8 elektrisch x8 physikalisch
- Gewicht: Weniger als 11 Unzen
- Formfaktor: Volle Höhe, halbe Länge (FHHL)
- Garantie: 5 Jahre oder maximale Nutzungsdauer
- Ausdauer: 190PBW (95PBW pro Controller)
- Unterstützte Betriebssysteme
- Microsoft Windows Microsoft Windows: 64-Bit Windows Server 2012, Windows Server 2008 R2, Windows Server 2008, Windows Server 2003
- Linux RHEL 5/6; SLES 10/11; AGW 5/6; CentOS 5/6; Debian-Squeeze; Fedora 16/17; openSUSE 12; Ubuntu 10
- UNIX Solaris 10/11 x64; OpenSolaris 2009.06 x64; OSX 10.6/10.7/10.8
- Hypervisoren VMware ESX 4.0/4.1/ESXi 4.1/5.0/5.1, Windows 2008 R2 mit Hyper-V, Hyper-V Server 2008 R2
Designen und Bauen
Die Fusion ioDrive2 Duo 1.2 TB SLC ist eine Full-Height Half-Length (FHHL) x8 PCI-Express 2.0-Karte mit zwei Controllern und einem PCIe-Switch, die an der Hauptplatine angebracht sind. Das NAND wird über zwei Tochterplatinen angeschlossen, was Fusion einen Fertigungsvorteil beim Wechsel zu neuen NAND-Konfigurationen verschafft. Anstatt die Karte jedes Mal neu zu gestalten, wenn ein Lithographiewechsel stattfindet (NAND sterben schrumpfen), können sie eine neue Tochterplatine installieren und neue Firmware auf das FPGA flashen. Unser SLC ioDrive2 Duo besteht aus zwei 600-GB-ioMemory-Geräten, die jeweils 4 Lanes der PCIe-Verbindung nutzen. Das PCB-Layout ist sehr effizient, mit großen passiven Kühlkörpern, die die beiden Controller auf der rechten Seite der Karte abdecken.
Jeder Controller repräsentiert ein ioDrive2 mit seinem eigenen 40-nm-Xilinx-Virtex-6-FPGA und einem 768-GB-SLC-NAND-Pool. Das von uns getestete ioDrive2 Duo verwendet Micron NAND, Fusion-io ist jedoch NAND-herstellerunabhängig. Das NAND ist auf 24 32-GB-Chips pro Gerät aufgeteilt, wobei bei Standardformatierung 600 GB nutzbar sind. Dieses Verhältnis beziffert die Überbereitstellungsrate auf 22 %, was in etwa dem Niveau der meisten Flash-Geräte für Unternehmen entspricht.
Fusion ioMemory verbindet sich mit NAND-Flash wie ein Prozessor mit dem Systemspeicher. Es verwendet eine Kombination aus dem NAND-Controller (FPGA) von Fusion-io, der direkt über PCIe kommuniziert, und dem Treiber oder der Virtual Storage Layer (VSL)-Software von Fusion-io, die auf dem Hostsystem installiert ist, um das Gerät in ein herkömmliches Blockgerät zu übersetzen. Durch die VSL von Fusion-io emuliert die Software aus Kompatibilitätsgründen ein Blockgerät, obwohl Fusion auch ein SDK anbietet, um Softwareanbietern die native Kommunikation mit NAND zu ermöglichen und den Emulationsaufwand zu umgehen. ioMemory ist auch insofern unkonventionell, als es Systemressourcen für die Funktion der VSL-Treiber verbraucht, die Host-CPU nutzt und gleichzeitig Systemspeicher beansprucht. Da Fusion-io im Hinblick auf den Produktsupport ein FPGA als NAND-Controller und nicht einen ASIC verwendet, können Software-Updates auf sehr niedriger Ebene bereitgestellt werden, die Fehlerbehebungen und Leistungsverbesserungen ermöglichen. Dies steht im Gegensatz zu Standard-SSD-Controllern, bei denen grundlegende Änderungen nur durch die Herstellung eines neuen Controllers vorgenommen werden können – obwohl beide Designs eine umfassendere Optimierung über Firmware-Updates ermöglichen.
Eine Verbesserung, die mit der Veröffentlichung von VSL 3.2.2 für ioDrive2-Geräte einherging, ist eine neue Controller-Funktion. Bisher erschien jedes ioMemory-Gerät dem Hostsystem als einzelnes Gerät. In den aktuellsten Versionen des VSL von Fusion ist der Controller in zwei Geräte aufgeteilt und arbeitet im „Dual-Pipe“-Modus. Anstelle einer LUN für ein ioDrive2 und zwei LUNs für ein ioDrive2 Duo sind es also zwei bzw. vier LUNs. Bei unseren Tests mit dem alten und neuen Layout stellten wir eine starke Verbesserung der Leistung kleiner I/Os fest, obwohl alle unsere formalen Benchmarks nur mit VSL 3.2.2 durchgeführt wurden.
Stromversorgung ist ein weiteres Thema, das häufig auftaucht, wenn Fusion ioMemory-Geräte mit der PCIe-Landschaft verglichen werden, da sie als eine der wenigen mit externen Stromanschlüssen für bestimmte Anwendungen hervorstechen. Dies gilt für Produkte der Duo-Familie, bei denen es sich um zwei ioMemory-Geräte auf einer einzigen PCIe-Karte handelt. In diesen Fällen verbrauchen sie für den Betrieb mit voller Leistung mehr als 25 Watt, was der minimalen x8-PCIe-Nennleistung entspricht. Fusion-io bietet zwei Möglichkeiten, diesen Strombedarf zu decken: externe Stromkabel oder Power-Overrides, die es der Karte ermöglichen, über einen x25-PCIe-Steckplatz mehr als 8 W zu verbrauchen. In unserem Testbericht, der den ioDrive2 Duo SLC in einem bewertete Lenovo ThinkServer RD630Wir haben alle Benchmarks mit aktivierter Power-Override-Funktion durchgeführt und konnten so die volle Leistung erzielen, ohne dass eine externe Stromversorgung erforderlich war. Im Hardware-Installationshandbuch gibt Fusion-io an, dass die Software-Überschreibung sicher aktiviert werden kann, wenn der Hostserver für eine Leistungsaufnahme von 55 W ausgelegt ist.
Management Software
Fusion-io hat mit seiner ioSphere ioMemory Data Center Management Suite kontinuierlich die Messlatte gesetzt, die andere Hersteller zu erreichen versuchen. Wie wir durch die intensive Zusammenarbeit mit konkurrierenden Anwendungsbeschleunigern gesehen haben, ist selbst eine einfache GUI in Windows schwer zu bekommen, da viele Hersteller nur begrenzte CLI-Unterstützung anbieten. Dies spielt eine große Rolle bei der langfristigen Verwaltung eines bestimmten Flash-Geräts. da Garantie und erwartete Lebensdauer auf das Nutzungsprofil in einer bestimmten Umgebung zurückgehen.
ioSphere von Fusion deckt viele Schlüsselbereiche für einen IT-Administrator über eine Weboberfläche ab, darunter Echtzeit- und Verlaufsleistung, Zustandsüberwachung und Garantieprognosen. ioSphere unterstützt sowohl die Überwachung lokal installierter ioMemory-Geräte als auch von ioMemory-Geräten, die in einem großen Netzwerk installiert sind, und kann auch mit Fernzugriff konfiguriert werden, um Administratoren die Überwachung von Daten außerhalb des Rechenzentrums zu ermöglichen. Dieser umfangreiche Funktionsumfang ist konkurrenzlos.
Abgesehen davon ist eines der interessantesten Features das Echtzeit-Performance-Streaming. Mit ioSphere können Benutzer eine Verbindung zu einem bestimmten ioMemory-Gerät herstellen und die auf dem Gerät auftretenden Aktivitäten beobachten. Wir haben diese Funktion in Tests ausgiebig genutzt, wie oben im Stream gezeigt, der während eines internen Tests aufgezeichnet wurde MarkLogic NoSQL-Datenbank-Benchmark. Da ioSphere ständig Daten von allen angeschlossenen ioMemory-Geräten aufzeichnet, kann es auch Berichte mit früheren Leistungsinformationen erstellen, sodass Sie besser abschätzen können, wie lange ein bestimmtes ioMemory-Gerät in einer bestimmten Produktionsumgebung halten wird.
Für Benutzer, die an erweiterten Informationen interessiert sind, verfolgt ioSphere auch den Stromverbrauch, die Kartentemperatur, die gesamten gelesenen und geschriebenen Daten sowie eine Vielzahl anderer Details, die beim Debuggen nützlich sind. Auf diese Daten kann sowohl über ioSphere als auch über die Fusion-io-CLI zugegriffen werden, die standardmäßig mit den Gerätetreibern installiert wird. Ein weiterer Bereich, in dem diese erweiterten Funktionen ins Spiel kommen, ist die Über- oder Unterversorgung des Laufwerks, wodurch Kapazität gegen Leistung getauscht wird. In unserem Test haben wir das ioDrive2 Duo SLC sowohl im Standard- als auch im Hochleistungsmodus getestet. Der Hochleistungsmodus bietet 20 % zusätzliche Überbereitstellung, obwohl Fusion-io für fortgeschrittene Benutzer die Möglichkeit bietet, den genauen Grad der Über- oder Unterbereitstellung auszuwählen. Bei unzureichender Bereitstellung können Benutzer die Kapazität des ioDrive2 über die angekündigte Kapazität hinaus erhöhen (auf Kosten von Leistung und Ausdauer).
Hintergrund und Vergleiche testen
Alle in diesem Test verglichenen Anwendungsbeschleuniger werden auf unserer Unternehmenstestplattform der zweiten Generation getestet, die aus einem Intel Romley-basierten besteht Lenovo ThinkServer RD630. Diese neue Plattform ist sowohl mit Windows Server 2008 R2 SP1 als auch mit Linux CentOS 6.3 konfiguriert, damit wir die Leistung verschiedener AAs in den verschiedenen Umgebungen, die ihre Treiber unterstützen, effektiv testen können. Jedes Betriebssystem ist für höchste Leistung optimiert, einschließlich der Einstellung des Windows-Energieprofils auf „Hochleistung“ und der Deaktivierung der CPU-Geschwindigkeit in CentOS 6.3, um den Prozessor auf seiner höchsten Taktrate zu halten. Für synthetische Benchmarks verwenden wir FIO Version 2.0.10 für Linux und Version 2.0.12.2 für Windows, wobei in jedem Betriebssystem dieselben Testparameter verwendet werden, sofern zulässig.
StorageReview Lenovo ThinkServer RD630 Konfiguration:
- 2 x Intel Xeon E5-2620 (2.0 GHz, 15 MB Cache, 6 Kerne)
- Intel C602 Chipsatz
- Speicher – 16 GB (2 x 8 GB) 1333 MHz DDR3 registrierte RDIMMs
- Windows Server 2008 R2 SP1 64-Bit, Windows Server 2012 Standard, CentOS 6.3 64-Bit
- 100 GB Micron RealSSD P400e Boot-SSD
- LSI 9211-4i SAS/SATA 6.0 Gbit/s HBA (für Boot-SSDs)
- LSI 9207-8i SAS/SATA 6.0 Gbit/s HBA (zum Benchmarking von SSDs oder HDDs)
Als es darum ging, Vergleichswerte für diesen Test auszuwählen, haben wir uns für die neuesten SLC- und MLC-Anwendungsbeschleuniger mit der besten Leistung entschieden. Diese wurden basierend auf den Leistungsmerkmalen der einzelnen Produkte sowie der Preisspanne ausgewählt. Wir beziehen sowohl Standard- als auch Hochleistungs-Benchmark-Ergebnisse für das ioDrive2 Duo SLC ein und vergleichen es mit dem Micron RealSSD P320h sowie dem Virident FlashMAX II mit Überversorgung im Hochleistungsmodus.
1.2 TB Fusion ioDrive2 Duo SLC
- Veröffentlicht: 2. Halbjahr 2011
- NAND-Typ: SLC
- Controller: 2 x FPGA mit proprietärer Firmware
- Gerätesichtbarkeit: 4 JBOD-Geräte
- Fusion-io VSL Windows-Version: 3.2.2
- Fusion-io VSL Linux-Version: 3.2.2
- Vorkonditionierungszeit: 12 Stunden
- Veröffentlicht: 2. Halbjahr 2011
- NAND-Typ: SLC
- Controller: 1 x proprietärer ASIC
- Gerätesichtbarkeit: Einzelnes Gerät
- Micron Windows: 8.01.4471.00
- Micron Linux: 2.4.2-1
- Vorkonditionierungszeit: 6 Stunden
- Veröffentlicht: 2. Halbjahr 2012
- NAND-Typ: MLC
- Controller: 2 x FPGA mit proprietärer Firmware
- Gerätesichtbarkeit: Einzel- oder Doppelgerät, je nach Formatierung
- Virident Windows: Version 3.0
- Virident Linux: Version 3.0
- Vorkonditionierungszeit: 12 Stunden
Synthetische Workload-Analyse für Unternehmen
Die Art und Weise, wie wir PCIe-Speicherlösungen betrachten, geht tiefer als nur die Betrachtung der herkömmlichen Burst- oder Steady-State-Leistung. Wenn man sich die durchschnittliche Leistung über einen längeren Zeitraum ansieht, verliert man den Überblick über die Details zur Leistung des Geräts über diesen gesamten Zeitraum. Da die Flash-Leistung im Laufe der Zeit stark schwankt, analysiert unser Benchmarking-Prozess die Leistung in Bereichen wie Gesamtdurchsatz, durchschnittliche Latenz, Spitzenlatenz und Standardabweichung über die gesamte Vorkonditionierungsphase jedes Geräts. Bei High-End-Unternehmensprodukten ist die Latenz oft wichtiger als der Durchsatz. Aus diesem Grund unternehmen wir große Anstrengungen, um die vollständigen Leistungsmerkmale jedes Geräts zu zeigen, das wir unserem Unternehmenstestlabor unterziehen.
Wir bieten auch Leistungsvergleiche an, um zu zeigen, wie jedes Gerät unter einem anderen Treibersatz sowohl auf Windows- als auch auf Linux-Betriebssystemen funktioniert. Für Windows verwenden wir die zum Zeitpunkt der ursprünglichen Überprüfung neuesten Treiber, unter denen jedes Gerät dann in einer 64-Bit-Windows Server 2008 R2-Umgebung getestet wird. Für Linux verwenden wir die 64-Bit-CentOS 6.3-Umgebung, die jeder Enterprise PCIe Application Accelerator unterstützt. Unser Hauptziel bei diesem Test besteht darin, zu zeigen, wie sich die Betriebssystemleistung unterscheidet, denn wenn ein Betriebssystem auf einem Produktblatt als kompatibel aufgeführt ist, bedeutet dies nicht immer, dass die Leistung aller Betriebssysteme gleich ist.
Die Flash-Leistung variiert während der Vorkonditionierungsphase jedes Speichergeräts. Bei unterschiedlichen Designs und unterschiedlichen Kapazitäten dauert unser Vorkonditionierungsprozess entweder 6 Stunden oder 12 Stunden, je nachdem, wie lange es dauert, bis ein stationäres Verhalten erreicht ist. Unser Hauptziel besteht darin, sicherzustellen, dass sich jedes Laufwerk zu Beginn unserer Haupttests vollständig im stationären Modus befindet. Insgesamt wird jedes der vergleichbaren Geräte mit den Tools des Anbieters sicher gelöscht, mit der gleichen Arbeitslast, mit der das Gerät getestet wird, unter einer hohen Last von 16 Threads mit einer ausstehenden Warteschlange von 16 pro Thread in einen stabilen Zustand vorkonditioniert und dann getestet in festgelegten Intervallen in mehreren Thread-/Warteschlangentiefenprofilen, um die Leistung sowohl bei geringer als auch bei starker Auslastung anzuzeigen.
In Vorkonditionierungs- und Primär-Steady-State-Tests überwachte Attribute:
- Durchsatz (Lese- und Schreib-IOPS-Aggregat)
- Durchschnittliche Latenz (Lese- und Schreiblatenz insgesamt gemittelt)
- Maximale Latenz (Spitzen-Lese- oder Schreiblatenz)
- Latenz-Standardabweichung (Lese- und Schreib-Standardabweichung insgesamt gemittelt)
Unsere Enterprise Synthetic Workload Analysis umfasst vier Profile, die auf realen Aufgaben basieren. Diese Profile wurden entwickelt, um den Vergleich mit unseren früheren Benchmarks sowie weit verbreiteten Werten wie der maximalen Lese- und Schreibgeschwindigkeit von 4K und 8K 70/30, die häufig für Unternehmenslaufwerke verwendet wird, zu erleichtern. Wir haben auch zwei ältere gemischte Workloads integriert, den traditionellen Dateiserver und den Webserver, die jeweils eine breite Mischung an Übertragungsgrößen bieten.
- 4K
- 100 % Lesen oder 100 % Schreiben
- 100 % 4K
- 8K 70/30
- 70 % lesen, 30 % schreiben
- 100 % 8K
- Dateiserver
- 80 % lesen, 20 % schreiben
- 10 % 512b, 5 % 1, 5 % 2, 60 % 4, 2 % 8, 4 % 16, 4 % 32, 10 % 64
- Webserver
- 100 % gelesen
- 22 % 512b, 15 % 1, 8 % 2, 23 % 4, 15 % 8, 2 % 16, 6 % 32, 7 % 64, 1 % 128, 1 % 512
In unserem ersten Workload betrachten wir ein vollständig zufälliges 4K-Schreibvorkonditionierungsprofil mit einem herausragenden Workload von 16T/16Q. In diesem Test bietet der Fusion ioDrive2 Duo SLC mit seinem Linux-Treiber die höchste Burst-Leistung in der Gruppe und erreicht einen Burst von fast 550,000 IOPS. Unter Windows lagen die Burst-Geschwindigkeiten mit „nur“ 360–420,000 IOPS niedriger. Betrachtet man die Leistung, als sie sich dem stabilen Zustand näherte, pendelte sich das ioDrive2 Duo im HP-Modus bei etwa 230,000 IOPS unter Linux und 200,000 IOPS unter Windows ein. Im Standardkapazitätsmodus betrug die Leistung etwa 140,000 IOPS unter Linux und 115,000 IOPS unter Windows.
Bei einer hohen Auslastung von 16T/16Q betrug die durchschnittliche Latenz auf dem Fusion ioDrive2 Duo zwischen 1.85 ms und 2.20 ms im Standardkapazitätsmodus für Linux bzw. Windows. In Hochleistungskonfigurationen sank die Latenz auf etwa 1.10 ms und 1.25 ms.
Beim Vergleich der maximalen Latenz auf dem ioDrive2 Duo unter Windows und Linux mit unserem 4K-Random-Write-Profil konnte man leicht erkennen, dass es eine Linux-Umgebung begünstigt, wenn es um Spitzenreaktionszeiten geht. Im Verlauf des Vorkonditionierungszeitraums lag die maximale Windows-Latenz zwischen 40 und 360 ms bei Standardkapazität und 100 bis 250 ms im Hochleistungsmodus. Dies stand im Gegensatz zur Leistung unter Linux, wo die Spitzenreaktionszeiten sowohl bei Standard- als auch bei Hochleistungskonfigurationen zwischen 20 und 50 ms lagen.
Bei genauer Betrachtung der Latenzstandardabweichung zeigte sich, dass der Fusion ioDrive2 Duo SLC unter Windows sowohl im Standard- als auch im Hochleistungsmodus eine geringere Latenzkonsistenz aufwies als unter Linux. Beim Vergleich mit dem Micron P320h und dem Virident FlashMAX II im HP-Modus zeigten beide Modelle auf beiden Betriebssystemen ungefähr die gleiche Konsistenz.
Nachdem unser 12-stündiger Vorkonditionierungszeitraum auf dem ioDrive2 Duo SLC endete, erreichte er bei Bereitstellung im Hochleistungsmodus eine stabile zufällige 4K-Leistung mit einem Spitzenwert von 231,456 IOPS unter Linux. Dies gab ihm die höchste zufällige 4K-Schreibleistung in der Gruppe, obwohl seine Windows-Leistung in etwa der Schreibgeschwindigkeit des Micron P320h entsprach. Im Standard-Leistungsmodus sanken die zufälligen 4K-Schreibgeschwindigkeiten auf 114,917 IOPS unter Windows und 139,421 IOPS unter Linux. Dies entsprach in etwa dem FlashMAX II, wenn es im Hochleistungsmodus konfiguriert war. Betrachtet man die 4K-Zufallslesegeschwindigkeit der Gruppe, liegt der Micron P320h mit 637 IOPS unter Linux an der Spitze, während der ioDrive2 Duo SLC 460-463 IOPS unter Linux und 384-392 IOPS unter Windows misst.
Beim Vergleich der durchschnittlichen Latenz mit einer hohen 16T/16Q-Arbeitslast mit 100 % zufälliger 4K-Leseaktivität ergab der ioDrive2 Duo SLC zwischen 0.550–0.552 ms unter Windows und 0.649–0.663 ms unter Linux. Beim Wechsel zur Schreibleistung wurden 1.102–1.255 ms im Hochleistungsmodus und 1.832–2.223 ms bei Standardkapazität gemessen, wobei die Schreibstärke auf der Linux-Seite lag.
Beim Vergleich der maximalen Latenz stach das Fusion ioDrive2 Duo unter Windows mit den höchsten Spitzenreaktionszeiten in der Gruppe hervor und maß 373–1018 ms bei 4K-Zufallsschreibaktivität. Die Leistung unter Linux war mit 43–51 ms im Spitzenwert viel besser. Wenn es um die maximale Leselatenz ging, lag das ioDrive2 Duo in Windows mit einer maximalen Latenz von 3.32–3.76 ms an der Spitze.
Beim Vergleich der Standardabweichung der Latenz zwischen den einzelnen PCIe AA in unserem zufälligen 4K-Profil bot der ioDrive2 Duo SLC eine hervorragende Konsistenz der Leselatenz unter Windows, bei Schreibaktivitäten jedoch eine der weniger konsistenten Latenzzeiten in der Gruppe. Dies wurde in einer Linux-Umgebung verbessert, obwohl diese auch höhere Werte erzielten als andere in der Gruppe. An der Spitze der Gruppe steht das Micron RealSSD P320h, das eine ausgewogene Latenz-Standardabweichung sowohl bei Lese- als auch bei Schreibaktivitäten bietet.
Unser nächster Test wechselt zu einer gemischten 8K 70/30-Arbeitslast, bei der der ioDrive2 Duo SLC mit den höchsten Burst-Geschwindigkeiten zwischen 424 und 443,000 IOPS und höherem Durchsatz unter Windows die Nase vorn hat. Als sich die Leistung dem stabilen Zustand näherte, wurden beim ioDrive2 Duo SLC in der Standardkapazität zwischen 140 und 148 IOPS gemessen, die im Hochleistungsmodus auf 195 bis 200 IOPS anstiegen.
Beim Vergleich der durchschnittlichen Latenz in unserem 8K-70/30-Workload betrug der Wert des Fusion ioDrive2 Duo SLC 0.57–0.59 ms im Burst (kleiner Vorsprung unter Windows) und stieg auf etwa 1.70–1.80 ms bei Standardkapazität und 1.28–1.33 ms im Hochleistungsmodus .
Beim Übergang des ioDrive2 Duo SLC vom Burst- zum Dauer- oder Steady-State-Modus schwankte die Spitzenlatenz sowohl unter Windows und Linux als auch im Standard- und Hochleistungsmodus zwischen 50 und 250 ms. Dies im Vergleich zum Micron P320h, der 10–30 ms maß, oder zum Virident FlashMAX II, der zwischen 30–50 ms maß.
Während die maximale Latenz des ioDrive2 Duo in unserem 8k 70/30-Vorkonditionierungstest hoch war, stellten wir fest, dass die Latenzkonsistenz im Hochleistungsmodus direkt hinter dem Micron P320h lag. In der Standardkapazitätskonfiguration skalierte es etwas höher als der Virident FlashMAX II.
Im Vergleich zur festen maximalen Arbeitslast von 16 Threads und 16 Warteschlangen, die wir im 100 % 4K-Schreibtest durchgeführt haben, skalieren unsere gemischten Arbeitslastprofile die Leistung über eine Vielzahl von Thread-/Warteschlangenkombinationen. In diesen Tests erstrecken wir uns über die Intensität unserer Arbeitsbelastung von 2 Threads und 2 Warteschlangen bis hin zu 16 Threads und 16 Warteschlangen. In unserem erweiterten 8K 70/30-Test erzielte der Fusion ioDrive2 Duo SLC in der Hochleistungskonfiguration die höchste Spitzenleistung in der Gruppe. Im direkten Vergleich mit dem Micron P320h konnte er bei 2, 4, 8 und 16 Threads eine viel höhere Leistung bei geringer Warteschlangentiefe bieten, hinkte dann aber mit zunehmender Warteschlangentiefe hinterher. Bei der Bestandsbereitstellung bot es eine bemerkenswert ähnliche Leistung wie der Virident FlashMAX II, da es im Hochleistungsmodus konfiguriert war.
Im Segment der skalierten durchschnittlichen Latenz unseres 8k 70/30-Tests stellten wir fest, dass der Fusion ioDrive2 Duo SLC die niedrigste durchschnittliche Latenz in der Gruppe bot, was teilweise auf seine starke Leistung bei geringen Warteschlangentiefen zurückzuführen ist. Mit zunehmender Warteschlangentiefe übernahm der Micron P320h die Führung, bis 16T/16Q, wo der ioDrive2 Duo SLC erneut die Nase vorn hatte.
Als wir die maximale Latenz in unserem skalierten 8k 70/30-Test verglichen, verzeichneten wir einige größere Spitzen beim ioDrive2 Duo SLC, die mit zunehmender effektiver Warteschlangentiefe scheinbar immer höher wurden. Dies war am bemerkenswertesten beim ioDrive2 mit Standardkapazität in Windows. Seine Linux-Leistung sowie Windows im Hochleistungsmodus hielten die Spitzenlatenz bei effektiven Lasten kleiner oder gleich QD70 unter 64 ms, während die Latenz bei QD128 und QD256 auf bis zu 160 ms bzw. 220 ms anstieg.
In unserem skalierten 8k 70/30-Test lag der Micron P320h mit der konsistentesten Latenz über alle Arbeitslasten hinweg an der Spitze, gefolgt vom Virident FlashMAX II auf dem zweiten Platz und dem ioDrive2 Duo SLC bei hoher Leistung, der ganz dicht dahinter lag.
Die Arbeitslast des Dateiservers stellt ein größeres Übertragungsgrößenspektrum dar, das jedes einzelne Gerät betrifft. Anstatt sich also auf eine statische Arbeitslast von 4 KB oder 8 KB einzulassen, muss das Laufwerk Anforderungen im Bereich von 512 KB bis 64 KB bewältigen. Da der Fusion ioDrive2 Duo SLC bei dieser Arbeitsbelastung mit einer größeren Übertragungsspanne zurechtkommen musste, konnte er seine Muskeln spielen lassen und im Hochleistungsmodus die Nase vorn haben. Im Burst hatte der ioDrive2 Duo SLC einen fast doppelt so hohen Durchsatz wie der Micron P320h und der Virident FlashMAX II und maß etwa 305,000 IOPS. Als es sich im Hochleistungsmodus dem stabilen Zustand näherte, pendelte es sich sowohl für Windows als auch für Linux bei rund 136,000 IOPS ein, verglichen mit 320 IOPS beim P125,000h. Bei der Formatierung mit Standardkapazität verringerte sich der Durchsatz auf etwa 110,000 IOPS, verglichen mit dem Virident FlashMAX II im Hochleistungsmodus, der fast 70,000 IOPS erreichte.
Aufgrund der starken Burst-Leistung betrug die durchschnittliche Latenz zu Beginn unserer Vorkonditionierungskurve beim ioDrive0.83 Duo SLC etwa 2 ms, bevor sie sich im Hochleistungsmodus auf 1.87 ms oder bei Standardkapazität auf etwa 2.25 ms einpendelte.
Als der ioDrive2 Duo SLC vom Burst-Modus in den Dauer- und Steady-State-Modus überging, begann die Spitzenlatenz wie in unserem 8k 70/30-Test anzusteigen, wenn auch nicht so hoch. Insgesamt haben wir beim ioDrive20 Duo in allen Modi eine maximale Latenz zwischen 200 ms und 2 ms gemessen, wobei der Linux-HP-Modus die beste war. Wir haben beim ioDrive1,000 Duo unter Windows auch im Hochleistungsmodus einen Anstieg von etwas mehr als 2 ms festgestellt. Im Gegensatz dazu hielt der Micron P320h sowohl für Windows als auch für Linux eine Spitzenlatenz von unter 20 ms aufrecht.
Während wir in unserem vorherigen Test beim ioDrive2 Duo ein stärkeres Schwanken der Spitzenlatenz bemerkten, lag es bei Betrachtung der Latenzstandardabweichung im Mittelfeld zwischen dem Micron P320h und dem Virident FlashMAX II. Insgesamt bot Linux sowohl in Standard- als auch in Hochleistungskonfigurationen eine bessere Konsistenz, wobei letztere eine höhere Stabilität aufwiesen.
Nachdem der Vorkonditionierungsprozess des Dateiservers mit einer konstanten 16T/16Q-Last abgeschlossen war, begannen wir mit unseren Haupttests, bei denen die Leistung auf festgelegten Ebenen zwischen 2T/2Q und 16T/16Q gemessen wurde. Bei unserem Haupt-Dateiserver-Workload bot der ioDrive2 Duo SLC mit 132–135,000 IOPS bei 16T/16Q die höchste Spitzenleistung im Vergleich zum P320h mit 125,500 IOPS. Das ioDrive2 Duo zeigte auch seine geringe Warteschlangentiefe gegenüber dem Micron P320h bei 2-, 4- und 8-Thread-Workloads und hatte im Hochleistungsmodus einen leichten Vorsprung. Mit zunehmender Warteschlangentiefe bot der Micron P320h in jeder Stufe die höchste Leistung und erreichte deutlich höhere Spitzenwerte.
Beim Vergleich der durchschnittlichen Latenz zwischen jedem erstklassigen PCIe-Anwendungsbeschleuniger in unserem Dateiserver-Workload wies der ioDrive2 Duo SLC die niedrigste Latenz in der Gruppe auf und maß 0.14 ms für Linux und Windows bei 2T/2Q im Hochleistungsmodus. Mit zunehmender Arbeitslast behielt der Micron P320h einen starken Vorsprung, bis 16T/16Q, wo der ioDrive2 Duo SLC die niedrigste durchschnittliche Latenz bei Spitzenlast aufwies.
Betrachtet man die Spitzenreaktionszeiten in unserem Haupttest für Dateiserver, wies der Fusion ioDrive2 Duo SLC eine höhere maximale Latenz auf, die bei Arbeitslasten ab einer effektiven Warteschlangentiefe von 128 zuzunehmen begann. Unter QD128 hatte der ioDrive2 Duo eine maximale Latenz von 11 -100 ms, mit besserer Leistung im Hochleistungsmodus.
Beim Wechsel von Spitzenreaktionszeiten zu Latenzkonsistenz in unserem Dateiservertest liegt der ioDrive2 Duo SLC im Hochleistungsmodus hinter dem Micron P320h und bietet einen leichten Vorsprung bei der Standardabweichung der Latenz gegenüber dem Virident FlashMAX II in der Standardkonfiguration.
Bei unserem letzten synthetischen Workload für ein Webserverprofil, bei dem es sich traditionell um einen 100-prozentigen Lesetest handelt, wenden wir 100-prozentige Schreibaktivität an, um jedes Laufwerk vor unseren Haupttests vollständig vorzukonditionieren. Bei diesem anspruchsvollen Vorkonditionierungstest erzielte der ioDrive2 Duo SLC sowohl in der Standard- als auch in der Hochleistungskonfiguration einen beeindruckenden Vorsprung vor dem Micron P320h und dem Virident FlashMAX II. In diesem Test lagen die Burst-Geschwindigkeiten bei über 145,000 IOPS, während der Micron P320h einen Spitzenwert von 67,000 IOPS erreichte und der Virident FlashMAX II im Hochleistungsmodus mit 32,000 IOPS startete.
Bei einer hohen 100-prozentigen Schreibauslastung von 16T/16Q in unserem Webserver-Vorkonditionierungstest behielt das ioDrive2 eine durchschnittliche Reaktionszeit von etwa 3.5–3.8 ms in der Hochleistungskonfiguration und 6.4–7.2 ms in der Standardkonfiguration bei.
Beim Vergleich der maximalen Latenz in unserem Webserver-Vorkonditionierungstest hat der ioDrive2 Duo SLC unter Linux sowohl im Standard- als auch im Hochleistungsmodus zwischen 25 und 70 ms gemessen, wobei die Spitzenlatenz unter Windows von 25 bis 380 ms anstieg, mit einigen Spitzen über 1,000 ms.
Beim Vergleich der Latenzkonsistenz in unserem stressigen Webserver-Vorkonditionierungslauf lag der Micron P320h an der Spitze, während der ioDrive2 Duo SLC im Mittelfeld landete. Bei der Konfiguration im Hochleistungsmodus war die Leistung sowohl unter Windows als auch unter Linux höher als in der Standardkonfiguration.
Beim Wechsel zum Hauptsegment unseres Webservertests mit einem 100 % Leseprofil zeigte der ioDrive2 Duo SLC eine Leistungsskalierung von 23.9–25.5 IOPS bei 2T/2Q, die auf einen Spitzenwert von 141–147 IOPS bei 16T/16Q anstieg. Im Vergleich zum Micron P320h konnte der ioDrive2 Duo seine Leistung bei niedrigen oder hohen Warteschlangentiefen nicht erreichen und lag bei effektiven Warteschlangentiefen unter QD32 hinter dem Virident FlashMAX II zurück, obwohl er ihn oberhalb dieses Niveaus schnell überholte.
Die durchschnittliche Latenz des Fusion ioDrive2 Duo SLC lag zwischen 0.153 und 0.163 ms bei 2T/2Q und stieg auf einen Spitzenwert von 1.737 bis 1.803 ms bei 16T/16Q. Insgesamt hatte der Micron P320h die niedrigste Latenz, während der Virident FlashMAX II bei QD32 und darunter die Nase vorn hatte, den der ioDrive2 Duo SLC bei höheren effektiven Warteschlangentiefen übertreffen konnte.
In unserem 100 % gelesenen Webserverprofil haben wir Latenzspitzen vom ioDrive2 Duo SLC von bis zu 130 ms festgestellt, obwohl die meisten bei effektiven Warteschlangentiefen unter 20 unter 256 ms lagen. Unter unserer höchsten Last von 16T/16Q kam es beim ioDrive2 Duo SLC zu Spitzen auf 164–320 ms, wobei der höchste Wert unter Windows in der Standardkonfiguration gemessen wurde.
Beim Vergleich der Standardabweichung der Latenz in unserem Web-Server-Test mit 100 % Lesezugriff hatte der Micron P320h einen klaren Vorsprung in der Gruppe, wobei der ioDrive2 Duo SLC bei niedrigen bis hohen effektiven Warteschlangentiefen hinter dem Virident FlashMAX II zurückblieb oder mit ihm gleichauf lag.
Fazit
Fusion-io hat gezeigt, dass es mit dem ioDrive2 Duo SLC-Anwendungsbeschleuniger mehr als nur inkrementelle Änderungen entwickeln kann. Vom Innenleben, wie dem Adaptive FlashBack NAND-Ausfallschutz, bis hin zum verbesserten Platinendesign, das den NAND auf seine eigenen Tochterplatinen verlagert, hat Fusion-io mehrere Hardwareänderungen vorgenommen, die den ioDrive2 besser als den Vorgänger machen. Das Entwicklungsteam hat intensiv daran gearbeitet, die Latenz im Laufwerk zu verringern. Wir haben diese Vorteile bei den 4K 100 %- und 8K 70/30-Tests gesehen, bei denen der ioDrive2 SLC die besten Latenz- und Durchsatzwerte unter Spitzenlast erzielte. Es zeigte auch die stärkste Leistung bei niedrigen Warteschlangentiefen, mit einem deutlichen Vorsprung vor dem Micron P320h und dem FlashMAX II in unserem 8k 70/30-Test bei QD2 für 2-, 4- und 8-Thread-Workloads. Dies bot einen weiteren Vorteil der niedrigsten durchschnittlichen Latenz, da nicht so viele ausstehende I/Os erforderlich waren, um eine deutlich höhere Leistung zu erzielen. Auf der Verwaltungsseite ist das ioDrive2 mit ioSphere ausgestattet, der umfassendsten verfügbaren Laufwerksverwaltungssoftware. Vergleichen Sie es mit jeder gebündelten Software in Kombination mit Application Accelerators, die derzeit auf dem Markt erhältlich ist, und es übertrifft sie in puncto Funktionen und Schnittstellendesign um Längen.
Wir haben bei den meisten anderen Anwendungsbeschleunigern gesehen, dass sie in einem Betriebssystem im Allgemeinen eine bessere Leistung erbringen als in einem anderen. Deshalb testen wir die Laufwerke natürlich sowohl unter Windows als auch unter Linux, um die Stärken und Schwächen eines Laufwerks herauszufinden. Wie wir bei früheren Fusion-io-Laufwerken gesehen haben, schneidet das ioDrive2 Duo in Linux-Umgebungen außerordentlich gut ab, obwohl es unter Windows etwas unregelmäßiger wird. In unseren Diagrammen ist zwar deutlicher zu erkennen, dass die Windows-Leistung insgesamt nicht wesentlich darunter leidet, aber es gibt durchaus Raum für Verbesserungen. Unter Spitzenlasten von 16T/16Q bemerkten wir beim ioDrive2 Duo Spitzenlatenzausschläge. Wenn man jedoch die Latenzkonsistenz vergleicht, hatte dies insgesamt keinen großen Einfluss auf diese Zahlen. Während einige der Latenzwerte nicht den von Fusion-io gewünschten Werten entsprechen, ermöglicht ihr Design Aktualisierungen auf sehr niedriger Ebene, die in der Lage sein sollten, einige dieser Latenzprobleme im Laufe der Zeit zu glätten. Beim Thema Kompatibilität ist es auch erwähnenswert, dass Fusion-io eines der robusteren Betriebssysteme unterstützt, wodurch das Laufwerk in einer Vielzahl von Anwendungsfällen problemlos eingesetzt werden kann.
Das Fusion-io-Kartendesign gerät bei der Konkurrenz oft in die Kritik, da es die Host-CPU und den RAM nutzt, um den Großteil der NAND-Verwaltungsarbeit zu erledigen. Wie wir jedoch gesehen haben, handelt es sich hierbei um ein effizientes Design, das auch von Virident verwendet wird und das durch die Nutzung immer leistungsfähigerer CPUs eine beeindruckende Leistung und Latenz bietet. Microns P320h ist ein leuchtendes Beispiel für den alternativen Ansatz und nutzt einen sehr guten On-Board-Controller, aber die Karte bietet maximal 700 GB SLC-Speicher, was die Kompromisse verdeutlicht, die Speicheranbieter eingehen müssen. Ein neuer Branchenangriff gegen Fusion-io ist einigermaßen interessant, dieser betrifft den Formfaktor. Das ioDrive2 Duo verwendet ein FHHL-Design, während die meisten anderen HHHL verwenden, was aus Sicht der Servertauglichkeit ein universelleres Design ist. Alle Server in unserem Labor von HP, Dell, Lenovo und SuperMicro unterstützen die Formate FHHL und HHHL, es ist jedoch erwähnenswert, dass das Fusion-io-Design in dieser Hinsicht eher ein Ausreißer ist. Aus gestalterischer Sicht erscheint es akzeptabel, mehr Platz zu nutzen, um modulare NAND-Segmente zu ermöglichen. Dies begrenzt die Designkosten über die lange Lebensdauer der Produktlinie, wenn sich NAND ändert, die Konkurrenz erkennt jedoch schnell die Einschränkungen in speziellen Anwendungsfällen.
Vorteile
- Bietet die höchste Spitzenleistung bei unseren 100 % 4K-, 8K 70/30- und Dateiserver-Workloads
- Die ioSphere-Management-Suite bietet den besten Funktionsumfang ihrer Klasse
- Höchster Durchsatz und niedrigste Latenz bei 8K 70/30- und Dateiserver-Workloads bei geringer Warteschlangentiefe
- Bewährte Architektur mit Funktionen wie Adaptive Flashback zur Verbesserung der Zuverlässigkeit
Nachteile
- Probleme mit maximaler Latenz sowohl unter Windows als auch unter Linux
- Verliert gegenüber dem Micron P320h zwischen der niedrigsten und der höchsten effektiven Warteschlangentiefe an Boden
Fazit
Der Fusion-io ioDrive2 Duo SLC-Anwendungsbeschleuniger bietet 1.2 TB des schnellsten verfügbaren Speichers für mehrere Workloads und bietet gleichzeitig viele Design- und Funktions-Upgrades gegenüber dem Produkt der vorherigen Generation. Ein solches Upgrade ist Adaptive FlashBack, das Daten bewahrt und das Laufwerk auch nach mehreren NAND-Chip-Ausfällen betriebsbereit hält. Durch die Kombination der branchenweit besten Verwaltungssoftware und der Möglichkeit, das Laufwerk kontinuierlich zu verbessern, ohne dass ein neuer Controller erforderlich ist, wird der ioDrive2 Duo SLC mit Sicherheit einen langfristigen Einsatz bei den kritischsten Anwendungen finden, die von der hervorragenden Speicherleistung profitieren können.
Besprechen Sie diese Rezension