Der Virident FlashMAX II ist ein PCIe-Anwendungsbeschleuniger (AA) halber Höhe und halber Länge, der mit MLC-Flash-Medien erhältlich ist. Der FlashMAX II ist mit Kapazitäten von bis zu 2.2 TB erhältlich und ist damit der größte verfügbare AA-Speicher in diesem Formfaktor. Wie bei jedem Produkt dieser Klasse mag die Dichte zwar gut sein, aber letztendlich ist die Leistung ein wesentlicher Faktor für die Akzeptanz. Der FlashMAX II bietet gemischte 4K-IOPS (75 % Lesen, 25 % Schreiben) von bis zu 200,000 sowie 325,000 4K-Lese-IOPS.
Der Virident FlashMAX II ist ein PCIe-Anwendungsbeschleuniger (AA) halber Höhe und halber Länge, der mit MLC-Flash-Medien erhältlich ist. Der FlashMAX II ist mit Kapazitäten von bis zu 2.2 TB erhältlich und ist damit der größte verfügbare AA-Speicher in diesem Formfaktor. Wie bei jedem Produkt dieser Klasse mag die Dichte zwar gut sein, aber letztendlich ist die Leistung ein wesentlicher Faktor für die Akzeptanz. Der FlashMAX II bietet gemischte 4K-IOPS (75 % Lesen, 25 % Schreiben) von bis zu 200,000 sowie 325,000 4K-Lese-IOPS.
Wie andere Anwendungsbeschleuniger konzentriert sich der FlashMAX II auf den Rechenzentrumsbereich, wo geschäftskritische Anwendungen einen leistungsstarken Flash-Tier erfordern und nutzen können, entweder als Primärspeicher oder als großer Cache vor einem Spindel-Tier. Die Architektur von Virident ist ideal für einen solchen Einsatz konzipiert, da sie eine speziell entwickelte Schnittstelle nutzt und sich bei der Steuerungslogik auf hoher Ebene auf die CPUs des Hostsystems verlässt. Dies ähnelt den leistungsstarken Anwendungsbeschleunigern von Fusion-io und unterscheidet sich deutlich von den PCIe-Speicheranbietern wie Intel, LSI, Micron und OCZ, die stattdessen auf ASIC-Controller und/oder RAID mit mehreren kleineren SSDs auf einer einzigen PCIe-Leiterplatte setzen.
Während das FlashMAX II wie andere Laufwerke aussehen mag, unterscheidet sich Virident aufgrund einiger architektonischer Ähnlichkeiten auf der Softwareseite. Die wichtigste dieser Technologien ist Virident Flash-Management mit Adaptive Scheduling (vFAS). Die Hauptaufgabe von vFAS besteht darin, das Flash-Medium als Blockgerät darzustellen, ohne dass zusätzliche Speicherprotokolle, Controller oder Verbindungen verwendet werden müssen. Während die Anwendungen, die auf den FlashMAX II zugreifen, den Flash als Speicher betrachten, arbeitet vFAS hinter den Kulissen, um den Flash in einer 7+1 RAID-Konfiguration zu verwalten, die vor Ausfällen einzelner NAND-Chips schützt. vFAS kümmert sich auch um zusätzliche Optimierungen wie Wear Leveling, Garbage Collection, Datenpfadschutz, ECC und dergleichen. Diese Effizienz im Design und die Möglichkeit, die Host-CPU zu nutzen, sind ein wichtiger Faktor für die niedrigen angegebenen Zugriffslatenzen für den FlashMAX II von unter 20 µs.
Der Virident FlashMAX II in MLC wird in einem Einzelmodul mit 550 GB und 1.1 TB Kapazität sowie als Doppelmodulkonfiguration mit 1.1 TB und 2.2 TB Kapazität geliefert. Die Laufwerke haben eine Lebensdauer von 10 PB, 16 PB bzw. 33 PB sowie eine dreijährige Garantie. Unser Testmodell ist das 2.2-TB-Laufwerk.
Virident FlashMAX II-Spezifikationen
- Kapazitäten
- 550 GB (einzeln)
- Sequentielles Lesen: 1,600 MB/s (64 KB)
- Sequentielles Schreiben: 540 MB/s (64 KB)
- Zufälliges Lesen: 175,000 IOPS (4 KB)
- Zufälliges Schreiben: 48,000 IOPS (4 KB, stabiler Zustand)
- 1,100 GB (einzeln)
- Sequentielles Lesen: 1,600 MB/s (64 KB)
- Sequentielles Schreiben: 540 MB/s (64 KB)
- Zufälliges Lesen: 175,000 IOPS (4 KB)
- Zufälliges Schreiben: 48,000 IOPS (4 KB, stabiler Zustand)
- 1,100 GB (Dual)
- Sequentielles Lesen: 2,700 MB/s (64 KB)
- Sequentielles Schreiben: 1,000 MB/s (64 KB)
- Zufälliges Lesen: 350,000 IOPS (4 KB)
- Zufälliges Schreiben: 103,000 IOPS (4 KB, stabiler Zustand)
- 2,200 GB (Dual)
- Sequentielles Lesen: 2,700 MB/s (64 KB)
- Sequentielles Schreiben: 1,000 MB/s (64 KB)
- Zufälliges Lesen: 350,000 IOPS (4 KB)
- Zufälliges Schreiben: 103,000 IOPS (4 KB, stabiler Zustand)
- 550 GB (einzeln)
- 20 nm Intel NAND Flash-Speicher Multi-Level Cell (MLC)
- Leselatenz: < 76-78μs (512b)
- Schreiblatenz: < 16–18 μs (512b)
- Schnittstelle: PCI-Express 2.0 x8
- Formfaktor: HHHL
- Lifetime Endurance (550 GB / 1,100 GB (einzeln und dual) / 2,200 GB): 10 PB, 16 PB und 33 PB
- Betriebstemperatur: 0 °C bis 45 °C mit einem Luftstrom von 200 LFM (lineare Fuß pro Minute).
- OS-Kompatibilität
- Microsoft: Windows Server 2008 R2 SP1 und Windows 7 SP1
- Linux: RHEL 5/6, SLES 10/11, CentOS 5/6, Oracle EL 5/6, Debian 4/5/6, Ubuntu 8/9/10/11/12, Fedora Core 12/13/14/15 /16, OpenSUSE 11
- VMWare: ESXi 5.x
- Garantie: 3 Jahr
Designen und Bauen
Der Virident FlashMAX II ist ein PCIe 2.0-Anwendungsbeschleuniger halber Höhe und halber Länge mit einer x8-Verbindung. Sein superkompaktes Design bietet Platz für 3 TB NAND auf einem Platz, wo die Konkurrenz nur halb so viel oder weniger unterbringen kann. Die alternative Möglichkeit, so viel NAND unterzubringen, besteht darin, entweder eine Karte voller Höhe und halber Länge oder eine Karte voller Höhe und voller Länge einzubauen. Dies wird von Low-Profile-Steckplätzen in dicht gedrängten Servern ausgeschlossen. Zu den Konkurrenten, die größere Designs benötigen, gehören Fusion-io, das einen FHHL-Formfaktor für seine ioDrive2 Duos verwendet, und OCZ, das einen FHFL-Formfaktor für den Z-Drive R4 verwendet.
Der FlashMAX II verwendet ein einzigartiges Design mit zwei FPGA-Controllern, ähnlich den ioDrive- und ioDrive2 Duo-Karten von Fusion, unterscheidet sich jedoch dadurch, dass das Gerät als einzelne LUN statt als zwei erscheint. Dies hat den Vorteil, dass Windows- oder Linux-Software-RAID übersprungen wird und die Karte dem System als ein großes Volume präsentiert wird, was für einige Benutzer die Verwaltung erleichtert. Ein weiterer Vorteil besteht darin, dass die Virident-Verwaltungssoftware durch die interne Verknüpfung das NAND-Wear-Leveling und andere Zuverlässigkeitsfunktionen global verwalten kann, was beim ioDrive2 Duo zwischen einzelnen Karten nicht möglich ist. Virident bietet Ihnen auch die Möglichkeit, die Karte so zu formatieren, dass der FlashMAX II als zwei Geräte dargestellt wird, obwohl wir in unserem Test die Leistung der Karte in einem großen Pool gemessen haben.
Der Virident sowie der Fusion-io unterscheiden sich von anderen Herstellern auf dem Markt für PCIe-Anwendungsbeschleuniger durch die Art und Weise, wie sie ihren Speicher dem Hostsystem präsentieren. Das traditionelle Design zwingt die Daten dazu, durch Software- oder Hardware-RAID, SATA/SAS-Treiber und dann höchstwahrscheinlich einen Flash-Controller eines Drittanbieters zu fließen, bevor sie schließlich das NAND erreichen. Die Virident- und Fusion-Methode verfolgen einen anderen Ansatz und ermöglichen es dem Host, über einen nativen Software-Stack als Gerätecontroller zu fungieren und in einem einzigen Schritt eine Schnittstelle zum NAND herzustellen. Dies hat theoretisch den Vorteil, dass durch das Weglassen aller Overhead-Schritte eine geringere Latenz möglich ist, hat aber auch den Nachteil, dass System-Overhead in die Gleichung einfließt, da der Host den Flash selbst verwalten muss. Indem Virident das System näher am NAND platziert, zwingt es das System auch dazu, es zu verwalten, während andere mit Hardware-Flash-Controllern diese Aktivitäten entlasten.
Virident verwendet 2xnm 2-Bit Intel MLC NAND auf dem FlashMAX II, obwohl die Architektur mit Firmware-Updates verschiedene NAND-Hersteller und -Dichten unterstützt. Die Rohkapazität des 2.2 TB FlashMAX II beträgt 3,072 GB, wobei 2,222 GB in der Standardkonfiguration oder 1,847 GB im Hochleistungsmodus nutzbar sind. Das entspricht einer Überbereitstellung von 38 % des Bestands und steigt im Hochleistungsmodus auf 66.3 %.
Management Software
Virident enthält sowohl GUI- als auch konsolenbasierte Verwaltungssoftware mit dem FlashMAX II. In Bezug auf Benutzerfreundlichkeit und Funktionen liegt der FlashMAX II Manager auf Augenhöhe mit dem Micron RealSSD Manager, der im P320h enthalten ist, abzüglich der Echtzeit-Leistungsinformationen, die Micron von der Karte streamen kann. Über die Verwaltungssoftware können Benutzer die FlashMAX II-Firmware aktualisieren, Informationen zur Lebensdauer anzeigen, die Karte in verschiedene Leistungsmodi formatieren, die Karte in zwei Volumes aufteilen sowie einen Beacon aktivieren, um die Karte (und den Server) in einer Umgebung schnell zu identifizieren mit mehreren Geräten.
In Bezug auf die Elemente, die wir gerne in der Verwaltungssoftware aufgelistet sehen möchten, trifft Virident in den meisten Punkten, obwohl es an der Bereitstellung detaillierter Gesundheitsinformationen, Echtzeit-Leistungsdaten oder detaillierter Statistiken zum elektrischen Verhalten der Geräte mangelt. Damit sind sie immer noch anderen im PCIe-Bereich voraus, darunter Intel oder LSI mit sehr minimalistischen, nur auf Konsolen basierenden Informationen, oder OCZ mit seiner OCZ-Toolbox zum Löschen der Karte, zum Aktualisieren von Software oder zum Abfragen von SMART-Informationen. Der Spitzenreiter bei den Verwaltungs- und Überwachungsfunktionen ist mit Abstand Fusion-io, das über eine sehr ausgefeilte Schnittstelle in seinem ioSphere-Paket eine umfangreiche Menge an Informationen bietet.
Hintergrund und Vergleiche testen
Alle in diesem Test verglichenen PCIe-Anwendungsbeschleuniger werden auf unserer Unternehmenstestplattform der zweiten Generation getestet, die aus einem Intel Romley-basierten Lenovo ThinkServer RD630 besteht. Diese neue Plattform ist sowohl mit Windows Server 2008 R2 SP1 als auch mit Linux CentOS 6.3 konfiguriert, damit wir die Leistung verschiedener AAs in den verschiedenen Umgebungen, die ihre Treiber unterstützen, effektiv testen können. Jedes Betriebssystem ist für höchste Leistung optimiert, einschließlich der Einstellung des Windows-Energieprofils auf „Hochleistung“ und der Deaktivierung der CPU-Geschwindigkeit in CentOS 6.3, um den Prozessor auf seiner höchsten Taktrate zu halten. Für synthetische Benchmarks verwenden wir FIO Version 2.0.10 für Linux und Version 2.0.12.2 für Windows, wobei in jedem Betriebssystem dieselben Testparameter verwendet werden, sofern zulässig.
StorageReview Lenovo ThinkServer RD630 Konfiguration:
- 2 x Intel Xeon E5-2620 (2.0 GHz, 15 MB Cache, 6 Kerne)
- Intel C602 Chipsatz
- Speicher – 16 GB (2 x 8 GB) 1333 MHz DDR3 registrierte RDIMMs
- Windows Server 2008 R2 SP1 64-Bit, Windows Server 2012 Standard, CentOS 6.3 64-Bit
- 100 GB Micron RealSSD P400e Boot-SSD
- LSI 9211-4i SAS/SATA 6.0 Gbit/s HBA (für Boot-SSDs)
- LSI 9207-8i SAS/SATA 6.0 Gbit/s HBA (zum Benchmarking von SSDs oder HDDs)
Bei der Auswahl der Vergleichsprodukte für diesen Test haben wir uns für die neuesten, leistungsstärksten SLC-Anwendungsbeschleuniger entschieden. Diese wurden basierend auf den Leistungsmerkmalen der einzelnen Produkte sowie der Preisspanne ausgewählt. Gegebenenfalls beziehen wir sowohl Bestands- als auch Hochleistungs-Benchmark-Ergebnisse ein, wenn der Hersteller diese Konfigurationsebene durch Software berücksichtigt, um auf verschiedene Produktanwendungsfälle abzuzielen. Beim FlashMAX II berücksichtigen wir sowohl Vollkapazitäts- als auch Hochleistungs-Benchmarks.
200 GB LSI Nytro WarpDrive WLP4-200
- Veröffentlicht: 1. Halbjahr 2012
- NAND-Typ: SLC
- Controller: 4 x LSI SandForce SF-2500 bis LSI SAS2008 PCIe zu SAS Bridge
- Gerätesichtbarkeit: Hardware-RAID0 behoben
- LSI-Windows: 2.10.51.0
- LSI Linux: Nativer CentOS 6.3-Treiber
- Vorkonditionierungszeit: 6 Stunden
700 GB Micron RealSSD P320h
- Veröffentlicht: 2. Halbjahr 2011
- NAND-Typ: SLC
- Controller: 1 x proprietärer ASIC
- Gerätesichtbarkeit: Einzelnes Gerät
- Micron Windows: 8.01.4471.00
- Micron Linux: 2.4.2-1
- Vorkonditionierungszeit: 6 Stunden
2.2 TB Virident FlashMAX II
- Veröffentlicht: 2. Halbjahr 2012
- NAND-Typ: MLC
- Controller: 2 x proprietäres FPGA
- Gerätesichtbarkeit: Einzel- oder Doppelgerät, je nach Formatierung
- Virident Windows: Version 3.0
- Virident Linux: Version 3.0
- Vorkonditionierungszeit: 12 Stunden
Synthetische Workload-Analyse für Unternehmen
Die Art und Weise, wie wir PCIe-Speicherlösungen betrachten, geht tiefer als nur die Betrachtung der herkömmlichen Burst- oder Steady-State-Leistung. Wenn man sich die durchschnittliche Leistung über einen längeren Zeitraum ansieht, verliert man den Überblick über die Details zur Leistung des Geräts über diesen gesamten Zeitraum. Da die Flash-Leistung im Laufe der Zeit stark schwankt, analysiert unser Benchmarking-Prozess die Leistung in Bereichen wie Gesamtdurchsatz, durchschnittliche Latenz, Spitzenlatenz und Standardabweichung über die gesamte Vorkonditionierungsphase jedes Geräts. Bei High-End-Unternehmensprodukten ist die Latenz oft wichtiger als der Durchsatz. Aus diesem Grund unternehmen wir große Anstrengungen, um die vollständigen Leistungsmerkmale jedes Geräts zu zeigen, das wir unserem Unternehmenstestlabor unterziehen.
Wir bieten auch Leistungsvergleiche an, um zu zeigen, wie jedes Gerät unter einem anderen Treibersatz sowohl auf Windows- als auch auf Linux-Betriebssystemen funktioniert. Für Windows verwenden wir die zum Zeitpunkt der ursprünglichen Überprüfung neuesten Treiber. Anschließend wird jedes Gerät in einer 64-Bit-Windows Server 2008 R2-Umgebung getestet. Für Linux verwenden wir die 64-Bit-CentOS 6.3-Umgebung, die jeder Enterprise PCIe Application Accelerator unterstützt. Unser Hauptziel bei diesem Test besteht darin, zu zeigen, wie sich die Betriebssystemleistung unterscheidet, denn wenn ein Betriebssystem auf einem Produktblatt als kompatibel aufgeführt ist, bedeutet dies nicht immer, dass die Leistung aller Betriebssysteme gleich ist.
Die Flash-Leistung variiert während der Vorkonditionierungsphase jedes Speichergeräts. Bei unterschiedlichen Designs und unterschiedlichen Kapazitäten dauert unser Vorkonditionierungsprozess entweder 6 Stunden oder 12 Stunden, je nachdem, wie lange es dauert, bis ein stationäres Verhalten erreicht ist. Unser Hauptziel besteht darin, sicherzustellen, dass sich jedes Laufwerk zu Beginn unserer Haupttests vollständig im stationären Modus befindet. Insgesamt wird jedes der vergleichbaren Geräte mit den Tools des Anbieters sicher gelöscht, mit der gleichen Arbeitslast, mit der das Gerät getestet wird, unter einer hohen Last von 16 Threads mit einer ausstehenden Warteschlange von 16 pro Thread in einen stabilen Zustand vorkonditioniert und dann getestet in festgelegten Intervallen in mehreren Thread-/Warteschlangentiefenprofilen, um die Leistung sowohl bei geringer als auch bei starker Auslastung anzuzeigen.
In Vorkonditionierungs- und Primär-Steady-State-Tests überwachte Attribute:
- Durchsatz (Lese- und Schreib-IOPS-Aggregat)
- Durchschnittliche Latenz (Lese- und Schreiblatenz insgesamt gemittelt)
- Maximale Latenz (Spitzen-Lese- oder Schreiblatenz)
- Latenz-Standardabweichung (Lese- und Schreib-Standardabweichung insgesamt gemittelt)
Unsere Enterprise Synthetic Workload Analysis umfasst vier Profile, die auf realen Aufgaben basieren. Diese Profile wurden entwickelt, um den Vergleich mit unseren früheren Benchmarks sowie weit verbreiteten Werten wie der maximalen Lese- und Schreibgeschwindigkeit von 4K und 8K 70/30, die häufig für Unternehmenslaufwerke verwendet wird, zu erleichtern. Wir haben auch zwei ältere gemischte Workloads integriert, den traditionellen Dateiserver und den Webserver, die jeweils eine breite Mischung an Übertragungsgrößen bieten.
- 4K
- 100 % Lesen oder 100 % Schreiben
- 100 % 4K
- 8K 70/30
- 70 % lesen, 30 % schreiben
- 100 % 8K
- Dateiserver
- 80 % lesen, 20 % schreiben
- 10 % 512b, 5 % 1, 5 % 2, 60 % 4, 2 % 8, 4 % 16, 4 % 32, 10 % 64
- Webserver
- 100 % gelesen
- 22 % 512b, 15 % 1, 8 % 2, 23 % 4, 15 % 8, 2 % 16, 6 % 32, 7 % 64, 1 % 128, 1 % 512
In unserer ersten Arbeitslast messen wir die Leistung eines 4K-Sättigungstests mit 100 % zufälligem Schreiben mit einer Last von 16T/16Q (effektive Warteschlangentiefe von 256). Virident gibt die Dauerleistung des Virident FlashMAX II unter solchen Bedingungen mit 103,000 IOPS für unsere 2.2 TB Kapazität an. In der Standardkonfiguration bot der FlashMAX II Burst-Geschwindigkeiten von bis zu 210,000 IOPS, bevor er sich auf eine Dauergeschwindigkeit von etwa 54,000 IOPS einpendelte. Bei der Konfiguration des FlashMAX II im Hochleistungsmodus konnten wir Burst-Geschwindigkeiten von bis zu 250,000 IOPS und eine Dauerleistung von etwa 114,000 IOPS feststellen.
Bei einer hohen 16T/16Q 100 % 4K-Schreibsättigungslast haben wir die durchschnittliche Latenz des FlashMAX II mit Standardkonfiguration bei nahezu 4.5–4.7 ms gemessen, während sich die Hochleistungskonfiguration bei 2.2–2.3 ms einpendelte.
Beim Vergleich der maximalen Latenz des MLC-basierten Virident FlashMAX II mit dem SLC-basierten Micron P320h und Nytro WarpDrive in unserem 100 % zufälligen 4K-Schreibvorkonditionierungstest lag es genau dazwischen. Die Spitzenreaktionszeiten, wenn sich der FlashMAX II dem stabilen Zustand näherte, lagen zwischen 30 und 50 ms, bei Linux mit Standardkapazität ist mit einem Anstieg auf etwa 80 ms zu rechnen.
Beim Vergleich der Latenzkonsistenz blieb der FlashMAX II definitiv im gleichen Bereich wie die SLC-Vergleichsgeräte; knapp hinter dem Micron P320h zurück, der dieses Feld anführte. In Hochleistungskonfigurationen boten sowohl Linux als auch Windows eine ähnliche Leistung, während bei Standardkapazität die Standardabweichung der Linux-Konfiguration mit Standardkapazität erheblich zunahm, je mehr sich das Laufwerk dem stabilen Zustand näherte.
Nachdem wir die Vorkonditionierungsphase unseres 100 % 4K-Schreibtests abgeschlossen hatten, nahmen wir längere Proben, um die durchschnittliche Leistung jedes Geräts im stationären Zustand anzuzeigen. Der Virident FlashMAX II landete mit einer 100 % zufälligen 4K-Lesegeschwindigkeit von 341.5–343 K IOPS in allen Konfigurationen ganz oben auf der Liste. Bei 100 % 4K-Schreibleistung betrug die Leistung bei Standardkapazität 53.7–55.5 K IOPS, während sie im Hochleistungsmodus 111.6 – 114.9 K IOPS betrug.
Bei einer starken 16T/16Q-Last betrug die durchschnittliche Latenz des FlashMAX II je nach Konfiguration 0.744–0.747 ms bei 100 % 4K-Leseübertragungen und 2.224–4.756 ms bei 100 % 4K-Schreibübertragungen.
Beim Vergleich der maximalen Latenz zwischen Linux und Windows in beiden Konfigurationen stellten wir niedrigere Lesereaktionszeiten in Windows und eine niedrigere maximale Schreibreaktionszeit für 4K-Schreiblatenz im HP-Modus sowie unter Windows fest.
Betrachtet man die Latenzkonsistenz unter Windows und Linux, so wies der FlashMAX II unter Windows sowohl im Standard- als auch im Hochleistungsmodus eine geringere Latenzstandardabweichung auf. Der größte Unterschied ergab sich beim Vergleich der Schreibstandardabweichung, wo im Standardmodus unter Linux ein großer Anstieg zu verzeichnen war.
Unser nächster Test wechselt zu einer gemischten 8K 70/30-Workload, wobei der Virident FlashMAX II die höchsten Burst-Übertragungsgeschwindigkeiten in der Gruppe bietet. In einer Linux-Umgebung erreichte der FlashMAX II Burst-Geschwindigkeiten von bis zu 400,000 IOPS, während in Windows Burst-Geschwindigkeiten von bis zu 310,000 IOPS erreicht wurden. Beim Vergleich der stationären Leistung maß das Laufwerk im Standardkapazitätsmodus 75–80 IOPS unter Windows bzw. Linux. Im Hochleistungsmodus betrugen die stabilen Geschwindigkeiten 123 KB unter Windows und 134 KB unter Linux.
Betrachtet man die durchschnittliche Latenz in unserem 8K 70/30-Vorkonditionierungs-Workload mit einer hohen Workload von 16T/16Q, so hatte der Virident FlashMAX II eine durchschnittliche Burst-Latenz von 0.64 ms bis 0.80 ms. Beim Übergang zur stationären Leistung pendelte sich der FlashMAX II auf 1.89 ms bis 3.41 ms ein.
Betrachtet man die Spitzenreaktionszeiten in unserer 8K 70/30-Vorkonditionierungsphase, so hatte der Virident FlashMAX II eine maximale Latenz von 10–25 ms im Burst-Modus, die sich auf 30–45 ms erhöhte.
Beim Vergleich der Latenzstandardabweichung zwischen dem MLC-basierten Virident FlashMAX II und dem SLC-basierten 200 GB Nytro WarpDrive mit 700 GB Micron P320h lag der FlashMAX II im Mittelfeld, wobei der Linux-Treiber die beständigste Leistung bot.
Im Vergleich zur festen maximalen Arbeitslast von 16 Threads und 16 Warteschlangen, die wir im 100 % 4K-Schreibtest durchgeführt haben, skalieren unsere gemischten Arbeitslastprofile die Leistung über eine Vielzahl von Thread-/Warteschlangenkombinationen. In diesen Tests erstrecken wir uns über die Intensität unserer Arbeitsbelastung von 2 Threads und 2 Warteschlangen bis hin zu 16 Threads und 16 Warteschlangen. In unserem erweiterten 8K 70/30-Test bot der Virident FlashMAX II die höchste 2T/2Q- und 2T/4Q-Leistung in der Gruppe und maß 25 bzw. 41 IOPS für die HP Linux-Umgebung, verglichen mit dem Micron P320h, der 20 und 37 IOPS maß Linux. Auf dem Höhepunkt erreichte der FlashMAX II 134 IOPS im Linux-HP-Modus und 79 IOPS im Stock-Capacity-Modus.
In unserem skalierten 8K 70/30-Durchschnittslatenztest maß der FlashMAX II zwischen 0.15 ms in Linux HP bei 2T/2Q und 1.9 ms in Linux HP bei 16T/16Q im stationären Modus. Im Vergleich zur Standardkapazitätsformatierung maß das Laufwerk im stationären Modus 0.18 ms bei 2T/2Q und 3.23 ms bei 16T/16Q.
Der Virident FlashMAX II war in unserem 8K 70/30-Test sowohl unter Linux als auch unter Windows sehr stabil unter Last. Seine Spitzenreaktionszeiten lagen zwischen 7 ms und 49 ms von 2T/2Q bis 16T/16Q, wobei das Laufwerk mit seinem Windows-Treiber einen leichten Vorsprung hatte.
Beim Vergleich der Latenzkonsistenz in unserem 8K 70/30-Test lag der Virident FlashMAX II ungefähr auf Augenhöhe mit dem SLC-basierten LSI Nytro WarpDrive, wobei der Micron P320h bei den Workloads einen leichten Vorsprung hatte.
Die Arbeitslast des Dateiservers stellt ein größeres Übertragungsgrößenspektrum dar, das jedes einzelne Gerät betrifft. Anstatt sich also auf eine statische Arbeitslast von 4 KB oder 8 KB einzulassen, muss das Laufwerk Anforderungen im Bereich von 512 KB bis 64 KB bewältigen. Da der Virident FlashMAX II bei dieser Arbeitslast mit einem breiteren Spektrum an Übertragungsgrößen zurechtkommen muss, vergrößert sich der Leistungsunterschied zwischen den Windows- und Linux-Treibersätzen, wobei Linux die Nase vorn hat. Was die Leistung im Vergleich zu anderen PCIe AAs auf dem Markt angeht, bot der FlashMAX II sowohl im Standard- als auch im Hochleistungsformatierungsmodus die höchsten Burst-Geschwindigkeiten, die sich dann im Steady-State-Modus im unteren Mittelfeld einpendelten.
Bei einer hohen 16T/16Q-Arbeitslast in unserem Dateiserver-Vorkonditionierungstest startet der Virident FlashMAX II mit einer Burst-Latenz von 1.5–1.8 ms und erhöht sich dann auf eine durchschnittliche Latenz von 3.5–5.5 ms, wenn sich das Laufwerk dem stabilen Zustand nähert.
Bei der Dateiserver-Arbeitslast mit der großen Bandbreite an Übertragungsgrößen liegt der Virident FlashMAX II über den SLC-basierten PCIe-Anwendungsbeschleunigern mit Spitzenreaktionszeiten zwischen 20 und 80 ms im Burst-Modus und 40 bis 100 ms, wenn er sich dem stabilen Zustand nähert.
Beim Vergleich der Latenzkonsistenz in unserem Dateiserver-Vorkonditionierungsprozess blieb der MLC-basierte Virident FlashMAX II hinter unseren beiden SLC-Vergleichsgeräten zurück, blieb jedoch im Hinblick auf die Standardabweichung der Latenz relativ konkurrenzfähig zum LSI Nytro WarpDrive.
Nachdem der Vorkonditionierungsprozess des Dateiservers mit einer konstanten 16T/16Q-Last abgeschlossen war, begannen wir mit unseren Haupttests, bei denen die Leistung auf festgelegten Ebenen zwischen 2T/2Q und 16T/16Q gemessen wurde. Bei unserem Haupt-Dateiserver-Workload lag die Leistung des Virident FlashMAX II in der Standardformatierung auf Augenhöhe mit dem 200 GB LSI Nytro WarpDrive und im Hochleistungsmodus leicht darüber. Der SLC-basierte Micron P320h bot in diesem Test den höchsten Durchsatz. Bei 16T/16Q hat der FlashMAX II 46–48 IOPS im Standardmodus und 66–72 IOPS im Hochleistungsmodus gemessen. Dies im Vergleich zum Micron P320h, der einen Spitzenwert von 125 IOPS erreichte.
Die durchschnittliche Latenz in unserer Haupt-Dateiserver-Arbeitslast betrug 0.21–0.25 ms bei 2T/2Q und stieg auf 3.52–5.53 ms bei 16T/16Q. Die Treiberstärke lag weiterhin in einer Linux-Umgebung im Vergleich zu Windows.
Während Durchsatz und durchschnittliche Latenz unter Linux mit dem FlashMAX II besser waren, konnte die maximale Latenz unter Windows besser kontrolliert werden. Bei der Formatierung mit voller Kapazität stieg die Spitzenlatenz des FlashMAX II unter Linux unter hoher Last auf bis zu 300 ms an, während sie unter Windows bei etwa 50 ms blieb.
Beim Vergleich der Latenzkonsistenz zwischen den einzelnen Anwendungsbeschleunigern blieb der FlashMAX II hinter dem Micron P320h zurück, schnitt jedoch knapp mit dem SLC 200 GB Nytro WarpDrive ab.
Bei unserem letzten synthetischen Workload für ein Webserverprofil, bei dem es sich traditionell um einen 100-prozentigen Lesetest handelt, wenden wir 100-prozentige Schreibaktivität an, um jedes Laufwerk vor unseren Haupttests vollständig vorzukonditionieren. Bei diesem anstrengenden Vorkonditionierungstest pendelte sich der FlashMAX II in der Standardformatierung bei 8,700 IOPS ein, während er im Hochleistungsmodus eine Geschwindigkeit von 16.2-17.2K IOPS beibehielt.
Bei einer 100 % Schreib-Webserver-Vorkonditionierungsauslastung bei 16T/16Q pendelte sich der FlashMAX II auf etwa 28 ms im Standardmodus und etwa 15 ms im Hochleistungsmodus ein.
Beim Vergleich der Spitzenreaktionszeiten in unserem Webserver-Vorkonditionierungsprozess bot der FlashMAX II im Hochleistungsmodus eine relativ niedrige maximale Latenz, obwohl die Spitzenlatenz bei Standardformatierung unter Linux erheblich anstieg.
Beim Vergleich der Latenzkonsistenz in unserem Webserver-Vorkonditionierungstest lag die Latenzstandardabweichung bei der Standardformatierung hinter beiden SLC-basierten AAs, während die Leistung im Hochleistungsmodus eher mit der der SLC-basierten Gegenstücke übereinstimmte.
Als wir zum Hauptsegment unseres Webservertests mit einem 100 %-Leseprofil wechselten, erreichte der Virident FlashMAX II eine Leistungsskalierung von 25–27 IOPS bei 2T/2Q, die auf einen Spitzenwert von 112–114 IOPS bei 16T/16Q anstieg. Damit liegt es knapp in der Mitte und liegt hinter dem Micron P320h, schneidet aber besser ab als das 200 GB SLC Nytro WarpDrive. In allen Leistungsmodi bot der FlashMAX II nahezu identische Leistung, sogar über alle Betriebssysteme hinweg.
Die durchschnittliche Latenz beim FlashMAX II skalierte von 0.142–0.157 ms bei 2T/2Q und erreichte ihren Höhepunkt bei 2.235–2.274 ms bei 16T/16Q.
Vergleicht man die maximale Latenz zwischen dem FlashMAX II unter Windows und Linux, so bot es bei jeder Arbeitslast unter Windows etwas niedrigere Spitzenreaktionszeiten. Insgesamt lagen die Spitzenreaktionszeiten in unserem 100 % schreibgeschützten Webserver-Test zwischen 2 und 36 ms.
Während die maximale Latenz insgesamt niedrig war, weist die Latenzkonsistenz des FlashMAX II im Vergleich zu den leistungsstarken SLC-Vergleichsgeräten eine höhere Standardabweichung auf, wenn auch nicht wesentlich, bis die effektive Warteschlangentiefe auf oder über 128 stieg.
Fazit
Der Virident FlashMAX II mit MLC NAND bietet mit 2.2 TB die größte verfügbare Kapazität in einem Anwendungsbeschleuniger dieses Formfaktors, halber Höhe, halber Länge. Der Entwurf besticht sowohl durch seine rohe Dichte als auch durch seine Architektur. Mit der Karte mit hoher Kapazität nutzt Virident zwei FPGAs, die das NAND als einen einzigen Pool direkt der Softwareschicht präsentieren, die auf dem Host-Computer ausgeführt wird. Die als vFAS bezeichnete Software nutzt die Host-CPU und die Systemressourcen, um den Zugriff auf den NAND-Pool des Laufwerks zu verwalten und diesen zu erhalten. Die Einfachheit dieses Ansatzes hat mehrere Vorteile, die vor allem durch einen effizienteren Datenpfad hervorgehoben werden, der weder die Kombination mehrerer Laufwerke auf der Leiterplatte über RAID noch Schnittstellenübersetzungsschichten erfordert. Der Virident-Ansatz ist auch insofern etwas neu, als er das Laufwerk als einzelnes LUN darstellt, während Fusion-io, das eine ähnliche Laufwerksarchitektur verwendet, zwei Laufwerke darstellt, die über RAID kombiniert werden müssen, wenn ein Benutzer ein einzelnes Volume wünscht. Während einige vielleicht argumentieren, dass der Rückgriff auf die CPU benötigte Ressourcen verschlingt, ist der Nettovorteil ein Anwendungsbeschleuniger mit sehr geringer Latenz, ein Kompromiss, mit dem viele Rechenzentren angesichts der Leistung der CPUs der aktuellen Generation zufrieden sind aggregierter Nettovorteil für die Anwendungsleistung.
Beim Vergleich der Management-Suite mit anderen Anwendungsbeschleunigern auf dem Markt bietet Virident GUI- und Konsolensoftware zur Überwachung des Zustands der Karte und zur Handhabung von Formatierungsanforderungen. Der einzige Bereich, den wir als etwas vermissen, ist die Möglichkeit, Echtzeit-Leistungsdaten zu überwachen, die Micron in seinem RealSSD Manager und Fusion-io in seinem ioSphere-Paket bereitstellt. Wenn man das hinzufügt, würde der FlashMAX Manager von Virident an allen Fronten mithalten und sich wirklich von vielen anderen in diesem Bereich abheben, die nur sehr minimale Informationen über Software bereitstellen.
Wenn man zur Beurteilung der Laufwerksleistung auf den Kern zurückblickt, findet sich der FlashMAX II in einem interessanten Bereich wieder, mit wenigen direkten Vergleichswerten. Sein großer MLC-NAND-Pool schneidet im Vergleich zum führenden SLC-Vergleich, dem P320h von Micron, nicht nur beim Durchsatz, sondern auch bei der maximalen Latenz und der Latenzstandardabweichung sehr gut ab. In unserem Vorkonditionierungstest für 4K-Zufallsschreibvorgänge haben wir außergewöhnliche Spitzenreaktionszeiten festgestellt, die vom Burst bis zum stabilen Zustand unter 80 ms blieben. Da die Stabilität bei hoher Schreiblast die Visitenkarte bisheriger SLC-Laufwerke ist, trägt der Wettbewerb in diesem Bereich und eine gute Konkurrenz dazu bei, dass sich der FlashMAX II als leistungsstarker Konkurrent hervorhebt. Bei unseren gemischten Workloads mit starker Leseneigung haben wir eine robuste Leistung in Standard- und Hochleistungskonfigurationen festgestellt, sowohl unter Linux als auch unter Windows. Beim Durchsatz ist Linux führend, während es in dieser Kategorie auf Spitzenreaktionszeiten ankommt und Windows die Nase vorn hat. Insgesamt bietet der FlashMAX II eine hervorragende Leistung unter Windows und Linux, mit einer starken Steigerung im Hochleistungsmodus, wenn der Benutzer bereit ist, auf nutzbare Laufwerkskapazität zu verzichten.
Vorteile
- Bewährte Antriebsarchitektur der dritten Generation
- Hervorragendes Latenzverhalten bei hoher Arbeitslast
- Bietet SLC-ähnliche Ausdauer und Leistung mit MLC-NAND
- Design mit zwei Laufwerken, das als einzelnes Volume mit dem Hostsystem interagiert
Nachteile
- Die Garantie von drei Jahren ist niedriger als die branchenübliche Garantie von fünf Jahren
- Der Verwaltungssoftware fehlen Echtzeit-Leistungsstatistiken
Fazit
Der Virident FlashMAX II bietet branchenführende Kapazität im HHHL-Formfaktor mit einer robusten Softwareschicht und einer Leistung in Bezug auf Durchsatz und Latenz, die mit dem führenden SLC-basierten Anwendungsbeschleuniger mithalten kann. Insgesamt hat Virident mit dem FlashMAX II umfassende Arbeit geleistet und bietet sowohl in Windows- als auch in Linux-Umgebungen eine hervorragende Leistung.
Virident FlashMAX II-Produktseite
Besprechen Sie diese Rezension