Der Micron RealSSD P320h ist ein Anwendungsbeschleuniger mit halber Höhe und halber Länge (HHHL), der SLC NAND und eine PCIe Gen 2 x8-Schnittstelle nutzt, um die angegebene Leistung von 3.2 GB/s beim sequentiellen Lesen und bis zu 785,000 zufälligen Lese-IOPS zu erreichen. Die P320h-Architektur unterscheidet sich von vielen anderen kürzlich von uns getesteten Anwendungsbeschleunigern, die im Allgemeinen mehrere Flash-Laufwerke als RAID zusammenfassen. Das Micron-Angebot ist anders und verwendet stattdessen RAIN (redundantes Array unabhängiger NAND) mit benutzerdefiniertem Controller, was dem Ansatz von Fusion-io und Virident ähnelt. Mit dieser Architektur kann Micron einige überragende Geschwindigkeits- und Latenzansprüche vorweisen und gleichzeitig ein hohes Maß an Datensicherheit auf dem Laufwerk bieten. In diesem Test testen wir ein Paar der 700-GB-Karten und werden nicht nur sehen, wie schnell sie alleine funktionieren, sondern auch, wie sich die P320h unter Windows Server 2012 skaliert.
Der Micron RealSSD P320h ist ein Anwendungsbeschleuniger mit halber Höhe und halber Länge (HHHL), der SLC NAND und eine PCIe Gen 2 x8-Schnittstelle nutzt, um die angegebene Leistung von 3.2 GB/s beim sequentiellen Lesen und bis zu 785,000 zufälligen Lese-IOPS zu erreichen. Die P320h-Architektur unterscheidet sich von vielen anderen kürzlich von uns getesteten Anwendungsbeschleunigern, die im Allgemeinen mehrere Flash-Laufwerke als RAID zusammenfassen. Das Micron-Angebot ist anders und verwendet stattdessen RAIN (redundantes Array unabhängiger NAND) mit benutzerdefiniertem Controller, was dem Ansatz von Fusion-io und Virident ähnelt. Mit dieser Architektur kann Micron einige überragende Geschwindigkeits- und Latenzansprüche vorweisen und gleichzeitig ein hohes Maß an Datensicherheit auf dem Laufwerk bieten. In diesem Test testen wir ein Paar der 700-GB-Karten und werden nicht nur sehen, wie schnell sie alleine funktionieren, sondern auch, wie sich die P320h unter Windows Server 2012 skaliert.
Wie bereits erwähnt, spielen die Laufwerksarchitektur und die NAND-Verwaltungsrichtlinien eine entscheidende Rolle im Hinblick auf die Geräteleistung, sowohl aus Sicht des Durchsatzes als auch der Latenz. Beim P320h vereint Micron sein eigenes geistiges Eigentum mit dem ASIC-Design und der Fertigung von IDT. Das Endergebnis ist ein ASIC-Controller, der die proprietäre Intelligenz von Micron rund um die NAND-Verwaltung und -Steuerung umfasst, einschließlich RAIN. Der RAIN-Ansatz von Micron ist in der Art und Weise, wie er mit NAND umgeht, sehr effizient, und diese Effizienz ist letztendlich der Motor für die Leistung und den Datenschutz des P320h. Micron verwendet innerhalb von RAIN eine 7+1P RAID5-Architektur. Da das Striping auf der 7+1-Ebene verwendet wird, ist Micron in der Lage, die gleiche Leistung wie ein Laufwerk ohne Parität zu liefern und gleichzeitig die von Unternehmen benötigte Datensicherheit zu gewährleisten.
Während der P320h dank der NAND-Verwaltungstechniken von Micron interessant ist, ist er auch physikalisch interessant. Die HHHL-Platine ist voll mit Micron-Bauteilen, darunter natürlich SLC NAND und DDR, und es ist kein externer Stromanschluss erforderlich, um die maximale Leistung zu erreichen. Unsere 700-GB-Laufwerke verfügen über 64 NAND-Teile auf der Platine, die durch den passiven Kühlkörper auf dem einzelnen Controller hervorgehoben werden. Das Design mit nur einem Controller ermöglicht eine bessere Leistung und Zuverlässigkeit als konkurrierende Lösungen, die auf der Kombination mehrerer Controller über Hardware und Software basieren. Die Verwendung eines speziell für Micron NAND entwickelten Controllers verschafft Micron einen weiteren Vorteil, wenn es um Interoperabilität, Leistung und Unterstützung des Laufwerks geht. Im Gegensatz zu anderen Berichten unterstützt das Laufwerk kein NVMe, Micron geht bei zukünftigen Produkten jedoch definitiv in diese Richtung.
Micron bietet den P320h in zwei reinen SLC-Kapazitäten an: 350 GB und 700 GB nutzbar. Ein 350-GB-Laufwerk hat zunächst 512 GB RAW, aber nach Abzug von 12.5 % für RAIN und dann 22 % für Überbereitstellung kommt das Laufwerk auf 350 GB. Das P320h bietet eine Speicherkapazität von bis zu 25 PB für das 350-GB-Modell und 50 PB für das 700-GB-Modell und verfügt über Softwaretools für die Laufwerksverwaltung und Zustandsberichte.
Micron RealSSD P320h-Spezifikationen
- Kapazitäten
- 350 GB (MTFDGAR350SAH-1N1AB)
- Sequentielles Lesen: 3.2 GB/s (128 KB, stabiler Zustand)
- Sequentielles Schreiben: 1.9 GB/s (128 KB, stabiler Zustand)
- Zufälliges Lesen: 785,000 IOPS (4 KB, stabiler Zustand)
- Zufälliges Schreiben: 175,000 IOPS (4 KB, stabiler Zustand)
- 700 GB (MTFDGAR700SAH-1N1AB)
- Sequentielles Lesen: 3.2 GB/s (128 KB, stabiler Zustand)
- Sequentielles Schreiben: 1.9 GB/s (128 KB, stabiler Zustand)
- Zufälliges Lesen: 785,000 IOPS (4 KB, stabiler Zustand)
- Zufälliges Schreiben: 205,000 IOPS (4 KB, stabiler Zustand)
- 350 GB (MTFDGAR350SAH-1N1AB)
- Bereitschaftslatenz: <42 µs (512 Bytes)
- Schreiblatenz: <9µs
- Schnittstelle: PCIe Gen2 x8
- Leistung: 25 W maximal, 10 W im Leerlauf
- Formfaktor: HHHL
- Native Befehlswarteschlange für bis zu 256 Befehle
- Ausdauer: 350 GB – 25 PB, 700 GB – 50 PB
- Abmessungen: 68.90mm x 167.65mm x 18.71mm
- Betriebstemperatur: 0°C bis +50°C
- OS-Kompatibilität
- Microsoft: Windows Server 2008 R2 SP1 (x86-64), Windows Server 2008 R2 SP1 Hyper-V (x86-64), Windows Server 2012 (x86-64) SP128, Windows Server 2012 Hyper-V (x64)
- Linux: RHEL Linux 5.5, 5.6, 5.7, 5.8 (SP128), 6.1, 6.2 (x86-64), SLES Linux 11 SP1 und SP2 (x86-64)
- Open-Source-GPL (Kernel Rev. 2.6.25+)
- Datenaufbewahrung am Lebensende 1 Jahr
Video-Übersicht
Aufbau und Design
Die Micron RealSSD P320h ist eine x8-PCI-Express-Karte halber Höhe und halber Länge mit dem grundlegendsten PCIe-AA-Layout auf dem Markt, was das Design betrifft. Mit einem einzigen Controller und zwei kleinen Tochterkarten ist es schlanker als jede andere Lösung, die wir bisher getestet haben, und bei weitem die am wenigsten komplexe. Dies kommt Micron in mehrfacher Hinsicht zugute. Erstens passt die Karte automatisch in fast alle Server auf dem Markt, die PCIe-Erweiterungskarten unterstützen, aber sie kommt auch beim Vergleich der Gesamtzuverlässigkeit in Unternehmenslösungen ins Spiel. Mit einem einzigen Controller und nicht einmal einem PCIe-Switch wie bei den Fusion-io „Duo“-Angeboten gibt es weniger Teile, die ausfallen können. Dies steht in krassem Gegensatz zu den Multi-Controller-Konfigurationen einiger konkurrierender Lösungen, die mehrere SandForce-Controller als RAID zusammenfassen. In einem Markt, der es hasst, Plattformen abzuschalten, sobald sie in Produktion sind, außer für den späteren Austausch, ist die Gewissheit, dass das Gerät, das Sie heute installiert haben, jahrelang ohne Probleme funktionieren wird, ein großes Plus.
Das Herzstück des Micron RealSSD P320h ist ein speziell für diese Lösung einzigartiger Micron/IDT-ASIC-Controller. Bei unseren beiden 700-GB-Beispielen ist dieser Controller dann mit einem 1-TB-Pool von Micron SLC NAND verbunden und mit 2.25 GB Micron DDR RAM gepuffert. Je nachdem, wie man es betrachtet, bieten diese Artikel einen großen Vorteil für Micron, da das Unternehmen über sehr detaillierte Kenntnisse darüber verfügt, wie alle diese Komponenten auf Kernebene funktionieren, da sie sie im eigenen Haus haben.
Beim Stromverbrauch ist das Micron RealSSD P320h sehr flink und verbraucht weniger als 25 Watt aus einem PCIe 2.0 x8-Bus; kein externer Stromanschluss erforderlich. Dies gibt dem P320h mehr Flexibilität bei der Suche nach geeigneten Plattformen für die Installation, ohne dass zusätzliche Stromkabel oder Testserver für die Stromversorgung über PCIe-Spezifikation erforderlich sind.
Management Software
Während die meisten Anwendungsbeschleuniger mit Software ausgestattet sind, reicht die Benutzerfreundlichkeit und Effektivität dieser Tools von ausgezeichnet bis schlecht. Micron stellt seine RealSSD Manager-Tools zur Verfügung, die darauf ausgelegt sind, die Verwaltung des P320h effektiver zu gestalten, einschließlich einer CLI und einer GUI. Diese Tools sind sowohl mit Windows als auch mit Linux kompatibel und bieten eine breite Palette an Funktionen. Benutzer können diese Softwaretools nutzen, um die Firmware des Laufwerks zu aktualisieren, den Zustand des PCIe AA zu überprüfen und eine Geräteformatierung zu initiieren. Auf der fortgeschritteneren Ebene können Sie die aktuelle Laufwerksnutzung und -temperatur mit integrierten Protokollierungsfunktionen überwachen.
Im Vergleich zu den vom Hersteller mitgelieferten Dienstprogrammen, die wir bisher gesehen haben, liegt Micron in Bezug auf Funktionsumfang und Gesamtdesign direkt hinter Fusion-io. Obwohl das Design im Vergleich zu ioSphere etwas gespart wird, bietet der Micron RealSSD Manager viele der gleichen Verwaltungs- und Überwachungsfunktionen, allerdings nur auf lokaler Ebene. Derzeit unterstützt es keine Überwachungsgeräte auf Remote-Systemen, bietet aber im Vergleich zu LSI- oder OCZ-Verwaltungstools insgesamt einen enormen Funktionsvorteil.
Hintergrund und Vergleiche testen
Wenn es um das Testen von Unternehmenshardware geht, ist die Umgebung ebenso wichtig wie die Testprozesse, mit denen sie bewertet wird. Bei StorageReview bieten wir die gleiche Hardware und Infrastruktur wie in vielen Rechenzentren, für die die von uns getesteten Geräte letztendlich bestimmt sind. Dazu gehören nur Tests mit Unternehmensservern sowie geeigneter Infrastrukturausrüstung wie Unternehmensnetzwerken, Rack-Platz, Stromaufbereitung/-überwachung und vergleichbarer Hardware derselben Klasse, um die Leistung eines Geräts richtig zu bewerten. Keine unserer Bewertungen wird vom Hersteller der von uns getesteten Geräte bezahlt oder kontrolliert; mit relevanten Vergleichswerten, die nach unserem Ermessen aus den von uns angebotenen Produkten ausgewählt werden in unserem Labor.
StorageReview Enterprise-Testplattform:
- 2 x Intel Xeon X5650 (2.66 GHz, 12 MB Cache)
- Windows Server 2008 Standard Edition R2 SP1 64-Bit und CentOS 6.2 64-Bit
- Intel 5500+ ICH10R Chipsatz
- Speicher – 8 GB (2 x 4 GB) 1333 MHz DDR3 registrierte RDIMMs
Bei der Auswahl der Vergleichsgeräte für diesen Test haben wir die Spitzenreiter der einzelnen Hersteller ausgewählt, allerdings nur in Bereichen, die im Vergleich zum mit SLC ausgestatteten Micron RealSSD P320h sinnvoll waren. Aus diesem Grund haben wir das LSI WarpDrive der ersten Generation aufgegeben, da es durch das Nytro WarpDrive der zweiten Generation ersetzt wurde, sowie das OCZ Z-Drive R4, das zu weit außerhalb der Latenzkurve lag, um den Anforderungen des leistungsstarken Unternehmensspeichermarkts gerecht zu werden .
640GB Fusion-io ioDrive Duo
- Veröffentlicht: 1. Halbjahr 2009
- NAND-Typ: MLC
- Controller: 2 x proprietär
- Gerätesichtbarkeit: JBOD, Software-RAID je nach Betriebssystem
- Fusion-io VSL Windows: 3.1.1
- Fusion-io VSL Linux 3.1.1
200GB LSI Nytro WarpDrive WLP4-200
- Veröffentlicht: 1. Halbjahr 2012
- NAND-Typ: SLC
- Controller: 4 x LSI SandForce SF-2500 bis LSI SAS2008 PCIe zu SAS Bridge
- Gerätesichtbarkeit: Hardware-RAID0 behoben
- LSI-Windows: 2.10.51.0
- LSI Linux: Nativer CentOS 6.2-Treiber
700 GB Micron RealSSD P320h
- Veröffentlicht: 2. Halbjahr 2011
- NAND-Typ: SLC
- Controller: 1 x proprietär
- Gerätesichtbarkeit: Einzelnes Gerät
- Micron Windows: 7.03.3452.00
- Micron Linux: 1.3.7-1
Synthetische Workload-Analyse für Unternehmen (Bestandseinstellungen)
Die Art und Weise, wie wir PCIe-Speicherlösungen betrachten, geht tiefer als nur die Betrachtung der herkömmlichen Burst- oder Steady-State-Leistung. Wenn man sich die durchschnittliche Leistung über einen längeren Zeitraum ansieht, verliert man den Überblick über die Details zur Leistung des Geräts über diesen gesamten Zeitraum. Da die Flash-Leistung im Laufe der Zeit stark schwankt, analysiert unser neuer Benchmarking-Prozess die Leistung in Bereichen wie Gesamtdurchsatz, durchschnittliche Latenz, Spitzenlatenz und Standardabweichung über die gesamte Vorkonditionierungsphase jedes Geräts. Bei High-End-Unternehmensprodukten ist die Latenz oft wichtiger als der Durchsatz. Aus diesem Grund unternehmen wir große Anstrengungen, um die vollständigen Leistungsmerkmale jedes Geräts, das wir verwenden, darzustellen Unternehmenstestlabor.
Wir haben außerdem Leistungsvergleiche hinzugefügt, um mithilfe des Fio-Workload-Generators zu zeigen, wie jedes Gerät unter einem anderen Treibersatz auf Windows- und Linux-Betriebssystemen funktioniert. Für Windows verwenden wir die zum Zeitpunkt der ursprünglichen Überprüfung neuesten Treiber. Anschließend wird jedes Gerät in einer 64-Bit-Windows Server 2008 R2-Umgebung getestet. Für Linux verwenden wir die 64-Bit-CentOS 6.2-Umgebung, die jeder Enterprise PCIe Application Accelerator unterstützt. Unser Hauptziel bei diesem Test besteht darin, zu zeigen, wie sich die Betriebssystemleistung unterscheidet, denn wenn ein Betriebssystem auf einem Produktblatt als kompatibel aufgeführt ist, bedeutet dies nicht immer, dass die Leistung aller Betriebssysteme gleich ist.
Für alle getesteten Geräte gelten von Anfang bis Ende dieselben Testrichtlinien. Derzeit werden Geräte für jede einzelne Arbeitslast mithilfe der vom Anbieter bereitgestellten Tools sicher gelöscht und in einen stabilen Zustand mit der gleichen Arbeitslast vorkonditioniert, mit der das Gerät unter hoher Last von 16 Threads mit einer ausstehenden Warteschlange von 16 pro Thread getestet wird Anschließend wurde es in festgelegten Intervallen in mehreren Thread-/Warteschlangentiefenprofilen getestet, um die Leistung bei leichter und starker Nutzung zu zeigen. Bei Tests mit 100 % Leseaktivität erfolgt die Vorkonditionierung mit der gleichen Arbeitslast, jedoch auf 100 % Schreibaktivität umgestellt.
Vorkonditionierung und primäre stationäre Tests:
- Durchsatz (Lese- und Schreib-IOPS-Aggregat)
- Durchschnittliche Latenz (Lese- und Schreiblatenz insgesamt gemittelt)
- Maximale Latenz (Spitzen-Lese- oder Schreiblatenz)
- Latenz-Standardabweichung (Lese- und Schreib-Standardabweichung insgesamt gemittelt)
Derzeit umfasst die Enterprise Synthetic Workload Analysis vier gängige Profile, die versuchen können, reale Aktivitäten abzubilden. Diese wurden ausgewählt, um eine gewisse Ähnlichkeit mit unseren früheren Benchmarks sowie eine gemeinsame Grundlage für den Vergleich mit weithin veröffentlichten Werten wie der maximalen Lese- und Schreibgeschwindigkeit von 4K sowie der üblicherweise für Unternehmenslaufwerke verwendeten 8K 70/30 zu bieten. Wir haben auch zwei ältere gemischte Workloads integriert, darunter den traditionellen Dateiserver und den Webserver, die eine breite Mischung an Übertragungsgrößen bieten. Die letzten beiden werden durch Anwendungsbenchmarks in diesen Kategorien ersetzt, sobald diese auf unserer Website eingeführt werden, und durch neue synthetische Workloads ersetzt.
- 4K
- 100 % Lesen oder 100 % Schreiben
- 100 % 4K
- 8K 70/30
- 70 % lesen, 30 % schreiben
- Dateiserver
- 80 % lesen, 20 % schreiben
- 10 % 512b, 5 % 1, 5 % 2, 60 % 4, 2 % 8, 4 % 16, 4 % 32, 10 % 64
- Webserver
- 100 % gelesen
- 22 % 512b, 15 % 1, 8 % 2, 23 % 4, 15 % 8, 2 % 16, 6 % 32, 7 % 64, 1 % 128, 1 % 512
Bei unserem ersten Test, der eine 4K-Workload zur Vorkonditionierung zufälliger Schreibvorgänge abdeckt, startet das Micron RealSSD P320h mit Spitzengeschwindigkeiten knapp unter 400 IOPS in unserem Lenovo ThinkServer. Die Leistung pendelte sich etwa nach 200 Minuten auf über 80 IOPS ein, mit einer sehr ähnlichen Leistung zwischen unseren CentOS 6.2- und Windows Server 2008-Testumgebungen.
Betrachtet man die durchschnittliche Latenz über die Dauer unseres 4K-Vorkonditionierungstests, stellte sich heraus, dass sich der P320h bei einer 1T/16Q-Last schnell auf etwas mehr als 16 ms Latenz einstellte, was weit unter dem mit SLC ausgestatteten LSI Nytro WarpDrive liegt.
Beim Vergleich der maximalen Latenz von Windows und Linux über die Dauer unserer Vorkonditionierungsarbeitslast stellten wir fest, dass die Linux-Umgebung die wenigsten Latenzspitzen aufwies, während der Windows-Treibersatz zeitweise auf 1,000 ms schwankte.
Während 1,000-ms-Spitzen beunruhigend sein können, ergibt ein Vergleich der Standardabweichung ein besseres Gesamtbild der Gesamtlatenz über die Dauer des Tests. Im Fall des P320h gelang es ihm trotz seiner höheren Spitzen unter Windows Server 2008 immer noch, unter Linux den zweiten Platz hinter sich selbst zu erreichen.
Nach dem Übergang aus der Vorkonditionierungsphase haben wir eine längere Probe jedes Anwendungsbeschleunigers im 4K-Workload mit einer 16T/16Q-Last genommen. Das Micron RealSSD P320h bot mit Abstand die höchste Leistung, sowohl beim 4K-Random-Read als auch beim Random-Write, wobei der Linux-Treibersatz die Nase vorn hatte. In CentOS haben wir 417 IOPS beim Lesen gemessen, im Vergleich zu „nur“ 378 IOPS in Windows. Die 4K-Zufallsschreibgeschwindigkeit war auf beiden Plattformen konstant und betrug über 202 IOPS.
Angesichts des nahezu unglaublichen Durchsatzes war es keine Überraschung, dass das P320h die niedrigste durchschnittliche Latenz aufwies. Die durchschnittliche Leselatenz lag bei etwas über 0.6 ms, die Schreiblatenz betrug 1.26 ms.
Beim Vergleich der Spitzenlatenz in unserer letzten Stichprobe der 4K-Zufallslese- und -schreibleistung wies die Micron RealSSD P320h sowohl unter Windows als auch unter Linux einige der höchsten 4K-Zufallslesefehler auf. Die zufällige Schreibleistung war stärker aufgeteilt, mit höherer Spitzenlatenz auf der Windows-Seite und niedrigerer Spitzenlatenz auf der Linux-Seite.
Betrachtet man die Gesamtlatenz weiter, so bot die Micron realSSD P320h unter Linux mit Abstand die beständigste zufällige 4K-Leistung, mit ihren Windows-Treibern etwas weniger.
Unser nächster Test verlagert den Fokus auf unsere 8K 70/30-Arbeitslast, bei der der Micron P320h die Gruppe beim Durchsatz erneut mit großem Abstand anführt. In diesem Segment wechselten die Burst-Geschwindigkeiten innerhalb von 30 Minuten nach Beginn des Tests und pendelten sich dann etwa bei der 120-Minuten-Marke in einen stabilen Zustand ein.
Der P320h bot in unserem 8K 70/30-Workload eine sehr niedrige durchschnittliche Latenz, die während der Dauer des Vorkonditionierungsprozesses etwa 1.5 ms betrug. Der Linux-Treibersatz bot einen leichten Vorsprung, aber im Gesamtbild würde man diesen Unterschied kaum bemerken.
Wenn der Fokus von der durchschnittlichen Latenz auf die Spitzenlatenz umgestellt wird, ist ein deutlicher Unterschied zwischen dem Verhalten unter Windows und Linux zu erkennen. Die Windows-Treiber hatten maximale Reaktionszeiten zwischen 1,000 und 1,200 ms, während die Linux-Seite mit etwa 200 ms niedriger war.
Während die Spitzenlatenz die schlechtesten Einzelreaktionszeiten zeigt, befasst sich unser nächster Abschnitt mit der Standardabweichung, um zu sehen, wie sich das Gesamtbild der Latenz während unserer Vorkonditionierungsphase auswirkte. Unter Linux bot der Micron P320h im Vergleich zur Windows-Seite ein viel höheres Maß an Konsistenz. Die Windows-Leistung war zwar weniger konstant, lag aber immer noch im Mittelfeld.
Im Vergleich zur festen maximalen Arbeitslast von 16 Threads und 16 Warteschlangen, die wir im 100 % 4K-Schreibtest durchgeführt haben, skalieren unsere gemischten Arbeitslastprofile die Leistung über eine Vielzahl von Thread-/Warteschlangenkombinationen. In diesen Tests erstrecken wir uns über die Intensität unserer Arbeitsbelastung von 2 Threads und 2 Warteschlangen bis hin zu 16 Threads und 16 Warteschlangen. Der Micron P320h bot bei höheren Warteschlangentiefen einen deutlichen Vorsprung gegenüber den Vergleichsgeräten dieser Gruppe, während er auf der 2T/2Q-Ebene nur minimale Leistung einbüßte. Über das gesamte Spektrum hinweg bot der Linux-Treibersatz in den meisten Bereichen einen geringfügig höheren Durchsatz.
Das Micron RealSSD P320h bot in allen Fällen außer der 2T/2Q-Last die besten Reaktionszeiten in der Gruppe und blieb bei allen außer dem 1T/16Q-Segment unter 16 ms.
Die höheren Reaktionszeiten zeigten sich auf dem P320h unter Windows gegen Mitte des Tests mit mehr als 4 gleichzeitigen Threads. Die Linux-Treiber hielten diese Fehler bei allen Tests außer den effektivsten QD128- und QD256-Tests in Grenzen, bei denen sie fast 200 ms betrugen.
Beim Vergleich der Standardabweichung bot das Micron RealSSD P320h unter Linux die konstanteste Leistung und lag mit seinem Windows-Treibersatz im Mittelfeld.
Die Arbeitslast des Dateiservers stellt ein größeres Übertragungsgrößenspektrum dar, das jedes einzelne Gerät betrifft. Anstatt sich also auf eine statische Arbeitslast von 4 KB oder 8 KB einzulassen, muss das Laufwerk Anforderungen im Bereich von 512 KB bis 64 KB bewältigen. Der Dateiserver-Vorkonditionierungstest war der erste Bereich, in dem der Micron P320h die anderen Modelle bei der Burst-Geschwindigkeit nicht übertraf, obwohl er nach Abschluss des Tests aus dem sicher gelöschten Zustand heraus immer schneller wurde. Zu Beginn waren es weniger als 80 IOPS, nach 100 Minuten überstiegen sie im eingeschwungenen Zustand 120 IOPS. Dies übertraf die bestehenden Modelle in diesem Segment bei weitem.
Betrachtet man die durchschnittliche Latenz, so kam das Micron RealSSD P320h bei einer effektiven Warteschlangentiefe von 256, als es sich dem stabilen Zustand näherte, mit einer durchschnittlichen Reaktionszeit von 2 ms voran.
Als wir uns auf die Spitzenreaktionszeiten konzentrierten, zeigte der Windows-Treibersatz erneut höhere Spitzenreaktionszeiten, die während unseres gesamten Tests bei etwa 1,000 ms lagen. Dies wurde mit dem Linux-Treibersatz verglichen, der einen Spitzenpegel von nicht mehr als 50 ms aufrechterhielt.
Obwohl die Spitzenreaktionszeiten nicht unbedingt gut aussehen, verlagern wir unseren Fokus auf die Standardabweichung, um ein klareres Bild der Gesamtlatenz des Micron P320h zu zeichnen. In diesem Bereich können Sie im Verlauf des Tests beim P320h unter Windows einige Ausreißer erkennen, aber es bleibt immer noch auf einem Niveau, das zu den niedrigsten in der Gruppe zählt.
Nach Abschluss unserer Vorkonditionierungsphase begannen wir mit unseren Primärtests mit einer Belastung zwischen 16T/16Q und 2T/2Q. Das Micron RealSSD P320h startete schnell und führte das Feld mit einem deutlichen Vorsprung an, da die effektive Warteschlangentiefe zunahm. Letztendlich erreichte die Leistung auf unserem Dual-Prozessor-Server einen Spitzenwert von unter 130 IOPS.
Beim Vergleich der durchschnittlichen Latenz bot der P320h seinen höchsten Durchsatz von 130 IOPS bei 16T/4Q mit einer durchschnittlichen Latenz von etwa 0.5 ms, die auf den Ebenen EQD1 und EQD2 auf 128–256 ms anstieg.
Das Bild der maximalen Latenz während des Hauptabschnitts unseres Dateiservertests wies während des Windows-Abschnitts unseres Tests die gleichen 1,000-ms-Blips auf wie bei den vorherigen Tests, wobei die Linux-Treiber viel kürzere Spitzenreaktionszeiten boten.
Beim Vergleich der Standardabweichung der Latenz bot das Micron RealSSD P320h unter Linux die beste Latenzverteilung in der Gruppe und lag unter Windows im Mittelfeld.
Bei unserem letzten synthetischen Workload für ein Webserverprofil, bei dem es sich traditionell um einen 100-prozentigen Lesetest handelt, wenden wir 100-prozentige Schreibaktivität an, um jedes Laufwerk vor unseren Haupttests vollständig vorzukonditionieren. In diesem Test schnitt das Micron RealSSD P320h mit der schnellsten Dauerleistung ab, neu in diesem Test war jedoch der deutliche Unterschied im Durchsatz zwischen den Windows- und Linux-Treibern. Die Linux-Leistung war viel höher und bot eine bessere Burst-Leistung.
Beim Fokussieren auf die durchschnittliche Latenz zeigte der Micron P320h ab etwas mehr als 20 Minuten im Test eine flache Kurve, wobei die Linux-Leistung fast 2 ms Vorsprung hatte.
Im Vergleich zu den gemischten Lese-/Schreib-Workloads in früheren Tests, bei denen es beim P1,000h häufig zu 320-ms-Blips kam, verlief der Webserver-Vorkonditionierungstest im Vergleich viel ruhiger. Trotzdem war die Linux-Seite noch ruhiger und zeigte während des Vorkonditionierungsprozesses keine Latenzausfälle.
Im Vergleich zur Standardabweichung der Latenz in unserer Webserver-Vorkonditionierungsphase bot das Micron RealSSD P320h mit Abstand die konsistenteste Latenz, selbst wenn wir die von den Windows-Treibern beobachteten Fehler mit einbeziehen. Betrachtet man den sehr leichten Latenzanstieg, als sich das Laufwerk dem stabilen Zustand näherte, sehen wir, dass sich die Leistung nach 60 bis 80 Minuten vollständig einpendelte.
Beim Übergang zum Hauptsegment unseres Webservertests mit einem 100-prozentigen Leseprofil lag der Micron P320h immer noch in allen Kategorien an der Spitze, mit Ausnahme der Windows-Leistung im 2T/2Q-Abschnitt unseres Tests. Ein interessanter Aspekt beim Vergleich der Leistung ist, dass die Linux-Seite zwar eine höhere Schreibleistung bot, der Windows-Treibersatz jedoch eine höhere Leseleistung. Dies führte zu einer höheren Windows-Leistung in allen Abschnitten mit einer größeren Warteschlangentiefe und einer viel höheren Höchstgeschwindigkeit (152 gegenüber 170 IOPS).
Die durchschnittliche Latenz des Micron RealSSD P320h blieb in allen Phasen unter 1 ms, außer wenn die effektive Warteschlangentiefe 256 betrug. Wenn wir den Spitzendurchsatz mit der durchschnittlichen Latenz vergleichen, stellen wir fest, dass der Sweet Spot dieser Karte in unserem Webserver-Trace zwischen einer effektiven Warteschlangentiefe von 64 liegt und 128.
Obwohl die Windows-Treiber in puncto Durchsatz und durchschnittlicher Latenz schließlich die Oberhand gewannen, lagen die maximalen Reaktionszeiten in den meisten Abschnitten des Tests immer noch bei nahezu 1,000 ms; Die Linux-Leistung wies keine hohen Latenzspitzen auf
Beim Vergleich der Standardabweichung der Latenz zwischen den Laufwerken in dieser Gruppe bot das Micron RealSSD unter Linux die beste Latenzverteilung, während die Windows-Treiber im Mittelfeld lagen.
Synthetische Workload-Analyse für Unternehmen (mehrere Laufwerke/Netzwerk)
Ausgestattet mit zwei 700 GB Micron RealSSD P320h PCIe-Anwendungsbeschleunigern haben wir eine Testumgebung konfiguriert, die aus einem leistungsstarken Supermicro-Server mit Windows Server 2012 besteht. Diese Testplattform wurde über zwei separate PCIe 3.0 Mellanox InfiniBand-Adapter mit unserem SX6036 IB-Switch verbunden, zu zwei Auf HP Proliant DL380p Gen8-Servern läuft auch Windows Server 2012. Auf dem leistungsstarken Supermicro-Speicherserver haben wir mithilfe von Storage Spaces ein einfaches Speicherarray erstellt, das dann über SMB gemeinsam genutzt wurde. Im Gegensatz zu unseren primären Benchmarks, bei denen die gesamte LBA-Oberfläche des Laufwerks getestet wird, wurden bei diesen Tests zwei über das Stripeset-Volume verteilte 50-GB-Segmente beansprucht, die sowohl lokal als auch über das InfiniBand-Netzwerk getestet wurden.
Nachfolgend haben wir ein Übersichtsvideo unserer InfiniBand-Tests eingefügt:
StorageReview 56Gb/s Enterprise-Testplattform:
Super Mikrocomputer SuperServer 7047R-TXRF
- Super Micro Computer X9DRX+-F
- Zwei Intel E5-2670-CPUs (2.6 GHz, 20 MB Cache)
- Windows Server 2012 DataCenter
- 128 GB RAM (8 GB x 16 Hynix DDR3, 64 GB pro CPU)
- Intel Xeon E5-2640 (6 Kerne, 2.50 GHz, 15 MB, 95 W)
- Windows Server Standard 2012
- Intel C600 Chipsatz
- 64 GB (8 x 8 GB) und 16 GB (4 x 4 GB) 1333 MHz DDR3 registrierte RDIMMs
Mellanox SX6036 56Gb/s InfiniBand-Switch und Hardware
- 36 56-Gbit/s-FDR-Ports
- Passive QSFP-Kupferkabel
- Mellanox ConnectX-3 VPI PCIe 3.0 Twin 56Gb/s InfiniBand-Adapter
Unsere aktuelle InfiniBand-Hochleistungs-Verbindungstestinfrastruktur besteht aus zwei HP Proliant DL380p Gen8-Servern, die mit Mellanox ConnectX-3 VPI PCIe-Adaptern ausgestattet sind und über den 36-Port-56-Gbit/s-IB-Switch von Mellanox verbunden sind. In dieser Umgebung kann das von uns getestete Speichergerät zum I/O-Engpass werden und nicht die Netzwerkausrüstung selbst.
In unserem Abschnitt zum Testen lokaler einfacher Räume und InfiniBand haben wir uns auf eine begrenzte Auswahl an Tests beschränkt und nicht auf unsere vollständige Suite. Um den Vergleich zu erleichtern, haben wir unsere 8K-70/30-Workload verwendet, um den Leistungsunterschied zwischen lokalem Zugriff und der gemeinsamen Nutzung über das Netzwerk zu zeigen.
Wir haben festgestellt, dass sich die Leistung in einer Dual-Card-Umgebung extrem gut skalieren lässt, da wir auf Basis unserer Primärtests eine insgesamt geringere Stellfläche nutzen konnten. Vor Ort haben wir mit zwei Workload-Generator-Sitzungen, die gleichzeitig ausgeführt wurden, um die beiden über das Netzwerk laufenden Server nachzuahmen, eine Leistung von über 490 IOPS in unserem 8K-70/30-Workload gemessen. Bei der Präsentation dieses Single-Striped-Arrays über zwei Freigaben und dem Zugriff darauf über unsere beiden HP Proliant DL380p Gen8-Server sank die Leistung auf 402 IOPS. Wir konnten den Durchsatz in beiden Szenarien mehr als verdoppeln und dennoch eine hervorragende Leistung pro Server aufrechterhalten.
Betrachtet man die durchschnittliche Latenz in unserer Twin-P320h-Umgebung, so gab es einen gewissen Unterschied in der durchschnittlichen Latenz beim Vergleich des lokalen Zugriffs mit dem Remote-Zugriff über InfiniBand, aber die Latenz war immer noch niedriger als das, was wir mit einem P320h in unserem primären Testbett gemessen haben. Angesichts der minimalen Auswirkungen auf die Latenz bei der gemeinsamen Nutzung dieses Geräts mit hohem I/O-Wert zwischen mehreren Systemen öffnet es wirklich die Tür für die gemeinsame Nutzung kostspieliger Hochleistungsressourcen auf mehr als ein System.
Es gab wirklich keinen messbaren Unterschied in der Spitzenlatenz im Vergleich zum lokalen Zugriff mit dem Fernzugriff. Dies ist wichtig, wenn man bedenkt, dass das InfiniBand-Netzwerk die Latenz für Geräte wie PCIe-Anwendungsbeschleuniger nicht wesentlich erhöht.
Ähnlich wie bei der Spitzenlatenz konnten wir keinen erkennbaren Unterschied zwischen der Latenzstandardabweichung feststellen, die lokal in einer Stripeset-Umgebung oder über unser InfiniBand-Netzwerk beobachtet wurde.
Nachdem wir gesehen hatten, dass die 8K 70/30-Leistung bei zwei gleichzeitigen Lasten mit einer effektiven Warteschlangentiefe von jeweils 256 zu einem leichten Leistungsabfall über das Netzwerk im Vergleich zu lokal führt, haben wir unseren Fokus auf eine variierende Arbeitslast zwischen 2T/2Q und 16T/16Q verlagert . Da dies auf zwei Servern oder zwei lokalen Workload-Generatoren gleichzeitig geschah, würde die Gesamtlast 4T/2Q bis zu 32T/16Q betragen. Sowohl der lokale als auch der Netzwerkzugriff auf das Stripeset-P320h-Array boten die gleiche Reaktionsfähigkeit auf eine zunehmende Last. Beide Tests zeigten im gesamten Spektrum nahezu identische Muster, wobei der lokale Zugang die größte Leistung erbrachte.
Die durchschnittliche Latenz im Hauptabschnitt unserer 8K 70/30-Arbeitslast auf der gestreiften P320h-Konfiguration bot eine hervorragende Leistung lokal und über unser Netzwerk. Am beeindruckendsten sind die InfiniBand-Ergebnisse, bei denen jeder Server eine Latenz von weniger als 0.8 ms für mehr als 400,000 IOPS über das Netzwerk verzeichnete.
Der Vergleich der maximalen Latenz im 8K 70/30-Workload mit unserem Dual-P320h-Setup ergab ähnliche Ergebnisse lokal und remote, wobei beide über die Dauer des Tests Ausschläge von über 1,000 ms aufwiesen.
Ähnlich wie bei unseren oben genannten Ergebnissen zur maximalen Latenz gab es kaum einen Unterschied zwischen dem lokalen Zugriff auf das P320h-Array oder der gemeinsamen Nutzung über Windows Storage Space über unser InfiniBand-Netzwerk.
Fazit
Die Micron RealSSD P320h ist einfach ein großartiges Beispiel für gut ausgeführte Technik. Alles, vom Platinendesign und -layout bis hin zum benutzerdefinierten Controller, macht den P320h zu einer echten integrierten Einheit, was selbst im Enterprise-Speicherbereich nicht immer der Fall ist. Micron findet Wege, um im gesamten Laufwerk einen Mehrwert zu schaffen, von der NAND-Management-IP im benutzerdefinierten ASIC bis hin zur tiefstmöglichen NAND-Charakterisierung, die zu maximaler Leistung und Lebensdauer der SLC-Flash-Komponenten führt.
Wenn wir die Leistung des P320h bewerten, schreit das Laufwerk und hält nahezu die Parität zwischen unseren CentOS- und Windows Server-Testumgebungen aufrecht. In Bezug auf seine bessere Umgebung hatte Linux immer die Nase vorn, insbesondere wenn es um optimale Latenz ging. Zu sagen, dass der Micron P320h schnell ist, ist jedoch etwas untertrieben. Es übertraf jede andere Lösung, die wir bisher getestet haben, bei weitem, mit höheren Burst-Geschwindigkeiten als die meisten anderen und einer weitaus besseren Dauerleistung als konkurrierende Lösungen. Was die Reaktionsfähigkeit betrifft, so war die durchschnittliche Latenz tadellos, aber was noch beeindruckender war, war die neue makellose Linux-Leistung mit sehr niedriger Spitzenlatenz und Latenzstandardabweichung. Die Windows-Seite war nicht allzu weit entfernt, obwohl die Spitzenlatenz und die Standardabweichung der Latenz im Vergleich im Mittelfeld lagen.
Was die Kompatibilität betrifft, haben wir festgestellt, dass die Micron RealSSD P320h in einer Unternehmensumgebung einwandfrei funktioniert. Für uns macht es keinen Sinn, dieses erstklassige Unternehmensangebot auf einer Verbraucherplattform zu testen, da es niemals in eine Produktionsumgebung integriert werden würde, die dort läuft. Zu diesem Zweck funktionierte es auf den Tier-320-Servern, auf denen wir es getestet haben, unter mehreren Betriebssystemen ohne Probleme. Wie in unserem Video zu sehen ist, hatte der P7047h auch keine Probleme mit der Konfiguration mit zwei Laufwerken in unserem Supermicro SuperServer 2012R mit Windows Server XNUMX.
Wenn wir uns überhaupt sehr beschweren wollen, dann ist es, dass die Windows-Umgebung einige kleinere Bereiche mit Verbesserungsbedarf hinterlässt, insbesondere da wir die Spitzenlatenz und die Standardabweichung bei allen unseren Arbeitslasten verglichen haben. Selbst mit dieser höheren Latenz übertraf er viele, wenn nicht sogar alle der von uns getesteten PCIe-Anwendungsbeschleuniger, wir sind jedoch der Meinung, dass mit ausgefeilteren Treibern noch etwas Leistung herausgeholt werden könnte. Ein weiterer Bereich mit geringfügigen Kritikpunkten sind die reinen SLC-Produktangebote in nur zwei Kapazitäten. Mitbewerber bieten Laufwerke in MLC oder eMLC an, was einen niedrigeren Einstiegspreis sowie viel größere Kapazitäten ermöglicht; In einigen Fällen über 2 TB auf einer einzelnen Karte. Zugegebenermaßen ist der leseintensive Einstiegsmarkt für Unternehmen nicht das Ziel des P320h, aber mehr Vielfalt für mehr Anforderungen könnte die P320h-Familie vielseitiger machen.
Vorteile
- Der schnellste PCIe-Anwendungsbeschleuniger, den wir bisher getestet haben
- Sehr niedrige Durchschnitts- und Spitzenlatenz
- Hervorragende Leistungsparität in Windows- und Linux-Umgebungen
Nachteile
- Beschränkt auf SLC NAND
- Die Höchstkapazität liegt bei 700 GB
Fazit
Das Micron RealSSD P320h ist ein gut durchdachtes Komplettangebot für Unternehmen, die das Beste aus dem Angebot von PCIe-Speicher wollen. Der P320h ist der Spitzenreiter seiner Klasse und bietet dank Micron-Komponenten und überlegenem geistigem Eigentum für das NAND-Management, das in den Controller integriert ist, eine hervorragende und konsistente Multi-OS-Leistung.
Besprechen Sie diese Rezension