Startseite Unternehmen ScaleFlux CSD 2000-Rezension

ScaleFlux CSD 2000-Rezension

by Adam Armstrong

ScaleFlux ist ein Unternehmen, das sich ausschließlich auf Computational Storage, genauer gesagt auf Computational Storage im großen Maßstab, konzentriert. Dies gelingt dem Unternehmen vor allem mit seinen ScaleFlux Computational Storage Drives (CSD). Wie der Name schon vermuten lässt, handelt es sich bei der CSD um eine NVMe-SSD mit integrierter Rechen-Engine, die die Laufwerks- und Systemleistung verbessern kann. Aber Computerspeicher bedeutet viele verschiedene Dinge, je nachdem, mit wem Sie sprechen. In diesem Testbericht bekommen wir mit dem ScaleFlux CSD 2000 einen Vorgeschmack auf die Perspektive von ScaleFlux.

ScaleFlux ist ein Unternehmen, das sich ausschließlich auf Computational Storage, genauer gesagt auf Computational Storage im großen Maßstab, konzentriert. Dies gelingt dem Unternehmen vor allem mit seinen ScaleFlux Computational Storage Drives (CSD). Wie der Name schon vermuten lässt, handelt es sich bei der CSD um eine NVMe-SSD mit integrierter Rechen-Engine, die die Laufwerks- und Systemleistung verbessern kann. Aber Computerspeicher bedeutet viele verschiedene Dinge, je nachdem, mit wem Sie sprechen. In diesem Testbericht bekommen wir mit dem ScaleFlux CSD 2000 einen Vorgeschmack auf die Perspektive von ScaleFlux.

ScaleFlux CSD 2000

Was ist Computerspeicher?

Tatsächlich schreiben wir hier bei StorageReview schon seit mehreren Jahren über Computational Storage. Kurz gesagt bedeutet Computational Storage, dass Rechenressourcen (die nicht zur Rechen- und/oder Speicherarchitektur des Systems gehören) im Speicher selbst untergebracht werden.

Manchmal werden diese Rechenressourcen auch zwischen Host und Speicher platziert. Dies kann die Datenbewegung reduzieren, die Rechenressourcen des Systems entlasten und möglicherweise die Leistung oder zumindest die Leistungskonsistenz steigern. Da es viele Anbieter im Bereich Computational Storage gibt, ist es wichtig zu verstehen, dass der Begriff „Computational Storage“ je nach Produkt sehr unterschiedliche Bedeutungen haben kann.

ScaleFlux CSD 2000 und Computational Storage

ScaleFlux CSD zeichnet sich durch die Einführung von Datenpfad-Komprimierungs-/Dekomprimierungs-Engines aus. Nach Angaben des Unternehmens kann dadurch die Kapazität effektiv vervierfacht und die Leistung verdoppelt werden. Dies setzt natürlich voraus, dass die Daten komprimierbar sind, was für die gute Funktion dieser Plattform von grundlegender Bedeutung ist. Wenn die Bedingungen stimmen, wird die effektive Kapazität zum starken Verkaufsargument.

ScaleFlux CSD 2000 zurück

Es gibt auch ein Kosten- und Dichteargument. ScaleFlux geht davon aus, dass Unternehmen durch die Komprimierung von Daten und die effektivere Kapazitätsverrechnung bis zu 50 % der Flash-Kosten einsparen können. Dank der Komprimierung können sie auch „mehr“ Flash im selben Steckplatz bieten.

Kosten und Effizienz bedeuten wenig ohne Leistung, die laut ScaleFlux im Vergleich zu herkömmlichen SSDs verdoppelt werden kann? Das Laufwerk ist sowohl als Data Center- als auch als Data Scale-Version erhältlich, aber schauen wir uns hier die Spitzenwerte an. Die Höchstzahl bei einer 1:1-Datenkomprimierung beträgt 750 IOPS beim 4K-Lesen und 490 IOPS beim 4K-Schreiben für eine 2:1-Datenkomprimierung. Für sequentielle Geschwindigkeiten wird angegeben, dass das Laufwerk bei beiden Komprimierungen 3 GB/s und bei 2.3:1-Komprimierung bis zu 1 ​​GB/s beim Schreiben erreicht.

Ein paar weitere Unterschiede zum CSD bestehen darin, dass er über abstimmbares FTL/FM verfügt, was es Benutzern ermöglicht, Leistung und Preis pro GB zu optimieren. Bei hoher Leistung kann es zu Leistungs- und Temperaturproblemen kommen. Diese können jedoch gedrosselt werden, um eine Überhitzung zu vermeiden. Datenschutz scheint nicht mehr in aller Munde zu sein, und in diesem Zusammenhang fordert der CSD einen durchgängigen Datenschutz und ECC für alle internen Speicher im Datenpfad sowie Schutz vor Stromausfällen.

Um mit ScaleFlux an dieser CSD-Aktion teilzunehmen, gibt es einige Nachteile. Zum einen handelt es sich bei dem Laufwerk, das wir testen, um ein Laufwerk der 3. Generation, zu einer Zeit, in der herkömmliche SSDs auf PCIe der 4. Generation migriert wurden. Dies ist ein lösbares Problem. Ein weiterer Knaller ist, dass die Treiberunterstützung derzeit auf Linux beschränkt ist. Windows und VMware sind out. Lokalisierte Virtualisierung wäre ein interessanter Anwendungsfall und bietet Vorteile bei der Datenreduzierung. Es ist zu hoffen, dass es noch mehr Unterstützung auf breiterer Basis geben wird.

ScaleFlux CSD 2000-Schlüsselspezifikationen

Formfaktoren PCIe AIC und 2.5 Zoll U.2
Schnittstelle PCIe Gen3 x4 Blockspeichergerät mit geringer Latenz
NAND-Medien 3D-TLC und 3D-QLC
Schutz vor Stromausfall Ja
Datenschutz
  • End-to-End-Schutz
  • ECC für alle Erinnerungen
  • Vollständiger Datenpfad-CRC
  • LDPC- und RAID-Schutz auf Die-Ebene
Power
  • 18 Watt typisch aktiv
  • Maximal 25 W
  • 12 W im Leerlauf (keine Ausgangslatenz)
Umgebungstemperaturbereich 50°C bei 200LFM (AIC) 35°C bei 200LFM (U.2)
Temperaturschutz Thermische Drosselung aktiviert
MTTF 2 Millionen Stunden
Rechenfähigkeit
  • Transparente Datenpfadkomprimierung
  • Beschleunigte Leistung
  • Erweiterte Kapazität
Software-Kompatibilität Nur Linux OS 2.6 Kernel oder höher

  • Repository-Unterstützung: Ubuntu 16/18/20, RedHat/CentOS 6/7/8

Komprimierung mit ScaleFlux

Von Anfang an wollten wir einen Überblick darüber bekommen, wie die Komprimierung implementiert wird. Um mit Linux zu beginnen, müssen Sie den benutzerdefinierten Treiber laden, um das Laufwerk anzuzeigen und mit ihm zu interagieren. Dabei handelt es sich um einen Zweig des allgemeinen nvme-cli-Toolsets. Auf diese Weise können Sie das Laufwerk so anzeigen, wie es ist, es formatieren sowie interagieren und/oder die nutzbare Kapazität basierend auf dem aktuellen Datensatz ändern. Nachfolgend finden Sie ein kurzes Beispiel der Ausgabe vor und nach unserem Workload-Test. Der erste Befehl von „sfx-nvme list“ zeigt das installierte Laufwerk.

root@storagereview:~# sfx-nvme list
Node SN Model Namespace Usage Format FW Rev BUS:slot:func
/dev/sfdv0n1 UC1945A7112M CSDU3RF040B1 1 3.20 TB / 3.20 TB 512 B + 0 B 4870 0000:d8:00.0

Nach unserer ersten Benchmark-Runde mit vollständig inkomprimierbaren Daten (unserem normalen Arbeitsdatensatz) sehen wir, dass das Laufwerk ein Komprimierungsverhältnis von 1.00 aufweist.

root@storagereview:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
freier_Speicherplatz, physische_Größe, logische_Größe, Comp_Ratio, Provisioned_Cap, Space_Flag
2736 6251231232 6251231312 1.00 6251233968 0

Als nächstes haben wir die vdbench-Komprimierungsstufe auf 4x umgestellt, damit das Laufwerk einen Teil seiner Magie hinter den Kulissen entfalten kann. Nachdem dies abgeschlossen ist und wir die SSD erneut abgefragt haben, sehen wir die erhöhte Größe und das Komprimierungsverhältnis von 4.10. Die gute Nachricht ist also, dass die Laufwerke mit dieser grundlegenden Bereinigung das tun, was sie angeblich tun, was die Komprimierungsfunktionalität betrifft.

root@storagereview:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
freier_Speicherplatz, physische_Größe, logische_Größe, Comp_Ratio, Provisioned_Cap, Space_Flag
4728607824 1522626144 6251231312 4.10 6251233968 0

ScaleFlux CSD 2000 Leistung

VDBench-Workload-Analyse

Wenn es um das Benchmarking von Speichergeräten geht, sind Anwendungstests am besten und synthetische Tests stehen an zweiter Stelle. Obwohl sie keine perfekte Darstellung der tatsächlichen Arbeitslasten darstellen, helfen synthetische Tests dabei, Speichergeräte mit einem Wiederholbarkeitsfaktor zu vergleichen, der es einfach macht, direkte Vergleiche zwischen konkurrierenden Lösungen anzustellen.

Diese Workloads bieten eine Reihe unterschiedlicher Testprofile, die von „Vier-Ecken“-Tests über allgemeine Tests der Datenbankübertragungsgröße bis hin zu Trace-Erfassungen aus verschiedenen VDI-Umgebungen reichen. Alle diese Tests nutzen den gemeinsamen vdBench-Workload-Generator mit einer Skript-Engine, um Ergebnisse über einen großen Computing-Testcluster zu automatisieren und zu erfassen. Dadurch können wir dieselben Arbeitslasten auf einer Vielzahl von Speichergeräten wiederholen, einschließlich Flash-Arrays und einzelnen Speichergeräten.

Unser Testprozess für diese Benchmarks füllt die gesamte Laufwerksoberfläche mit Daten und partitioniert dann einen Laufwerksabschnitt, der 25 % der Laufwerkskapazität entspricht, um zu simulieren, wie das Laufwerk auf Anwendungsauslastungen reagieren könnte. Dies unterscheidet sich von vollständigen Entropietests, die 100 % des Antriebs nutzen und ihn in einen stabilen Zustand versetzen. Infolgedessen spiegeln diese Zahlen höhere Dauerschreibgeschwindigkeiten wider.

Profile:

  • 4K Random Read: 100 % Read, 128 Threads, 0-120 % Iorate
  • 4K Random Write: 100 % Schreiben, 64 Threads, 0-120 % Iorate
  • 64K sequentielles Lesen: 100 % Lesen, 16 Threads, 0-120 % Leserate
  • 64K Sequentielles Schreiben: 100 % Schreiben, 8 Threads, 0-120 % Iorate
  • Synthetische Datenbank: SQL und Oracle
  • VDI-Vollklon- und Linked-Clone-Traces

Zum Vergleich schauen wir uns die ScaleFlux SSD an, wobei VDBench inkompressible Daten und 4x komprimierbare Daten sendet. Bei zufälligem 4K startete der inkompressible CSD unter 100 µs und erreichte einen Spitzenwert von 588,893 IOPS mit einer Latenz von 216 µs. Mit Komprimierung war das Laufwerk mit einem Spitzenwert von 573,460 IOPS bei einer Latenz von 222 µs nur geringfügig langsamer.

ScaleFlux CSD 2000 4k gelesen

Beim zufälligen 4K-Schreiben erreichte das inkompressible Laufwerk seinen Spitzenwert bei etwa 355 IOPS bei etwa 325 µs, bevor es etwas abfiel. Mit der Komprimierung blieb das Laufwerk größtenteils unter 100 µs mit einem Spitzenwert von etwa 572 IOPS und einer Latenz von 168 µs.

Bei der Umstellung auf sequenzielle 64-KB-Workloads erreichte das inkomprimierbare Laufwerk beim Lesen einen Spitzenwert von 33,785 IOPS oder 2.11 GB/s bei einer Latenz von 473 µs. Bei der Komprimierung erreichte das Laufwerk 47,489 IOPS oder 2.97 GB/s bei einer geringeren Latenz von 336 µs.

ScaleFlux CSD 2000 64k gelesen

Beim 64K-Schreiben liefen beide Konfigurationen für einen großen Teil des Tests unter 100 µs. Die inkomprimierbare Konfiguration erreichte einen Spitzenwert von 24,074 IOPS oder 1.5 GB/s bei einer Latenz von 643 µs. Bei 4-facher Komprimierung sahen wir einen Spitzenwert von 36,364 IOPS oder 2.27 GB/s bei einer Latenz von 397 µs.

ScaleFlux CSD 2000 sql

Unsere nächste Testreihe sind unsere SQL-Workloads: SQL, SQL 90-10 und SQL 80-20. Beginnend mit SQL waren beide Datenkonfigurationen sehr ähnlich. Das inkompressible Gerät erreichte einen Spitzenwert von 188,269 IOPS und einer Latenz von 167 µs, während die komprimierten Daten, die an das Laufwerk gesendet wurden, einen Spitzenwert von 190,370 IOPS mit einer Latenz von ebenfalls 167 µs erreichten.

In SQL 90-10 erreichte der inkompressible ScaleFlux CSD 2000 einen Spitzenwert von 185,310 IOPS mit einer Latenz von 172 µs. Bei 4-facher Komprimierung des Laufwerks wurde ein Spitzenwert von 220,615 IOPS und eine Latenz von 144 µs erreicht.

SQL 80-20 hatte den Spitzenwert des inkompressiblen Laufwerks bei 179,482 IOPS mit einer Latenz von 177 µs. Bei der Komprimierung zum CSD sahen wir einen Spitzenwert von 221,851 IOPS bei einer Latenz von 143 µs.

Als nächstes folgen unsere Oracle-Workloads: Oracle, Oracle 90-10 und Oracle 80-20. Beginnend mit Oracle erreichte das Inkompressible einen Spitzenwert von 184,048 IOPS und einer Latenz von 194 µs. Bei der Betrachtung des Laufwerks mit Komprimierung sahen wir einen Spitzenwert von 245,385 IOPS und eine Latenz von 135 µs.

ScaleFlux CSD 2000 Orakel

Bei Oracle 90-10 waren beide anfangs in Bezug auf Leistung und Latenz nahezu gleich. Die inkompressible Version erreichte einen Spitzenwert von 155,641 IOPS bei einer Latenz von 141 µs. Die Komprimierungsversion erreicht einen Spitzenwert von 175,681 IOPS bei einer Latenz von 125 µs.

Oracle 80-20 Booth-Laufwerkskonfigurationen starteten mit weniger als 100 µs. Bei inkompressiblen Daten lag der Spitzenwert für die Latenz bei 151,983 IOPS bei 144 µs. Mit komprimierten Daten sahen wir eine Spitzenleistung von 182,640 IOPs mit einer Latenz von 120 µs.

Als nächstes wechselten wir zu unserem VDI-Klontest „Full and Linked“. Beim VDI Full Clone (FC) Boot, dem ScaleFlux CSD 2000 ohne inkomprimierbare Daten, erreichte das Laufwerk einen Spitzenwert von 127,616 IOPS bei einer Latenz von 263 µs. Durch das Senden der 4-fachen Komprimierung stieg die Leistung auf bis zu 161,543 IOPS mit 216 µs Latenz.

ScaleFlux CSD 2000 vdi fc-Boot

Beim ersten Login mit VDI FC erreichten wir Spitzenwerte von 78,125 IOPS bei 379 µs mit inkomprimierbaren Daten und 154,077 IOPS bei 189 µs mit komprimierten Daten.

Für VDI FC Monday erreichte das inkompressible Laufwerk einen Spitzenwert von 62,922 IOPS mit einer Latenz von 251 µs. Bei 4-facher Komprimierung gab es einen deutlich höheren Spitzenwert von 100,680 IOPS bei einer Latenz von nur 156 µs.

Beim VDI Linked Clone (LC) Boot erreichten die inkomprimierbaren Daten zum Laufwerk einen Spitzenwert von 58,705 IOPS bei einer Latenz von 271 µs. Als wir die 4-fache Komprimierung an das Laufwerk schickten, erreichte sie einen Spitzenwert von 81,137 IOPPS und eine Latenz von 196 µs.

ScaleFlux CSD 2000 vdi LC-Boot

Beim ersten Login von VDI LC erreichte das Laufwerk mit inkomprimierbaren Daten eine Spitzenleistung von 36,537 IOPS bei einer Latenz von 215 µs. Als die vierfach komprimierten Daten das Laufwerk erreichten, erreichten sie einen Spitzenwert von 4 IOPS und einer Latenz von 56,739 µs.

Schließlich erreichte das inkompressible Laufwerk mit VDI LC Monday Login einen Spitzenwert von 48,814 IOPS bei einer Latenz von 323 µs. Mit Komprimierung erreichte die SSD einen Spitzenwert von 81,799 IOPS bei einer Latenz von 192 µs.

Schlussfolgerung

ScaleFlux konzentriert sich ausschließlich auf Computerspeicher. Dies geschieht hauptsächlich über seine SSDs, bekannt als ScaleFlux Computational Storage Drives (CSD). Dabei handelt es sich um PCIe-Gen3-SSDs mit Rechen-Engines zur Verbesserung der Leistung und Dateneffizienz. Das Unternehmen verfügt über eine Handvoll verschiedener Laufwerke, aber für diesen Test haben wir uns das ScaleFlux CSD 2000 angesehen.

Der Hauptunterschied zwischen dem ScaleFlux-Laufwerk und anderen Rechenspeichern ist die Datenpfad-Komprimierungs-/Dekomprimierungs-Engine. ScaleFlux gibt dank seiner Rechentechnologie eine Vervierfachung der Kapazität bei gleichzeitiger Verdoppelung der Leistung an. Dies beeinträchtigt nicht nur die Leistung, sondern könnte angesichts der Speichereffizienz bei stark komprimierbaren Daten auch die Kosten pro TB SSD-Speicher senken.

Die Hauptsorge ist dann, ob die Kompressionsmaschine funktioniert. Das war ein einfaches Ja, da wir die Komprimierung in unseren Tests von Anfang an manipuliert haben. Wir begannen mit völlig inkomprimierbaren Daten und sahen erwartungsgemäß ein Verhältnis vom Laufwerk von 1:1. Durch die Umstellung auf ein 4-faches Komprimierungsverhältnis erreichten wir eine Komprimierungsrate von 4.1:1 auf dem Laufwerk. Der kritische erste Schritt wurde mit einem Häkchen versehen, bevor die Leistung betrachtet wurde.

Schauen wir uns zunächst das Laufwerk an, ohne dass inkompressible Daten an es gesendet werden. Zu den Highlights zählen 589 IOPS beim 4K-Lesen, 355 IOPS beim 4K-Schreiben, 2.11 GB/s beim 64K-Lesen und 1.5 GB/s beim 64K-Schreiben. In SQL sahen wir Spitzenwerte von 188 IOPS, 185 IOPS in SQL 90–10 und 179 IOPS in SQL 80–20. Bei unseren Oracle-Workloads verzeichneten wir Spitzenwerte von 184 IOPS, 156 IOPS in Oracle 90–10 und 152 IOPS in Oracle 80–20. Bei unseren VDI-Klontests lieferte uns der CSD 2000 ohne Komprimierung 128 IOPS beim Booten, 78 IOPS beim ersten Login und 63 IOPS beim Montag-Login für den vollständigen Klon. Für Linked Clone lieferte uns das Laufwerk 59 IOPS beim Booten, 37 IOPS bei der ersten Anmeldung und 49 IOPS bei der Anmeldung am Montag.

Nachdem wir vierfach komprimierte Daten gesendet hatten, waren wir angenehm überrascht, den Leistungssprung in jedem Test zu sehen, außer beim 4K-Lesen, wo die Unterschiede nicht so weit auseinander lagen. Zu den Highlights zählen 4 IOPS beim 573K-Lesen, 4 IOPS beim 572K-Schreiben, 4 GB/s beim 2.97K-Lesen und 64 GB/s beim 2.27K-Schreiben. In SQL sahen wir Spitzenwerte von 64 IOPS, 190 IOPS in SQL 221–90 und 10 IOPS in SQL 222–80. Bei Oracle sahen wir Spitzenwerte von 20 IOPS, 245 IOPS in Oracle 176-90 und 10 IOPS in Oracle 183-80. Bei unseren VDI-Klontests lieferte uns ScaleFlux mit Komprimierung 20 IOPS beim Booten, 162 IOPS bei der ersten Anmeldung und 154 IOPS bei der Montaganmeldung für den vollständigen Klon. Für Linked Clone lieferte uns das Laufwerk 101 IOPS beim Booten, 81 IOPS bei der ersten Anmeldung und 57 IOPS bei der Anmeldung am Montag.

Der ScaleFlux CSD 2000 ist wirklich ein interessantes Produkt und deutet auf eine mögliche Umwälzung im traditionellen SSD-Bereich hin, da die Rechenspeicherung auf dem Vormarsch ist. CSD gibt es schon seit vielen Jahren, das Konzept ist also nicht neu. Was wahrscheinlich fehlt, ist die Umsetzung. ScaleFlux seinerseits ist der erste CSD-Mitarbeiter, der etwas in unser Labor bekommt. Das Selbstvertrauen alleine reicht jedoch nicht aus, der Antrieb muss Leistung erbringen.

In diesem Fall besteht die Leistung nicht nur aus den Zahlen, die Sie in unseren Diagrammen sehen, obwohl es dort ganz gut geklappt hat. Der Beweis für dieses SSD-Pudding liegt in seiner Fähigkeit, mit komprimierbaren Daten gut zu arbeiten. Es macht dies genau wie in unseren Tests erwartet und liefert sogar in allen Testprofilen bis auf ein leichtes Leistungsplus. Damit diese SSD sinnvoll ist, muss der Anwendungsfall lediglich angepasst werden. Komprimierbare Daten werden zweifellos stark von der ScaleFlux-Technologie profitieren. Solange Sie derzeit keine VMware- oder Windows-Virtualisierungsunterstützung benötigen, lohnt es sich auf jeden Fall, den CSD 2000 in einem PoC zu erkunden, um zu sehen, wie viel Ihr Workload davon profitieren kann.

ScaleFlux

Planen Sie einen PoC mit ScaleFlux

Beteiligen Sie sich an StorageReview

Newsletter | YouTube |  LinkedIn | Instagram | Twitter | Facebook | TikTokRSS Feed