Home Enterprise Prestaties en veerkracht: Graid SupremeRAID voor AI- en HPC-workloads

Prestaties en veerkracht: Graid SupremeRAID voor AI- en HPC-workloads

by Kevin OBrien

Graid Technology stelt nieuwe normen voor gegevensbescherming en prestaties met SupremeRAID, met name voor AI- en HPC-workloads.

SupremeRAID van Graid Technology blijft het opslaglandschap herdefiniëren door nieuwe normen voor gegevensbescherming en prestaties te stellen, met name voor moderne workloads zoals AI en High-Performance Computing (HPC). Traditionele RAID-configuraties hebben vaak moeite om te voldoen aan de eisen van deze data-intensieve omgevingen, vooral wanneer ze afhankelijk zijn van hardware-RAID-kaarten die worden beperkt door de beperkingen van de PCIe-bus. Graid maakt gebruik van GPU-versnelling en doorbreekt deze barrières, levert uitzonderlijke prestaties met minimale impact op CPU-bronnen en zorgt tegelijkertijd voor robuuste RAID-bescherming.

Graid SupremeRAID voor AI en HPC

Gigabyte S183-SH0-AAV1-server

Bij geavanceerde workloads zoals AI en HPC worden alternatieve configuraties zoals JBOD (Just a Bunch of Disks) en software RAID (mdadm) ook vaak gebruikt. Hoewel praktisch in combinatie met checkpointing om dataverlies te voorkomen, introduceert JBOD meer punten van falen en belast IT-beheerders met uitdagende herstelprocessen. Software RAID biedt dataveerkracht, maar put waardevolle CPU-bronnen uit om RAID-pariteitsdata te beheren en presteert op veel gebieden ondermaats. Graid's SupremeRAID biedt daarentegen een gestroomlijnde, krachtige oplossing die databeheer vereenvoudigt zonder in te leveren op snelheid of betrouwbaarheid.

Graid SupremeRAID-kaart

In dit artikel wordt een prestatievergelijking uitgevoerd tussen SupremeRAID, JBOD en software-RAID van Graid. Hieruit blijkt waarom Graid de beste keuze is voor IT-omgevingen waar prestaties en gegevensbescherming van het grootste belang zijn.

Prestatietestbed

We gebruikten de Gigabyte S183-SH0-AAV1 dual Intel 5th Gen Scalable 1U server voor deze testbed. We wilden een compacte server met veel rekenkracht vinden, en het gebeurde zomaar dat de server 32 E1.S SSD's ondersteunt, het maximum van wat wordt ondersteund met een enkele Graid SupremeRAID SR-1010. De Gigabyte server heeft 32 DIMM-slots, met 96GB RDIMM en 256GB 3DS RDIMM-ondersteuning. Dit platform biedt drie FHHL PCIe Gen5-slots aan de achterkant, wat veel opties biedt voor snelle netwerkconnectiviteit. Daarnaast biedt het moederbord dual 1GbE onboard networking en een 1GbE-beheerpoort.

Graid HPC DRAM

Kingston 96GB DDR5-5600 ECC RDIMM

De server ondersteunt 32 DIMM-slots, maar in dit geval hebben we 16 Kingston DIMM's, 1 DIMM per kanaal (1DPC) voor maximale DRAM-snelheid geplaatst. Mocht de workload een grotere footprint vereisen, dan is het mogelijk om over te stappen op DIMM's met hogere dichtheid of een 2DPC-configuratie, maar de laatste verlaagt de DRAM-snelheid tot 4400MT/s. De Kingston 96GB DDR5-5600 ECC RDIMM's in deze server bieden een uitstekende mix van prestaties per dollar, waardoor ze een aantrekkelijke optie zijn voor workloads die high-speed DRAM en een redelijke DRAM-footprint nodig hebben zonder de meerprijs van 128 GB DIMM's. Deze modules bieden het beste van twee werelden voor intensieve HPC- en AI-workloads. 

KIOXIA 7.68TB XD7P SSD's

De 32 E1.S SSD-bays worden gevuld door KIOXIA 7.68TB XD7P SSD's. De drives gebruiken een PCIe Gen4 x2-interface en leveren een maximale bandbreedte van 7.2 GB/s lezen en 4.8 GB/s schrijven. KIOXIA heeft deze drives speciaal ontworpen voor intensieve hyperscale- en HPC-workloads, waarbij de dichtheidsvoordelen van E1.S SSD's gunstig zijn. Belangrijk is dat KIOXIA ervoor heeft gezorgd dat het thermische ontwerp van de XD7P klaar is om gelijke tred te houden met dit dichte serverontwerp, zelfs onder zware belasting.

Gigabyte S183-SH0-AAV1 Server Achter I/O

Testsysteem specificaties

  • Gigabyte S183-SH0-AAV1-server
  • 2 x Intel Xeon Platinum 8592+ CPU's (64 cores, 1.9 GHz)
  • 16 x 96 GB Kingston DDR5-5600
  • 32 x KIOXIA XD7P 7.68TB E1.S SSD's
  • Graid SupremeRAID SR-1010
  • Ubuntu 22.04.4-server

Resultaten van prestatietesten

HPC-workloads kunnen dagen, weken of maanden achtereen werken en zonder veerkrachtige backend-opslag kan een enkele schijfstoring deze taken terug naar af dwingen. Om de impact van Graid op zowel veerkracht als prestaties voor HPC- en Ai-workloads te evalueren, kijken we naar de prestaties van de interne opslagbenchmark van y-cruncher. Het doel is om verschillende opslagconfiguraties, JBOD, software RAID en Graid SupremeRAID te vergelijken om hun impact op CPU-intensieve workloads te begrijpen.

RAID-configuratie

We weten dat mdadm software RAID een substantiële schrijfhit voor pariteitsgegevens ziet. Hoewel RAID10 hogere prestaties zou behalen, zou het ook de bruikbare capaciteit aanzienlijk verminderen. Om de software RAID5-prestaties het beste te optimaliseren, hebben we twee RAID5-pools geconfigureerd, verdeeld over SSD's 0-15 en 16-31. Dit bracht ze in evenwicht over beide CPU's.

De Graid-vergelijking was ook afgestemd op het gebruik van twee RAID5-pools, met een gelijke verdeling van de helft van de SSD's op CPU0 en de andere helft op CPU1 voor NUMA-balancering. We hebben getest met één volume op elke RAID5-pool en twee volumes per RAID5-pool.

Elke schijf wordt afzonderlijk toegewezen in de JBOD-configuratie, waardoor een gelijkmatige NUMA-balans wordt gegarandeerd.

We konden hardware RAID niet opnemen in dit rapport omdat de manier waarop de schijven in deze server zijn bekabeld ervoor zorgt dat traditionele hardware RIAD-kaarten niet worden ondersteund. Het is echter vermeldenswaard dat zelfs als we dat konden, het beste scenario zou zijn om de bandbreedtelimiet van een PCIe Gen4 x16-slot voor een enkele kaart te bereiken, rond de 28 GB/s.

software Configuration

Voor deze verschillende opslagscenario's hebben we gebruik gemaakt van y-cruncher's interne prestatietesttool. De testresultaten zijn onderverdeeld in sequentiële lees- en schrijfprestaties, reken-I/O-snelheid, schijf-I/O-snelheid en de verhouding van schijf-I/O-snelheid tot rekensnelheid. We hebben deze tool geselecteerd omdat deze tegelijkertijd de CPU, het geheugen en de schijf-I/O belast. Hoewel deze geen enkele specifieke werklast vertegenwoordigt, hebben we ontdekt dat de gegenereerde gegevens nauw samenhangen met de algehele systeemprestaties onder I/O-intensieve toepassingen. Met name de I/O-test omvat daadwerkelijke gegevensverwerking in plaats van alleen bits zo snel mogelijk door een interface te pushen, waardoor het een nauwkeurigere weerspiegeling is van de systeemprestaties onder echte belasting.

Sequentiële lees- en schrijfprestaties geven de ruwe snelheid van de disk array aan. Rekensnelheid is de snelheid waarmee de CPU gegevens verwerkt, terwijl schijf-I/O-snelheid aangeeft hoe snel gegevens naar de CPU kunnen worden gestreamd terwijl berekeningen worden uitgevoerd. Werklasten die naar schijf gaan, hebben een schijf-I/O-snelheid nodig die hoger is dan de rekensnelheid om niet te worden vertraagd. Als deze verhouding kleiner is dan 1.0, is de schijf een knelpunt, terwijl boven 1.0 de CPU een knelpunt is. y-cruncher voor grote werklasten presteert het beste wanneer de verhouding 2.0 of hoger is.

Opslagconfiguratie Sequentieel lezen GB/s Sequentieel schrijven GB/s Berekening GB/s Schijf I/O GB/s Verhouding
Directe JBOD 102 102 18.4 81.5 4.42
Graid RAID5 x 2 2VD 64.3 43.8 23.1 70.4 3.05
Graid RAID5 x 2 4VD 85.2 73.7 22.1 69.4 3.14
SW RAID5 x 2 122 3.6 25.7 10.9 0.42

Met directe JBOD naar 32 individuele E1.S SSD's zag y-cruncher een prestatie van 102 GB/s lezen en 102 GB/s schrijven met zijn interne stripingproces. Dit is over het algemeen de hoogste prestatie die y-cruncher voor dit platform zal zien, hoewel de afweging geen datapariteit is. Toen de configuratie werd overgeschakeld naar software RAID5-volumes (verspreid over beide CPU's) met mdadm, daalde de sequentiële prestatie tot slechts 3.6 GB/s schrijven en 122 GB/s lezen. Graid met twee RAID5-pools en twee volumes mat 64.3 Gb/s lezen met schrijfprestaties van 43.8 GB/s. Door dat te splitsen in twee RAID5-pools maar met vier volumes zag Graid een toename in bandbreedte tot 85.2 GB/s lezen en 73.7 GB/s schrijven.

Nu de bandbreedtenummers zijn aangepakt en het spectrum van opslagconfiguratieopties is begrepen, gaan we dieper in op de impact van deze beslissing op de applicatie. De verhouding van berekening tot schijf-I/O-bandbreedte zag de hoogste verhouding van 4.43 van de JBOD-configuratie. Software RAID5 was een schamele 0.42, terwijl Graid RAID5 3.05 was met 2VD's en 3.14 met 4VD's.

In dit y-cruncher voorbeeld, dat alle prestatiemogelijkheden van de server omvat, is een ratio van 2.0 of hoger vereist voor optimale prestaties. Hoewel de JBOD-configuratie de beste algehele resultaten oplevert, gaat dit ten koste van pariteitsgegevens, wat betekent dat een storing van een schijf, zelfs voor een moment, gegevensverlies betekent. Aan de andere kant kan software-RAID gegevensbeschikbaarheid en een hogere leessnelheid bieden dan JBOD, maar de schrijfbewerkingen lijden er zo ernstig onder dat de schijf-I/O de CPU niet kan bijhouden, wat resulteert in het vreselijke resultaat van .42.

Deze twee datapunten zijn cruciaal om het voordeel te begrijpen dat Graid SupremeRAID deze workloads biedt. Voor dit use case liggen de totale prestatiecijfers tussen JBOD en software RAID, maar raw I/O is niet het complete verhaal. Dit voorbeeld laat zien dat Graid meer dan de vereiste applicatieprestaties kan leveren en tegelijkertijd databeschikbaarheid kan bieden. Deze combinatie betekent dat organisaties die Graid gebruiken RAID-beveiliging, opslag en applicatieprestaties kunnen verwachten met een niet-blokkerende architectuur die ver uitstijgt boven wat een traditionele RAID-kaart zou kunnen bieden.

Conclusie

Graid Technology's SupremeRAID verlegt consequent de grenzen van gegevensbescherming en prestaties en zet een nieuwe standaard in de industrie. Door de kracht van GPU-versnelling te benutten, levert Graid ongeëvenaarde snelheid en efficiëntie in RAID-configuraties, waardoor de CPU-belasting aanzienlijk wordt verminderd en de doorvoer wordt gemaximaliseerd.

De gegevens die we voor dit rapport hebben verzameld, tonen Graids vermogen om robuuste gegevensbescherming te garanderen en tegelijkertijd te voldoen aan de veeleisende vereisten van moderne AI- en HPC-workloads, gebieden waar traditionele RAID- en software-RAID-oplossingen vaak tekortschieten. Deze efficiëntie zorgt ervoor dat kritieke systeembronnen zoals de CPU, DRAM en opslag volledig kunnen bijdragen aan de prestaties van de applicaties die ze moeten ondersteunen, waardoor de algehele systeemwaarde en effectiviteit worden verbeterd.

Grid-technologie

Dit rapport wordt gesponsord door Graid Technology. Alle standpunten en meningen die in dit rapport worden geuit, zijn gebaseerd op onze onpartijdige visie op het/de product(en) in kwestie.

Neem contact op met StorageReview

Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed