Solidigms D5-P5336 122.88 TB SSD sätter en ny standard för lagringsdensitet och maximerar rackutrymme och energieffektivitet för moderna datacenter.
Densitet är viktigare än någonsin i ett modernt datacenter, där varje centimeter rackutrymme och watt strömförbrukning direkt påverkar driftseffektivitet och kostnad. Solidigms D5-P5336 122.88 TB SSD är en övertygande lösning på denna utmaning, med en anmärkningsvärd kapacitet i en enda U.2-enhet och en ny standard för SSD-lagringsdensitet.
Denna exempellösa lagringstäthet effektiviserar inte bara den fysiska infrastrukturen utan omvandlar även designmöjligheterna för datacenter genom att avsevärt minska rackutrymmesbehovet och förbättra den totala energieffektiviteten. I takt med att datacenter i allt högre grad balanserar de stigande kraven från AI-arbetsbelastningar, innehållsleverans och objektlagring mot hållbarhets- och kostnadspressen, representerar hårddiskar som Solidigm D5-P5336 inte bara tekniska framsteg utan en viktig utveckling inom företagslagringsstrategi.
Vi ser redan att detta sker; server- och lagringsleverantörer kvalificerar högkapacitetsdiskar snabbt så att de kan svara på kundernas krav på lagringseffektivitet. Dell Technologies har till exempel redan lagt till stöd för 122.88 TB-diskar i deras PowerScale-serie av lagringsmatriser, och de har just visat PowerEdge R7725xd, som kan hantera nästan 3 PB kapacitet med dessa rymliga hårddiskar.
I den här recensionen kommer vi inte att nå dessa skalnivåer; vi har bara en enda hårddisk för den här rapporten. Med det sagt kommer våra arbetsbelastningar att visa var den här hårddisken utmärker sig i olika företagsarbetsbelastningar, inklusive de som är utformade för att stödja moderna AI-applikationer. Om du föredrar en något mer fantasifull metod för att använda 122.88 TB SSD-diskar, undersökte vi potentialen hos Solidigm 122TB D5-P5336 i en unik edge AI-distribution tidigare i år, med hjälp av NVIDIA Jetson Orin Nano Super.
En sista anmärkning innan vi dyker in. Det är viktigt att förstå vad 122.88TB P5336 är och inte är. Denna lansering är en utökning av Drive-familjen, som lanserades i mitten av 2023. Solidigm var en av de första att kommersialisera QLC-lagring för företagsanvändning, vilket gav densitet, kostnadseffektivitet, god läsprestanda och adekvat prestanda till arbetsbelastningar som kunde dra nytta av denna unika blandning. Sedan dess har branschen skyndat sig att komma ikapp Solidigms kapacitetsledarskap. Med variationen av enhetskonfigurationer och formfaktorer har dock läget blivit relativt grumligt. Även om Solidigm 122.88TB-enheten fortfarande är en Gen4-modell i en U.2-formfaktor (den finns även i E1.L), är den utformad för att ge hög kapacitet till ett attraktivt TB/$-förhållande.
Bygg och design
Solidigm D5-P5336 122.88TB har samma kärnarkitektur som den tidigare recenserad 61.44 TB-modell, med 192-lagers QLC NAND. Denna konsistens säkerställer förutsägbar prestanda, termiskt beteende och gränssnittskompatibilitet över kapaciteter, vilket är avgörande för skalbara distributioner. Som en 32KB I/O-enhetsdisk (upp från 16KB i 61TB-versionen) är 122TB D5-P5336 optimerad för medelstora I/O-mönster som vanligtvis finns i objektlagring och AI-datapipelines. Denna design ger större flexibilitet i arbetsbelastningen samtidigt som effektiviteten bibehålls.
Det som skiljer den här modellen från mängden är dess kapacitet på 122.88 TB, vilket fördubblar lagringsutrymmet utan att öka det fysiska utrymmet. Den har ett standard 2.5-tums U.2 15 mm-format och erbjuds även i E3.S 7.5 mm- och E1.L 9.5 mm-konfigurationer för att stödja olika hyperskalebehov. Hårddisken använder PCIe Gen4 x4 NVMe-gränssnittet, vilket ger upp till 7 GB/s sekventiell läshastighet och 3 GB/s skrivhastighet. Även om den inte använder PCIe Gen5, ger Gen4 tillräcklig bandbredd för de läsintensiva arbetsbelastningar som D5-P5336 riktar sig mot, inklusive AI-pipelines, innehållsdistribution och objektlagring.
Ur prestandasynpunkt levererar hårddisken upp till 900,000 4 IOPS för slumpmässiga läsningar (256K, QD19,000) och 16 256 IOPS för slumpmässiga skrivningar (110K, QD4). Läslatensen är angiven till 40 mikrosekunder (32K) och skrivlatensen till 8 mikrosekunder (4K). Latensen för sekventiell åtkomst är ännu lägre, med läsningar på 21 mikrosekunder (32K) och skrivningar på XNUMX mikrosekunder (XNUMXK), vilket stöder mycket responsiv drift i storskaliga implementeringar.
Jämfört med den tidigare 122 TB-disken, kör SSD:n med högre kapacitet med en lägre listad skrivprestanda. Sekventiella 5336K-överföringar sjunker till 61 GB/s från 128 GB/s, och 3K slumpmässig skrivprestanda minskar mer avsevärt, från 3.3 16 IOPS till bara 43 19 IOPS. När vi arbetar oss igenom utvärderingen är det viktigt att notera att kapaciteterna kommer att variera allt eftersom specifika arbetsbelastningar belastar diskarna när det gäller sekventiell eller slumpmässig överföringsprestanda.
Enheten inkluderar SK hynix DRAM-cache och kondensatorer för strömavbrottsskydd. Dessa komponenter säkerställer tillförlitlig buffring och skyddar data vid oväntade strömavbrott, vilket är obligatoriskt i storskaliga miljöer. Enhetens tillförlitlighet inkluderar en genomsnittlig tid mellan fel (MTBF) på två miljoner timmar och en oåterkallelig bitfelsfrekvens på mindre än ett bitfel per 100 kvadriljoner bitar som läses.
Organisationer är bekymrade över SSD-diskarnas totala livslängd, med fokus på antalet skrivningar under många års användning. Uthållighetsklassificeringen för Solidigm D5-P5336 är 0.6 hårddiskskrivningar per dag (DWPD), baserat på en slumpmässig skrivningsarbetsbelastning på 32 134.3, vilket motsvarar 122 petabyte skrivna (PBW) under garantiperioden. 5 TB D5336-P24 SSD från Solidigm sätter en ny standard för uthållighet, designad för kontinuerlig drift dygnet runt under en femårsperiod. Den kan hantera antingen 7 KB slumpmässiga skrivningar, med bibehållen 32 % av sin uthållighet efter fem år, eller 5 4 slumpmässiga skrivningar, med 12 % återstående uthållighet. Medan den bibehåller en Drive Writes Per Day (DWPD)-klassificering på 0.60, gör den ökade NAND-kapaciteten det möjligt för den att stödja kontinuerliga arbetsbelastningar mer effektivt.
Enheten är passivt kyld och inrymd i ett solidt aluminiumhölje. Den har en blygsam effektprofil på 24 watt aktivt och 5 watt i tomgång, vilket gör att den enkelt kan integreras i befintliga infrastrukturer. Den väger cirka 166.4 gram, stöder ett driftstemperaturområde på 0 till 70 grader Celsius, är vibrationstålig upp till 2.17 GRMS, stöttålig upp till 1,000 XNUMX G och backas upp av en femårig garanti. Den är utformad för miljöer som prioriterar densitet, effektivitet och rackkonsolidering, och levererar massiv kapacitet inom ett välbekant företagsformat.
Solidigm D5-P5336-serien (122.88 TB) Specifikationer
specifikationer Översikt | Solidigm D5-P5336-serien (122.88 TB) |
---|---|
Kapacitet | 122.88TB |
Formfaktor | U.2 15 mm eller E1.L 9.5 mm |
Gränssnitt | PCIe 4.0 x4, NVMe |
Användningsfall | Server / Företag |
Sekventiell läsning | 7000MB / s |
Sekventiell Skriv | 3000MB / s |
Slumpmässig läsning (IOPS) | 900,000 4 (256K, QDXNUMX) |
Slumpmässig skrivning (IOPS) | 19,000 16 (256K, QDXNUMX) |
Latens (läs/skriv) | Läs: 110 μs (4K) / Skriv: 40 μs (32K) |
Sekventiell latens (typ.) | Läs: 8 μs (4K) / Skriv: 21 μs (32K) |
Ström (aktiv/viloläge) | Aktiv: 24W / Viloläge: 5W |
Endurance | 0.6 DWPD (32K RW) / 134.3 PBW |
MTBF | 2 miljoner timmar |
UBER | <1 sektor per 10 bitar avläsning |
rörelse Temp | 0 ° C till 70 ° C |
Vibration/chock | 2.17 GRMS (drift), 1,000 XNUMX G (stöt) |
Garanti | 5 år |
Vikt | 166.4g ± 10g |
Prestandatester
Plattform för enhetstestning
Vi använder en Dell PowerEdge R760 som kör Ubuntu 22.04.02 LTS som testplattform för alla arbetsbelastningar i den här recensionen. Utrustad med en Seriekablar Gen5 JBOF, den erbjuder bred kompatibilitet med U.2, E1.S, E3.S och M.2 SSD-diskar. Vår systemkonfiguration beskrivs nedan:
- 2 x Intel Xeon Gold 6430 (32-kärniga, 2.1 GHz)
- 16 x 64 GB DDR5-4400
- 480 GB Dell BOSS SSD
- Seriekablar Gen5 JBOF
Jämförda enheter
- Solidigm P5336 122.88 TB (Gen4 | 2.5″ | U.2)
- Solidigm P5336 61.44 TB (Gen4 | 2.5″ | U.2)
- Micron 6550 ION 61.44 TB (Gen5 | E3.S)
Som nämnts i inledningen är marknaden för högkapacitetshårddiskar för företag komplex, med olika formfaktorer, NAND-typer och kostnads-prestandaprofiler att beakta. För den här recensionen har vi en liten grupp SSD-diskar att jämföra med 122.88 TB Solidigm P5336, inklusive den mindre 61.44 TB Solidigm P5336 och 61.44 TB Micron 6550.
Micron 6550 är unik genom att den är Gen5- och TLC-baserad, och en av få i produktion vid denna kapacitetsnivå. Micron-enheten kommer att ha fördelen av högre I/O-hastigheter.
När vi granskar prestandaresultaten är det viktigt att förstå denna stegvisa utveckling. Vid driftsättning kanske dessa hårddiskar inte konkurrerar direkt, men de överlappar varandra i den kapacitet de erbjuder. För att ge en referens för skalbarhet har vi inkluderat Micron-hårddisken i den här recensionen.
CDN-prestanda
För att simulera en realistisk CDN-arbetsbelastning med blandat innehåll utsattes SSD-diskarna för en flerfasig benchmarkingsekvens utformad för att replikera I/O-mönstren för innehållstunga edge-servrar. Testproceduren omfattar en rad blockstorlekar, inklusive både stora och små, fördelade över slumpmässiga och sekventiella operationer, med varierande samtidighetsnivåer.
Före de huvudsakliga prestandatesterna genomförde varje SSD en total enhetsfyllning med ett 100 % sekventiellt skrivpass med 1 MB-block. Denna process använde synkron I/O och ett ködjup på fyra, vilket möjliggjorde fyra samtidiga jobb. Denna fas säkerställer att hårddisken går in i ett stationärt tillstånd som representerar verklig användning. Efter den sekventiella fyllningen utfördes ett sekundärt tre timmar långt randomiserat skrivmättnadssteg med en viktad bssplit-fördelning (blockstorlek/procent), vilket starkt gynnade 128 98.51-överföringar (128 %), med mindre bidrag från block under 8 XNUMX ner till XNUMX XNUMX. Detta steg emulerar fragmenterade och ojämna skrivmönster som ofta ses i distribuerade cachemiljöer.
Den huvudsakliga testsviten fokuserade på skalade slumpmässiga läs- och skrivoperationer för att mäta hårddiskens beteende under varierande ködjup och samtidighet i jobb. Varje test kördes i fem minuter (300 sekunder) och följdes av en tre minuters inaktiv period, vilket gjorde det möjligt för interna återställningsmekanismer att stabilisera prestandamätvärden.
- Utfördes med en fast blockstorleksfördelning som gynnar 128K (98.51%), medan de återstående 1.49% av operationerna bestod av mindre överföringsstorlekar från 64K till 8K. Varje konfiguration varierade över 1, 2 och 4 samtidiga jobb, med ködjup på 1, 2, 4, 8, 16 och 32, för att profilera dataflödesskalbarhet och latens under typiska edge-write-förhållanden.
- En kraftigt blandad blockstorleksprofil, som imiterade CDN-innehållshämtning, användes, med början i en dominant komponent på 128K (83.21%) och följt av en lång svans med över 30 mindre blockstorlekar, från 4K till 124K, var och en med fraktionerad frekvensrepresentation. Denna fördelning återspeglar de olika förfrågningsmönster som uppstår vid hämtning av videosegment, åtkomst till miniatyrbilder och sökning av metadata. Dessa tester kördes också över hela matrisen av jobbantal och ködjup.
Denna kombination av förkonditionering, mättnad och randomiserade åtkomsttester i blandade storlekar är utformade för att avslöja hur SSD-diskar hanterar ihållande CDN-liknande miljöer, med betoning på responsivitet och effektivitet i bandbreddskrävande och mycket parallelliserade scenarier.
CDN-arbetsbelastning Läsning 1
I detta enkeltrådade lästest som simulerar leveranstrafik med låg innehållsnivå uppvisar Solidigm P5336 122.88 TB och Solidigm P5336 61.44 TB konsekventa skalningsegenskaper. 122.88 TB-modellen når 7,109 32 MB/s vid QD61.44, något före 7,002 TB-modellens 6550 61.44 MB/s. Denna nästan identiska skalning tyder på att Solidigms modell med högre kapacitet bibehåller samma effektivitet under låg läsbelastning utan prestandaförsämring. Däremot skalar Micron 12,288 XNUMX TB mycket mer aggressivt och når en topphastighet på XNUMX XNUMX MB/s.
CDN-arbetsbelastning Läsning 2
Med två trådar tillämpade levererar Solidigm P5336 122.88 TB och P5336 61.44 TB nästan identisk prestanda, med en skalning från 840 MB/s vid QD1 till cirka 7,467 7,469 MB/s respektive 32 16 MB/s vid QD6550. Båda hårddiskarna uppvisar konsekventa vinster upp till QD1,384, varefter dataflödet planas ut, vilket indikerar en mättnadspunkt i deras nuvarande arkitektur. För applikationer med måttlig parallellitet ger detta en tillförlitlig baslinje för förutsägbar skalning. Micron 13,312, däremot, visar ett högre totalt skalningsområde, som börjar vid 32 5 MB/s och fortsätter uppåt till XNUMX XNUMX MB/s vid QDXNUMX, vilket återspeglar fördelarna med dess TLC NAND- och GenXNUMX-gränssnitt.
CDN-arbetsbelastning Läsning 4
Detta scenario med hög läsbelastning sätter större press på hårddiskarna med ökad samtidighet. Solidigm P5336 122.88 TB och P5336 61.44 TB-hårddiskar uppvisar konsekvent skalning och når cirka 7,466 7,469–16 32 MB/s vid QD6550 och bibehåller stabilitet fram till QD13,107. Resultaten mellan de två kapaciteterna förblir i praktiken identiska, vilket förstärker Solidigms konsekventa styrenhetsbeteende över hela deras högkapacitetssortiment. Som jämförelse uppnådde Micron 16 XNUMX XNUMX MB/s vid QDXNUMX och bibehöll den bandbredden under resten av testet.
CDN-arbetsbelastning Skrivning 1
Solidigm P5336 122.88TB övergår till skrivprestanda under enkeltrådade förhållanden och börjar vid 1,742 2,572 MB/s och når cirka 32 5336 MB/s vid QD61.44. Solidigm P461 3,029TB börjar lägre vid 6550 MB/s men skalar mer aggressivt och når en topp på 984 6,288 MB/s. Micron 32 börjar vid XNUMX MB/s och fortsätter att skala konsekvent genom ködjupsintervallet och når XNUMX XNUMX MB/s vid QDXNUMX. Solidigm-modellerna uppvisar olika skalningsegenskaper, medan Micron bibehåller en mer linjär progression över testet.
CDN-arbetsbelastning Skrivning 2
När man går över till dubbeltrådad skrivprestanda ökar bandbredden för alla tre hårddiskar. Solidigm P5336 61.44TB börjar på 2,771 32 MB/s och bibehåller relativt stabil utdata fram till QD5336, med endast mindre fluktuationer. Solidigm P122.88 2,468TB arbetar inom ett snävare intervall och ligger mellan 2,620 6550 MB/s och 2,035 6,743 MB/s över alla ködjup. Micron 32 uppvisar kontinuerlig skalning, från XNUMX XNUMX MB/s och upp till XNUMX XNUMX MB/s fram till QDXNUMX. Solidigm-hårddiskarna bibehåller en jämn dataflödeshastighet, medan Micron visar en bredare skalningsprofil över samma intervall.
CDN-arbetsbelastning Skrivning 4
Under maximal samtidighet visar båda Solidigm P5336-modellerna stabil men begränsad skalning. P5336 61.44 TB börjar vid cirka 2,935 3,062 MB/s och når sin topp vid 5336 122.88 MB/s, medan P2,529 2,562 TB börjar vid 16 122.88 MB/s och slutar något lägre vid 61.44 6550 MB/s. Detta resulterar i en ungefär 2,323 % lägre toppdatakapacitet för 6,731 TB-modellen jämfört med 32 TB-versionen. Micron XNUMX, å andra sidan, skalar stadigt från XNUMX XNUMX MB/s till XNUMX XNUMX MB/s med QDXNUMX.
Objektlagringsprestanda
Det här testet använder ett FIO-skript som approximerar en ObjectStorage-arbetsbelastning, där 65 % av förfrågningarna utfärdas vid en överföringsstorlek på 64 KiB för att representera vanliga småblocksoperationer, 15 % vid 8 MiB för mellanstora strömmande arbetsbelastningar och ytterligare 15 % vid 64 MiB för att betona hårddiskens hantering av stora block. De sista 5 % vid 1 GiB nyttolasten ökar den maximala sekventiella dataflödet. Genom att sammanfoga dessa fyra blockstorlekar i de angivna proportionerna simuleras en blandad arbetsbelastning som visar både styrenhetens flexibilitet under små I/O-data och dess råa bandbreddskapacitet under massiva överföringar.
Slumpmässig läsning (1 tråd, 40QD)
Drive | Läsbandbredd (MB/s) | Läs IOPS | Läsfördröjning (ms) |
---|---|---|---|
Micron 6550 61TB | 13,444.10 | 3,165.10 | 12.5011 |
Solidigm P5336 61TB | 7,117.38 | 1,673.76 | 23.4513 |
Solidigm P5336 122TB | 7,101.97 | 1,674.78 | 23.4385 |
I detta enkeltrådade, djupgående slumpmässiga lästest presterar Solidigm P5336 122.88 TB och P5336 61.44 TB nästan identiskt. 122.88 TB-modellen når 7,101.97 1,674.78 MB/s och 23.44 61.44 IOPS med en latens på 7,117.38 ms, medan 1,673.76 TB-varianten mäter 23.45 0.25 MB/s och 5336 XNUMX IOPS vid XNUMX ms. Skillnaden i bandbredd mellan de två Solidigm-kapaciteterna är under XNUMX %, vilket visar på konsekvent prestanda över hela PXNUMX-serien för slumpmässiga läsningsarbetsbelastningar.
Micron 6550 levererar betydligt högre prestanda och når 13,444.10 3,165.10 MB/s och 12.50 5 IOPS med en lägre latens på 4 ms. Dess fördel i detta scenario påverkas av dess användning av TLC NAND och ett PCIe GenXNUMX-gränssnitt, vilka båda bidrar till starkare slumpmässig läsningskapacitet och responsivitet jämfört med de QLC-baserade GenXNUMX Solidigm-diskarna.
Sekventiell läsning (1 tråd, 40QD)
Drive | Läsbandbredd (MB/s) | Läs IOPS | Läsfördröjning (ms) |
---|---|---|---|
Micron 6550 61TB | 13,955.46 | 223.32 | 174.723 |
Solidigm P5336 61TB | 7,098.64 | 114.12 | 341.727 |
Solidigm P5336 122TB | 7,103.98 | 114.60 | 340.322 |
När det gäller sekventiell läsprestanda visar Solidigm P5336 122.88 TB och P5336 61.44 TB nästan identiska resultat. 122.88 TB-modellen når 7,103.98 114.60 MB/s med 340.32 IOPS och en latens på 61.44 ms, medan 7,098.64 TB-versionen når 114.12 341.73 MB/s, 0.1 IOPS och 6550 ms. Skillnaden i prestanda mellan de två är mindre än 13,955.46 %, vilket återspeglar ett konsekvent beteende över båda kapaciteterna vid ihållande sekventiella läsbelastningar. Micron 223.32 mäter betydligt högre prestanda med 174.72 96 MB/s och XNUMX IOPS med XNUMX ms latens, vilket erbjuder ungefär XNUMX % högre dataflöde än någon av Solidigm-modellerna i detta test.
Slumpmässig läsning (4 tråd, 10QD)
Drive | Läsbandbredd (MB/s) | Läs IOPS | Läsfördröjning (ms) |
---|---|---|---|
Micron 6550 61TB | 13,301.67 | 3,142.01 | 12.5619 |
Solidigm P5336 61TB | 7,131.65 | 1,686.98 | 22.9787 |
Solidigm P5336 122TB | 7,131.95 | 1,690.84 | 22.9315 |
Med en läshastighet på fyra trådar och ett ködjup på 10, registrerar Solidigm P5336 122.88TB 7,131.95 1,690.84 MB/s, 22.93 5336 IOPS och en latens på 61.44 ms. Solidigm P7,131.65 1,686.98TB kommer strax efter med 22.98 0.005 MB/s och 6550 13,301.67 IOPS, med en latens på 3,142.01 ms. Skillnaden i bandbredd mellan de två modellerna är mindre än 12.56 %. Micron 86 uppnår XNUMX XNUMX MB/s och XNUMX XNUMX IOPS med en latens på XNUMX ms, vilket erbjuder cirka XNUMX % mer dataflöde än någon av Solidigm-diskarna.
Sekventiell läsning (4 tråd, 10QD)
Drive | Läsbandbredd (MB/s) | Läs IOPS | Läsfördröjning (ms) |
---|---|---|---|
Micron 6550 61TB | 13,524.00 | 218.06 | 171.040 |
Solidigm P5336 61TB | 7,130.97 | 115.03 | 315.565 |
Solidigm P5336 122TB | 7,130.99 | 114.72 | 316.304 |
I detta fyrtrådiga sekventiella lästest på ködjup 10 når Solidigm P5336 122.88 TB 7,130.99 114.72 MB/s med 316.30 IOPS och 5336 ms latens. Solidigm P61.44 7,130.97 TB-latensen matchar nära med 115.03 315.57 MB/s, 0.01 IOPS och 6550 ms. De två modellerna uppvisar nästan identisk sekventiell prestanda över olika kapaciteter, med en skillnad på mindre än 13,524.00 %. Micron 218.06 matar ut 171.04 89 MB/s och XNUMX IOPS med en latens på XNUMX ms, vilket ger cirka XNUMX % högre dataflöde än någon av Solidigm-diskarna under samma förhållanden.
DLIO Checkpointing Benchmark
För att utvärdera SSD-prestanda i verkliga AI-träningsmiljöer använde vi benchmarkverktyget Data and Learning Input/Output (DLIO). DLIO, som utvecklats av Argonne National Laboratory, är specifikt utformat för att testa I/O-mönster i djupinlärningsarbetsbelastningar. Det ger insikter i hur lagringssystem hanterar utmaningar som kontrollpunkter, datainmatning och modellträning. Diagrammet nedan illustrerar hur båda enheterna hanterar processen över 99 kontrollpunkter (198 för 122TB). Vid träning av maskininlärningsmodeller är kontrollpunkter viktiga för att spara modellens tillstånd regelbundet och förhindra förlust av framsteg vid avbrott eller strömavbrott. Denna lagringsbehov kräver robust prestanda, särskilt under långvariga eller intensiva arbetsbelastningar. Vi använde DLIO-benchmarkversion 2.0 från och med utgåvan den 13 augusti 2024.
För att säkerställa att våra benchmarking-test återspeglade verkliga scenarier baserade vi våra tester på modellarkitekturen LLAMA 3.1 405B. Vi implementerade kontrollpunkter med hjälp av torch.save() för att samla in modellparametrar, optimeringstillstånd och lagertillstånd. Vår installation simulerade ett system med åtta GPU:er och implementerade en hybrid parallellitetsstrategi med 4-vägs tensorparallell och 2-vägs pipelineparallell bearbetning fördelad över de åtta GPU:erna. Denna konfiguration resulterade i kontrollpunktsstorlekar på 1,636 XNUMX GB, vilket representerar moderna utbildningskrav för stora språkmodeller.
Jämfört med Solidigm P61 på 122 TB och 5336 TB vad gäller kontrollpunktsprestanda, har 122 TB SSD längre kontrollpunkter när hårddisken är full. Vid första omgången är gapet mellan de två SSD:erna cirka 20 % snabbare för 122 TB-versionen än för 61 TB-versionen, medan det vid andra och tredje omgången är 16.4 % respektive 18.4 % långsammare. 61 TB Micron 6550 har en genomsnittlig kontrollpunktstid på 585 sekunder vid tredje omgången, jämfört med 640 sekunder för 61 TB P5336 och 757 sekunder för 122 TB P5336.
122TB Solidigm P5336 har en unik fördel direkt när det gäller kontrollpunkter; den kan hantera många av dem. Medan 61TB SSD-diskarna når upp till 33 kontrollpunkter per pass, kan 122TB-modellen hantera 66 av dem innan den når kapacitet. Medan diagrammet över genomsnittlig tid per pass ovan något döljer mängden, hjälper tidsvyn per kontrollpunkt till att illustrera kapacitetsfördelen. Båda Solidigm SSD-diskarna stabiliseras efter att den första kontrollpunktspasseringen är klar, medan Micron 6550 är relativt konsekvent under hela testet och trendar snabbare.
FIO-prestandamåttstock
För att mäta lagringsprestanda för varje SSD-disk utifrån vanliga branschmått använder vi FIO. Varje disk körs genom samma testprocess, vilket inkluderar ett förkonditioneringssteg med två fullständiga diskfyllningar med en sekventiell skrivarbetsbelastning, följt av mätning av prestanda i stationärt tillstånd. När varje arbetsbelastningstyp som mäts ändras kör vi ytterligare en förkonditioneringsfyllning med den nya överföringsstorleken.
I det här avsnittet fokuserar vi på följande FIO-riktmärken:
- 128K sekventiell
- 64K slumpmässigt
- 16K slumpmässigt
- 4K slumpmässigt
Med QLC SSD-diskar med hög kapacitet, utformade för stora överföringsstorlekar, stannar våra skrivhastighetstester vid 16K slumpmässigt. För 4K utnyttjar vi det förfyllda tillståndet från 16K-arbetsbelastningen för att endast mäta prestandan för slumpmässig läsning i 4K.
128K sekventiellt förvillkor (IODjup 256 / Antal jobb 1)
I detta intensiva test av förkonditionering med ködjup uppnår Solidigm P5336 122.88 TB 3,134 5336 MB/s, medan P61.44 2,500.9 TB når 25.3 6550 MB/s. Detta motsvarar en förbättring på 10,455.3 % i skrivbandbredd för modellen med högre kapacitet. Micron 122 toppar listan med 61 5336 MB/s. Även om båda Solidigm-modellerna ligger efter Micron i rå dataöverföring, visar prestandaskillnaden mellan 6550 TB- och XNUMX TB-modellerna på optimering i stor skala inom samma PXNUMX-plattform, där den större hårddisken visar tydliga vinster i hållbar sekventiell skrivhantering. Medan Micron XNUMX verkar ha ett mycket mindre förkonditioneringssteg, gjorde dess högre skrivhastighet det möjligt för den att slutföra den första fyllningen mycket snabbare.
128K sekventiell förvillkorslatens (IODjup 256 / Antal jobb 1)
När det gäller latens under den förkonditionerade 128K sekventiella skrivningen registrerar Micron 6550 det lägsta värdet på 3.06 ms. Solidigm P5336 122.88TB följer på 10.21 ms, medan P5336 61.44TB ligger på 12.80 ms. Detta markerar en latensreduktion på 20.2 % för 122.88TB-modellen jämfört med 61.44TB-modellen, vilket återspeglar en mer effektiv och stabil latens och demonstrerar förbättringar som gjorts inom Solidigm P5336-serien.
128K sekventiell skrivning (IODjup 16 / Antal jobb 1)
I detta sekventiella skrivtest med ett ködjup på 16 och ett enda jobb når Solidigm P5336 122.88 TB 3,152.5 25,220 MB/s med 5336 61.44 IOPS. P2,503.5 20,030 TB-modellen ligger efter med 25.9 122 MB/s och 6550 10,456.4 IOPS, vilket resulterar i en förbättring av dataflödet med 83,650 % jämfört med XNUMX TB-modellen. Micron XNUMX uppnår den högsta totala prestandan med XNUMX XNUMX MB/s och XNUMX XNUMX IOPS, vilket överträffar båda Solidigm-diskarna.
128K sekventiell skrivlatens (IODjup 16 / Antal jobb 1)
När det gäller latens har Micron 6550 den lägsta latensen på 0.191 ms. Solidigm P5336 122.88 TB följer med 0.634 ms, vilket visar bättre respons än P5336 61.44 TB, som mäter 0.798 ms. Detta återspeglar en minskning av latensen med 20.5 % för Solidigm-modellen med högre kapacitet, vilket indikerar förbättrad effektivitet vid sekventiella skrivoperationer.
128K sekventiell läsning (IODjup 64 / Antal jobb 1)
I detta sekventiella lästest med 64 ködjup når Solidigm P5336 61.44 TB 7,132.3 57,060 MB/s och 122.88 7,121.6 IOPS, medan 56,970 TB-modellen följer tätt efter med 0.2 6550 MB/s och 13,979.7 111,840 IOPS. Skillnaden mellan de två är mindre än 96 %, vilket inte visar någon mätbar fördel i dataflödet här från den ökade kapaciteten. Micron XNUMX uppnår XNUMX XNUMX MB/s och XNUMX XNUMX IOPS, vilket ger nästan XNUMX % mer läsbandbredd än någon av Solidigm-modellerna i detta test.
128K sekventiell läslatens (IODjup 64 / Antal jobb 1)
I detta test av sekventiell läsfördröjning uppnår Micron 6550 den lägsta fördröjningen på 0.572 ms. Solidigm P5336 122.88 TB mäter 1.123 ms, nästan identiskt med P5336 61.44 TB på 1.121 ms. Resultaten visar ingen verklig fördröjningsfördel från den ökade kapaciteten, då båda Solidigm-diskarna presterar lika bra vad gäller sekventiell läsrespons.
64K slumpmässig skrivning
I 64K slumpmässiga skrivtestet vid låg samtidighet (1-1) presterar alla tre hårddiskar nära. Micron 6550 levererar 2,485.97 39,780 MB/s och 5336 122.88 IOPS. Solidigm P2,429.93 38,880 TB följer med 5336 61.44 MB/s och 2,412.90 38,610 IOPS, medan PXNUMX XNUMX TB ligger något efter med XNUMX XNUMX MB/s och XNUMX XNUMX IOPS.
Allt eftersom arbetsbelastningen skalas till högre samtidighet (32-8) blir skillnaderna tydligare. 122.88 TB-modellen uppnår 3,121.54 49,950 MB/s och 61.44 2,654.46 IOPS, vilket överträffar 42,470 TB-modellen, som når upp till 17.6 122 MB/s och 6550 10,070.71 IOPS. Detta markerar en ökning med 161,130 % i dataflöde för XNUMX TB-disken med högre kapacitet, vilket visar effektivare skalning under högre slumpmässigt skrivtryck. Micron XNUMX ligger långt före med XNUMX XNUMX MB/s och XNUMX XNUMX IOPS.
64K slumpmässig skrivlatens
Vid låg belastning (1-1) rapporterar alla tre hårddiskar identisk latens på 0.025 ms. Under arbetsbelastningen (32-8) registrerar Solidigm P5336 122.88 TB 5.121 ms, jämfört med 6.026 ms på P5336 61.44 TB. Detta resulterar i en 15 % minskning av latensen för 122 TB-modellen med högre kapacitet. Micron 6550 bibehåller en betydligt lägre latens på 1.588 ms, vilket visar starkare respons vid hög slumpmässig samtidighet.
64K slumpmässig läsning
I 64K slumpmässigt lästest vid minimal belastning (1-1) når Micron 6550 482.09 MB/s och 7,710 5336 IOPS. Solidigm P61.44 299.40 TB följer med 4,790 MB/s och 5336 122.88 IOPS, medan P274.04 4,390 TB kommer in på 8.5 MB/s och 61.44 XNUMX IOPS, en minskning av prestandan med XNUMX % jämfört med XNUMX TB-modellen vid detta djup.
Under hög samtidighetshastighet (32-8) levererar P5336 122.88 TB 7,124.69 113,995 MB/s och 61.44 7,125 IOPS, medan 114,000 TB ligger nära 6550 13,153.64 MB/s och ungefär 210,460 XNUMX IOPS. Det finns ingen betydande prestandaskillnad mellan de två kapaciteterna på denna nivå. Micron XNUMX fortsätter att skala upp och når XNUMX XNUMX MB/s och XNUMX XNUMX IOPS.
64K slumpmässig läsfördröjning
Vid (1-1) djup och jobbantal har Micron 6550 den lägsta latensen på 0.129 ms. Solidigm P5336 61.44 TB följer på 0.208 ms, medan P5336 122.88 TB mäter något högre på 0.228 ms, vilket resulterar i en ökning på 9.6 % för den större kapaciteten. Under tyngre belastning (32-8) rapporterar båda Solidigm-modellerna identisk latens på 2.245 ms, vilket inte visar någon fördel av den ökade kapaciteten. Micron 6550 bibehåller en mycket lägre latens på 1.217 ms för denna körning.
16K slumpmässig skrivning
Vid låg belastning (1-1) levererar Solidigm P5336 122.88 TB 549.14 MB/s och 35,145 5336 IOPS. P61.44 1,036.53 TB presterar betydligt bättre vid 66,338 122.88 MB/s och 47 61.44 IOPS. Detta placerar 6550 TB-modellen cirka 856.61 % lägre i både bandbredd och IOPS jämfört med 54,823 TB. Micron XNUMX ligger mellan de två Solidigm-diskarna och uppnår XNUMX MB/s och XNUMX XNUMX IOPS.
Vid hög samtidighet (32-8) bibehåller 122.88 TB-modellen en dataflödeshastighet på 549.14 MB/s och 35,145 1 IOPS, vilket inte visar någon skalning från dess 1-61.44-prestanda. Samtidigt skalar 2,542.36 TB-versionen till 162,711 363 MB/s och 122 6550 IOPS, vilket resulterar i en ökning av dataflödet med 10,295.66 % jämfört med 658,922 TB-disken. Micron XNUMX leder totalt sett och når XNUMX XNUMX MB/s och XNUMX XNUMX IOPS.
16K slumpmässig skrivlatens
Vid (1-1) visar Solidigm P5336 122.88TB en latens på 0.028ms, medan P5336 61.44TB presterar snabbare vid 0.015ms. Micron 6550 hamnar mellan dem vid 0.018ms. Detta resulterar i en 86% högre latens för 122TB-modellen jämfört med 61TB Solidigm vid minimal belastning. Under en tung belastning (32-8) bibehåller 122.88TB-modellen en stabil svarstid på 0.028ms, vilket indikerar ingen skalning. 61.44TB stiger till 1.572ms, vilket återspeglar ökat tryck under samtidighet men också en betydande dataflödesökning. Micron 6550 förblir effektiv vid 0.388ms, vilket visar starkare respons vid maximal slumpmässig skrivstress.
16K slumpmässig läsning
Vid minimal belastning (1-1) når Micron 6550 188.80 MB/s och 12,083 5336 61.44 IOPS. Solidigm P126.55 8,100 TB följer med 5336 MB/s och 122.88 125.87 IOPS, medan P8,060 0.5 TB registrerar XNUMX MB/s och XNUMX XNUMX IOPS. De två Solidigm-diskarna presterar nästan identiskt, med en skillnad på mindre än XNUMX %, vilket indikerar ingen kapacitetsbaserad fördel på detta djup.
Vid högre samtidighetshastigheter (32-16) når Micron 6550 13,053.35 835,420 MB/s och 61.44 7,063.02 IOPS. Solidigm 452,030 TB når 122.88 6,855.59 MB/s och 438,760 2.9 IOPS, något före XNUMX TB-modellen med XNUMX XNUMX MB/s och XNUMX XNUMX IOPS. Detta motsvarar en minskning av dataflödet med XNUMX % för den större Solidigm-disken under denna arbetsbelastning.
16K slumpmässig läsfördröjning
Vid (1-1) registrerar Micron 6550 den lägsta latensen på 0.082 ms. De två Solidigm P5336-modellerna följer på 0.123 ms respektive 0.124 ms, med en skillnad på mindre än 1 % mellan dem. Under tung belastning (32-16) bibehåller Micron effektiv skalning på 0.612 ms, medan Solidigm 61.44 TB ökar till 1.132 ms och 122.88 TB når 1.165 ms. Detta markerar en ökning på 2.9 % i latens för Solidigm-enheten med högre kapacitet jämfört med 61 TB-modellen, vilket indikerar en mindre effektivitetsminskning under maximal samtidighet.
4K slumpmässig läsning
Vid minimal belastning (1-1) levererar Micron 6550 57.71 MB/s och 14,770 5336 IOPS. Solidigm P61.44 38.21 TB följer med 9,782 MB/s och 5336 122.88 IOPS, medan P37.93 9,710 TB släpar efter något med 1 MB/s och XNUMX XNUMX IOPS. Skillnaden mellan de två Solidigm-modellerna är under XNUMX %, vilket inte visar någon fördel av den ökade kapaciteten på lågt djup.
Med högre samtidighet (32-16) når Micron 6550 7,787.27 1.99 MB/s och 61.44 miljoner IOPS. Solidigm 3,799.77 TB skalar till 972,743 122.88 MB/s och 3,643.64 932,770 IOPS, något före 4.1 TB, som ligger på 4.1 XNUMX MB/s och XNUMX XNUMX IOPS. Detta motsvarar en minskning med XNUMX % i dataflöde och en minskning med XNUMX % i IOPS för modellen med större kapacitet under maximal slumpmässig läsbelastning.
4K slumpmässig läsfördröjning
Vid (1-1) har Micron 6550 den lägsta latensen på 0.067 ms. Båda Solidigm P5336-modellerna mäter 0.102 ms, vilket inte visar någon förbättring av latensen med den ökade kapaciteten. Under tung belastning (32-16) bibehåller Micron en stark effektivitet på 0.260 ms. P5336 61.44 TB registrerar 0.525 ms, medan 122.88 TB-modellen ökar något till 0.546 ms, en ökning av latensen med 4 % som återspeglar en mycket minimal minskning av effektiviteten för hårddisken med högre kapacitet under maximala slumpmässiga läsförhållanden.
GPU direkt lagring
Ett av testerna vi genomförde på denna testbänk var Magnum IO GPU Direct Storage (GDS)-testet. GDS är en funktion utvecklad av NVIDIA som gör att GPU:er kan kringgå CPU:n när de kommer åt data lagrade på NVMe-enheter eller andra höghastighetslagringsenheter. Istället för att dirigera data genom processorn och systemminnet, möjliggör GDS direkt kommunikation mellan GPU:n och lagringsenheten, vilket avsevärt minskar latensen och förbättrar datagenomströmningen.
Hur GPU Direct Storage fungerar
Traditionellt, när en GPU bearbetar data lagrad på en NVMe-enhet, måste data först färdas genom CPU:n och systemminnet innan de når GPU:n. Denna process introducerar flaskhalsar, eftersom CPU:n blir en mellanhand, lägger till latens och förbrukar värdefulla systemresurser. GPU Direct Storage eliminerar denna ineffektivitet genom att göra det möjligt för GPU:n att komma åt data direkt från lagringsenheten via PCIe-bussen. Denna direkta väg minskar de omkostnader som är förknippade med datarörelser, vilket möjliggör snabbare och mer effektiva dataöverföringar.
AI-arbetsbelastningar, särskilt de som involverar djupinlärning, är mycket dataintensiva. Att träna stora neurala nätverk kräver bearbetning av terabyte med data, och varje fördröjning i dataöverföringen kan leda till underutnyttjade GPU:er och längre träningstider. GPU Direct Storage hanterar denna utmaning genom att säkerställa att data levereras till GPU:n så snabbt som möjligt, vilket minimerar vilotiden och maximerar beräkningseffektiviteten.
Dessutom är GDS särskilt fördelaktigt för arbetsbelastningar som involverar streaming av stora datamängder, såsom videobearbetning, naturlig språkbehandling eller realtidsinferens. Genom att minska beroendet av CPU:n påskyndar GDS datarörelsen och frigör CPU-resurser för andra uppgifter, vilket ytterligare förbättrar den övergripande systemets prestanda.
För 16K slumpmässiga läsningar med en enda tråd levererar Solidigm P5336 61.44TB 526.40MB/s, vilket överträffar 122.88TB-modellen på 187.21MB/s med en marginal på 181%. Micron 6550 landar mellan dem på 169.15MB/s. Här presterar Solidigm-modellen med högre kapacitet underpresterande i förhållande till sin mindre motsvarighet.
Med 128 trådantal och 1 miljon sekventiella läsningar under hög samtidighet leder Solidigm P5336 61.44 TB med 4,391.68 122.88 MB/s, tätt följt av 4,193.56 TB-modellen med 6550 2,667.99 MB/s. Micron 122.88 kommer in lägre med 4.5 57 MB/s. XNUMX TB-disken ligger cirka XNUMX % efter sin mindre syskon, samtidigt som den överträffar Micron med XNUMX %.
Solidigm P5336 61.44 TB levererar den lägsta latensen på 0.048 ms, följt av 122.88 TB-modellen på 0.082 ms, vilket är cirka 70.8 % högre än sitt mindre syskon. Micron 6550 ligger efter båda, med den högsta latensen på 0.090 ms i denna konfiguration.
Vid hög trådantal mättes latensen för Solidigm 61.44 TB till 0.291 ms, följt av 122.88 TB vid 0.305 ms, en ökning med 4.8 %. Micron 6550 kommer sist med 0.479 ms, vilket visar betydligt högre latens under tung skrivbelastning.
Vid en enda tråd med 16K blockstorlek börjar Solidigm P5336 61.44TB med 592.34MB/s, följt av Micron 6550 med 502.97MB/s. Solidigm P5336 122.88TB släpar något efter vid 496.59MB/s, vilket visar en prestandaskillnad på 16.1% mellan de två Solidigm-modellerna vid denna lågbelastningsinställning.
Under maximal samtidighetshastighet på 128T och 1M blockstorlek börjar Micron 6550 med 3,281.49 61.44 MB/s, strax före Solidigm 3,134.03TB som registrerar 122.88 2,549.28 MB/s. Solidigm 18.6TB ligger på 61 122 MB/s, vilket gör den ungefär XNUMX % långsammare än XNUMXTB-modellen. Trots sin högre kapacitet visar XNUMXTB-varianten minskad dataflödesskalning under denna tunga skrivbelastning.
Vid 1T 16K sekventiella skrivningar har Micron 6550 återigen den lägsta latensen på 0.030 ms, bara en aning före Solidigm P5336 122.88 TB på 0.031 ms, en försumbar skillnad. Solidigm P5336, på 61.44 TB, leder faktiskt gruppen här på 0.026 ms, och slår båda hårddiskarna med en liten marginal.
Vid sekventiella skrivningar på 128T 1M under kraftig samtidighet uppnår Micron 6550 en latens på 0.390 ms. Solidigm 61.44TB följer efter vid 0.408 ms, medan 122.88TB-modellen släpar efter vid 0.502 ms, vilket återspeglar en ökning av latensen med 23 % jämfört med 61TB Solidigm-modellen.
Slutsats
Solidigms D5-P5336 122.88TB SSD levererar oöverträffad lagringstäthet, robust energieffektivitet per TB och imponerande skalbarhet, vilket tillgodoser kritiska företagsbehov för utrymmesminskning, energibesparing och förenklad infrastrukturhantering. Genom att dramatiskt öka kapaciteten per hårddisk utan att utöka det fysiska fotavtrycket, gör Solidigm det möjligt för datacenter att konsolidera lagringsrack avsevärt, vilket direkt gynnar driftskostnader och miljömässig hållbarhet, samtidigt som de är redo för de ökande kraven från nya arbetsbelastningar som drivs av den ökande användningen av AI.
I CDN-arbetsbelastningstester levererade SSD:n en konsekvent sekventiell läsningshastighet och nådde cirka 7.5 GB/s vid högre ködjup, samtidigt som stabiliteten bibehölls även under ökad samtidighet. För slumpmässiga läsningar inom CDN-scenarier matchade den nära sin mindre motsvarighet på 61.44 TB, vilket visade nästan identisk prestanda, vilket framhäver Solidigms effektiva arkitekturkonsistens. I FIO-riktmärken överträffade D5-P5336 122.88 TB den tidigare 61 TB-modellen i sekventiella skrivningar med upp till 25 %, och uppnådde 3,152.5 16 MB/s vid ett ködjup på 20, med en latensförbättring på cirka 0.634 % (0.798 ms mot 16 ms). Slumpmässiga skrivscenarier indikerade dock vissa avvägningar, eftersom den större hårddisken registrerade lägre dataflöde vid XNUMXK blockstorlekar, vilket återspeglar dess designoptimering för sekventiella och läsintensiva arbetsbelastningar.
Under GPU Direct Storage (GDSIO)-förhållanden bibehöll hårddisken konkurrenskraftiga sekventiella läshastigheter på cirka 4,193 1 MB/s vid 4.5 MB blockstorlekar med hög samtidighet, vilket endast marginellt eftersläpade sin mindre variant med 5 %. Sammantaget levererar Solidigm D5336-P122.88 XNUMX TB SSD övertygande densitet, förutsägbar prestanda och effektiva skalningsfunktioner skräddarsydda för moderna, krävande företagsdatamiljöer.
I takt med att den oändliga aptiten på data fortsätter att öka, blir lagringslösningar som maximerar densiteten och minimerar strömförbrukningen allt viktigare. Hårddiskar som D5-P5336 illustrerar tydligt hur innovation inom NAND-teknik och intelligent design kan hjälpa datacenter att hantera framtida tillväxt på ett hållbart sätt. Framöver förväntar vi oss att Solidigm kommer att tänja på gränserna för kapacitet och effektivitet ytterligare, och potentiellt fördubbla sin kapacitet igen för att leverera en banbrytande SSD på 245.76 TB före årets slut.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde