Det är uppenbart att de senaste Gen5 SSD:erna, som Western Digital SN861, påverkar affärsresultaten. Om du behöver bevis, leta inte längre än deras inverkan på AI-revolutionen.
Sponsras av Western Digital
Western Digital Ultrastar® DC SN861 SSD är designad för att möta de högpresterande behoven hos både hyperskala datacenter och företagsmiljöer. SN861 stöder ett PCIe® Gen5-gränssnitt och finns i olika formfaktorer, inklusive U.2 och E1.S, vilket gör att den passar flera installationsscenarier. Det är dock inte så enkelt som att göra SN861 i olika formfaktorer; Western Digital har på ett klokt sätt konstruerat SN861-funktionsuppsättningen för att passa sina målmarknader.
Gen5-gränssnittet ger SN861 en omedelbar prestandaökning jämfört med föregående generation SN655. Fördelarna med den nya enheten är mycket djupare, med funktioner som Flexible Data Placement (FDP) i E1.S-formfaktorn. FDP minskar skrivförstärkningen och optimerar dataplaceringen. SN861 inkluderar avancerade säkerhetsfunktioner som dataskydd från slut till ände, AES-XTS-kryptering och TCG OPAL 2.01. Styrenheten hjälper också till att minska SSD-strömförbrukningen, i genomsnitt under 5 watt vid tomgång. Dessutom stöder enheten flera standarder som NVMe® 2.0 och OCP Cloud Spec 2.0.
Även om säkerhets- och effektivitetsfunktionerna är kritiska, inkluderar varje generationsuppdatering ett betydande prestandahopp, och SN861 är inte annorlunda. Enheten levererar sekventiell läshastighet på upp till 13,700 3.3 MB/s och slumpmässig läs IOPS upp till 861 miljoner, vilket är viktigt för applikationer som AI/ML och big data-analys. Båda versionerna av SN20 förbrukar i genomsnitt 5 watt under drift och mindre än 1 watt vid tomgång. Strömmen är inställbar, så det är enkelt att justera enhetens kraftprofil för att matcha den förväntade arbetsbelastningen. Hyperscalers, till exempel, kör ofta sina EXNUMX.S-enheter med mycket lägre effekttillstånd.
Intressant nog, medan de två formfaktorerna för SN861 är tekniskt mycket lika i design, har Western Digital ställt in varje enhet för specifika arbetsbelastningar. I E1.S-versionen betyder det till exempel funktioner som FDP och prestandajusterade för molnbelastningar. U.2-drevet, å andra sidan, kommer att hitta sin väg till högpresterande företagsarbetsbelastningar och utan tvekan nya arbetsbelastningar som AI som kan dra nytta av det massiva hoppet i drivprestanda.
EDSFF och FDP
FDP ger betydande fördelar för hyperskalare som Meta genom att optimera prestanda och tillförlitlighet hos deras SSD:er i arbetsbelastningar som CacheLib. FDP minskar Write Amplification Factor (WAF), vilket leder till förbättrade skrivhastigheter och förlängd SSD-livslängd, vilket är avgörande för att hantera omfattande databearbetningsuppgifter.
Tekniken förbättrar dataorganisationen genom att intelligent gruppera liknande data, minimera överprovisionering och minska behovet av intensiv sophämtning. FDP stöder också flera namnområden, vilket säkerställer konsekvent prestanda över olika arbetsbelastningar. Denna optimering förbättrar applikationsprestanda och uthållighet och sänker avsevärt den totala ägandekostnaden (TCO) för storskalig lagringsinfrastruktur.
Stöd för FDP i E1.S-versionen av Ultrastar SN861 bekräftar att enheten är redo för hyperskalares behov, men FDP är bara en del av ekvationen. E1.S-versionen av enheten måste leverera prestandakrav i hyperskala, särskilt QoS kring läsprestanda.
U.2 för företag
Lika spännande som E1.S-disken är för användning i hyperskala, är U.2 SN861 den hårddisk som de flesta företag kommer att använda. Vi genomförde en serie tester för att mäta övergripande prestanda i vår standardtestsvit.
Western Digital Ultrastar DC SN861 SSD Datablad
1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB | |
---|---|---|---|---|---|---|
Endurance | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD | 3 DWPD | 1 DWPD |
Säkerhet | ||||||
Formfaktor | ||||||
Gränssnitt | ||||||
NVMe-specifikation | ||||||
Prestanda (projekterad) | 1.60TB | 1.92TB | 3.20TB | 3.84TB | 6.40TB | 7.68TB |
Läskapacitet (max MB/s, Seq 128KiB) | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 | 13,700 |
Skrivkapacitet (max GB/s, Seq 256KiB) | 3,600 | 3,600 | 7,200 | 7,200 | 7,500 | 7,500 |
Läs IOPS (max, Rnd 4KiB) | 2,100K | 2,100K | 3,300K | 3,300K | 3,300K | 3,300K |
Skriv IOPS (max, Rnd 4KiB) | 350K | 165K | 665K | 330K | 800K | 430K |
Läslatens (µS) | 65 | 65 | 65 | 65 | 65 | 65 |
Skrivfördröjning (µS) | 8 | 8 | 8 | 8 | 8 | 8 |
Pålitlighet | ||||||
MTTF (timmar, beräknat) | ||||||
Okorrigerbar bitfelsfrekvens (UBER) | ||||||
Årlig misslyckandefrekvens (AFR, beräknad) | ||||||
Begränsad garanti (år) | ||||||
Strömhantering (projekterad) | ||||||
Krav (DC, +/- 10 %) | ||||||
Driftlägen (genomsnitt, max) | ||||||
Inaktiv (genomsnittlig) | ||||||
Fysisk storlek | ||||||
z-höjd (mm) | ||||||
Mått (bredd x längd, mm) | ||||||
Miljö | ||||||
Driftstemperatur (omgivningstemperatur) | ||||||
Icke-driftstemperatur |
För att mäta prestandan för företagets NVMe® Gen5 SSD:er som används i den här jämförelsen, använde vi en fio-testsvit för fyra hörn-arbetsbelastningar och Vdbench för blandade arbetsbelastningar. Fio-skriptpaketet vi utnyttjade är ett automatiserat skript som ställs in för att förutsätta och lätta testkörningar på ett konsekvent sätt, hittas här på github. Vi använde detta för att utföra 256K sekventiella läs- och skrivtester för toppbandbredd och 4K slumpmässiga läs- och skrivtester för toppkapacitet.
Toppkapacitet och bandbredd |
Western Digital SN861 7.68TB | KIOXIA CM7-R 7.68TB | Samsung PM1743 7.68TB | Samsung PM9A3 7.68TB |
256K sekventiell läsning (1T/64Q) | 13,283MB / s | 12,092MB / s | 14,495MB / s | 6,751MB / s |
256K sekventiell skrivning (1T/64Q) | 7,696MB / s | 5,796MB / s | 6,052MB / s | 4,055MB / s |
4K slumpmässig läsning (8T/32Q) | 2,108,065 IOPS | 1,963,066 IOPS | 1,900,838 IOPS | 1,068,508 IOPS |
4K slumpmässig skrivning (8T/32Q) | 473,658 IOPS | 301,061 IOPS | 319,758 IOPS | 206,660 IOPS |
När vi tittar på prestandasiffrorna från Western Digital SN861 använder den sitt Gen5-gränssnitt bra. I sekventiell läsning mätte den 13.3 GB/s, vilket kom på andra plats jämfört med Samsung PM1743, som mätte 14.5 GB/s. I sekventiell skrivning kom SN861 först och svepte de andra två jämförbara Gen5-modellerna, med en hastighet på 7.7 GB/s, med 6.1 GB/s från Samsung PM1743 som närmast närmast.
Slumpmässig 4K-läsprestanda var särskilt stark och mätte 2.11M IOPS, med 1.96M IOPS från KIOXIA CM7-R som näst närmast. När vi tittade på slumpmässig 4K-skrivprestanda kom Western Digital SN861 också först, med en hastighet på 474K IOPS, med Samsung PM1743 med 320K IOPS som näst närmaste modell. I våra fyra hörn arbetsbelastningar fick Western Digital SN861 toppsiffran i tre av de fyra testerna.
För att testa SN861 Gen5 SSD utnyttjade vi Dell® PowerEdge® R760 i vårt testlabb. Det är en mycket mångsidig 2U rackmonterad server som stöder två 4:e generationens Intel Xeon-processorer och har konfigurationer som stöder upp till 24 NVMe-enheter. Denna server är avsedd för blandade arbetsbelastningar, databaser och VDI. Det bör noteras att versionen av CM7-R som vi testar i denna recension kom från en Dell-server med Dells firmware-byggd. Den här enheten kan fungera annorlunda med KIOXIAs standardfirmware.
Dell PowerEdge R760-konfiguration:
- Dual Intel® Xeon® Gold 6430 (32 kärnor/64 trådar, 1.9 GHz bas)
- 1TB DDR5 RAM
- ubuntu 22.04
För ultimat flexibilitet arbetade vi också med seriella kablar, som försåg oss med en 8-fack PCIe Gen5 JBOF för U.2/U.3, M.2 och EDSFF SSD-testning. Detta gör det möjligt för oss att testa alla nuvarande och nya drivenheter på samma testhårdvara. VDbench användes också för att jämföra skalad prestanda över vårt SSD-val i olika typer av arbetsbelastning. Vår testprocess för dessa riktmärken fyller hela enhetens yta med data och partitionerar sedan en enhetssektion som motsvarar 25 % av enhetens kapacitet för att simulera hur enheten kan reagera på applikationsarbetsbelastningar. Detta skiljer sig från fullständiga entropitester, som använder 100 procent av enheten och tar dem till ett stabilt tillstånd. Som ett resultat kommer dessa siffror att återspegla högre ihållande skrivhastigheter.
profiler:
- 16K sekventiell läsning: 100 % läsning, 32 trådar, 0-120 % iorat
- 16K sekventiell skrivning: 100 % skrivning, 16 trådar, 0-120 % iorate
- 4K, 8K och 16K 70R/30W Random Mix, 64 trådar, 0-120 % iorat
- Syntetisk databas: SQL och Oracle
- VDI Full Clone och Linked Clone Traces
Vårt första Vdbench-test mätte sekventiell 16K läsprestanda med en 32-trådsbelastning. Här mätte vi en toppkapacitet på 325K IOPS och 5.1GB/s vid 98 μs från Western Digital SN861, som var hals och hals med KIOXIA CM7-R, som mätte 329K IOPS. PCIe Gen5 Samsung PM1743 mätte 289K IOPS, och Samsung PM9A3 som vi tog med som referens Gen4 SSD mätte 227K IOPS.Genom att flytta vårt fokus till skrivprestanda med samma 16K sekventiell arbetsbelastning, gav Western Digital SN861 ett starkt försprång mot de andra U.2 PCIe Gen5 SSD:erna vi jämförde den med. SN861 mätte en topp på 200K IOPS och 3.1GB/s vid 78 μs, med en bra ledning över både KIOXIA CM7-R och Samsung PM1743. Jämfört med Gen4-landskapet hade alla ett starkt försprång över Samsung PM9A3, som mätte 131K IOPS.
Våra nästa tre tester tittar på skalningsblockstorlekar i ett slumpmässigt överföringstest med en 70/30 R/W-blandning. Det första testet mätte en 4K-blockstorlek. Här finner vi att Western Digital SN861 och KIOXIA CM7-R har mycket liknande prestanda, med SN861 som mäter 903K IOPS vid 70 μs kontra 881K IOPS från CM7-R. Samsung PM1743 släpade efter med en topphastighet på 521K IOPS, med Gen4 PM9A3 som mätte 396K IOPS.
När vi flyttade upp till en 8K blockstorlek med vårt slumpmässiga test på 70/30 R/W, drog Western Digital SN861 före KIOXA CM7-R, och mätte en topp på 682K IOPS vid 93 μs, jämfört med CM7-R med 599K IOPS. Samsung PM1743 gick efter med 414K IOPS, medan Gen4 PM9A3 mätte 301K IOPS.
Vårt sista slumpmässiga 70/30 R/W-test tittar på en 16K blockstorlek. Western Digital SN861 fortsätter sin starka ledning här och mäter en topp på 434K IOPS vid 143 μs, med CM7-R som mäter 337K IOPS. Samsung PM1743 fortsatte att släpa och mätte 231K IOPS, medan Gen4 PM9A3 mätte 183K IOPS.
Vår nästa grupp av tester fokuserar på en syntetisk SQL-arbetsbelastning. I det här första testet finner vi Western Digital SN861 som kantar ut med en ledning över KIOXIA CM7-R, med en topphastighet på 407K IOPS vid 78 μs mot 396K IOPS för CM7-R. Samsung PM1743 gick efter med en topp på 340K IOPS, medan Gen4 PM9A3 mätte 310K IOPS.
Med SQL-arbetsbelastningen i en 80/20 R/W-blandning fortsätter Western Digital SN861 att leda över KIOXIA CM7-R, och mäter en topp på 424K IOPS vid 75 μs mot 407K från CM7-R. Samsung PM1743 gick efter de två med en topphastighet på 322K IOPS, med Gen4 PM9A3 som mätte 281K IOPS.
Genom att öka lässpridningen till en 90/10 R/W-delning i vår SQL-arbetsbelastning, fortsatte Western Digital SN861 att hålla sin ledning över KIOXIA CM7-R, och mätte 411K IOPS vid 77 μs kontra 398K IOPS för CM7-R. Samsung gick fortfarande efter de två med en topphastighet på 328K IOPS, och Gen4 PM9A3 mätte 297K IOPS.
Efter våra SQL-tester byter vi fokus till en syntetisk Oracle-arbetsbelastning. Här visar våra tre Gen5 SSD: er starka förbättringar jämfört med Gen4 Samsung PM9A3. Western Digital SN861 bibehöll sin ledning med en topphastighet på 445K IOPS vid 80 μs, före KIOXIA CM7-R med 417K IOPS. Samsung PM1743 kom in bakom dessa, som mätte 317K IOPS, och PM9A3 med 267K IOPS.
Genom att flytta R/W-spridningen för vår syntetiska Oracle-arbetsbelastning till 80/20, minskade spridningen mellan Western Digital SN861 och KIOXIA CM7-R, med SN861 som mätte en topp på 309K IOPS vid 71 μs och CM7-R mätte IOPS 304K . Samsung PM1743 mätte 252K IOPS topp, med Gen4 PM9A3 som kom in med 228K IOPS.
Vår sista syntetiska Oracle-arbetsbelastning med en 90/10 R/W-blandning såg ett liknande nära gap mellan Western Digital SN861 och KIOXIA CM7-R. SN861 hade en topphastighet på 296K IOPS vid 74 μs, medan CM7-R mätte 292K IOPS. Samsung PM1743 låg längre efter med en topphastighet på 250K IOPS, medan Gen4 PM9A3 mätte 231K IOPS.
Våra senaste sex arbetsbelastningar fokuserar på VDI-spår av virtuella datorer med full klon och länkad klon. Dessa täcker tre scenarier vardera: Boot, Initial Login och Monday Login. Vårt test täcker ett Full-Clone Boot-scenario, där Western Digital SN861 mätte 370K IOPS vid 94 μs jämfört med KIOXIA CM7-R med 348K IOPS. Samsung PM1743 följde med 263K IOPS och Gen4 PM9A3 med 227K IOPS.
I vårt Initial Login-scenario drog KIOXIA CM7-R fram med en ledning över Western Digital SN861, och mätte 196K IOPS vid 163 μs till SN861 med 181K IOPS. Samsung PM1743 mätte 157K IOPS topp, medan Gen4 PM9A3 kom in med 117K IOPS.
I Monday Login-profilen kom Western Digital SN861 och KIOXIA CM7-R i nacke och nacke. SN861 mätte en topp på 158K IOPS vid 99 μs medan CM7-R mätte 160K IOPS. Samsung PM1743 mätte 126K IOPS, och Gen4 PM9A3 kom in med 83K IOPS.
I våra senaste tre tester tittade vi på samma profiler i en VDI Linked Clone-installation, som började med en start. KIOXIA CM7-R kom först, mätte 161K IOPS, till Western Digital SN861 med 156K IOPS vid 102 μs. Samsung PM1743 mätte då 138K IOPS, med Gen4 PM9A3 bakom sig med 110K IOPS.
I vårt test som mätte en Initial Login-profil hade KIOXIA CM7-R den högsta hastigheten på 89K IOPS, med Western Digital SN861 tätt bakom med 85K IOPS vid 102 μs. Samsung PM1743 följde med 70K IOPS, med sitt Gen4-syskon bakom sig med 53K IOPS.
I vår senaste VDI-arbetsbelastning som täckte en måndagsinloggningsprofil kom Western Digital SN861 i täten med en topphastighet på 122K IOPS vid 129 μs, med KIOXIA CM7-R bakom sig som mätte 115K IOPS. Samsung PM1743 mätte 95K IOPS, med Gen4 PM9A3 efterföljande med en topphastighet på 64K IOPS.
Western Digital SN861 och AI
I en något relaterad väg till arbetet med SN861 i denna rapport, har vi också arbetat med den tidigare generationen Western Digital Ultrastar DC SN655 inom OpenFlex™ Data24-plattformen Western Digital systemgruppen tillhandahåller. I en demo för FMS '24 visade vi upp en AI-demo med en GPU-server, Data24 NVMe-oF™-plattformen och Gen4 SN655 SSD:er.
Våra tester med NVIDIA® IndeX® fokuserade på att utnyttja dess avancerade volymetriska visualiseringsfunktioner för att hantera massiva datamängder med hög tillförlitlighet. IndeX använder GPU-acceleration för att tillhandahålla interaktiv realtidsvisualisering av 3D-volymetrisk data, vilket är avgörande för industrier som olje- och gasutforskning, medicinsk bildbehandling och vetenskaplig forskning.
För att uppnå optimal prestanda, särskilt i GPU-intensiva miljöer, är det nödvändigt att säkerställa höghastighetsdatautbyte mellan GPU:er och lagring. Till exempel, för att grundligt mätta bandbredden för en NVIDIA H100 GPU, behövde vi uppnå cirka 64 GB/s kapacitet, vilket innebär att vi använder högpresterande NVMe-lagringslösningar och tekniker som NVIDIA GPUDirect™. Denna integration minskar latensen och maximerar datagenomströmningen, vilket säkerställer effektiv GPU-användning för snabbare och effektivare bearbetning av storskaliga datamängder.
När vi tittar på bandbreddsskillnaderna i vad Gen4 SN655 kan göra vid 6.8 GB/s topp jämfört med 13.7 GB/s från SN861, är det uppenbart att se fördelarna med att flytta till en Gen5 SSD. För att nå 64 GB/s med den tidigare generationens modell behöver du tio SSD:er, medan SN861 kan nå det målet med bara fem. Denna skillnad kan tillåta dig att öka antalet enheter för ytterligare bandbredd eller kapacitet.
Prestanda och kapacitet kommer att vara avgörande för att lagring ska skalas med behoven hos AI och andra avancerade applikationer. Gen5-gränssnittet och den övergripande prestandahöjningen som SN861 erbjuder över Gen4-enheter är mycket övertygande i detta avseende, vilket innebär att dessa enheter kan stödja fler GPU:er inom ett enda lagringssystem och säkerställa att dessa GPU:er matas i en takt som är tillräckligt snabb för att säkerställa fullt utnyttjande.
Slutsats
SN861 markerar ett stort steg framåt för Western Digital. Disken kommer i formfaktorer för att stödja både hyperskala och företagskunder, med drivfunktioner som FDP i E1.S-enheten anpassade för deras framtida användningsfall. Gen5-gränssnittet är dock den mest uppenbara fördelen för enheterna, och levererar en imponerande prestandaprofil.
Western Digital SN861 erbjöd stark prestanda utanför porten, och tog tre topplaceringar i våra första fyrahörnsarbetsbelastningar som mätte toppsekventiell bandbredd och slumpmässig genomströmning. Höjdpunkter inkluderar en slumpmässig 4K-läsprestanda på 2.11M IOPS och slumpmässig 4K-skrivprestanda som mäter 474K IOPS. Sekventiell läsprestanda var stark och kom på andra plats jämfört med Samsung PM1743 med 13.3 GB/s, även om den kunde ta över ledningen i sekventiell skrivbandbredd på 7.7 GB/s.
I våra VDbench-arbetsbelastningar, som främst fokuserade på blandade arbetsbelastningar eller mindre överföringar i blockstorlek, fortsatte SN861 att prestera exceptionellt bra. Vi mätte en stark 16K sekventiell skrivhastighet på 200K IOPS och starka avledningar i 70/30 R/W mixtesterna som täckte 4K, 8K och 16K överföringsstorlekar. I våra VDI-arbetsbelastningar bytte SN861 topplaceringen med KIOXIA CM7-R, som var nacke och hals i vissa områden. Sammantaget visade Western Digital SN861 en stark visning i vår testserie.
Det är uppenbart att de senaste Gen5 SSD:erna, som Western Digital SN861, påverkar affärsresultaten. Om du behöver bevis, leta inte längre än deras inverkan på AI-revolutionen. Vi har sett det i våra tester; AI-system behöver snabb lagring för att hålla GPU:er fungerande, oavsett om det är i en cache som NVIDIA IndeX-exemplet ovan eller inom delade lagringsmatriser eller GPU-servrar. Western Digital har gjort mycket bra positionering av SN861 för dessa avancerade arbetsbelastningar samtidigt som de erbjuder FDP-aktiverade SKU:er för hyperskalare.
Western Digital Data Center Storage
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Rssflöde