Hoewel de toepassing geschikt is voor workloads met veel leesopdrachten, beperken slechte schrijfprestaties de veelzijdigheid in AI- en data-intensieve omgevingen.
De DapuStor J5060 SSD is een NVMe-schijf met hoge capaciteit, gericht op bedrijven, ontworpen om te voldoen aan de toenemende vraag naar compacte, energiezuinige opslag in data-intensieve omgevingen. Hij is gebaseerd op 3D Enterprise QLC NAND Flash en ondersteunt de PCIe 4.0 x4-interface met NVMe 1.4a, in een standaard U.2 15mm-vormfactor. De schijf is ontworpen voor situaties waarin leesprestaties en kosten per terabyte essentieel zijn. Dit maakt hem potentieel geschikt voor toepassingen zoals cloudinfrastructuur, AI-inferentie, big data-platforms en intelligente productiepijplijnen, waar schrijfbewerkingen onregelmatig of voorspelbaar zijn.
Kenmerken en prestatieprofiel van de DapuStor J5060
Met een capaciteit tot 61.44 TB biedt de J5060 een interessante oplossing voor organisaties die hun opslag willen consolideren en tegelijkertijd de fysieke dichtheid en het stroomverbruik onder controle willen houden. Dit capaciteitsniveau in één U.2-schijf is met name relevant voor hyperscale- en enterprise-omgevingen die datasets van meerdere petabytes beheren, waar rackruimte en energie-efficiëntie belangrijke beperkingen vormen. De J5060 beschikt over enterprise-grade functies zoals ondersteuning voor twee poorten, geavanceerde bescherming tegen stroomverlies en spanningsoptimalisatie op flashniveau om de data-integriteit en -stabiliteit in high-availability-implementaties te waarborgen.
Wat de prestaties betreft, is de J5060 gespecificeerd voor workloads met veel leeswerk. Hij heeft een sequentiële leessnelheid tot 7,300 MB/s en ondersteunt tot 1.5 miljoen 4K willekeurige lees-IOPS, wat sterk is voor een QLC-gebaseerde schijf. De schrijfprestaties zijn echter aanzienlijk beperkter, met een specificatie van slechts 30K IOPS voor 16 KB willekeurige schrijfbewerkingen, en deze beperking is consistent tijdens onze workloadtests. De schrijfbandbreedte van de schijf is geclassificeerd op 3,000 MB/s. Dit is echter niet voldoende voor langdurige of diepgaande schrijfbewerkingen, wat de geschiktheid voor gemengde of schrijfintensieve taken kan beïnvloeden.
Door gebruik te maken van QLC NAND kan DapuStor deze hoge capaciteiten tegen lagere kosten leveren, maar wel met nadelen. De duurzaamheid is vastgesteld op slechts 0.5 DWPD (Drive Writes Per Day) gedurende vijf jaar, waardoor de J5060 het meest geschikt is voor leesgerichte toepassingen met lage tot gemiddelde schrijfvolumes. Workloads die frequente checkpointing, transactielogging of actieve caching vereisen, kunnen de duurzaamheid van de schijf op de proef stellen en beperkingen in de schrijfprestaties aan het licht brengen.
Qua stroomverbruik verbruikt de schijf ongeveer 12 watt tijdens het lezen, tot 23 watt tijdens het schrijven en slechts 5 watt in rust. Deze cijfers komen goed overeen met de verwachtingen van moderne datacenters, met name voor implementaties met hoge dichtheid, waar het stroomverbruik per terabyte een steeds groter probleem wordt.
In deze review concentreren we ons op het 61.44 TB-model en onderzoeken we het praktische prestatieprofiel ervan aan de hand van een reeks synthetische en applicatiegerichte workloads.
DapuStor J5060 Specificaties
J5060 | |
---|---|
Capaciteit (TB) | 61.44 |
Form Factor | U.2 15 mm |
Interface | PCIe 4.0 x4, NVMe 1.4a, ondersteuning voor twee poorten |
Lees-/schrijfbandbreedte (128K) MB/s | 7400 / 3000 |
Willekeurig lezen/schrijven (4 KB) K IOPS | 1500 / 30 (16KB) |
4K willekeurige latentie (typ.) R/W µs | 105 (4KB) / 33 (16KB) |
4K sequentiële latentie (typ.) R/W µs | 7 (4KB) / 12 (16KB) |
Typisch vermogen (W) | 23 |
Inactief vermogen (W) | 5 |
Flitstype | 3D Enterprise QLC NAND-flash |
Uithoudingsvermogen | 0.5 DWPD |
MTBF | 2 miljoen uur |
UBER | 1 sector per 10^17 bits gelezen |
Garantie | 5 jaar |
DapuStor J5060-prestaties
controlepunt
Om de real-world prestaties van de Dapustor J5060 SSD in AI-trainingsomgevingen te evalueren, hebben we gebruik gemaakt van de Benchmarktool voor Data en Learning Input/Output (DLIO)DLIO, ontwikkeld door Argonne National Laboratory, is specifiek ontworpen om I/O-patronen te testen in deep learning-workloads. Het biedt inzicht in hoe opslagsystemen omgaan met uitdagingen zoals checkpointing, data-invoer en modeltraining. De onderstaande grafiek illustreert hoe beide schijven het proces verwerken met 99 checkpoints. Bij het trainen van machine learning-modellen zijn checkpoints essentieel om de status van het model periodiek op te slaan en verlies van voortgang tijdens onderbrekingen of stroomuitval te voorkomen. Deze opslagbehoefte vereist robuuste prestaties, vooral bij aanhoudende of intensieve workloads.
Het gekozen platform voor dit werk was onze Dell PowerEdge R760 met Ubuntu 22.04.02 LTS. We gebruikten DLIO benchmarkversie 2.0 van de release van 13 augustus 2024. Onze systeemconfiguratie wordt hieronder beschreven:
- 2x Intel Xeon Gold 6430 (32-core, 2.1 GHz)
- 16x 64GB DDR5-4400
- 480 GB Dell BOSS SSD
- Seriële kabels Gen5 JBOF
- 61.44TB Dapustor J5060
- 61.44TB Solide D5-P5336
Om ervoor te zorgen dat onze benchmarking realistische scenario's weerspiegelde, baseerden we onze tests op de LLAMA 3.1 405B-modelarchitectuur. We implementeerden checkpointing met torch.save() om modelparameters, optimizerstatussen en laagstatussen vast te leggen. Onze opstelling simuleerde een systeem met 8 GPU's en implementeerde een hybride parallellismestrategie met 4-weg tensorparallelverwerking en 2-weg pijplijnparallelverwerking, verdeeld over de acht GPU's. Deze configuratie resulteerde in checkpointgroottes van 1,636 GB, wat representatief is voor de trainingsvereisten van moderne, grote taalmodellen.
Over het algemeen toonde de Dapustor J5060 een solide consistentie tijdens de eerste testfase, met tijden die rond de 575.66 seconden schommelden voor de eerste 33 controlepunten. De 5060J kon hogere prestaties handhaven voordat de schijf voor het eerst werd gevuld. De Solidigm P5336 daarentegen, hoewel aanvankelijk langzamer dan de J5060, toonde consistente prestaties naarmate de tests vorderden.
. rekening houdend met de algemene gemiddelden, noteerde de Dapustor J5060 een tijd van 769.44 seconden, terwijl de Solidigm P5336 eindigde in 640.17 secondenHierdoor loopt de Solidigm P5336 voorop als het gaat om het sneller opslaan van controlepunten.
Over het algemeen kan de Dapustor J5060 kortere bewerkingen goed aan, maar heeft hij moeite met aanhoudende schrijfbewerkingen van meer dan 30 minuten. De Solidigm P5336 is daarentegen de betere drive voor consistente prestaties tijdens langdurige taken. Deze zwakkere schrijfprestaties van de Dapustor J5060 worden duidelijk wanneer de checkpointsnelheid afneemt naarmate de test vordert.
GPU directe opslag
GPU Direct Storage is een technologie die directe gegevensoverdracht tussen opslagapparaten en GPU's mogelijk maakt, waarbij de CPU en het systeemgeheugen worden omzeild. Bij traditionele gegevensoverdracht worden gegevens vanuit de opslag in het geheugen van de CPU gelezen en vervolgens naar het geheugen van de GPU gekopieerd. Dit proces omvat meerdere kopieën van de gegevens, wat leidt tot verhoogde latentie en verminderde prestaties. De CPU fungeert als een knelpunt, omdat deze de gegevensoverdracht tussen de opslag en de GPU moet afhandelen. GDS elimineert dit knelpunt door opslagapparaten rechtstreeks gegevens van en naar het geheugen van de GPU te laten overbrengen.
We hebben systematisch elke combinatie van de volgende parameters getest in zowel lees- als schrijfworkloads:
- Blokformaten: 1M, 128K, 16K
- IODeepth: 128, 64, 32, 16, 8, 4, 1
Bij het beoordelen van onze GDSIO-resultaten kijken we naar de lees- en schrijfprestaties van de 61.44 TB Dapustor J5060 en Solidigm P5336.
GDSIO sequentiële leesprestaties
De Dapustor J5060 behaalt een piekleessnelheid van 4.2 GiB/s bij een blokgrootte van 1M met IO-dieptes van 64 en 128. Bij de kleinste blokgrootte (16K) variëren de prestaties van 0.1 GiB/s tot 0.8 GiB/s naarmate de IO-diepte toeneemt. Dit toont een duidelijke voorkeur aan voor grotere blokgroottes met hoge IO-dieptes voor optimale doorvoer. De piekprestaties worden bereikt bij grote blokgroottes, wat de efficiëntie van de drive bij het verwerken van bulkdataoverdrachten aangeeft.
Ter vergelijking: de Solidigm P5336 bereikte een vergelijkbare maximale doorvoersnelheid van 4.3 GiB/s bij dezelfde blokgrootte (1M), maar bereikte die prestatie eerder al op een IO-diepte van 32 en handhaafde deze consistent op hogere IO-dieptes. Dit suggereert een iets betere efficiëntie bij het verwerken van grote blokgroottes bij een breder bereik aan IO-dieptes voor de Solidigm P5336.
Voor een beter vergelijkingsoverzicht hebben we een differentiële grafiek die beide schijven vergelijkt. Een groener blok toont een voordeel van de Dapustor SSD, terwijl een blok dat naar de rode kant van het spectrum beweegt een zwakte aangeeft. Hier presteert de J5060 beter dan de P5336 in de 128K blokgrootte, behalve voor de 4 tot en met 8 I/O-dieptes. Er worden echter doorvoerdalingen opgemerkt bij hogere I/O-dieptes met blokgroottes van 16K en 1M, wat wijst op een lagere efficiëntie in die scenario's.
In de vergelijking van de sequentiële leeslatentie handhaaft de Solidigm P5336 consistent een lagere latentie dan de Dapustor J5060 over vrijwel alle blokgroottes en I/O-dieptes. Bij een blokgrootte van 16K wordt de kloof groter naarmate de wachtrijdiepte toeneemt: de J5060 piekt op 2,329 μs op een diepte van 128, terwijl de P5336 lager blijft op 1,365 μs. Bij 128K neemt Solidigm opnieuw de leiding over de meeste dieptes, met uitzondering van hoge belastingen (4,080 μs op de J5060 versus 5539 μs op de P5336) op een diepte van 128. Bij een blokgrootte van 1M ervaren beide schijven zoals verwacht een latentietoename, maar de P5336 blijft iets beter gecontroleerd, met 29,138 μs versus 29,512 μs op de hoogste wachtrijdiepte.
Sequentiële schrijfprestaties van GDSIO
De Dapustor J5060 laat een consistente schrijfsnelheid zien van 2.7 tot 2.8 GiB/s voor blokgrootten van 128K en 1M over alle IO-diepten (behalve 128K, 1 IO-dieptegrootte, die 2.2 GiB/s rapporteerde). Voor blokgrootten van 16K variëren de prestaties van 0.5 GiB/s tot 1.4 GiB/s, afhankelijk van de IO-diepte, met een piek van 1.4 GiB/s bij grotere IO-diepten.
Ter vergelijking: de Solidigm P5336 presteert beter bij blokken van 128K en 1M, met een piek van 3.2 GiB/s. Bij kleinere blokken (16K) laat de Solidigm P5336 ook hogere prestaties zien, met een piek van 1.4 GiB/s bij I/O-dieptes van 16 tot 64. Dit geeft aan dat de Solidigm P5336 iets efficiënter is met kleinere blokken tijdens schrijfbewerkingen.
Als we naar een differentieel perspectief kijken, zien we een grotere gapopening tussen de Dapustor J5060 en de schrijfprestaties van de Solidigm P5336. Onze throughputvergelijking laat zien dat de J5060 op de meeste vlakken achterloopt op de P5336, met name bij grote blokgroottes (1M) over alle IO-dieptes. De throughputdaling bereikt -0.5 GiB/s op de 4 IO-dieptes. Hoewel er prestatiewinst is bij hogere IO-dieptes met de 128K blokgroottes, is deze niet significant genoeg om de bredere achterblijvende prestaties te compenseren.
Bij een vergelijking van de sequentiële schrijflatentie tussen de Dapustor J5060 en de Solidigm P5336 vertonen beide schijven vergelijkbaar gedrag bij kleinere blokgroottes zoals 16K, waarbij Solidigm een lichte voorsprong heeft bij lagere I/O-dieptes, terwijl Dapustor de kloof dicht bij grotere dieptes (64 en 128K). Bij blokgroottes van 128K loopt Solidigm opnieuw voorop bij geringe wachtrijdieptes, maar Dapustor levert consistent een lagere latentie naarmate de I/O-diepte toeneemt, wat wijst op een betere schaalbaarheid onder belasting. Met blokgroottes van 1M behoudt Solidigm echter een duidelijk latentievoordeel over alle I/O-dieptes, met aanzienlijk snellere responstijden bij zware sequentiële schrijftaken. Over het algemeen presteert Solidigm consistenter, terwijl de kracht van Dapustor beter zichtbaar is bij middelgrote blokken en diepere wachtrijen.
FIO-werklastoverzicht
Flexible I/O Tester (FIO) is een industriestandaard benchmarktool die wordt gebruikt om de prestaties van opslagapparaten te meten onder een breed scala aan workloadscenario's. FIO staat bekend om zijn veelzijdigheid en betrouwbaarheid en simuleert realistische omstandigheden, waardoor inzicht wordt verkregen in de mogelijkheden en prestatielimieten van een SSD. StorageReview maakt gebruik van FIO om uitgebreide analyses te bieden, waarbij de doorvoer, latentie en IOPS worden gemeten over workloadpatronen, blokgroottes en wachtrijdieptes.
Toegepaste werklasten:
- 128K sequentieel lezen en schrijven
- 64K willekeurige lees- en schrijfbewerkingen
- 16K willekeurige lees- en schrijfbewerkingen
- 4K willekeurige lees- en schrijfbewerkingen
Deze workloads vertegenwoordigen een breed spectrum aan use cases in ondernemingen, waaronder grote sequentiële overdrachten, intensieve willekeurige I/O die kenmerkend is voor databases en willekeurige toegang met kleine blokken die vaak voorkomen in gevirtualiseerde omgevingen.
Deze prestatiesectie vat de prestaties van de Dapustor J5060 samen voor belangrijke synthetische workloads, inclusief sequentiële en willekeurige lees-/schrijfbewerkingen met verschillende blokgroottes en wachtrijdieptes. Metrieken worden rechtstreeks uit de geparseerde fio-uitvoer gehaald en omvatten bandbreedte (MB/s), IOPS en latentiepercentielen tot 99.9999%, wat inzicht biedt in zowel de doorvoer als het tailgedrag onder belasting.
Sequentiële lees- en schrijfprestaties van 128K
Drive | Thread/IO-diepte | Bandbreedte (MB/s) | IOPS | 99.0% | 99.9% | 99.99% |
---|---|---|---|---|---|---|
Dapustor J5060 Lezen | 1T/64Q | 7,482 | 57,081 | 1.66 ms | 2.02 ms | 2.83 ms |
Solidigm P5336 Lezen | 1T/64Q | 7,479 | 57,057 | 1.51 ms | 1.66 ms | 1.81 ms |
Dapustor J5060 Schrijf | 1T/16Q | 3,023 | 23,063 | 0.69 ms | 0.69 ms | 0.70 ms |
Solidigm P5336 Schrijf | 1T/16Q | 3,364 | 25,669 | 2.67 ms | 3.48 ms | 4.42 ms |
De Dapustor J5060 levert indrukwekkende sequentiële leesprestaties bij 128K, met een snelheid van 7.48 GB/s en een strakke latentiecontrole, zelfs bij hogere percentielen. Vergeleken met de Solidigm P5336 is de doorvoersnelheid van de J5060 nagenoeg gelijk (7.48 GB/s versus 7.47 GB/s). Solidigm behoudt echter een kleine voorsprong in consistente latentie, met een marginaal lagere tail-latentie.
Met 128K sequentiële schrijfbewerkingen (QD16) behaalt de J5060 een solide prestatie van 3,023 MB/s met een zeer lage latentie. De Solidigm P5336 overtreft dit echter met een marge van 3,364 MB/s, zij het met een aanzienlijk hogere latentie, met name in het 99.99%-percentiel (4.42 ms versus de opmerkelijk lage 0.70 ms van Dapustor). Dit geeft aan dat de J5060 een betere kandidaat is voor latentiegevoelige sequentiële schrijfbewerkingen.
64K willekeurige lees- en schrijfprestaties
Drive | IO-diepte | Bandbreedte (MB/s) | IOPS | 99.0% | 99.9% | 99.99% |
---|---|---|---|---|---|---|
Dapustor J5060 Lezen | 8T/32Q | 7,475 | 114,058 | 20.05 ms | 21.89 ms | 25.82 ms |
Solidigm P5336 Lezen | 8T/32Q | 7,472 | 114,014 | 21.36 ms | 21.89 ms | 22.68 ms |
Dapustor J5060 Schrijf | 8T/32Q | 534 | 8,151 | 574.6 ms | 708.8 ms | 742.39 ms |
Solidigm P5336 Schrijf | 8T/32Q | 857 | 13,070 | 196.1 ms | 208.6 ms | 221.24 ms |
Bij 64K random reads (QD256) blinkt de Dapustor J5060 uit met een doorvoersnelheid van bijna 7.4 GB/s en een goed gecontroleerde latentie. De resultaten van Solidigm komen sterk overeen (7.47 GB/s), met een iets betere maximale percentiellatentie. Beide schijven presteren hier uitzonderlijk goed, met minimale praktische verschillen.
Schrijfprestaties bij 64K random zijn waar de J5060 merkbaar moeite mee heeft, met een doorvoer die scherp daalt tot 534 MB/s en een aanzienlijk stijgende latentie (742.39 ms bij 99.99%). Ter vergelijking: de Solidigm P5336 presteert aanzienlijk beter dan de J5060, met 857 MB/s en een aanzienlijk lagere latentie (221.24 ms bij hetzelfde percentiel), waardoor hij veel beter geschikt is voor toepassingen die gevoelig zijn voor latentie en een constante schrijfsnelheid.
16K willekeurige lees- en schrijfprestaties
Drive | IO-diepte | Bandbreedte (MB/s) | IOPS | 99.0% | 99.9% | 99.99% |
---|---|---|---|---|---|---|
Dapustor J5060 Lezen | 8T/32Q | 7,430 | 453,461 | 5.28 ms | 6.39 ms | 8.16 ms |
Solidigm P5336 Lezen | 8T/32Q | 7,431 | 453,527 | 5.01 ms | 5.21 ms | 5.47 ms |
Dapustor J5060 Schrijf | 8T/32Q | 531 | 32,404 | 143.65 ms | 149.94 ms | 181.40 ms |
Solidigm P5336 Schrijf | 8T/32Q | 847 | 51,724 | 57.9 ms | 65.8 ms | 71.8 ms |
Bij een willekeurige leesbelasting van 16K (QD256) behaalt de Dapustor uitstekende resultaten met 453K IOPS en een gecontroleerde latentie. De Solidigm P5336 weerspiegelt deze prestaties in essentie en overtreft de Dapustor iets qua latentie (5.47 ms versus 8.16 ms bij 99.99%), wat duidt op een iets betere latentieconsistentie voor Solidigm in scenario's met veel willekeurige leesbewerkingen.
De 16K willekeurige schrijfsnelheid van de Dapustor SSD daalt aanzienlijk tot 32K IOPS en de latentie neemt toe tot 181.4 ms (99.99%). Ook hier overtreft Solidigm de Dapustor-schijf aanzienlijk met 51.7K IOPS en een aanzienlijk verbeterd latentieprofiel (71.8 ms bij 99.99%), wat het voordeel van Solidigm bij latentiegevoelige willekeurige schrijftaken onderstreept.
4K willekeurige lees- en schrijfprestaties
Drive | IO-diepte | Bandbreedte (MB/s) | IOPS | 99.0% | 99.9% | 99.99% |
---|---|---|---|---|---|---|
Dapustor J5060 Lezen | 8T/32Q | 6,941 | 1,694,464 | 1.43 ms | 1.58 ms | 1.79 ms |
Solidigm P5336 Lezen | 8T/32Q | 3,994 | 975,108 | 2.31 ms | 2.41 ms | 2.64 ms |
Dapustor J5060 Schrijf | 8T/32Q | 131 | 31,923 | 143.65 ms | 145.75 ms | 179.31 ms |
Solidigm P5336 Schrijf | 8T/32Q | 197 | 48,030 | 58.5 ms | 64.2 ms | 68.7 ms |
Het 4K random read-scenario is een hoogtepunt voor de Dapustor J5060, met piekprestaties van meer dan 1.69 miljoen IOPS bij QD256, gecombineerd met een indrukwekkend lage latentie. Ter vergelijking: de Solidigm P5336 blijft aanzienlijk achter, met slechts 975K IOPS en een aanzienlijk hogere latentie in alle percentielen. Voor intensieve random reads van small blocks is de Dapustor J5060 duidelijk de beste keuze.
Helaas neemt de 5060K random schrijfsnelheid van de J4 aanzienlijk af, met slechts 131 MB/s en 31.9 K IOPS met een hoge latentie (179.31 ms bij 99.99%). De Solidigm SSD kan dit scenario beter aan, met 197 MB/s, 48 K IOPS en een aanzienlijk lagere tail latentie (68.7 ms bij 99.99%). Hoewel Solidigm ook latentiepieken ervaart, blijft het een veel krachtigere schijf voor veeleisende 4K random schrijftaken.
Conclusie
Uiteindelijk is de DapuStor J5060 een zakelijke QLC SSD met hoge capaciteit, ontworpen voor leesintensieve workloads waarbij opslagdichtheid en kosten per terabyte voorrang hebben boven aanhoudende schrijfprestaties. Met een capaciteit tot 61.44 TB en een PCIe Gen4-interface is hij het meest geschikt voor omgevingen zoals content delivery networks (CDN's), cloudarchieven of AI-inferentiesystemen die afhankelijk zijn van grote sequentiële leesbewerkingen en onregelmatige schrijfbewerkingen.
Met dat doel voor ogen hebben we de J5060 aan verschillende tests onderworpen om te zien hoe hij in de praktijk presteert, met name in vergelijking met de Solidigm P5336. De J5060 levert solide sequentiële leesprestaties en biedt opslag met hoge dichtheid, wat goed kan werken in omgevingen met veel leeswerk. In sommige gevallen, met name bij lagere I/O-dieptes en grotere blokgroottes, presteert de J5060 beter dan de Solidigm P5336. De latentie en doorvoersnelheid in deze scenario's laten zien dat hij is ontworpen om prioriteit te geven aan de leesefficiëntie van grote blokken.
De prestaties lopen echter aanzienlijk terug als we kijken naar schrijfactiviteit. De J5060 presteert consistent ondermaats bij vrijwel elke schrijfmeting (inclusief IOPS, latentie en doorvoer). Deze zwakte is het meest zichtbaar bij sequentiële schrijfbelasting bij hoge I/O-dieptes en grote blokgroottes, waarbij de latentie relatief hoog is en de doorvoer afvlakt. Zelfs tijdens AI-gerelateerde checkpointing-workloads start de J5060 krachtig, maar neemt de prestatie snel af, wat wijst op problemen met de consistentie van de schrijfbewerking.
Voor organisaties met leesintensieve, capaciteitsgedreven behoeften biedt de J5060 een duidelijke meerwaarde, maar door de beperkingen is deze lastiger aan te bevelen voor gemengde of schrijfintensieve workloads.
Neem contact op met StorageReview
Nieuwsbrief | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS Feed