Home Entreprise Test du SSD DapuStor J5060 : SSD QLC haute densité optimisé pour les charges de travail centrées sur la lecture

Test du SSD DapuStor J5060 : SSD QLC haute densité optimisé pour les charges de travail centrées sur la lecture

by Lyle Smith

Bien qu'il soit adapté aux charges de travail à forte intensité de lecture, ses faibles performances d'écriture limitent sa polyvalence dans les environnements d'IA et à forte intensité de données.

Le SSD DapuStor J5060 est un disque NVMe haute capacité, conçu pour les entreprises, et conçu pour répondre à la demande croissante de stockage dense et économe en énergie dans les environnements gourmands en données. Basé sur la mémoire Flash NAND QLC 3D Enterprise, il prend en charge l'interface PCIe 4.0 x4 avec NVMe 1.4a et est logé dans un format U.2 standard de 15 mm. Ce disque est conçu pour les situations où les performances de lecture et le coût par téraoctet sont essentiels. Il est donc potentiellement adapté aux applications telles que les infrastructures cloud, l'inférence IA, les plateformes Big Data et les pipelines de fabrication intelligente, où les opérations d'écriture sont rares ou prévisibles.

DapuStor J5060

Caractéristiques et profil de performances du DapuStor J5060

Avec des capacités évolutives allant jusqu'à 61.44 To, le J5060 offre une solution intéressante aux entreprises souhaitant consolider leur stockage tout en maîtrisant la densité physique et la consommation d'énergie. Ce niveau de capacité sur un seul disque U.2 est particulièrement pertinent pour les environnements hyperscale et d'entreprise gérant des ensembles de données de plusieurs pétaoctets, où l'espace rack et l'efficacité énergétique constituent de réelles contraintes. Le J5060 intègre des fonctionnalités de niveau entreprise, telles que la prise en charge du double port, une protection avancée contre les coupures de courant et l'optimisation de la tension au niveau de la mémoire flash, afin de garantir l'intégrité et la stabilité des données dans les déploiements haute disponibilité.

Coque arrière du DapuStor J5060

Concernant ses performances, le J5060 est conçu pour les charges de travail intensives en lecture. Il affiche un débit de lecture séquentielle allant jusqu'à 7,300 1.5 Mo/s et prend en charge jusqu'à 4 million d'IOPS en lecture aléatoire de 30 Ko, ce qui est un excellent résultat pour un disque QLC. Cependant, ses performances en écriture sont nettement plus limitées, avec seulement 16 3,000 IOPS pour des écritures aléatoires de XNUMX Ko, une limitation constante tout au long de nos tests de charge de travail. La bande passante d'écriture du disque est évaluée à XNUMX XNUMX Mo/s. Cependant, cette bande passante est insuffisante pour les opérations d'écriture soutenues ou de grande profondeur, ce qui peut compromettre son aptitude aux tâches mixtes ou intensives en écriture.

Port DapuStor J5060

L'utilisation de la NAND QLC permet à DapuStor d'offrir ces capacités élevées à moindre coût, mais avec des compromis. L'endurance est évaluée à seulement 0.5 DWPD (écritures par jour sur le disque) sur cinq ans, ce qui rend le J5060 particulièrement adapté aux applications centrées sur la lecture avec des volumes d'écriture faibles à modérés. Les charges de travail impliquant des points de contrôle fréquents, la journalisation des transactions ou la mise en cache active peuvent solliciter l'endurance du disque et révéler des limites en termes de performances d'écriture.

Circuit imprimé DapuStor J5060

En termes d'énergie, le disque consomme environ 12 watts en lecture, jusqu'à 23 watts en écriture et seulement 5 watts au repos. Ces chiffres correspondent parfaitement aux attentes des centres de données d'entreprise modernes, notamment pour les déploiements haute densité, où la consommation par téraoctet est une préoccupation croissante.

Dans cette revue, nous nous concentrons sur le modèle 61.44 To et examinerons son profil de performances réel à travers une série de charges de travail synthétiques et alignées sur les applications.

Spécifications du DapuStor J5060

J5060
Capacité (To) 61.44
Facteur de forme U.2 15mm
Interface PCIe 4.0 x4, NVMe 1.4a, double port pris en charge
Bande passante en lecture/écriture (128 Ko) Mo/s 7400/3000
Lecture/écriture aléatoire (4 Ko) K IOPS 1500 / 30 (16 Ko)
Latence aléatoire 4K (Typ.) R/W µs 105 (4 Ko) / 33 (16 Ko)
Latence séquentielle 4K (typ.) R/W µs 7 (4 Ko) / 12 (16 Ko)
Puissance typique (W) 23
Puissance au ralenti (W) 5
Type de flash Mémoire flash NAND QLC 3D Enterprise
Endurance 0.5 DWPD
MTBF 2 millions d'heures
UBER 1 secteur par 10^17 bits lus
Garanties 5 ans

Performances du DapuStor J5060

Point de contrôle

Pour évaluer les performances réelles du SSD Dapustor J5060 dans les environnements de formation d'IA, nous avons utilisé le Outil de référence d'entrée/sortie de données et d'apprentissage (DLIO)Développé par l'Argonne National Laboratory, DLIO est spécialement conçu pour tester les schémas d'E/S dans les charges de travail d'apprentissage profond. Il fournit des informations sur la manière dont les systèmes de stockage gèrent les défis tels que les points de contrôle, l'ingestion de données et l'apprentissage des modèles. Le graphique ci-dessous illustre la manière dont les deux disques gèrent le processus sur 99 points de contrôle. Lors de l'apprentissage des modèles d'apprentissage automatique, les points de contrôle sont essentiels pour sauvegarder périodiquement l'état du modèle et éviter ainsi toute perte de progression en cas d'interruption ou de panne de courant. Cette demande de stockage exige des performances robustes, notamment sous des charges de travail soutenues ou intensives.

La plateforme choisie pour ce travail était notre Dell PowerEdge R760 sous Ubuntu 22.04.02 LTS. Nous avons utilisé le benchmark DLIO version 2.0 du 13 août 2024. Notre configuration système est décrite ci-dessous :

  • 2 x Intel Xeon Gold 6430 (32 cœurs, 2.1 GHz)
  • 16 x 64GB DDR5-4400
  • Disque SSD Dell BOSS de 480 Go
  • Câbles série Gen5 JBOF
    • Disque dur externe Dapustor J61.44 de 5060 To
    • Disque SSD Solidigm D61.44-P5 de 5336 To

Afin de garantir que nos analyses comparatives reflètent des scénarios réels, nous avons basé nos tests sur l'architecture du modèle LLAMA 3.1 405B. Nous avons implémenté des points de contrôle à l'aide de torch.save() pour capturer les paramètres du modèle, les états de l'optimiseur et les états des couches. Notre configuration simulait un système à 8 GPU, mettant en œuvre une stratégie de parallélisme hybride avec un traitement parallèle de tenseur à 4 voies et un traitement parallèle de pipeline à 2 voies réparti sur les huit GPU. Cette configuration a permis d'obtenir des points de contrôle de 1,636 XNUMX Go, représentatifs des besoins d'entraînement des modèles de langage modernes à grande échelle.

Globalement, le Dapustor J5060 a fait preuve d'une excellente régularité lors de la phase initiale de test, avec des temps oscillant autour de 575.66 secondes pour les 33 premiers points de contrôle. Le 5060J a maintenu des performances supérieures avant le premier remplissage du disque. En revanche, le Solidigm P5336, bien que plus lent initialement que le J5060, a affiché des performances constantes au fil des tests.

 

Lorsque compte tenu des moyennes globales, le Dapustor J5060 a affiché un temps de en 769.44 secondes, tandis que le Solidigm P5336 a terminé en en 640.17 secondes. Cela place le Solidigm P5336 en tête en termes de sauvegarde plus rapide des points de contrôle.

Globalement, le Dapustor J5060 gère bien les opérations courtes, mais peine à effectuer des écritures continues au-delà de 30 minutes. Le Solidigm P5336, quant à lui, offre des performances constantes lors des tâches prolongées. Cette baisse des performances en écriture du Dapustor J5060 se manifeste par la dégradation de la vitesse de pointage au fil du test.

Stockage direct du GPU

Le stockage direct GPU est une technologie qui permet le transfert direct de données entre les périphériques de stockage et les GPU, en contournant le processeur et la mémoire système. Dans un transfert de données traditionnel, les données sont lues depuis le stockage vers la mémoire du processeur, puis copiées vers celle du GPU. Ce processus implique de multiples copies de données, ce qui entraîne une latence accrue et une baisse des performances. Le processeur agit comme un goulot d'étranglement, car il doit gérer le transfert de données entre le stockage et le GPU. GDS élimine ce goulot d'étranglement en permettant aux périphériques de stockage de transférer directement les données vers et depuis la mémoire du GPU.

Nous avons testé systématiquement chaque combinaison des paramètres suivants dans les charges de travail de lecture et d'écriture :

  • Tailles de blocs : 1M, 128K, 16K
  • Profondeur d'IO : 128, 64, 32, 16, 8, 4, 1

Alors que nous examinons nos résultats GDSIO, nous examinons les performances de lecture et d’écriture du Dapustor J61.44 de 5060 To et du Solidigm P5336.

Performances de lecture séquentielle GDSIO

Le Dapustor J5060 atteint un débit de lecture maximal de 4.2 Gio/s pour une taille de bloc de 1 Mo avec des profondeurs d'E/S de 64 et 128. Pour la plus petite taille de bloc (16 Ko), les performances varient de 0.1 Gio/s à 0.8 Gio/s à mesure que la profondeur d'E/S augmente. Cela montre une nette préférence pour les blocs de plus grande taille avec des profondeurs d'E/S élevées pour un débit optimal. Les performances maximales sont atteintes avec des blocs de grande taille, ce qui témoigne de l'efficacité du disque à gérer les transferts de données en masse.

En comparaison, le Solidigm P5336 a atteint un débit maximal similaire de 4.3 Gio/s avec la même taille de bloc (1 Mo), mais a atteint cette performance plus tôt avec une profondeur d'E/S de 32 et l'a maintenue de manière constante à des profondeurs d'E/S plus élevées. Cela suggère une efficacité légèrement supérieure pour la gestion de blocs de grande taille avec une plage de profondeurs d'E/S plus large pour le Solidigm P5336.

Pour une meilleure comparaison, nous avons un graphique différentiel comparant les deux disques. Un bloc plus vert indique un avantage du SSD Dapustor, tandis qu'un bloc passant du côté rouge du spectre indique une faiblesse. Ici, le J5060 surpasse le P5336 dans la taille de bloc de 128 Ko, sauf pour les profondeurs d'E/S de 4 à 8. Cependant, des baisses de débit sont observées à des profondeurs d'E/S plus élevées, avec des tailles de bloc de 16 Ko et 1 Mo, ce qui indique une efficacité moindre dans ces scénarios.

Lors de la comparaison de la latence de lecture séquentielle, le Solidigm P5336 maintient systématiquement une latence inférieure à celle du Dapustor J5060, quelle que soit la taille des blocs et la profondeur des E/S. À 16 Ko, l'écart s'accentue à mesure que la profondeur de la file d'attente augmente : le J5060 atteint un pic à 2,329 128 μs à une profondeur de 5336, tandis que le P1,365 reste inférieur à 128 4,080 μs. À 5060 K, Solidigm est à nouveau en tête sur la plupart des profondeurs, à l'exception des charges élevées (5539 5336 μs sur le J128 contre 1 5336 μs sur le P29,138) à la profondeur 29,512. À la taille de bloc de XNUMX M, les deux disques connaissent des augmentations de latence comme prévu, mais le PXNUMX reste légèrement mieux contrôlé, avec XNUMX XNUMX μs contre XNUMX XNUMX μs à la profondeur de file d'attente la plus élevée.

 

Performances d'écriture séquentielle GDSIO

Le Dapustor J5060 affiche un débit d'écriture constant de 2.7 à 2.8 Gio/s pour des tailles de blocs de 128 Ko et 1 Mo sur toutes les profondeurs d'E/S (à l'exception de 128 Ko, taille de profondeur d'E/S 1, qui affiche 2.2 Gio/s). Pour des tailles de blocs de 16 Ko, les performances varient de 0.5 Gio/s à 1.4 Gio/s, selon la profondeur d'E/S, avec un pic à 1.4 Gio/s à des profondeurs d'E/S plus élevées.

En comparaison, le Solidigm P5336 est plus performant avec des blocs de 128 Ko et 1 Mo, avec un pic à 3.2 Gio/s. Pour des blocs de plus petite taille (16 Ko), le Solidigm P5336 affiche également des performances supérieures, atteignant un pic à 1.4 Gio/s avec des profondeurs d'E/S de 16 à 64. Cela indique que le Solidigm P5336 est légèrement plus efficace avec des blocs de plus petite taille lors des opérations d'écriture.

En adoptant une approche différentielle, nous observons un écart plus important entre les performances d'écriture du Dapustor J5060 et celles du Solidigm P5336. Notre comparaison de débit montre que le J5060 est inférieur au P5336 dans la plupart des domaines, notamment avec des blocs de grande taille (1 M) et toutes les profondeurs d'E/S. Les baisses de débit atteignent -0.5 Gio/s à 4 profondeurs d'E/S. Bien que des gains de performances soient observés à des profondeurs d'E/S plus élevées avec des blocs de 128 Ko, ils ne sont pas suffisants pour compenser la sous-performance générale.

En comparant la latence d'écriture séquentielle entre le Dapustor J5060 et le Solidigm P5336, les deux disques affichent un comportement similaire pour des tailles de blocs plus petites, comme 16 Ko. Solidigm conserve un léger avantage pour les profondeurs d'E/S plus faibles, tandis que Dapustor comble l'écart pour les profondeurs plus élevées (64 et 128 Ko). Avec des tailles de blocs de 128 Ko, Solidigm domine à nouveau pour les files d'attente peu profondes, mais Dapustor offre une latence systématiquement plus faible à mesure que la profondeur d'E/S augmente, ce qui indique une meilleure évolutivité sous charge. Cependant, avec des tailles de blocs de 1 Mo, Solidigm conserve un net avantage en termes de latence pour toutes les profondeurs d'E/S, affichant des temps de réponse nettement plus rapides sous des charges de travail d'écriture séquentielle importantes. Globalement, Solidigm affiche des performances plus constantes, tandis que la force de Dapustor est plus visible pour les blocs de taille moyenne et les files d'attente plus profondes.

Résumé de la charge de travail du FIO

Flexible I/O Tester (FIO) est un outil d'analyse comparative standard utilisé pour mesurer les performances des périphériques de stockage dans une grande variété de scénarios de charge de travail. Reconnu pour sa polyvalence et sa fiabilité, FIO simule des conditions réelles et fournit des informations sur les capacités et les limites de performance d'un SSD. StorageReview exploite FIO pour proposer des analyses complètes, mesurant le débit, la latence et les IOPS selon les schémas de charge de travail, la taille des blocs et la profondeur des files d'attente.

Charges de travail appliquées :

  • Lecture et écriture séquentielles de 128 K
  • 64 XNUMX lectures et écritures aléatoires
  • 16 XNUMX lectures et écritures aléatoires
  • 4 XNUMX lectures et écritures aléatoires

Ces charges de travail représentent un large éventail de cas d’utilisation d’entreprise, notamment des transferts séquentiels volumineux, des E/S aléatoires intensives typiques des bases de données et des accès aléatoires à petits blocs couramment observés dans les environnements virtualisés.

Cette section sur les performances résume les performances du Dapustor J5060 sur les principales charges de travail synthétiques, notamment les opérations de lecture/écriture séquentielles et aléatoires avec différentes tailles de blocs et profondeurs de file d'attente. Les métriques sont extraites directement de la sortie fio analysée et incluent la bande passante (Mo/s), les IOPS et les percentiles de latence jusqu'à 99.9999 %, offrant ainsi un aperçu du débit et du comportement de la queue sous charge.

Performances de lecture et d'écriture séquentielles de 128 K

par chaîne Profondeur de thread/E/S BW (Mo/s) IOPS 99.0% 99.9% 99.99%
Dapustor J5060 1T/64Q 7,482 57,081 1.66 ms 2.02 ms 2.83 ms
Solidigme P5336 1T/64Q 7,479 57,057 1.51 ms 1.66 ms 1.81 ms
Dapustor J5060 1T/16Q 3,023 23,063 0.69 ms 0.69 ms 0.70 ms
Solidigme P5336 1T/16Q 3,364 25,669 2.67 ms 3.48 ms 4.42 ms

Le Dapustor J5060 offre des performances de lecture séquentielle impressionnantes à 128 Ko, atteignant 7.48 Go/s avec un contrôle strict de la latence, même aux percentiles les plus élevés. Comparé au Solidigm P5336, le débit du J5060 est sensiblement le même (7.48 Go/s contre 7.47 Go/s). Cependant, Solidigm conserve un léger avantage en termes de régularité de la latence, avec une latence de queue légèrement inférieure.

À 128 Ko d'écritures séquentielles (QD16), le J5060 atteint des performances solides de 3,023 5336 Mo/s avec une latence très faible. Cependant, le Solidigm P3,364 surpasse légèrement ce chiffre, atteignant 99.99 4.42 Mo/s, mais avec une latence nettement supérieure, notamment au percentile 0.70 % (5060 ms contre XNUMX ms pour Dapustor). Cela indique que le JXNUMX est un candidat plus solide pour les scénarios d'écriture séquentielle sensibles à la latence.

Performances de lecture et d'écriture aléatoires de 64 K

par chaîne Profondeur des E/S BW (Mo/s) IOPS 99.0% 99.9% 99.99%
Dapustor J5060 8T/32Q 7,475 114,058 20.05 ms 21.89 ms 25.82 ms
Solidigme P5336 8T/32Q 7,472 114,014 21.36 ms 21.89 ms 22.68 ms
Dapustor J5060 8T/32Q 534 8,151 574.6 ms 708.8 ms 742.39 ms
Solidigme P5336 8T/32Q 857 13,070 196.1 ms 208.6 ms 221.24 ms

En lecture aléatoire 64 K (QD256), le Dapustor J5060 excelle avec un débit proche de 7.4 Go/s et une latence bien maîtrisée. Les résultats de Solidigm sont très proches (7.47 Go/s), avec une latence maximale légèrement supérieure. Les deux disques affichent ici des performances exceptionnelles, avec des différences pratiques minimes.

C'est là que le J64 peine à atteindre ses performances en écriture aléatoire à 5060 K, avec un débit en chute libre à 534 Mo/s et une latence en forte hausse (742.39 ms à 99.99 %). En comparaison, le Solidigm P5336 surpasse largement le J5060, avec un débit de 857 Mo/s et une latence nettement inférieure (221.24 ms au même percentile), ce qui le rend bien plus adapté aux applications sensibles à la latence et au débit d'écriture soutenu.

Performances de lecture et d'écriture aléatoires de 16 K

par chaîne Profondeur des E/S BW (Mo/s) IOPS 99.0% 99.9% 99.99%
Dapustor J5060 8T/32Q 7,430 453,461 5.28 ms 6.39 ms 8.16 ms
Solidigme P5336 8T/32Q 7,431 453,527 5.01 ms 5.21 ms 5.47 ms
Dapustor J5060 8T/32Q 531 32,404 143.65 ms 149.94 ms 181.40 ms
Solidigme P5336 8T/32Q 847 51,724 57.9 ms 65.8 ms 71.8 ms

Avec une charge de travail de 16 256 lectures aléatoires (QD453), le Dapustor obtient d'excellents résultats avec 5336 5.47 IOPS et une latence contrôlée. Le Solidigm P8.16 reproduit largement ces performances, devançant légèrement le Dapustor en termes de latence (99.99 ms contre XNUMX ms à XNUMX %), ce qui suggère une légère amélioration de la cohérence de la latence pour Solidigm dans les scénarios de lectures aléatoires intensives.

Les performances d'écriture aléatoire 16 K du SSD Dapustor chutent considérablement à 32 K IOPS, et la latence augmente à 181.4 ms (99.99 %). Là encore, Solidigm surpasse largement le disque Dapustor, avec 51.7 K IOPS et un profil de latence considérablement amélioré (71.8 ms à 99.99 %), soulignant l'avantage de Solidigm pour les charges de travail d'écriture aléatoire sensibles à la latence.

Performances de lecture et d'écriture aléatoires de 4 K

par chaîne Profondeur des E/S BW (Mo/s) IOPS 99.0% 99.9% 99.99%
Dapustor J5060 8T/32Q 6,941 1,694,464 1.43 ms 1.58 ms 1.79 ms
Solidigme P5336 8T/32Q 3,994 975,108 2.31 ms 2.41 ms 2.64 ms
Dapustor J5060 8T/32Q 131 31,923 143.65 ms 145.75 ms 179.31 ms
Solidigme P5336 8T/32Q 197 48,030 58.5 ms 64.2 ms 68.7 ms

Le scénario de lecture aléatoire 4K est un atout majeur du Dapustor J5060, avec des performances maximales dépassant 1.69 million d'IOPS à QD256, combinées à une latence incroyablement faible. En comparaison, le Solidigm P5336 est nettement moins performant, avec seulement 975 5060 IOPS et une latence nettement supérieure à tous les percentiles. Pour les lectures aléatoires intensives de petits blocs, le Dapustor JXNUMX est clairement le meilleur choix.

Malheureusement, les performances d'écriture aléatoire 5060K du J4 chutent considérablement, avec seulement 131 Mo/s et 31.9 K IOPS avec une latence élevée (179.31 ms à 99.99 %). Le SSD Solidigm gère ce scénario plus facilement, avec 197 Mo/s, 48 ​​K IOPS et une latence de fin de bande passante nettement inférieure (68.7 ms à 99.99 %). Malgré des pics de latence, Solidigm reste un disque beaucoup plus performant pour les charges de travail exigeantes en écriture aléatoire 4K.

Conclusion

En résumé, le DapuStor J5060 est un SSD QLC d'entreprise haute capacité conçu pour les charges de travail intensives en lecture, où la densité de stockage et le coût par téraoctet priment sur les performances d'écriture soutenues. Avec des capacités allant jusqu'à 61.44 To et une interface PCIe Gen4, il est particulièrement adapté aux environnements tels que les réseaux de diffusion de contenu, les archives cloud ou les systèmes d'inférence d'IA qui reposent sur des lectures séquentielles volumineuses et des écritures peu fréquentes.

Dans cet objectif, nous avons soumis le J5060 à divers tests pour évaluer ses performances en pratique, notamment par rapport au Solidigm P5336. Le J5060 offre de solides performances en lecture séquentielle et un stockage haute densité, ce qui peut convenir aux environnements à lecture intensive. Dans certains cas, notamment avec des profondeurs d'E/S plus faibles et des tailles de blocs plus importantes, le J5060 surpasse le Solidigm P5336. Sa latence et son débit dans ces scénarios montrent qu'il a été conçu pour privilégier l'efficacité de la lecture de gros blocs.

Cependant, les performances sont fortement impactées par l'activité d'écriture. Sur presque tous les indicateurs d'écriture (IOPS, latence et débit compris), le J5060 est systématiquement sous-performant. Cette faiblesse est particulièrement visible sous une pression d'écriture séquentielle élevée, avec des profondeurs d'E/S élevées et des blocs de grande taille, où la latence est relativement élevée et le débit stagne. Même lors des charges de travail de points de contrôle liées à l'IA, le J5060 démarre fort, mais ses performances se dégradent rapidement, signalant des problèmes de cohérence d'écriture continue.

Pour les organisations ayant des besoins en lecture intensive et en capacité, le J5060 offre une valeur évidente, mais ses limites le rendent plus difficile à vendre pour les charges de travail mixtes ou à forte intensité d'écriture.

S'engager avec StorageReview

Newsletter |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | Flux RSS