Le DapuStor R6060 est un SSD QLC PCIe Gen5 pour entreprises, basé sur le contrôleur DP800 et la mémoire NAND 3D QLC. Cette gamme se décline aux formats U.2, E3.L et E1.L, avec des capacités respectives de 15.36 To, 30.72 To, 61.44 To et 122.88 To, ainsi qu'une version haut de gamme de 245 To. L'interface prend en charge le fonctionnement double port PCIe 5.0 x4 ou 2×2 et NVMe 2.0. Notre modèle de test est la variante E3.L 2T de 122.88 To, que DapuStor destine aux infrastructures d'IA denses, aux déploiements cloud et aux pools de stockage à grande échelle où la densité de mémoire flash est primordiale. Le profil de performance correspond à ce rôle, associant une bande passante de lecture séquentielle élevée à un débit d'écriture beaucoup plus faible, ce qui rend le R6060 mieux adapté aux ensembles de données à forte intensité de lecture et aux niveaux de stockage axés sur la capacité qu'aux charges de travail transactionnelles par petits blocs.
DapuStor annonce un débit de lecture séquentielle maximal de 14 Go/s pour l'ensemble de la gamme R6060, et un débit d'écriture séquentielle de 4 Go/s. Les performances en lecture aléatoire atteignent 3 millions d'IOPS pour les modèles de 15.36 To et 30.72 To, tandis que les modèles de 61.44 To et 122.88 To sont évalués à 2.8 millions d'IOPS. Les performances en écriture aléatoire sont nettement inférieures : 40 000 IOPS à 16 Ko pour les capacités les plus faibles et 20 000 IOPS à 32 Ko pour le modèle de 122.88 To. Le R6060 se positionne ainsi comme un outil principalement dédié à la lecture, notamment pour les grands ensembles de données et les niveaux de stockage haute densité où la capacité utilisable prime sur la vitesse d'écriture par petits blocs.
Le R6060 intègre les fonctionnalités professionnelles attendues d'un disque de ce type, notamment la technologie NVMe 2.0 FDP (Flexible Data Placement), particulièrement pertinente pour la mémoire QLC. FDP offre à l'hôte un meilleur contrôle sur l'emplacement d'écriture des données, ce qui contribue à réduire l'amplification d'écriture et à optimiser l'utilisation de la mémoire flash. DapuStor annonce un taux d'écriture par jour (DWPD) de 0.6 DWPD pour ce disque et indique sa conformité OCP 2.5, NVMe-MI 1.2, la protection des données de bout en bout, le démarrage sécurisé, la vérification du firmware, la prise en charge de l'effacement sécurisé des données, la télémétrie, la surveillance de la latence et la prise en charge du double port pour les systèmes nécessitant une redondance des chemins d'accès.
DapuStor offre une garantie de cinq ans sur le R6060 et indique une consommation maximale de 25 W et une consommation en veille de 5 W. La latence aléatoire est de 80/25 µs en lecture/écriture, la latence séquentielle est de 7/8 µs et le MTBF est de 2.5 millions d'heures.
| Métrique/Champ | 15.36TB | 30.72TB | 61.44TB | 122.88TB |
|---|---|---|---|---|
| Généralités | ||||
| PCN | R6060 | |||
| Capacité (To) | 15.36 | 30.72 | 61.44 | 122.88 |
| Facteur de forme | U.2/E3.L 2T/E1.L | |||
| Interface | PCIe 5.0×4 / 2×2, NVMe 2.0 | |||
| Type de flash | Mémoire flash NAND QLC 3D Enterprise | |||
| Performances | ||||
| Bande passante de lecture à 128 Ko (Mo/s) | 14000 | 14000 | 14000 | 14000 |
| Bande passante d'écriture à 128 Ko (Mo/s) | 4000 | 4000 | 4000 | 4000 |
| Lecture aléatoire @4KB KIOPS | 3000 | 3000 | 2800 | 2800 |
| KIOPS d'écriture aléatoire | 40@16KB | 40@16KB | 40@16KB | 20@32KB |
| Latence aléatoire R/W (µs) | 80/25 | |||
| Latence séquentielle R/W (µs) | 7/8 | |||
| Tuning Moteur | ||||
| Puissance maximale (W) | 25 | |||
| Puissance au ralenti (W) | 5 | |||
| Fiabilité | ||||
| Endurance | 0.6 DWPD | |||
| MTBF | 2.5 millions d'heures | |||
| UBER | 1 secteur par 10^18 bits lus | |||
| Garantie | 5 ans | |||
Nous utilisons un Dell PowerEdge R760 exécutant Ubuntu 22.04.2 LTS comme plateforme de test pour toutes les charges de travail de cette évaluation. Équipé d'un Câbles série Gen5 JBOFIl offre une compatibilité étendue avec les SSD U.2, E1.S, E3.S et M.2. Notre configuration système est décrite ci-dessous :
Lors de l'analyse des résultats des tests de performance, il est important de tenir compte du positionnement de ces disques. Bien qu'ils ne soient pas tous en concurrence directe dans les scénarios de déploiement, leurs capacités et leurs cibles marketing se recoupent suffisamment pour fournir un contexte utile quant à la place du DapuStor R6060 122.88 To sur le marché actuel des SSD d'entreprise haute capacité.
Ce groupe de comparaison met en lumière différentes approches pour l'extension des capacités de mémoire flash d'entreprise. La Micron 6550 ION de 61.44 To, basée sur la technologie TLC, privilégie des performances brutes Gen5 supérieures, tandis que les Solidigm P5336 de 122.88 To et 61.44 To misent principalement sur l'optimisation de la densité et du rapport coût-efficacité grâce à la technologie NAND QLC. La DapuStor J5060 de 61.44 To constitue un autre point de référence pour la technologie Gen4 U.2, tandis que la R6060, avec ses 122.88 To, s'aventure sur le segment plus récent de la Gen5 E3.L.
L'inclusion de ces disques offre une vision plus large de la façon dont le R6060 se compare aux conceptions axées sur la performance et sur la densité, alors que les fournisseurs continuent de faire évoluer les plateformes de stockage d'entreprise haute capacité.
Pour mesurer les performances de stockage de chaque SSD selon les indicateurs courants du secteur, nous utilisons FIO. Chaque disque est soumis au même processus de test, qui comprend une étape de préconditionnement avec deux remplissages complets du disque avec une charge de travail d'écriture séquentielle, suivie d'une mesure des performances en régime permanent. À chaque modification du type de charge de travail mesuré, nous effectuons un nouveau remplissage de préconditionnement avec cette nouvelle taille de transfert.
Dans cette section, nous nous concentrons sur les benchmarks FIO suivants :
Écriture séquentielle de 128 K (IODepth 16 / NumJobs 1)
Le disque DapuStor R6060 de 122.88 To a atteint une vitesse de 3 920,6 Mo/s lors du test d'écriture séquentielle à 128 Ko, se classant ainsi deuxième de ce groupe. Le Micron 6550 ION de 61.44 To le devance largement avec 10 456,4 Mo/s, mais le R6060 reste nettement en tête devant le Solidigm P5336 de 122.88 To (3 152,5 Mo/s), le DapuStor J5060 de 61.44 To (2 883,1 Mo/s) et le Solidigm P5336 de 61.44 To (2 503,5 Mo/s).
Latence d'écriture séquentielle de 128 K (IODepth 16 / NumJobs 1)
Le DapuStor R6060 de 122.88 To a affiché une latence d'écriture séquentielle de 509.7 µs (128 Ko), se classant une nouvelle fois deuxième. Le Micron 6550 ION de 61.44 To a dominé le classement avec 191.0 µs, tandis que les autres disques testés étaient à la traîne du R6060, notamment le Solidigm P5336 de 122.88 To (634.0 µs), le DapuStor J5060 de 61.44 To (693.3 µs) et le Solidigm P5336 de 61.44 To (798.4 µs). Malgré une avance confortable de Micron, le R6060 a tout de même réalisé la meilleure performance parmi les disques restants.
Lecture séquentielle de 128 K (IODepth 64 / NumJobs 1)
Le DapuStor R6060 122.88 To a atteint 11 554,0 Mo/s au test de lecture séquentielle 128K, ce qui le place à nouveau en deuxième position derrière le Micron 6550 ION 61.44 To à 13 979,7 Mo/s.
Après ces deux modèles, les performances ont chuté brutalement pour le reste du groupe de comparaison : le Solidigm P5336 de 61.44 To a atteint 7 132,3 Mo/s, le Solidigm P5336 de 122.88 To 7 121,6 Mo/s et le DapuStor J5060 de 61.44 To 7 126,8 Mo/s. Seul le R6060, hormis le modèle Micron, a dépassé les 11 Go/s lors de ce test.
Latence de lecture séquentielle de 128 K (IODepth 64 / NumJobs 1)
Le DapuStor R6060 de 122.88 To a enregistré une latence de lecture séquentielle de 692.1 µs (128 Ko), se classant ainsi deuxième du groupe. Le Micron 6550 ION de 61.44 To a affiché la latence la plus faible (571.9 µs), tandis que le Solidigm P5336 de 122.88 To a enregistré la plus élevée (1123.0 µs). Les deux modèles Solidigm P5336 étaient quasiment identiques : 1123.0 µs pour la version 122.88 To et 1121.3 µs pour la version 61.44 To. Le DapuStor J5060 se situait entre les deux avec une latence de 1122.1 µs.
Le R6060 a conservé une belle avance sur le reste du peloton, même si Micron a toujours décroché le meilleur résultat.
Écriture aléatoire 64K
Le DapuStor R6060 de 122.88 To a affiché des performances quasi stables lors du test d'écriture aléatoire à 64 Ko. Il a débuté à 3 477,9 Mo/s et 55 600 IOPS avec un ratio de 1/1, puis a bondi à 3 915,2 Mo/s et 62 600 IOPS avec un ratio de 1/2. À partir de là, ses performances sont restées quasiment inchangées. La majeure partie du test s'est déroulée entre 3 913,7 Mo/s et 3 916,9 Mo/s, avec un résultat maximal de 3 916,9 Mo/s et 62 700 IOPS avec un ratio de 4/1. Même avec des paramètres plus exigeants, il a maintenu 3 914,6 Mo/s avec un ratio de 32/4, 3 913,8 Mo/s avec un ratio de 16/8 et 3 914,0 Mo/s avec un ratio de 32/8. Donc, en dehors du point de départ inférieur 1/1, le R6060 est resté essentiellement sur un plateau fixe pendant toute la durée du balayage.
En comparant les autres disques du tableau, le Micron 6550 ION 61.44 To a affiché des performances nettement supérieures, passant d'environ 2.4 Go/s à un peu plus de 10.3 Go/s. Derrière le R6060, le Solidigm P5336 122.88 To s'est maintenu autour de 3.0 Go/s, le DapuStor J5060 61.44 To a oscillé autour de 2.8 Go/s, et le Solidigm P5336 61.44 To a varié entre 2.5 et 2.6 Go/s. Le R6060 a ainsi conservé la deuxième place, devançant largement les autres disques non Micron.
Latence d'écriture aléatoire de 64 K
La latence a suivi la même tendance stable : 18 µs à 1/1, 31 µs à 1/2 et 2/1, 63 µs à 1/4, 2/2 et 4/1, puis 127 µs à 2/4, 4/2 et 8/1. Avec l’augmentation de la charge, elle est passée à 255 µs à 1/8, 2/8, 8/2 et 16/1, puis à 510 µs à 4/8, 8/4 et 32/1. Pour les charges les plus élevées, elle a atteint 1 021 µs à 8/8, 16/4 et 32/2, 2 043 µs à 16/8 et 32/4, et un pic de 4 087 µs à 32/8.
Le disque Micron a affiché la latence la plus faible, de loin, avec environ 1 600 µs à 32 bits/s. Le R6060 a terminé deuxième avec 4 087 µs. Le Solidigm P5336 de 122.88 To a atteint environ 5 100 µs, le J5060 environ 5 500 µs et le Solidigm P5336 de 61.44 To un peu plus de 6 000 µs. Ainsi, même si le R6060 était loin d'égaler le Micron en termes de latence, il a tout de même devancé les trois autres disques lorsque le test s'est intensifié.
Lecture aléatoire 64K
Le SSD DapuStor R6060 de 122.88 To a affiché une courbe de performance moins régulière en lecture aléatoire 64 Ko, mais ses résultats finaux étaient les meilleurs. Il a démarré à 381.4 Mo/s et 6 100 IOPS à 1/1, puis a atteint 748.2 Mo/s à 1/2, 1 007,1 Mo/s à 2/2, 1 431,8 Mo/s à 1/4 et 2 343,8 Mo/s à 2/4. Le débit a continué d'augmenter jusqu'à 2 767,5 Mo/s à 1/8, puis 3 668,5 Mo/s à 4/4, 4 060,2 Mo/s à 16/2, 4 750,0 Mo/s à 2/8, 6 433,3 Mo/s à 8/4 et 7 495,3 Mo/s à 4/8. De là, il a atteint 8 428,0 Mo/s à 32/2, 9 827,5 Mo/s à 16/4, 10 782,5 Mo/s à 8/8, 12 798,2 Mo/s à 16/8 et a culminé à 13 274,8 Mo/s à 32/8.
Comme l'indique le graphique ci-dessous, le Micron 6550 ION 61.44 To est resté en tête pendant une grande partie du test, atteignant un débit légèrement inférieur à 13.0 Go/s, bien que le R6060 ait réussi à terminer juste au-dessus du Micron à la toute fin.
Latence de lecture aléatoire de 64 K
Bien que plus instable que les autres disques en début de test, le R6060 a affiché de solides performances en fin de test. Il a commencé à 163 µs à 1/1, puis a mesuré 167 µs à 1/2, 174 µs à 1/4, 180 µs à 1/8, 217 µs à 2/8, 220 µs à 2/4, 249 µs à 2/2, 260 µs à 2/1, 287 µs à 4/8, 290 µs à 4/4 et 352 µs à 8/4. Les fréquences moyennes sont devenues moins nettes, avec 446 µs à 8/1, 505 µs à 16/2, 531 µs à 32/2, 574 µs à 16/1, 595 µs à 32/1, 700 µs à 16/8, 738 µs à 32/4 et un pic de 1 285 µs à 32/8.
Sur le graphique, Micron est resté globalement en dessous et a terminé autour de 1 200 µs à 32 bits/s. Le R6060 a terminé à 1 285 µs, ce qui était encore beaucoup plus bas que le J5060 et les deux disques Solidigm, qui ont tous dépassé les 2 200 µs à l'extrémité.
Lecture aléatoire 16K
Le SSD DapuStor R6060 de 122.88 To a obtenu d'excellents résultats au test de lecture aléatoire 16K après une augmentation progressive de la charge de travail. Il a démarré à 9 600 IOPS à 1/1, puis a progressé jusqu'à 18 000 à 2/1, 37 200 à 1/4, 58 200 à 8/1 et 72 800 à 1/8. Il a ensuite continué à progresser, atteignant 112 800 à 16/1, 133 300 à 4/4, 138 100 à 2/8 et 140 300 à 1/16, avant de connaître une accélération significative avec l'augmentation de la charge de travail. Il a ainsi atteint 211 600 à 32/1, 246 900 à 8/4, 256 500 à 4/8 et 261 200 à 2/16. Avec les paramètres les plus lourds, il a maintenu 436.0K à 16/4, 447.7K à 8/8 et 456.1K à 4/16, avant de terminer à 659.3K à 32/4, 671.3K à 16/8, 679.7K à 8/16, 784.5K à 32/8, 786.2K à 16/16 et de culminer à 817.7K IOPS à 32/16.
Face aux autres disques testés, le R6060 s'est avéré l'un des plus performants, même si Micron a conservé la première place. Le Micron 6550 ION 61.44 To a atteint environ 860 000 IOPS, devançant ainsi le R6060 en hautes performances. Cela dit, le R6060 a largement dominé les deux disques Solidigm P5336 pendant la majeure partie du test et a terminé nettement au-dessus d'eux.
Latence de lecture aléatoire de 16 K
La latence du R6060 est restée satisfaisante pendant la majeure partie du test, jusqu'à la fin. Elle a débuté à 104 µs sur un rapport signal/bruit de 1:1, puis s'est établie à 110 µs sur un rapport signal/bruit de 2:1 et à 124 µs sur un rapport signal/bruit de 4:1. Sur les réglages de puissance faible et moyenne, elle est restée stable, avec notamment 107 µs à 1/4, 109 µs à 1/8, 113 µs à 1/16, 115 µs à 2/8, 120 µs à 4:4, 130 µs à 8:4, 137 µs à 8:1 et 141 µs à 16:1. À mesure que la charge augmentait, la latence augmentait progressivement à 143 µs à 8/8, 148 µs à 16/4, 151 µs à 32/1, 189 µs à 8/16 et 193 µs à 16/8, avant de grimper plus rapidement aux combinaisons les plus lourdes, atteignant 196 µs à 32/4, 330 µs à 16/16, 336 µs à 32/8 et culminant à 642 µs à 32/16.
Cela a permis au R6060 de conserver de bonnes performances pendant la majeure partie du test, malgré une légère hausse en fin de parcours. Le Micron 6550 ION a quant à lui conservé la meilleure courbe de latence globale et est resté nettement en dessous sur l'ensemble du graphique.
Écriture aléatoire 16K
Le DapuStor R6060 de 122.88 To a affiché un faible rendement en écriture aléatoire (16 Ko) par rapport à la plupart des autres disques testés. Il a démarré à 42 700 IOPS le 1er janvier, est monté à 51 30.0 le 4 janvier et a culminé à 50 700 le 4 février. Par la suite, il s'est généralement maintenu entre 28 000 et 46 000 IOPS pour le reste du test, avec notamment 46 400 IOPS le 8 janvier, 43 000 le 8 février, 44 200 le 4 février, 41 300 le 8 février, 37 100 le 4 février, 36 100 le 8 février, 30 000 le 16 février et 27 300 le 32 février. En termes de bande passante, cela s'est traduit par un pic de 801.4 Mo/s, la majeure partie du trajet se situant plus près de la plage de 500 à 700 Mo/s.
Face à la concurrence, le R6060 affichait des performances nettement inférieures en termes d'IOPS d'écriture brutes, à l'exception de l'autre disque Solidigm de 122 To. Le Micron 6550 ION de 61.44 To s'est avéré de loin le plus performant, se maintenant la plupart du temps entre 250 000 et 660 000 IOPS. Le DapuStor J5060 de 61.44 To oscillait généralement autour de 175 000 à 185 000 IOPS, tandis que le Solidigm P5336 de 61.44 To se situait habituellement aux alentours de 160 000 IOPS.
Latence d'écriture aléatoire de 16 K
Le R6060 a commencé assez bas à 23 µs à 1/1, puis a mesuré 51 µs à 2/1, 77 µs à 1/4, 115 µs à 4/1 et 157 µs à 2/4. À partir de là, elle a grimpé assez rapidement à mesure que la charge de travail augmentait, atteignant 371 µs à 2/8, 470 µs à 16/1, 779 µs à 4/8, 815 µs à 8/4, 881 µs à 2/16, 1 139 µs à 32/1, 1 548 µs à 8/8, 1 723 µs à 16/4, 1 738 µs à 4/16, 3 660 µs à 8/16, 4 133 µs à 32/4, 8 537 µs à 16/16, 8 846 µs à 32/8 et enfin 18 759 µs à 32/16.
Cela a permis au R6060 d'afficher la latence la plus élevée du groupe en fin de test. Micron est resté nettement inférieur tout au long du test, et même le J5060 et les deux disques Solidigm ont terminé bien en dessous du R6060 lors des combinaisons les plus exigeantes.
Lecture aléatoire 4K
Le DapuStor R6060 122.88 To a affiché d'excellents résultats en lectures aléatoires 4K, avec des performances s'améliorant à mesure que le test passait à des combinaisons de profondeur de file d'attente et de nombre de tâches plus lourdes.
Le nombre d'IOPS a commencé à 11.5K à 1/1, puis a grimpé à 21.5K à 2/1, 44.0K à 1/4, 83.2K à 2/4, 85.4K à 1/8, 162.2K à 2/8 et 165.0K à 1/16. À partir de là, il a continué à augmenter, atteignant 313.1K à 4/8, 316.5K à 2/16, 557.9K à 16/4, 585.6K à 8/8, 598.9K à 4/16, 1.043M à 16/8, 1.069M à 8/16, 1.729M à 16/16 et finalement culminant à 2.061M d'IOPS à 32/16. La bande passante a atteint un maximum de 8 050,3 Mo/s.
Latence de lecture aléatoire de 4 K
La latence de lecture est restée stable pendant la majeure partie du test, n'augmentant sensiblement qu'en fin de période. Le R6060 a débuté à 0.086 ms à 1/1, puis a enregistré 0.092 ms à 2/1, 0.090 ms à 1/4, 0.095 ms à 2/4, 0.093 ms à 1/8, 0.098 ms à 2/8 et 0.096 ms à 1/16. Au milieu du test, elle est restée proche de ce niveau, avec notamment 0.101 ms à 4/4 et 4/8, 0.107 ms à 8/4, 0.109 ms à 8/8, 0.115 ms à 16/4, 0.119 ms à 8/16 et 0.123 ms à 16/8. Avec les réglages les plus élevés, il est monté à 0.148 ms à 16/16, à 0.155 ms à 32/8 et a culminé à 0.247 ms à la fin du test.
L'un des tests que nous avons menés sur ce banc d'essai était le test Magnum IO GPU Direct Storage (GDS). GDS est une fonctionnalité développée par NVIDIA qui permet aux GPU de contourner le CPU lors de l'accès aux données stockées sur des disques NVMe ou d'autres périphériques de stockage haute vitesse. Au lieu de faire transiter les données par le CPU et la mémoire système, GDS permet une communication directe entre le GPU et le périphérique de stockage, réduisant ainsi considérablement la latence et améliorant le débit.
Comment fonctionne le stockage direct GPU
Traditionnellement, lorsqu'un GPU traite des données stockées sur un disque NVMe, celles-ci transitent d'abord par le processeur et la mémoire système avant d'atteindre le GPU. Ce processus crée des goulots d'étranglement, le processeur servant d'intermédiaire, augmentant la latence et consommant de précieuses ressources système. Le stockage direct GPU élimine cette inefficacité en permettant au GPU d'accéder directement aux données depuis le périphérique de stockage via le bus PCIe. Ce chemin direct réduit la charge de travail liée au transfert de données, permettant des transferts plus rapides et plus efficaces.
Les charges de travail de l’IA, en particulier celles impliquant l’apprentissage profond, sont très gourmandes en données. La formation de grands réseaux neuronaux nécessite le traitement de téraoctets de données, et tout retard dans le transfert de données peut entraîner une sous-utilisation des GPU et des temps de formation plus longs. Le stockage direct GPU relève ce défi en garantissant que les données sont transmises au GPU le plus rapidement possible, en minimisant les temps d’inactivité et en maximisant l’efficacité de calcul.
En outre, GDS est particulièrement utile pour les charges de travail impliquant la diffusion de grands ensembles de données, comme le traitement vidéo, le traitement du langage naturel ou l'inférence en temps réel. En réduisant la dépendance au processeur, GDS accélère le déplacement des données et libère les ressources du processeur pour d'autres tâches, améliorant ainsi encore les performances globales du système.
Débit de lecture séquentielle GDSIO
Lors de notre test de débit de lecture séquentielle GDSIO, le DapuStor R6060 de 122.88 To a affiché des résultats mitigés pour les transferts de 16 Ko, avant de se stabiliser avec des performances nettement supérieures à mesure que la taille des blocs augmentait. À 16 Ko, il a atteint 663.7 Mio/s avec un seul cœur, puis 221.5 Mio/s avec quatre cœurs et 200.3 Mio/s avec huit cœurs, avant de remonter à 978.8 Mio/s avec 128 cœurs. Ce débit s'est donc avéré inférieur à celui de certains autres disques sur la majeure partie de la portion du test consacrée aux petits blocs, notamment avec un nombre moyen de cœurs. Les lectures séquentielles de 16 Ko n'ont donc pas été le point fort de ce disque.
À 128 Ko/s, le R6060 s'est montré nettement plus performant. Il a atteint 1.4 Gio/s avec un seul cœur, 1.7 Gio/s avec 16 cœurs, 2.8 Gio/s avec 32 cœurs, puis 4.3 Gio/s avec 64 cœurs et 4.9 Gio/s avec 128 cœurs. Il a ainsi obtenu les meilleurs résultats de ce groupe pour les lectures séquentielles à 128 Ko/s avec un nombre élevé de cœurs, devançant le DapuStor J5060 (61.44 To), le Micron 6550 ION (61.44 To) et le Solidigm P5336 (122.88 To). L'écart était particulièrement marqué à 64 et 128 cœurs, où le R6060 s'est démarqué de ses concurrents.
Les gains les plus importants ont été observés lors des tests à 1 million de requêtes, où le R6060 a démarré à 1.7 Gio/s avec un seul cœur, puis est passé à 3.0 Gio/s avec quatre cœurs, 4.4 Gio/s avec huit, 5.2 Gio/s avec seize, pour atteindre un pic de 5.9 Gio/s avec 128 cœurs. À partir de huit cœurs, il a dominé le groupe de comparaison et a continué à creuser l'écart à mesure que le nombre de requêtes simultanées augmentait. Ainsi, malgré des performances irrégulières du R6060 sur la section des 16 Ko, ses résultats en lecture séquentielle à 128 Ko et 1 million de requêtes étaient excellents, notamment lorsque le nombre de cœurs atteignait des niveaux élevés.
IOPS de lecture séquentielle GDSIO
Pour les IOPS en lecture séquentielle GDSIO, le DapuStor R6060 de 122.88 To a affiché un profil contrasté selon la taille des blocs. À 16 Ko, il a démarré en force avec 42 500 IOPS sur un seul cœur, avant de chuter à 14 200 IOPS sur quatre cœurs et à 12 800 sur huit, puis de remonter progressivement pour atteindre 19 900 IOPS sur 32 cœurs, 36 600 sur 64 et 62 600 sur 12.8. Cette reprise l'a placé au niveau du Micron 6550 ION en haut du classement, même si le Solidigm P5336 a largement dominé cette partie du test avec 92 500 IOPS sur 128 cœurs. Les charges de travail plus légères à 16 Ko ont été un peu irrégulières pour le R6060 au milieu de la plage de nombre de cœurs, mais ses performances finales ont été bien meilleures qu'il n'y paraissait au départ.
À 128 000 IOPS, le R6060 a affiché une courbe de montée en charge plus robuste et stable. Il a atteint 11 600 IOPS sur un seul cœur, 6 400 sur quatre, 8 700 sur huit, 14 000 sur seize, 23 200 sur trente-deux, 35 300 sur soixante-quatre et 40 300 sur vingt-huit. Il s'agissait du meilleur résultat du groupe dans cette plage de performances, devant le DapuStor J5060 (61.44 To à 31 300 IOPS), le Solidigm P5336 (122.88 To à 23 300 IOPS) et le Micron 6550 ION (61.44 To à 19 400 IOPS). Dès que la concurrence a augmenté, le R6060 s'est nettement démarqué dans ce domaine.
Lors des tests de transfert de 1 million d'opérations (1M), le R6060 a affiché de bonnes performances (bien que cela soit difficilement visible sur le graphique). Il a démarré à 1 700 IOPS, puis est passé à 3 000 à quatre cœurs, 4 500 à huit cœurs, 5 300 à seize cœurs, 5 600 à trente-deux cœurs, 5 900 à soixante-quatre cœurs et enfin 6 000 à vingt-huit cœurs. Il a ainsi obtenu le meilleur résultat du groupe de comparaison pour les transferts de 1 M, surpassant le DapuStor J5060 (4 300 IOPS), le Solidigm P5336 (4 300 IOPS) et le Micron 6550 ION (2 600 IOPS). Malgré quelques baisses de performance à 16 000 IOPS, le R6060 a offert d'excellentes performances en lecture séquentielle à 128 000 et 1 M, notamment lorsque le nombre de cœurs atteignait la limite supérieure du test.
Latence de lecture séquentielle GDSIO
En termes de latence de lecture séquentielle GDSIO, le DapuStor R6060 122.88 To a affiché l'un des meilleurs résultats de ce groupe, notamment avec l'augmentation du nombre de threads. À 16 000 tr/min, il a atteint 22 µs avec un seul thread, puis 281 µs avec quatre threads, 623 µs avec huit, 1.1 ms avec 16, 1.6 ms avec 32, 1.7 ms avec 64 et 2.0 ms avec 128. Il a ainsi enregistré la latence la plus faible à la charge la plus légère (16 000 tr/min) et est resté compétitif sur le reste de la plage de performances. Les SSD Micron 6550 ION et Solidigm P5336 ont toutefois affiché des latences légèrement inférieures en milieu de plage (16 000 tr/min) avant que l'écart ne se resserre à nouveau en fin de plage.
À 128 Ko, le R6060 a conservé une excellente position, avec des temps de réponse de 85 µs à 1 thread, 621 µs à 4 threads, 923 µs à 8 threads, 1.1 ms à 16 threads, 1.4 ms à 32 threads, 1.8 ms à 64 threads et 3.2 ms à 128 threads. Sur 32 threads, il s'est maintenu en tête du classement, et même lorsque la latence augmentait sous une charge plus importante, ses performances restaient compétitives par rapport aux autres disques testés. Le Micron 6550 ION a obtenu des résultats nettement supérieurs sur la partie supérieure du test à 128 Ko, tandis que les DapuStor J5060 et Solidigm P5336 ont également surpassé le R6060 sur 128 threads.
L'écart le plus important est apparu lors des tests avec une charge de travail de 1 million de transferts (1M), où le R6060 a affiché des temps de réponse de 587 µs avec un seul thread, 1.3 ms avec quatre, 1.8 ms avec huit, 3.0 ms avec 16, 5.8 ms avec 32, 10.8 ms avec 64 et 21.3 ms avec 128. Ces performances étaient supérieures à celles du Micron 6550 ION sur l'ensemble du test et inférieures à celles du Solidigm P5336 avec un nombre de threads plus élevé, bien que le DapuStor J5060 ait conservé la tête avec 64 et 128 threads. Globalement, le R6060 a bien géré la latence de lecture séquentielle malgré l'augmentation de la taille des transferts et de la concurrence, avec des résultats particulièrement solides lors des tests les plus exigeants.
Débit d'écriture séquentielle GDSIO
En termes de débit d'écriture séquentielle GDSIO, le DapuStor R6060 de 122.88 To a affiché d'excellents résultats sur la majeure partie de la plage de tests, notamment à 128 Ko/s et lors des premiers essais à 1 Mo. À 16 Ko/s, il a démarré à 0.67 Gio/s, a atteint 1.18 Gio/s avec quatre cœurs, 1.37 Gio/s avec huit, et a culminé à 1.47 Gio/s avec seize cœurs avant de retomber à 1.20 Gio/s à 128 Ko/s. Ces performances étaient comparables à celles du Micron 6550 ION, qui a affiché des résultats légèrement supérieurs sur une grande partie de la plage de débits à 16 Ko/s avec un nombre moyen de cœurs.
Le R6060 s'est montré nettement plus performant une fois la taille des blocs passée à 128 Ko. Il a démarré à 2.79 Gio/s, puis a bondi à 3.82 Gio/s avec quatre cœurs et s'est maintenu à ce niveau jusqu'à 16 cœurs, où il a atteint 3.83 Gio/s. Ensuite, il a affiché 3.71 Gio/s à 32 cœurs, 3.80 Gio/s à 64 et 3.28 Gio/s à 128 cœurs. Cela l'a placé en tête des autres disques de ce comparatif sur la quasi-totalité de la plage de 128 Ko, avec seulement une légère baisse de performances observée au nombre de cœurs le plus élevé.
À 1 million de copies, le R6060 a de nouveau dominé le groupe pour les nombres de copies inférieurs et moyens. Il a atteint un débit de 3.81 Gio/s avec une copie, 3.73 Gio/s avec quatre copies, 3.79 Gio/s avec huit copies et 3.49 Gio/s avec seize copies, avant de diminuer à 3.31 Gio/s avec trente-deux copies, 3.06 Gio/s avec soixante-quatre copies et 2.93 Gio/s avec vingt-huit copies. Le Micron 6550 ION a finalement pris la tête dans la partie la plus exigeante du test à 1 million de copies, atteignant un pic de 3.90 Gio/s avec trente-deux copies, tandis que le Solidigm P5336 est resté aux alentours de 3 Gio/s et le DapuStor J5060 s'est maintenu aux alentours de 2.8 Gio/s tout au long du test. Globalement, le R6060 a affiché l'un des meilleurs profils de débit d'écriture séquentielle de ce groupe, avec ses meilleures performances à 128K et une forte montée en puissance initiale sur les charges de travail de 1M.
IOPS d'écriture séquentielle GDSIO
Pour les IOPS en écriture séquentielle GDSIO, le DapuStor R6060 de 122.88 To a affiché d'excellentes performances dès le départ (16 000 IOPS) et s'est maintenu parmi les meilleurs pendant la majeure partie de cette période. Il a débuté à 43 500 IOPS avec un seul cœur, puis est passé à 76 900 IOPS avec quatre cœurs, 89 400 avec huit, 95 900 avec seize, et a culminé à 98 400 IOPS avec 32 cœurs avant de redescendre à 89 800 avec 64 cœurs et à 78 700 avec 128 cœurs. Le Micron 6550 ION a terminé légèrement au-dessus au milieu de la période de test à 16 000 IOPS, atteignant 100 000 IOPS avec 32 cœurs et 97 500 avec 64 cœurs, mais le R6060 est resté très proche jusqu'au nombre de cœurs le plus élevé, où le J5060 et le Solidigm P5336 l'ont devancé.
À 128 Ko, le R6060 a affiché les meilleures performances de ce groupe du début à la fin. Il a enregistré 22 800 IOPS sur un seul cœur, puis 31 300 sur quatre, 31 300 sur huit, 31 400 sur seize, 30 300 sur trente-deux, 31 200 sur soixante-quatre et 26 900 sur douze. Il a ainsi devancé le Micron 6550 ION, qui s'est maintenu aux alentours de 30 000 IOPS en milieu de plage avant de chuter aux alentours de 20 000, et a largement devancé le J5060 et le Solidigm P5336, qui ont tous deux accusé un retard plus important sur la majeure partie de la plage de performances à 128 Ko.
La section à 1 Mo était beaucoup plus serrée pour les quatre disques, mais le R6060 est tout de même resté parmi les meilleurs. Il a atteint 3.9 3.8 IOPS sur un seul cœur, 3.9 3.6 sur quatre, 16 3.4 sur huit, 32 3.1 sur seize, 64 3.0 sur trente-deux, 128 32 sur soixante-quatre et 64 128 sur vingt-huit. Cela le place légèrement devant le J5060 en bas de la plage de performances et quasiment au même niveau que le Solidigm P5336 en fin de test, tandis que le Micron 6550 ION a brièvement pris la tête sur trente-deux et soixante-quatre cœurs. Globalement, le R6060 a affiché un excellent profil d'IOPS en écriture séquentielle, avec un meilleur résultat à vingt-huit Ko, dominant ainsi le groupe de comparaison sur toute la plage de cœurs.
Latence d'écriture séquentielle GDSIO
En matière de latence d'écriture séquentielle GDSIO, le DapuStor R6060 de 122.88 To a affiché d'excellents résultats sur les portions de test à charge faible et moyenne, avant de céder du terrain à mesure que le nombre de threads augmentait. À 16 000 écritures par minute, il a mesuré 22 µs avec un thread, 51 µs avec quatre, 88 µs avec huit, 165 µs avec seize, 323 µs avec trente-deux, 709 µs avec soixante-quatre et 16 ms avec vingt-huit. Ces résultats sont globalement très bons et ont permis au R6060 de se maintenir parmi les meilleurs du groupe pendant la majeure partie du test à 1.6 000 écritures par minute. Le Micron 6550 ION a obtenu un résultat légèrement inférieur sur la charge la plus lourde à 16 000 écritures par minute, tandis que le J5060 et le Solidigm P5336 ont fait mieux.
À 128 000 threads, le R6060 est resté compétitif, affichant une latence de 43 µs à 1 thread, 126 µs à 4, 254 µs à 8, 508 µs à 16, 1.1 ms à 32, 2.0 ms à 64 et 4.8 ms à 128. Il s'agissait de l'une des courbes de latence les plus faibles de la comparaison, notamment à 64 threads. Seul le Micron 6550 ION affichait une latence légèrement inférieure à 64 threads, tandis que le J5060 et le Solidigm P5336 surpassaient le R6060 à 128 threads.
La plus forte augmentation a été observée dans la section 1M, où le R6060 a mesuré 255 µs avec un seul thread, 1.0 ms avec 4, 2.1 ms avec 8, 4.5 ms avec 16, 9.5 ms avec 32, 20.5 ms avec 64 et 42.7 ms avec 128. Ces résultats le placent derrière le Micron 6550 ION sous les charges les plus importantes, et légèrement au-dessus du Solidigm P5336, tandis que le J5060 a enregistré la latence la plus élevée de ce groupe à pleine charge. Ainsi, le R6060 a affiché de bonnes performances en écriture séquentielle jusqu'à 16 et 128 Ko, mais les transferts plus importants (1M) ont montré une augmentation plus marquée de la latence à mesure que la concurrence augmentait.
Pour évaluer les performances réelles des SSD dans les environnements d'entraînement d'IA, nous avons utilisé l'outil de test DLIO (Data and Learning Input/Output). Développé par le Laboratoire national d'Argonne, DLIO est spécifiquement conçu pour tester les schémas d'E/S dans les charges de travail d'apprentissage profond. Il permet d'analyser comment les systèmes de stockage gèrent des problématiques telles que la création de points de contrôle, l'ingestion de données et l'entraînement de modèles. Le test est conçu de manière à ce que chaque disque soit entièrement rempli de points de contrôle ; les SSD de plus grande capacité peuvent en gérer davantage. Le graphique ci-dessous illustre les performances des deux disques sur 99 points de contrôle (198 pour le disque de 122 To). Lors de l'entraînement de modèles d'apprentissage automatique, les points de contrôle sont essentiels pour sauvegarder régulièrement l'état du modèle et éviter toute perte de données en cas d'interruption ou de coupure de courant. Cette exigence de stockage requiert des performances robustes, notamment sous des charges de travail soutenues ou intensives. Nous avons utilisé la version 2.0 du test DLIO, publiée le 13 août 2024.
Afin de garantir que nos tests de performance reflètent des scénarios réels, nous les avons basés sur l'architecture du modèle LLAMA 3.1 405B. Nous avons implémenté la sauvegarde des données à l'aide de `torch.save()` pour enregistrer les paramètres du modèle, l'état de l'optimiseur et l'état des couches. Notre configuration simulait un système à huit GPU, mettant en œuvre une stratégie de parallélisme hybride avec un parallélisme tensoriel à quatre voies et un parallélisme de pipeline à deux voies, répartis sur les huit GPU. Cette configuration a généré des points de sauvegarde d'une taille de 1 636 Go, représentative des exigences actuelles en matière d'entraînement de grands modèles de langage.
Pour le test de moyenne de réussite des points de contrôle DLIO, nous avons comparé le DapuStor R6060 122TB au Solidigm P5336 122.88TB, au Solidigm P5336 61.44TB et au Micron 6550 ION 61.44TB.
Le DapuStor R6060 a réalisé un excellent premier passage, signant le meilleur temps du groupe avec 465.33 secondes. Cependant, ses performances ont fortement chuté lors des passages suivants, atteignant 934.50 secondes au deuxième passage et 965.27 secondes au troisième. Il s'est ainsi retrouvé dernier au classement général, derrière le Solidigm P5336 122.88 To (757.31 secondes), le Solidigm P5336 61.44 To (639.63 secondes) et le Micron 6550 ION 61.44 To (585.03 secondes).
Lors du test de points de contrôle DLIO, le DapuStor R6060 122 To a affiché la variation de performances la plus marquée au fil de la charge de travail. En début de test, ce disque figurait parmi les plus performants, se maintenant de manière très constante autour de 460 secondes, au même niveau que le Micron 6550 ION 61.44 To et devant les deux disques Solidigm. Cependant, dès que le nombre de points de contrôle a augmenté, le R6060 a considérablement ralenti, atteignant entre 900 et 1 000 secondes pour la plupart des points de contrôle restants.
Le SSD DapuStor R6060 de 122.88 To a fonctionné conformément à ses spécifications. Les lectures de gros blocs, les transferts séquentiels et les charges de travail GPU Direct Storage ont été ses points forts, tandis que les écritures aléatoires de petits blocs ont constitué son point faible. Sous FIO, le R6060 a atteint 11 554 Mo/s en lecture séquentielle 128 Ko et 3 920,6 Mo/s en écriture séquentielle 128 Ko. Il a maintenu des performances quasi stables entre 3 913 Mo/s et 3 916 Mo/s lors des tests d'écriture aléatoire 64 Ko, a atteint 13 274,8 Mo/s en lecture aléatoire 64 Ko, 817 700 IOPS en lecture aléatoire 16 Ko et un pic de 2.061 millions d'IOPS en lecture aléatoire 4 Ko. Les résultats en écriture aléatoire 16 Ko ont été son point faible, le SSD se montrant nettement en deçà des performances des SSD axés sur l'écriture figurant dans notre comparatif.
GDSIO a suivi la même tendance. Le R6060 s'est montré irrégulier lors des tests de lecture de blocs de 16 Ko, mais a affiché d'excellentes performances avec l'augmentation de la taille des transferts. Il a dominé le groupe de comparaison en termes de débit de lecture séquentielle (128 Ko et 1 Mo) avec un nombre élevé de threads, atteignant 5.9 Gio/s en lecture séquentielle (1 Mo), et a affiché les meilleures performances en écriture séquentielle (128 Ko) sur toute la plage de nombres de threads. La latence lors des tests GPU directs avec des blocs de grande taille était également globalement satisfaisante.
DapuStor propose le R6060 dans une large gamme de formats, avec des options U.2, E3.L et E1.L allant de 15.36 To à 122.88 To, ainsi qu'une version haut de gamme de 245 To. Cette diversité offre une grande flexibilité aux intégrateurs, mais souligne également l'importance d'une vérification préalable de la compatibilité. La variante E3.L 2T de 122.88 To que nous avons testée se situe en dehors des déploiements U.2 et E3.S les plus courants dans les centres de données. De manière générale, les SSD EDSFF nécessitent toujours une attention particulière concernant les emplacements de disques, l'épaisseur, la longueur et l'allocation des lignes PCIe avant toute commande. Un disque de 2 To ne s'insère pas dans un emplacement de 1 To, et un disque E3.L ne s'installe pas dans un emplacement E3.S. Bien que cela soit courant pour l'intégration de SSD EDSFF aujourd'hui, il est important de le signaler pour toute personne intégrant ces variantes plus denses pour la première fois dans un déploiement.
Pour les niveaux de stockage pour lesquels le R6060 est conçu, il a bien fonctionné et offre à DapuStor une option QLC Gen5 haute capacité crédible.
Bien que les serveurs Dell PowerEdge R4715 et R5715 soient deux produits distincts, ils doivent être considérés comme une matrice configurable. Cette matrice…
Le SSD NVMe 6600 ION de Micron atteint désormais 245.76 To, propulsant ainsi la gamme PCIe Gen5 QLC de l'entreprise, axée sur la capacité, dans la catégorie des quarts de pétaoctets. Micron…
La Radeon RX 9070 GRE n'est pas une nouvelle carte graphique. AMD l'a lancée l'année dernière exclusivement en Chine, et…
Les mises à jour de stockage se présentent généralement sous deux formes. Il y a la mise à niveau discrète, où un fournisseur intègre un nouveau processeur, affirme…
L'infrastructure de sauvegarde et de restauration a toujours été la partie du centre de données qui retient le plus l'attention lorsqu'un problème survient…
L'infrastructure de cyber-résilience occupe une place dans l'architecture d'entreprise que le stockage principal n'occupe pas. Lorsqu'un système tombe en panne…