Accueil Entreprise Test du SSD KIOXIA CD6 PCIe 4.0

Test du SSD KIOXIA CD6 PCIe 4.0

by Lyle Smith
Vue de face du KIOXIA CD6

L'interface NVMe, en particulier PCIe 3.0 NVMe 1.3, est depuis un certain temps l'interface SSD préférable pour pratiquement tous les cas d'utilisation. Cette interface a été utilisée maintes et maintes fois alors que les fournisseurs continuent d'améliorer leurs performances à chaque nouvelle génération. PCIe est maintenant entré en 4.0, apportant avec lui des gains massifs en performances séquentielles et aléatoires. Le KIOXIA CD6 est le dernier SSD à arriver sur le marché (et l'un des premiers PCIe 4.0 pour les entreprises), se concentrant sur des performances constantes dans des environnements exigeants 24 × 7. Cela le rend idéal pour les centres de données ayant des besoins d'endurance à usage mixte et à lecture intensive. Les SSD KIOXIA CD6 sont également conformes à la norme SFF-TA-1001, ce qui permet une connectivité avec les disques SAS, SATA et NVMe sur le même fond de panier (ainsi qu'avec les contrôleurs tri-mode). La gamme KIOXIA propose des capacités allant de 800 Go à 15.36 To et est disponible dans plusieurs options de sécurité et d'endurance différentes.

L'interface NVMe, en particulier PCIe 3.0 NVMe 1.3, est depuis un certain temps l'interface SSD préférable pour pratiquement tous les cas d'utilisation. Cette interface a été utilisée maintes et maintes fois alors que les fournisseurs continuent d'améliorer leurs performances à chaque nouvelle génération. PCIe est maintenant entré en 4.0, apportant avec lui des gains massifs en performances séquentielles et aléatoires. Le KIOXIA CD6 est le dernier SSD à arriver sur le marché (et l'un des premiers PCIe 4.0 pour les entreprises), se concentrant sur des performances constantes dans des environnements exigeants 24 × 7. Cela le rend idéal pour les centres de données ayant des besoins d'endurance à usage mixte et à lecture intensive. Les SSD KIOXIA CD6 sont également conformes à la norme SFF-TA-1001, ce qui permet une connectivité avec les disques SAS, SATA et NVMe sur le même fond de panier (ainsi qu'avec les contrôleurs tri-mode). La gamme KIOXIA propose des capacités allant de 800 Go à 15.36 To et est disponible dans plusieurs options de sécurité et d'endurance différentes. Le CD6 est également disponible dans des facteurs de forme de 2.5 pouces et 15 mm de hauteur Z et est alimenté par le contrôleur propriétaire de KIOXIA, le micrologiciel et la mémoire BiCS FLASH 96D TLC à 3 couches. Il utilise une conception à port unique (c'est-à-dire qu'il existe un chemin de données de l'hôte au SSD).

MISE À JOUR 4/2/22 - Nous avons réexaminé le Kioxia CD6 avec un firmware plus mature

Vue de face du KIOXIA CD6

Les performances de PCIe 4.0 ont le potentiel d'atteindre des chiffres assez incroyables, et le KIOXIA CD6 ne fait certainement pas exception. KIOXIA cite sa nouvelle gamme de disques pour offrir des performances séquentielles jusqu'à 6.2 Go/s et 4.0 Go/s en lecture et en écriture, respectivement, tandis que les performances aléatoires ont le potentiel d'atteindre jusqu'à un million d'IOPS en lecture et 250,000 XNUMX IOPS en écriture. Ce sont des chiffres pour le moins impressionnants.

Vue arrière du KIOXIA CD6

Il dispose également d'une gamme de fonctionnalités de fiabilité intégrées, y compris la récupération de panne de disque de 6e génération, la protection à double parité et la protection contre les coupures de courant (PLP), la correction des données de bout en bout pour une fiabilité accrue. Le KIOXIA CD6 est compatible NVMe 1.4, ce qui apporte des fonctionnalités importantes au lecteur. Cela inclut les journaux d'événements persistants, les améliorations de nettoyage, la granularité de l'espace de noms et la protection en écriture de l'espace de noms.

Vue bâbord / latérale du KIOXIA CD6

Spécifications KIOXIA CD6

Spécification CM6-R (lecture intensive) CM6-V (usage mixte)
Facteur de forme

2.5 pouces 15 mm de hauteur Z

Capacités 960 Go, 1.92 To, 3.84 To, 7.68TB, 15.36 To 800 Go, 1.6 To, 3.2 To, 6.4 To, 12.8 To
Interface PCIe Gen3/4, 1×4
Conformité PCIe 4.0 et NVMe 1.4
Type NAND KIOXIA BiCS FLASH TLC 96D 3 couches
Lecture séquentielle Gen3 = jusqu'à 3,500 4 Mo/s ; Gen6,200 = jusqu'à XNUMX XNUMX Mo/s Gen3 = jusqu'à 3,500 4 Mo/s ; Gen6,200 = jusqu'à XNUMX XNUMX Mo/s
Écriture séquentielle Gen3 = jusqu'à 2,350 4 Mo/s ; Gen4,000 = jusqu'à XNUMX XNUMX Mo/s Gen3 = jusqu'à 2,350 4 Mo/s ; Gen4,000 = jusqu'à XNUMX XNUMX Mo/s
Lecture aléatoire Gen3 = jusqu'à 770 4 IOPS ; Gen1.0 = jusqu'à XNUMX million d'IOPS Gen3 = jusqu'à 770 4 IOPS ; Gen1.0 = jusqu'à XNUMX million d'IOPS
Écriture aléatoire Gen3 = jusqu'à 75 4 IOPS ; Gen85 = jusqu'à XNUMX XNUMX IOPS Gen3 = jusqu'à 165 4 IOPS ; Gen250 = jusqu'à XNUMX XNUMX IOPS
Consommation d'énergie

Actif : 20 W ; Inactif : < 5 W

Endurance 1 DWPD pendant 5 ans 3 DWPD pendant 5 ans
BER incorrigible

1 secteur par 10^17 bits lus

MTTF / RFA

2.5 millions d'heures / 0.35 %

Température de fonctionnement

0 à 70C

Performances du KIOXIA CD6

Banc d'essai

Nos nouvelles revues de SSD PCIe Gen4 Enterprise tirent parti d'un Lenovo Think System SR635 pour les tests applicatifs et les benchmarks synthétiques. Le ThinkSystem SR635 est une plate-forme AMD à processeur unique bien équipée, offrant une puissance de processeur bien supérieure à ce qui est nécessaire pour mettre l'accent sur le stockage local hautes performances. C'est également la seule plate-forme de notre laboratoire (et l'une des rares sur le marché actuellement) avec des baies PCIe Gen4 U.2. Les tests synthétiques ne nécessitent pas beaucoup de ressources CPU mais exploitent toujours la même plate-forme Lenovo. Dans les deux cas, l'intention est de présenter le stockage local sous le meilleur jour possible, conformément aux spécifications maximales des lecteurs du fournisseur de stockage.

Plate-forme synthétique et d'application PCIe Gen4 (Lenovo ThinkSystem SR635)

  • 1 x AMD 7452 (2.35 GHz x 32 cœurs)
  • 8 x 64 Go DDR4-3200 MHz ECC DRAM
  • Cent OS 7.7 1908
  • ESXi 6.7u3

Plate-forme d'applications PCIe Gen3 (Lenovo Think System SR850)

  • 4 processeurs Intel Platinum 8160 (2.1 GHz x 24 cœurs)
  • 16 x 32 Go DDR4-2666 Mhz ECC DRAM
  • 2 cartes RAID RAID 930-8i 12 Go/s
  • 8 baies NVMe
  • VMware ESXI 6.7u3

Plate-forme synthétique PCIe Gen3 (Dell PowerEdge R740xd)

  • 2 processeurs Intel Gold 6130 (2.1 GHz x 16 cœurs)
  • 4 x 16 Go DDR4-2666 MHz ECC DRAM
  • 1x carte RAID PERC 730 2 Go 12 Go/s
  • Adaptateur NVMe complémentaire
  • Ubuntu-16.04.3-bureau-amd64

Étant la première série d'examens sur une nouvelle plate-forme, nous avons inclus les résultats des lecteurs passés, qui sont proches mais pas à 100 % des comparaisons de pommes à pommes puisqu'ils étaient testés sur une plate-forme plus ancienne. Nos différences de test synthétiques n'auront pas beaucoup de biais dans les résultats, mais les charges de travail des applications fonctionnant sur la plate-forme AMD à processeur unique par rapport à la plate-forme Intel Quad CPU peuvent dans une certaine mesure. Lors de nos tests MySQL, l'un des nouveaux produits Gen4 KIOXIA a pris les devants, mais la latence du serveur SQL était moyenne. Avec seulement deux disques Gen4 que nous avons pu publier, nous n'avons pas une quantité importante de données comparables, mais il est important de prendre note de la visualisation de ces résultats. Nous avons également intensifié nos tests synthétiques pour tirer parti des SSD plus rapides, affichant désormais les résultats des tests avec un nombre de threads de pointe plus élevé.

Contexte des tests et comparables

Vue d'ensemble Laboratoire de test d'entreprise StorageReview fournit une architecture flexible pour effectuer des tests de performances des périphériques de stockage d'entreprise dans un environnement comparable à ce que les administrateurs rencontrent dans les déploiements réels. Le laboratoire de test d'entreprise intègre une variété de serveurs, de réseaux, de conditionnement d'alimentation et d'autres infrastructures de réseau qui permettent à notre personnel d'établir des conditions réelles pour évaluer avec précision les performances lors de nos examens.

Nous intégrons ces détails sur l'environnement de laboratoire et les protocoles dans les revues afin que les professionnels de l'informatique et les responsables de l'acquisition du stockage puissent comprendre les conditions dans lesquelles nous avons obtenu les résultats suivants. Aucun de nos examens n'est payé ou supervisé par le fabricant de l'équipement que nous testons. Des détails supplémentaires sur le Laboratoire de test d'entreprise StorageReview et mes un aperçu de ses capacités de mise en réseau sont disponibles sur ces pages respectives.

Analyse de la charge de travail des applications

Afin de comprendre les caractéristiques de performance des périphériques de stockage d'entreprise, il est essentiel de modéliser l'infrastructure et les charges de travail des applications trouvées dans les environnements de production en direct. Nos références pour le Kioxia CD6 sont donc les Performances MySQL OLTP via SysBench et mes Performances OLTP de Microsoft SQL Server avec une charge de travail TCP-C simulée. Pour nos charges de travail d'application, chaque disque exécutera 4 machines virtuelles configurées de manière identique.

Performances du serveur SQL

Chaque machine virtuelle SQL Server est configurée avec deux vDisks : un volume de 100 Go pour le démarrage et un volume de 500 Go pour la base de données et les fichiers journaux. Du point de vue des ressources système, nous avons configuré chaque machine virtuelle avec 8 vCPU, 64 Go de DRAM et exploité le contrôleur LSI Logic SAS SCSI. Alors que nos charges de travail Sysbench testées saturaient la plate-forme à la fois en termes d'E/S de stockage et de capacité, le test SQL recherche les performances de latence.

Ce test utilise SQL Server 2014 s'exécutant sur des machines virtuelles invitées Windows Server 2012 R2 et est souligné par Benchmark Factory for Databases de Quest. StorageReview's Protocole de test OLTP Microsoft SQL Server utilise la version actuelle du Transaction Processing Performance Council's Benchmark C (TPC-C), une référence de traitement des transactions en ligne qui simule les activités trouvées dans des environnements d'application complexes. Le benchmark TPC-C est plus proche que les benchmarks de performances synthétiques pour évaluer les forces de performance et les goulots d'étranglement de l'infrastructure de stockage dans les environnements de base de données. Chaque instance de notre machine virtuelle SQL Server pour cet examen utilise une base de données SQL Server de 333 Go (échelle 1,500 15,000) et mesure les performances transactionnelles et la latence sous une charge de XNUMX XNUMX utilisateurs virtuels.

Configuration des tests SQL Server (par machine virtuelle)

  • Windows Server 2012 R2
  • Empreinte de stockage : 600 Go alloués, 500 Go utilisés
  • SQL Server 2014
    • Taille de la base de données : échelle 1,500 XNUMX
    • Charge de client virtuel : 15,000 XNUMX
    • Mémoire tampon : 48 Go
  • Durée du test : 3 heures
    • 2.5 heures de préconditionnement
    • Période d'échantillonnage de 30 minutes

Pour notre benchmark transactionnel SQL Server, le KIOXIA CD6 avait un score de 12,633.7 4 TPS sur XNUMX VM.

La latence moyenne a vu le KIOXIA CD6 avoir 5.5 ms à 4 VM (le même que le CD6), le plaçant légèrement derrière les lecteurs Huawei et Memblaze.

Performances de Sybench

Le prochain benchmark applicatif consiste en un Base de données Percona MySQL OLTP mesuré via SysBench. Ce test mesure également le TPS moyen (transactions par seconde), la latence moyenne et la latence moyenne au 99e centile.

Chaque Banc Sys La VM est configurée avec trois vDisks : un pour le démarrage (~92 Go), un avec la base de données prédéfinie (~447 Go) et le troisième pour la base de données testée (270 Go). Du point de vue des ressources système, nous avons configuré chaque machine virtuelle avec 8 vCPU, 60 Go de DRAM et exploité le contrôleur LSI Logic SAS SCSI.

Configuration des tests Sysbench (par machine virtuelle)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tableaux de base de données : 100
    • Taille de la base de données : 10,000,000 XNUMX XNUMX
    • Threads de base de données : 32
    • Mémoire tampon : 24 Go
  • Durée du test : 3 heures
    • 2 heures de préconditionnement 32 fils
    • 1 heure 32 fils

Passant au benchmark transactionnel Sysbench, le KIOXIA a affiché un score de pointe de 9,333 4 TPS sur XNUMXVM.

Dans la latence moyenne de Sysbench, nous avons vu le CD6 avec une latence de seulement 13.71 ms à 4 VM, encore une fois en tête du peloton.

Pour notre pire scénario de latence (99e centile), le CD6 a atteint 27.48 ms à 4 VM, cette fois derrière le Huawei d'un cheveu (27.22 ms).

Analyse de la charge de travail VDBench

Lorsqu'il s'agit de comparer les périphériques de stockage, les tests d'application sont les meilleurs et les tests synthétiques viennent en deuxième position. Bien qu'ils ne soient pas une représentation parfaite des charges de travail réelles, les tests synthétiques aident à référencer les périphériques de stockage avec un facteur de répétabilité qui facilite la comparaison de pommes à pommes entre des solutions concurrentes. Ces charges de travail offrent une gamme de profils de test différents, allant des tests « aux quatre coins », des tests de taille de transfert de base de données communs, aux captures de traces à partir de différents environnements VDI. Tous ces tests exploitent le générateur de charge de travail vdBench commun, avec un moteur de script pour automatiser et capturer les résultats sur un grand cluster de test de calcul. Cela nous permet de répéter les mêmes charges de travail sur une large gamme de périphériques de stockage, y compris les baies flash et les périphériques de stockage individuels. Notre processus de test pour ces benchmarks remplit toute la surface du disque avec des données, puis partitionne une section de disque égale à 25 % de la capacité du disque pour simuler la façon dont le disque pourrait répondre aux charges de travail des applications. Ceci est différent des tests d'entropie complète qui utilisent 100% du lecteur et les amènent dans un état stable. Par conséquent, ces chiffres refléteront des vitesses d'écriture plus soutenues.

Profils:

  • Lecture aléatoire 4K : 100 % de lecture, 128 threads, 0-120 % d'iorate
  • Écriture aléatoire 4K : 100 % d'écriture, 128 threads, 0-120 % de vitesse
  • Lecture aléatoire 4K (charge élevée) : 100 % de lecture, 512 threads, 0-120 % d'iorate
  • Écriture aléatoire 4K (charge élevée) : 100 % d'écriture, 512 threads, 0-120 % d'iorate
  • Lecture séquentielle 64K : 100 % de lecture, 32 threads, 0-120 % d'iorate
  • Écriture séquentielle 64K : 100 % d'écriture, 16 threads, 0-120 % d'iorate
  • Lecture séquentielle 64K (charge élevée) : 100 % de lecture, 64 threads, 0-120 % d'iorate
  • Écriture séquentielle 64K (charge élevée) : 100 % d'écriture, 64 threads, 0-120 % d'iorate
  • Base de données synthétique : SQL et Oracle
  • Traces de clone complet et de clone lié VDI

Comparables :

Dans notre première analyse de charge de travail VDBench, Random 4K Read, le KIOXIA CD6 avait un score maximal de 760,160 165.5 IOPS avec une latence de XNUMX µsPerformances de lecture aléatoire KIOXIA CD6 4KLors d'une charge élevée en lecture aléatoire 4K, nous avons vu le KIOXIA CD6 ralentir un peu en approchant la barre des 1 million d'IOPS, se terminant avec un pic de 1,067,840 472 XNUMX IOPS à XNUMX µs.

Performances de lecture aléatoire KIOXIA CD6 4K (charge élevée)

Pour l'écriture aléatoire 4K, le CD6 était le plus performant, culminant à 579,919 211.1 IOPS avec une latence de XNUMX µs.

Performances d'écriture aléatoire 4KDans une charge d'écriture élevée, le KIOXIA CD6 a montré un pic impressionnant de 709,547 713.3 IOPS avec une latence de XNUMX µs.

KIOXIA CD6 4K Performances d'écriture aléatoire (charge élevée)En passant aux charges de travail séquentielles, le CD6 a montré de solides résultats avec un pic de 68,413 4.28 IOPS (ou 465.6 Go/s) à XNUMX µs (l'autre KIOXIA était censé être le meilleur lecteur en lecture). Performances de lecture séquentielle KIOXIA CD6 64KLors d'une charge élevée en lectures séquentielles, le CD6 a culminé à 75,598 4.72 IOPS (843.5 Go/s) avant de ralentir pour atteindre une latence aussi élevée que XNUMX ms.

KIOXIA CD6 64K lecture hautePour l'écriture séquentielle 64K, le KIOXIA CD6 a de nouveau montré qu'il est une centrale électrique en écriture, affichant un pic de 53,402 3.33 IOPS (ou 291.6 Go/s) avec une latence de XNUMX ms avant de chuter un peu à la fin.

KIOXIA CD6 64K écrireDans une charge d'écriture élevée, le KIOXIA CD6 a culminé à 42,299 2.58 IOPS (ou 65.1 Go/s) avec une latence de seulement XNUMX ms.

KIOXIA CD6 64K écriture hauteNotre prochaine série de tests concerne nos charges de travail SQL : SQL, SQL 90-10 et SQL 80-20. En commençant par SQL, le KIOXIA CD6 avait un pic solide de 241,700 131.1 IOPS et une latence de XNUMX ms.  Dans SQL 90-10, le CD6 avait à peu près les mêmes performances que le lecteur Memblaze, culminant à 243,292 129.9 IOPS et XNUMX ms de latence.Dans le SQL 80-20, les disques les plus performants affichaient des performances assez similaires, le CD6 affichant un pic de 244,857 128.3 IOPS avec une latence de XNUMX ms.

Viennent ensuite nos charges de travail Oracle : Oracle, Oracle 90-10 et Oracle 80-20. En commençant par Oracle, le KIOXIA CD6 a culminé à la troisième place avec un solide 253,635 137.5 IOPS et une latence de XNUMX µs. 

Oracle 90-10 nous a montré plus de ce qui précède, le CD6 a culminé à 168,000 116.8 IOPS avec XNUMX µs de latence.Avec Oracle 80-20, les 4 premiers disques ont montré des performances très similaires, le CD6 culminant à 192,663 112.3 avec une latence de XNUMX ms.Ensuite, nous sommes passés à notre test de clone VDI, Full et Linked. Pour le démarrage VDI Full Clone (FC), le KIOXIA CD6 avait un pic de 196,584 172.3 IOPS à une latence de XNUMX µs pour la troisième place.  VDI FC Initial Login, le KIOXIA CD6 a eu les meilleures performances avec un pic de 169,412 172.6 IOPS à XNUMX ms.

VDI FC Monday Login, le CD6 a de nouveau montré des performances optimales avec un pic de 109,488 142.7 IOPS à XNUMX ms.

Pour le démarrage VDI Linked Clone (LC), le CD6 a affiché un impressionnant 100,678 157 IOPS à 6 ms de latence, juste derrière le KIOXIA CMXNUMX.  La connexion initiale VDI LC a montré des nombres inégaux lors du profil de connexion initial, culminant à 25,235 313.8 IOPS et XNUMX ms de latence avant de subir une forte baisse des performances.Enfin, avec VDI ​​LC Monday Login, le KIOXIA CD6 a terminé nos tests avec une autre bonne performance, avec 84,903 184.3 IOPS à XNUMX ms.

Conclusion

Le KIOXIA CD6 est le tout dernier SSD de centre de données hautes performances à arriver sur le marché, tirant parti de la nouvelle interface PCIe 4.0. Il est spécialement conçu pour les environnements exigeants 24 × 7, en particulier ceux qui ont des besoins d'endurance à usage mixte et à lecture intensive. Le nouveau disque KIOXIA est disponible dans un facteur de forme de 2.5 pouces de hauteur Z de 15 mm, comprend KIOXIA BiCS FLASH 96D TLC à 3 couches et est disponible dans une large gamme de capacités allant de 960 Go à 15.36 To. Il est également livré avec une gamme d'options de sécurité.

Pour les performances, nous avons comparé le CD6 à d'autres SSD de classe similaire, dont le KIOXIA CM6. Pour l'analyse de la charge de travail des applications, nous avons vu le CD6 atteindre 12,633.7 5.5 TPS avec une latence moyenne de 9,333 ms dans SQL Server, le plaçant juste en dessous des disques Memblaze et Huawei. Pour Sysbench, le disque a atteint 13.71 27.48 TPS, une latence moyenne de XNUMX ms et une latence de XNUMX m dans le pire des cas.

Notre test VDbench a vu des performances plus solides de la part de KIOXIA. Dans la plupart des cas, cependant, il suivait le lecteur CM6. Les points forts incluent : 760,160 4 IOPS en lecture 1,067,840K (charge élevée de 579,919 4 709,547 IOPS), 4.28 64 IOPS en écriture 4.72K (charge élevée de 3.33 64 IOPS), 2.58 Go/s en lecture 242K (charge élevée de 243 Go/s) et 90 Go/s en 10K écriture (charge élevée de 245 Go/s). Les charges de travail SQL ont enregistré 80 20 IOPS, 6 254 IOPS pour SQL 168-90 et 10 192 IOPS dans SQL 80-20. Dans Oracle, les disques les plus performants ont eu des performances très similaires (dont le CD6), affichant des charges de travail avec XNUMX IOPS, XNUMX XNUMX IOPS dans Oracle XNUMX-XNUMX et XNUMX XNUMX IOPS dans Oracle XNUMX-XNUMX. Dans notre test VDI Clone, le CDXNUMX a montré des performances impressionnantes dans tous les domaines, mises en évidence par ses meilleures performances dans nos tests VDI FC Monday Login et VDI FC Initial Login.

L'accent de cette revue est mis sur les performances du CD6, qui rassemble une carte de pointage impressionnante. Peut-être que l'histoire la plus importante est l'avenir de PCIe Gen4. Lenovo est le premier à sortir de la porte avec un serveur qui prend en charge PCIe Gen4 de l'avant vers l'arrière. La plupart des autres serveurs ne prennent en charge que Gen4 à l'arrière, ce qui est une décision de conception fondamentale. Il était plus facile et plus rapide de sauter les baies avant. Lenovo a pris la voie la plus complète et a développé ses serveurs Rome pour pouvoir profiter de tout ce qu'AMD avait à offrir. Le résultat net est que Lenovo peut tirer parti des nouvelles technologies, comme le CD6 de KIOXIA, là où la plupart des autres ne le peuvent pas. Cela place KIOXIA dans un scénario poule/œuf, du moins jusqu'à ce qu'Intel sorte ses processeurs de serveur de nouvelle génération. On pourrait dire qu'être en avance sur la courbe informatique dans ce cas est correct, le CD6 fonctionnera bien avec les plates-formes héritées, prêt à en donner plus lorsque les systèmes PCIe Gen4 seront disponibles. Pour l'instant, attendez-vous à voir de nombreuses références vantant les avantages des serveurs AMD, d'autant plus que les systèmes Lenovo à double processeur arrivent sur le marché.

MISE À JOUR 4/2/22 - Nous avons réexaminé le Kioxia CD6 avec un firmware plus mature

SSD KIOXIA

Discutez sur Reddit

S'engager avec StorageReview

Infolettre |  YouTube | Podcast iTunes/Spotify | Followers | Twitter | Facebook | Flux RSS