Accueil EntrepriseTest du SSD KIOXIA CM6 PCIe 4.0

Test du SSD KIOXIA CM6 PCIe 4.0

by Adam Armstrong

Les SSD NVMe sont devenus les plus performants à tous les niveaux. Ils ont commencé par faire d'énormes progrès par rapport aux disques SAS et SATA, mais ces dernières années, ils ont lentement amélioré les performances à chaque itération. Il existe une limite supérieure avec PCIe 3.0 et les disques actuels les atteignent. Mais maintenant, avec les processeurs AMD EPYC 7002 de deuxième génération, PCIe 4.0 est là, et KIOXIA en tire parti avec les SSD CM6.

Les SSD NVMe sont devenus les plus performants à tous les niveaux. Ils ont commencé par faire d'énormes progrès par rapport aux disques SAS et SATA, mais ces dernières années, ils ont lentement amélioré les performances à chaque itération. Il existe une limite supérieure avec PCIe 3.0 et les disques actuels les atteignent. Mais maintenant avec la deuxième génération Processeurs AMD EPYC 7002, PCIe 4.0 est là, et KIOXIA en tire parti avec les SSD CM6.

KIOXIA CM6

KIOXIA a annoncé les nouveaux disques PCIe 4.0, CM6 et CD6, en tant que démo lors du dernier Flash Memory Summit, à l'époque oubliée des événements physiques. À l'époque, il s'agissait des premiers SSD PCIe 4.0 et, au moment d'écrire ces lignes, la série de SSD CM6 est peut-être encore l'un des rares, voire uniquement, des SSD PCIe 4.0 pour les entreprises. Le gros problème avec les nouveaux disques va être des performances plus élevées: cité comme atteignant jusqu'à 6.9 Go / s et 1.4 million d'IOPS en lecture. Ce sont des chiffres théoriques impressionnants. Les disques sont également livrés avec NVMe-MI intrabande, un journal des événements persistant et une granularité d'espace de noms.

Fond KIOXIA CM6

Le KIOXIA CM6 est un facteur de forme U.3, conforme à la norme SFF-TA-1001, ce qui lui permet d'être utilisé dans des fonds de panier compatibles tri-mode. Le CM6 est disponible dans une large gamme de capacités allant de 800 Go à 30.72 To. Les disques sont disponibles dans une version à lecture intensive (CM6-R) et à usage mixte (CM6-V) en fonction des besoins des utilisateurs. En plus des modèles spécifiques aux cas d'utilisation, il existe une variété de versions sécurisées, notamment un Sanitize Instat Erase (SIE), un lecteur à cryptage automatique (SED) et un modèle FIPS 140-2 (niveau 2). Le disque est à double port pour fournir également une haute disponibilité.

Côté KIOXIA CM6

Pour cet examen, nous examinons un KIOXIA CM6-V à 6.4 To de capacité.

Spécifications KIOXIA CM6 PCIe 4.0

Modèle CM6-R (lecture intensive) CM6-V (usage mixte)
Facteur de forme 2.5 pouces 15 mm de hauteur Z
Capacité1 960 Go, 1.92 To, 3.84 To, 7.68 To, 15.36 To, 30.72 To 800 Go, 1.6 To, 3.2 To, 6.4 To, 12.8 To
Interface PCIe Gen3/4, 1×4 et 2×2
Conformité PCIe 4.0 et NVMe 1.4
Type NAND KIOXIA BiCS FLASH96 couches TLC 3D
Lecture séquentielle Gen3 = jusqu'à 3,500 XNUMX Mo/s
Gen4 = jusqu'à 6,900 XNUMX Mo/s
Gen3 = jusqu'à 3,500 XNUMX Mo/s
Gen4 = jusqu'à 6,900 XNUMX Mo/s
Écriture séquentielle Gen3 = jusqu'à 3,100 XNUMX Mo/s
Gen4 = jusqu'à 4,200 XNUMX Mo/s
Gen3 = jusqu'à 3,100 XNUMX Mo/s
Gen4 = jusqu'à 4,200 XNUMX Mo/s
Lecture aléatoire Gen3 = jusqu'à 800 XNUMX IOPS
Gen4 = jusqu'à 1.4 million d'IOPS
Gen3 = jusqu'à 800 XNUMX IOPS
Gen4 = jusqu'à 1.4 million d'IOPS
Écriture aléatoire Gen3 = jusqu'à 155 XNUMX IOPS
Gen4 = jusqu'à 170 XNUMX IOPS
Gen3 = jusqu'à 290 XNUMX IOPS
Gen4 = jusqu'à 350 XNUMX IOPS
Consommation d'énergie Actif : 20 W ; Inactif : < 5 W
Endurance 1 DWPD pendant 5 ans 3 DWPD pendant 5 ans
BER incorrigible 1 secteur par 10^17 bits lus
MTTF / RFA 2.5 millions d'heures / 0.35 %
Température de fonctionnement 0 à 70C

Performances

Banc d'essai

Nos nouvelles revues de SSD PCIe Gen4 Enterprise tirent parti d'un Lenovo Think System SR635 pour les tests applicatifs et les benchmarks synthétiques. Le ThinkSystem SR635 est une plate-forme AMD à processeur unique bien équipée, offrant une puissance de processeur bien supérieure à ce qui est nécessaire pour mettre l'accent sur le stockage local hautes performances. C'est également la seule plate-forme de notre laboratoire (et l'une des rares sur le marché actuellement) avec des baies PCIe Gen4 U.2. Les tests synthétiques ne nécessitent pas beaucoup de ressources CPU mais exploitent toujours la même plate-forme Lenovo. Dans les deux cas, l'intention est de présenter le stockage local sous le meilleur jour possible, conformément aux spécifications maximales des lecteurs du fournisseur de stockage.

Plate-forme synthétique et d'application PCIe Gen4 (Lenovo ThinkSystem SR635)

  • 1 x AMD 7452 (2.35 GHz x 32 cœurs)
  • 8 x 64 Go DDR4-3200 MHz ECC DRAM
  • Cent OS 7.7 1908
  • ESXi 6.7u3

Plate-forme d'applications PCIe Gen3 (Lenovo Think System SR850)

  • 4 processeurs Intel Platinum 8160 (2.1 GHz x 24 cœurs)
  • 16 x 32 Go DDR4-2666 Mhz ECC DRAM
  • 2 cartes RAID RAID 930-8i 12 Go/s
  • 8 baies NVMe
  • VMware ESXI 6.7u3

Plate-forme synthétique PCIe Gen3 (Dell PowerEdge R740xd)

  • 2 processeurs Intel Gold 6130 (2.1 GHz x 16 cœurs)
  • 4 x 16 Go DDR4-2666 MHz ECC DRAM
  • 1x carte RAID PERC 730 2 Go 12 Go/s
  • Adaptateur NVMe complémentaire
  • Ubuntu-16.04.3-bureau-amd64

Étant la première série d'examens sur une nouvelle plate-forme, nous avons inclus les résultats des lecteurs passés, qui sont proches mais pas à 100 % des comparaisons de pommes à pommes puisqu'ils étaient testés sur une plate-forme plus ancienne. Nos différences de test synthétiques n'auront pas beaucoup de biais dans les résultats, mais les charges de travail des applications fonctionnant sur la plate-forme AMD à processeur unique par rapport à la plate-forme Intel Quad CPU peuvent dans une certaine mesure. Lors de nos tests MySQL, l'un des nouveaux produits Gen4 KIOXIA a pris les devants, mais la latence du serveur SQL était moyenne. Avec seulement deux disques Gen4 que nous avons pu publier, nous n'avons pas une quantité importante de données comparables, mais il est important de prendre note de la visualisation de ces résultats. Nous avons également intensifié nos tests synthétiques pour tirer parti des SSD plus rapides, affichant désormais les résultats des tests avec un nombre de threads de pointe plus élevé.

Contexte des tests et comparables

Le Laboratoire de test d'entreprise StorageReview fournit une architecture flexible pour effectuer des tests de performances des périphériques de stockage d'entreprise dans un environnement comparable à ce que les administrateurs rencontrent dans les déploiements réels. Le laboratoire de test d'entreprise intègre une variété de serveurs, de réseaux, de conditionnement d'alimentation et d'autres infrastructures de réseau qui permettent à notre personnel d'établir des conditions réelles pour évaluer avec précision les performances lors de nos examens.

Nous intégrons ces détails sur l'environnement de laboratoire et les protocoles dans les revues afin que les professionnels de l'informatique et les responsables de l'acquisition du stockage puissent comprendre les conditions dans lesquelles nous avons obtenu les résultats suivants. Aucun de nos examens n'est payé ou supervisé par le fabricant de l'équipement que nous testons. Des détails supplémentaires sur le Laboratoire de test d'entreprise StorageReview et un aperçu de ses capacités de mise en réseau sont disponibles sur ces pages respectives.

Analyse de la charge de travail des applications

Afin de comprendre les caractéristiques de performance des périphériques de stockage d'entreprise, il est essentiel de modéliser l'infrastructure et les charges de travail des applications trouvées dans les environnements de production en direct. Nos références pour le KIOXIA CM6 sont donc les Performances MySQL OLTP via SysBench et  Performances OLTP de Microsoft SQL Server avec une charge de travail TCP-C simulée. Pour nos charges de travail d'application, chaque disque exécutera 4 machines virtuelles configurées de manière identique.

Performances du serveur SQL

Chaque machine virtuelle SQL Server est configurée avec deux vDisks : un volume de 100 Go pour le démarrage et un volume de 500 Go pour la base de données et les fichiers journaux. Du point de vue des ressources système, nous avons configuré chaque machine virtuelle avec 8 vCPU, 64 Go de DRAM et exploité le contrôleur LSI Logic SAS SCSI. Alors que nos charges de travail Sysbench testées saturaient la plate-forme à la fois en termes d'E/S de stockage et de capacité, le test SQL recherche les performances de latence.

Ce test utilise SQL Server 2014 s'exécutant sur des machines virtuelles invitées Windows Server 2012 R2 et est souligné par Benchmark Factory for Databases de Quest. StorageReview's Protocole de test OLTP Microsoft SQL Server utilise la version actuelle du Transaction Processing Performance Council's Benchmark C (TPC-C), une référence de traitement des transactions en ligne qui simule les activités trouvées dans des environnements d'application complexes. Le benchmark TPC-C est plus proche que les benchmarks de performances synthétiques pour évaluer les forces de performance et les goulots d'étranglement de l'infrastructure de stockage dans les environnements de base de données. Chaque instance de notre machine virtuelle SQL Server pour cet examen utilise une base de données SQL Server de 333 Go (échelle 1,500 15,000) et mesure les performances transactionnelles et la latence sous une charge de XNUMX XNUMX utilisateurs virtuels.

Configuration des tests SQL Server (par machine virtuelle)

  • Windows Server 2012 R2
  • Empreinte de stockage : 600 Go alloués, 500 Go utilisés
  • SQL Server 2014
    • Taille de la base de données : échelle 1,500 XNUMX
    • Charge de client virtuel : 15,000 XNUMX
    • Mémoire tampon : 48 Go
  • Durée du test : 3 heures
    • 2.5 heures de préconditionnement
    • Période d'échantillonnage de 30 minutes

Pour notre benchmark transactionnel SQL Server, le KIOXIA CM6 s'est classé quatrième au classement général avec 12,633.6 10.6 TPS, même s'il n'était que de XNUMX TPS sous le plus performant.

KIOXIA CM6 SQL TPS

Avec la latence moyenne de SQL Server, le CM6 avait une latence moyenne de 5.5 ms, la même que son cousin CD6 SSD.

Performances de Sybench

Le prochain benchmark applicatif consiste en un Base de données Percona MySQL OLTP mesuré via SysBench. Ce test mesure également le TPS moyen (transactions par seconde), la latence moyenne et la latence moyenne au 99e centile.

Chaque Banc Sys La VM est configurée avec trois vDisks : un pour le démarrage (~92 Go), un avec la base de données prédéfinie (~447 Go) et le troisième pour la base de données testée (270 Go). Du point de vue des ressources système, nous avons configuré chaque machine virtuelle avec 8 vCPU, 60 Go de DRAM et exploité le contrôleur LSI Logic SAS SCSI.

Configuration des tests Sysbench (par machine virtuelle)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tableaux de base de données : 100
    • Taille de la base de données : 10,000,000 XNUMX XNUMX
    • Threads de base de données : 32
    • Mémoire tampon : 24 Go
  • Durée du test : 3 heures
    • 2 heures de préconditionnement 32 fils
    • 1 heure 32 fils

En regardant notre benchmark transactionnel Sysbench, le KIOXIA CM6 avait 8,632 XNUMX TPS prenant à nouveau la quatrième place dans notre pack comparable.

KIOXIA CM6 Sysbench TPS

Avec la latence moyenne de Sysbench, le CM6 a de nouveau pris la quatrième place à 14.82 ms.

Pour notre pire scénario de latence (99e centile), le CM6 est resté là où il est confortable, à la quatrième place, avec 29.86 ms.

Analyse de la charge de travail VDBench

Lorsqu'il s'agit de comparer les périphériques de stockage, les tests d'application sont les meilleurs et les tests synthétiques viennent en deuxième position. Bien qu'ils ne soient pas une représentation parfaite des charges de travail réelles, les tests synthétiques aident à référencer les périphériques de stockage avec un facteur de répétabilité qui facilite la comparaison de pommes à pommes entre des solutions concurrentes. Ces charges de travail offrent une gamme de profils de test différents, allant des tests « aux quatre coins », des tests de taille de transfert de base de données communs, aux captures de traces à partir de différents environnements VDI. Tous ces tests exploitent le générateur de charge de travail vdBench commun, avec un moteur de script pour automatiser et capturer les résultats sur un grand cluster de test de calcul. Cela nous permet de répéter les mêmes charges de travail sur une large gamme de périphériques de stockage, y compris les baies flash et les périphériques de stockage individuels. Notre processus de test pour ces benchmarks remplit toute la surface du disque avec des données, puis partitionne une section de disque égale à 25 % de la capacité du disque pour simuler la façon dont le disque pourrait répondre aux charges de travail des applications. Ceci est différent des tests d'entropie complète qui utilisent 100% du lecteur et les amènent dans un état stable. Par conséquent, ces chiffres refléteront des vitesses d'écriture plus soutenues.

Profils:

  • Lecture aléatoire 4K : 100 % de lecture, 128 threads, 0-120 % d'iorate
  • Écriture aléatoire 4K : 100 % d'écriture, 128 threads, 0-120 % de vitesse
  • Lecture aléatoire 4K (charge élevée) : 100 % de lecture, 512 threads, 0-120 % d'iorate
  • Écriture aléatoire 4K (charge élevée) : 100 % d'écriture, 512 threads, 0-120 % d'iorate
  • Lecture séquentielle 64K : 100 % de lecture, 32 threads, 0-120 % d'iorate
  • Écriture séquentielle 64K : 100 % d'écriture, 16 threads, 0-120 % d'iorate
  • Lecture séquentielle 64K (charge élevée) : 100 % de lecture, 64 threads, 0-120 % d'iorate
  • Écriture séquentielle 64K (charge élevée) : 100 % d'écriture, 64 threads, 0-120 % d'iorate
  • Base de données synthétique : SQL et Oracle
  • Traces de clone complet et de clone lié VDI

Comparables :

Dans notre première analyse de charge de travail VDBench, Random 4K Read, le KIOXIA CM6 s'est retourné avec une performance impressionnante culminant à 846,288 150 IOPS avec une latence de XNUMX µs. Cela place le lecteur au premier rang.

Lecture KIOXIA CM6 4K

Les nouveaux disques PCIe 4.0 peuvent supporter une charge plus élevée et nous serions négligents si nous ne les poussions pas un peu plus fort pour voir ce qu'ils peuvent faire. Ainsi, avec une charge élevée de lecture aléatoire 4K, le CM6 a pu culminer à 1,507,564 337.9 6 IOPS avec une latence de XNUMX µs. Beaucoup mieux que son homologue CDXNUMX.

KIOXIA CM6 4K lecture haute

Pour l'écriture aléatoire 4K, a pris la troisième place au classement général. Il a fonctionné avec une latence inférieure à 100 µs jusqu'à environ 490 548,169 IOPS et a culminé à 226.4 XNUMX IOPS avec une latence de XNUMX µs.

La charge élevée d'écriture aléatoire 4K a vu le CM6 atteindre un pic à 549,103 922 IOPS avec une latence de 6 µs derrière le CDXNUMX cette fois.

En passant aux charges de travail séquentielles, le CM6 a eu une chance de briller une fois de plus en prenant la première place en lecture 64K avec un score maximal de 97,779 6.11 IOPS ou 325 Go/s avec une latence de seulement XNUMX µs.

KIOXIA CM6 64k luLa lecture séquentielle 64K à charge élevée a été similaire au placement en lecture 4K avec le CM6 culminant à 101,018 6.3 IOPS ou 629 Go/s à une latence de XNUMX µs.

KIOXIA CM6 64K lecture hauteL'écriture 64K a montré au CM6 un score de pointe élevé, bien que les performances aient chuté après le pic, se classant troisième. Les performances de pointe étaient d'environ 49 3.1 IOPS ou 50 Go/s avec une latence d'environ XNUMX µs.

L'écriture séquentielle High Load 64K a vu le CM6 avoir un pic plus élevé mais une baisse des performances par la suite. Le CM6 a culminé à environ 49 3.1 IOP ou XNUMX Go/s à une latence si faible que nous pouvons à peine le voir avant de tomber.

Notre prochaine série de tests concerne nos charges de travail SQL : SQL, SQL 90-10 et SQL 80-20. En commençant par SQL, le KIOXIA CM6 a pris la deuxième place au classement général avec un pic de 266,458 119 IOPS à une latence de XNUMX µs.

 

Pour SQL 90-10, le CM6 a de nouveau pris la deuxième place avec une performance maximale de 265,276 119.2 IOPS à une latence de XNUMX µs.

SQL 80-20 a donné au CM6 une chance de se montrer en arrivant premier avec une performance maximale de 263,819 119.4 IOPS XNUMX µs.

Viennent ensuite nos charges de travail Oracle : Oracle, Oracle 90-10 et Oracle 80-20. En commençant par Oracle, le CM6 est arrivé en tête une fois de plus avec une performance maximale de 271,230 128.6 IOPS à une latence de XNUMX µs.

Oracle 90-10 avait la deuxième place du CM6 avec une performance maximale de 202,341 107.4 IOPS à une latence de seulement XNUMX µs.

Le CM6 glisse juste à côté de la concurrence pour prendre à nouveau la première place dans l'Oracle 80-20 avec un pic de 206,733 104.7 IOPS à une faible latence de XNUMX µs.

Ensuite, nous sommes passés à notre test de clone VDI, Full et Linked. Pour le démarrage VDI Full Clone (FC), le CM6 a pris la première place avec 223,668 153.5 IOPS et une latence de XNUMX µs.

Pour la connexion initiale VDI FC, le CM6 a glissé au troisième rang avec une performance maximale de 154,836 189 IOPS à une latence de XNUMX µs.

Notre benchmark VDI FC Monday Login a vu le CM6 rester en troisième position avec un pic de 98,867 158.4 IOPS avec une latence de XNUMX µs.

Pour le démarrage VDI Linked Clone (LC), le KIOXIA CM6 est revenu à la première place avec un score maximal de 115,058 137.7 IOPS à une latence de XNUMX µs.

La connexion initiale VDI LC est un peu difficile à lire dans le graphique, mais le CM6 a atterri au milieu du peloton avec un pic de 38,848 202.4 IOPS à une latence de XNUMX µs avant d'en laisser tomber.

Enfin, VDI LC Monday Login a encore une fois permis au CM6 d'être le plus performant avec un score maximal de 96,008 162.5 IOPS et une latence de XNUMX µs.

Conclusion

Le KIOXIA CM6 était l'un des premiers SSD PCIe 4.0 pour l'entreprise, sinon le premier. Les nouveaux disques promettent des performances supérieures, dans ce cas jusqu'à 6.9 Go/s et jusqu'à 1.4 million d'IOPS. Le CM6 est à double port, ajoutant un niveau de haute disponibilité au disque. Le disque est disponible dans une large gamme de capacités allant de 800 Go à 30.72 To avec 9 options de capacité entre les deux. Le CM6 dispose à la fois d'un modèle à lecture intensive et d'un modèle à usage mixte avec respectivement 1 et 3 DWPD. Et le SSD est livré avec une variété d'options de modèles sécurisés.

Pour les performances, nous avons exécuté notre barrage habituel d'analyse de la charge de travail des applications et de VDBench à quelques exceptions près. Nous avons dû sauter le test Houdini car la plate-forme de test est Intel et les disques KIOXIA seraient handicapés par les ports Gen3. Sur VDBench, nous avons ajouté un test de charge plus élevé pour stresser un peu plus les nouveaux disques car ils sont conçus pour le gérer.

Dans notre analyse de la charge de travail des applications, nous avons exécuté SQL Server et Sysbench. Avec SQL Server, le CM6 a pris la quatrième place à la fois en TPS et en latence moyenne avec 12,633.6 5.5 TPS et 8,632 ms, toujours un très bon score. Avec Sysbench, le lecteur a de nouveau occupé la quatrième place dans tous les domaines avec 14.82 29.86 TPS, une latence moyenne de XNUMX ms et XNUMX ms dans notre pire scénario de latence.

Dans VDBench, le lecteur a vraiment brillé. Le CM6 a été le plus performant dans plusieurs de nos benchmarks. Les points forts de base incluent 846K IOPS en lecture 4K, 1.5 million d'IOPS en lecture 4K à charge élevée, 548K IOPS en écriture 4K, 549K IOPS en écriture 4K à charge élevée, 6.1 Go/s en lecture 64K, 6.3 Go/s en lecture 64K à charge élevée, et 3.1 Go/s en écriture 64K et en écriture 64K à charge élevée. SQL a enregistré des pics de 266 265 IOPS, 90 10 IOPS dans SQL 264-80 et 20 271 IOPS dans SQL 202-90. Oracle nous a donné des pics de 10K IOPS, 207K IOPS dans Oracle 80-20 et 224K IOPS dans Oracle 155-99. VDI FC nous a donné un démarrage de 115 39 IOPS, une connexion initiale de 96 XNUMX IOPS et XNUMX XNUMX IOPS lors de la connexion du lundi. VDI LC a vu le démarrage de XNUMX XNUMX IOPS, la connexion initiale de XNUMX XNUMX IOPS et la connexion du lundi de XNUMX XNUMX IOPS.

Cette revue et celle du CD6 jettent un regard spécifique sur PCIe 4.0 et l'avenir des périphériques de stockage à mesure que d'autres entrent sur le marché. Il n'y a pas beaucoup de fournisseurs de serveurs qui produisent une prise en charge de bout en bout pour PCIe 4.0, Lenovo étant le seul dans notre laboratoire à ce jour. Lenovo n'a pas tardé à saisir tous les avantages offerts par les processeurs AMD EPYC 2 de 7002e génération, anticipant les produits de stockage comme le KIOXIA CM6. Mais pour KIOXIA, cela les place dans la position intéressante d'être en avance sur les autres, mais le plein potentiel de leur disque n'est atteint qu'avec des serveurs AMD plus récents (jusqu'à ce qu'Intel décide de se lancer également dans le jeu). Pour l'instant, le CM6 fonctionnera toujours avec les équipements hérités et sera prêt à libérer plus de performances à mesure que les entreprises se mettront à niveau.

SSD d'entreprise KIOXIA

Discutez sur Reddit

S'engager avec StorageReview

Bulletin |  YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | Flux RSS