Accueil Entreprise Examen du SSD Memblaze PBlaze5 910 U.2 NVMe

Examen du SSD Memblaze PBlaze5 910 U.2 NVMe

by Adam Armstrong

Lors de leur événement Step Ahead à Pékin, Memblaze a lancé une nouvelle série de 500 disques NVME ainsi qu'une extension de sa gamme 900 à 910 et 916. Nous examinerons la série 910 dans cette revue. Les nouveaux disques 910 sont proposés en deux facteurs de forme et exploitent la NAND 64D à 3 couches, ce qui permet aux disques d'avoir des capacités allant jusqu'à 16 To. Cette densité plus élevée peut entraîner des racks plus denses ou une consolidation des racks dans le centre de données.


Lors de leur événement Step Ahead à Pékin, Memblaze a lancé une nouvelle série de 500 disques NVME ainsi qu'une extension de sa gamme 900 à 910 et 916. Nous examinerons la série 910 dans cette revue. Les nouveaux disques 910 sont proposés en deux facteurs de forme et exploitent la NAND 64D à 3 couches, ce qui permet aux disques d'avoir des capacités allant jusqu'à 16 To. Cette densité plus élevée peut entraîner des racks plus denses ou une consolidation des racks dans le centre de données.

En plus de tirer parti de 64 couches pour atteindre des capacités plus élevées, le Memblaze PBlaze5 910 revendique des performances supérieures à celles des modèles précédents. La société déclare que le lecteur peut atteindre des lectures séquentielles jusqu'à 3.5 Go/s et un débit jusqu'à 835 910 IOPS, tout en ayant une latence inférieure à la milliseconde. Le disque est également livré avec une haute disponibilité intégrée, étant à double port, ainsi un seul chemin de panne est supprimé. Le 1 a XNUMX DWPD d'endurance ainsi que deux millions d'heures MTBF. Les cas d'utilisation idéaux incluent : base de données, recherche, indexation, CDN, cloud et hyper-échelle, SDS, apprentissage en profondeur et analyse de données volumineuses, ERP, SAP HANA, BOSS, banque, fiscalité, trading à haute fréquence et paiement en ligne.

Pour cet examen, nous examinerons les 3.84 To, U.2 du PBlaze5 910.

Spécifications du SSD Memblaze PBlaze5 910 NVMe

Facteur de forme U.2
Capacités 3.84TB 7.68TB 15.36TB
NON eTLC 3D
Interface PCIe 3.0 x 4
Passerelle NVMe 1.2a
Performance
Lecture séquentielle (128 Ko) 3.5GB / s 3.5GB / s 3.3GB / s
Écriture séquentielle (128 Ko) 3.1GB / s 3.5GB / s 3.3GB / s
Lecture aléatoire soutenue (4 Ko) 835K IOPS 830K IOPS 826K IOPS
Ecriture aléatoire soutenue (4 Ko) 99K IOPS 135K IOPS 150K IOPS
Latence R/W 87 / 12μs
DWPD 1
UBER <10^-17
MTBF 2 millions d'heures
Consommation d'énergie  7 ~ 25W

Performance

Banc d'essai

Nos critiques de SSD d'entreprise s'appuient sur un Lenovo ThinkSystem SR850 pour les tests d'application et un Dell PowerEdge R740xd pour les benchmarks synthétiques. Le ThinkSystem SR850 est une plate-forme à quatre processeurs bien équipée, offrant une puissance de processeur bien supérieure à ce qui est nécessaire pour mettre l'accent sur le stockage local hautes performances. Les tests synthétiques qui ne nécessitent pas beaucoup de ressources CPU utilisent le serveur biprocesseur plus traditionnel. Dans les deux cas, l'intention est de présenter le stockage local sous le meilleur jour possible, conformément aux spécifications maximales des lecteurs du fournisseur de stockage.

Lenovo Think System SR850

  • 4 processeurs Intel Platinum 8160 (2.1 GHz x 24 cœurs)
  • 16 x 32 Go DDR4-2666 Mhz ECC DRAM
  • 2 cartes RAID RAID 930-8i 12 Go/s
  • 8 baies NVMe
  • VMwareESXI 6.5

Dell PowerEdge R740xd

  • 2 processeurs Intel Gold 6130 (2.1 GHz x 16 cœurs)
  • 16 x 16 Go DDR4-2666 MHz ECC DRAM
  • 1x carte RAID PERC 730 2 Go 12 Go/s
  • Adaptateur NVMe complémentaire
  • Ubuntu-16.04.3-bureau-amd64

Contexte des tests et comparables

Votre partenaire Laboratoire de test d'entreprise StorageReview fournit une architecture flexible pour effectuer des tests de performances des périphériques de stockage d'entreprise dans un environnement comparable à ce que les administrateurs rencontrent dans les déploiements réels. Le laboratoire de test d'entreprise intègre une variété de serveurs, de réseaux, de conditionnement d'alimentation et d'autres infrastructures de réseau qui permettent à notre personnel d'établir des conditions réelles pour évaluer avec précision les performances lors de nos examens.

Nous intégrons ces détails sur l'environnement de laboratoire et les protocoles dans les revues afin que les professionnels de l'informatique et les responsables de l'acquisition du stockage puissent comprendre les conditions dans lesquelles nous avons obtenu les résultats suivants. Aucun de nos examens n'est payé ou supervisé par le fabricant de l'équipement que nous testons. Des détails supplémentaires sur le Laboratoire de test d'entreprise StorageReview et  un aperçu de ses capacités de mise en réseau sont disponibles sur ces pages respectives.

Comparables pour cet avis :

Analyse de la charge de travail des applications

Afin de comprendre les caractéristiques de performance des périphériques de stockage d'entreprise, il est essentiel de modéliser l'infrastructure et les charges de travail des applications trouvées dans les environnements de production en direct. Nos références pour le Memblaze PBlaze5 910 sont donc les Performances MySQL OLTP via SysBench et  Performances OLTP de Microsoft SQL Server avec une charge de travail TCP-C simulée. Pour nos charges de travail d'application, chaque disque exécutera 2 à 4 machines virtuelles configurées de manière identique.

Performances du serveur SQL

Chaque machine virtuelle SQL Server est configurée avec deux vDisks : un volume de 100 Go pour le démarrage et un volume de 500 Go pour la base de données et les fichiers journaux. Du point de vue des ressources système, nous avons configuré chaque machine virtuelle avec 16 vCPU, 64 Go de DRAM et exploité le contrôleur LSI Logic SAS SCSI. Alors que nos charges de travail Sysbench testées saturaient la plate-forme à la fois en termes d'E/S de stockage et de capacité, le test SQL recherche les performances de latence.

Ce test utilise SQL Server 2014 s'exécutant sur des machines virtuelles invitées Windows Server 2012 R2 et est souligné par Benchmark Factory for Databases de Quest. StorageReview's Protocole de test OLTP Microsoft SQL Server utilise la version actuelle du Transaction Processing Performance Council's Benchmark C (TPC-C), une référence de traitement des transactions en ligne qui simule les activités trouvées dans des environnements d'application complexes. Le benchmark TPC-C est plus proche que les benchmarks de performances synthétiques pour évaluer les forces de performance et les goulots d'étranglement de l'infrastructure de stockage dans les environnements de base de données. Chaque instance de notre machine virtuelle SQL Server pour cet examen utilise une base de données SQL Server de 333 Go (échelle 1,500 15,000) et mesure les performances transactionnelles et la latence sous une charge de XNUMX XNUMX utilisateurs virtuels.

Configuration des tests SQL Server (par machine virtuelle)

  • Windows Server 2012 R2
  • Empreinte de stockage : 600 Go alloués, 500 Go utilisés
  • SQL Server 2014
    • Taille de la base de données : échelle 1,500 XNUMX
    • Charge de client virtuel : 15,000 XNUMX
    • Mémoire tampon : 48 Go
  • Durée du test : 3 heures
    • 2.5 heures de préconditionnement
    • Période d'échantillonnage de 30 minutes

Pour notre benchmark transactionnel SQL Server, le Memblaze PBlaze5 910 U.2 est arrivé en bas du peloton avec 12,546.5 XNUMX TPS, inférieur à trois autres disques PBlaze. 

Étonnamment, le 910 avait également la latence la plus élevée à 38.8 ms. 

Performances de Sybench

Le prochain benchmark applicatif consiste en un Base de données Percona MySQL OLTP mesuré via SysBench. Ce test mesure également le TPS moyen (transactions par seconde), la latence moyenne et la latence moyenne au 99e centile.

Chaque Banc Sys La VM est configurée avec trois vDisks : un pour le démarrage (~92 Go), un avec la base de données prédéfinie (~447 Go) et le troisième pour la base de données testée (270 Go). Du point de vue des ressources système, nous avons configuré chaque machine virtuelle avec 16 vCPU, 60 Go de DRAM et exploité le contrôleur LSI Logic SAS SCSI.

Configuration des tests Sysbench (par machine virtuelle)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tableaux de base de données : 100
    • Taille de la base de données : 10,000,000 XNUMX XNUMX
    • Threads de base de données : 32
    • Mémoire tampon : 24 Go
  • Durée du test : 3 heures
    • 2 heures de préconditionnement 32 fils
    • 1 heure 32 fils

Avec le benchmark transactionnel Sysbench, le U.2 910 a fait mieux en atteignant 6,664.6 XNUMX TPS en atterrissant à peu près au milieu du peloton testé. 

Avec la latence moyenne de Sysbench, le U.2 910 s'est à nouveau retrouvé en milieu de peloton avec une latence de 19.2 ms. 

Notre référence de latence dans le pire des cas a vu le U.2 910 atterrir à nouveau près du milieu avec 37.8 ms.

Houdini par SideFX

Le test Houdini est spécifiquement conçu pour évaluer les performances de stockage en ce qui concerne le rendu CGI. Le banc d'essai pour cette application est une variante du noyau Dell PowerEdge R740xd type de serveur que nous utilisons en laboratoire avec deux processeurs Intel 6130 et 64 Go de DRAM. Dans ce cas, nous avons installé Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) fonctionnant en métal nu. La sortie de l'indice de référence est mesurée en secondes pour terminer, moins étant mieux.

La démo Maelstrom représente une section du pipeline de rendu qui met en évidence les capacités de performance du stockage en démontrant sa capacité à utiliser efficacement le fichier d'échange comme une forme de mémoire étendue. Le test n'écrit pas les données de résultat ou ne traite pas les points afin d'isoler l'effet de temps d'arrêt de l'impact de la latence sur le composant de stockage sous-jacent. Le test lui-même est composé de cinq phases, dont trois que nous exécutons dans le cadre du benchmark, qui sont les suivantes :

  1. Charge les points compactés à partir du disque. C'est le moment de lire à partir du disque. Il s'agit d'un thread unique, ce qui peut limiter le débit global.
  2. Déballe les points dans un seul tableau plat afin de permettre leur traitement. Si les points ne dépendent pas d'autres points, l'ensemble de travail peut être ajusté pour rester dans le noyau. Cette étape est multithread.
  3. (Pas exécuté) Traiter les points.
  4. Les remballe dans des blocs de compartiments adaptés au stockage sur disque. Cette étape est multithread.
  5. (Non exécuté) Réécrivez les blocs compartimentés sur le disque.

Avec le test Houdini, la 910 U.2 s'est placée du milieu à l'extrémité inférieure, mais dans la lignée des autres produits Memblaze avec un score de 3,093.8 XNUMX secondes.

Analyse de la charge de travail VDBench

Lorsqu'il s'agit de comparer les périphériques de stockage, les tests d'application sont les meilleurs et les tests synthétiques viennent en deuxième position. Bien qu'ils ne soient pas une représentation parfaite des charges de travail réelles, les tests synthétiques aident à référencer les périphériques de stockage avec un facteur de répétabilité qui facilite la comparaison de pommes à pommes entre des solutions concurrentes. Ces charges de travail offrent une gamme de profils de test différents, allant des tests « aux quatre coins », des tests de taille de transfert de base de données communs, aux captures de traces à partir de différents environnements VDI. Tous ces tests exploitent le générateur de charge de travail vdBench commun, avec un moteur de script pour automatiser et capturer les résultats sur un grand cluster de test de calcul. Cela nous permet de répéter les mêmes charges de travail sur une large gamme de périphériques de stockage, y compris les baies flash et les périphériques de stockage individuels. Notre processus de test pour ces benchmarks remplit toute la surface du disque avec des données, puis partitionne une section de disque égale à 25 % de la capacité du disque pour simuler la façon dont le disque pourrait répondre aux charges de travail des applications. Ceci est différent des tests d'entropie complète qui utilisent 100% du lecteur et les amènent dans un état stable. Par conséquent, ces chiffres refléteront des vitesses d'écriture plus soutenues.

Profils:

  • Lecture aléatoire 4K : 100 % de lecture, 128 threads, 0-120 % d'iorate
  • Écriture aléatoire 4K : 100 % d'écriture, 64 threads, 0-120 % de vitesse
  • Lecture séquentielle 64K : 100 % de lecture, 16 threads, 0-120 % d'iorate
  • Écriture séquentielle 64K : 100 % d'écriture, 8 threads, 0-120 % d'iorate
  • Base de données synthétique : SQL et Oracle
  • Traces de clone complet et de clone lié VDI

Dans notre première analyse de charge de travail VDBench, lecture aléatoire 4K, le Memblaze PBlaze5 910 U.2 a pu rester sous 1 ms tout au long avec un pic de 665,679 191.3 IOPS et une latence de XNUMX μs plaçant le disque à peu près au milieu. 

L'écriture aléatoire 4K a de nouveau vu une latence inférieure à la milliseconde tout au long. Le 910 U.2 s'est classé avant-dernier avec une performance maximale de 296,639 429.6 IOPS et une latence de XNUMX μs.

Passant aux charges de travail séquentielles, le 910 U.2 s'est une fois de plus classé avant-dernier dans les lectures séquentielles de 64 38,472 avec un score maximal de 2.4 415.3 IOPS ou XNUMX Go/s avec une latence de XNUMX μs.

Restant à l'avant-dernière place, le 910 U.2 a culminé avec environ 18 1.1 IOPS ou 870 Go/s avec une latence d'environ 64 μs en écriture séquentielle XNUMX XNUMX. 

Passant aux charges de travail SQL, le 910 U.2 a culminé à 243,228 130.4 IOPS avec une latence de seulement XNUMX μs plaçant le disque au quatrième rang.

SQL 90-10 a vu le 910 conserver la quatrième place avec un score maximal de 232,061 136.5 IOPS et une latence de XNUMX μs.

Toujours quatrième, le 910 U.2 a culminé à 220,195 144.6 IOPS avec une latence de 80 μs dans le benchmark SQL 20-XNUMX.

Avec notre charge de travail Oracle, le 910 U.2 a continué à rester à la quatrième place avec un score maximal de 212,052 168.5 IOPS et une latence de XNUMX μs.

Pour Oracle 90-10, le 910 U.2 est passé à la troisième place avec un pic de 180,723 121.1 IOPS et une latence de XNUMX μs.

Dans Oracle 80-20, le 910 était presque à égalité avec le 900 pour la troisième place avec une performance maximale de 177,143 123.5 IOPS et une latence de XNUMX μs.

Ensuite, nous passons à notre test de clone VDI, Full et Linked. Pour VDI Full Clone Boot, le 910 U.2 a atterri en quatrième position avec une performance maximale de 176,239 197.9 IOPS et une latence de XNUMX μs.

La connexion initiale au VDI FC a vu le 910 U.2 toujours quatrième mais plus loin derrière les trois premiers disques avec une performance maximale de 66,925 445.1 IOPS et une latence de XNUMX μs.

Avec VDI ​​FC Monday Login, le 910 U.2 a terminé à la quatrième place avec 67,309 235.7 IOPS et une latence de XNUMX μs.

En passant au clone lié (LC), nous examinons d'abord le test de démarrage. Ici, le 910 U.2 est arrivé quatrième avec 83,210 191.2 IOPS et une latence de XNUMX μs.

VDI LC Initial Login a maintenu le 910 U.2 en quatrième position avec 40,035 197.4 IOPS et une latence de XNUMX μs.

Enfin, le VDI LC Monday Login a atteint le pic de 910 U.2 à 45,349 349 IOPS et une latence de XNUMX μs pour la quatrième place.

Conclusion

Le Memblaze PBlaze5 910 est le nouveau disque de centre de données NVMe de la société qui exploite la NAND 64D à 3 couches. Le disque est disponible en deux facteurs de forme (U.2 pour cette revue) et en capacités de 3.84 To, 7.68 To et 15.36 To. Memblaze revendique des performances allant jusqu'à 3.5 Go/s en lecture, 3.5 Go/s en écriture et un débit allant jusqu'à 835 150 IOPS en lecture et 256 8 IOPS en écriture. Le disque répond aux critères d'une pléthore de cas d'utilisation et est livré avec des options de sécurité telles que le cryptage des données AES XNUMX et prend en charge la fonction TRIM jusqu'à XNUMX To/s. 

En ce qui concerne les performances d'analyse de la charge de travail des applications, le 910 U.2 est arrivé à la dernière place de nos benchmarks SQL Server avec 12,546.5 38.8 TPS et une latence moyenne de 6,664.6 ms. Dans Sysbench, le disque a effectué un atterrissage un peu meilleur au milieu du peloton avec 19.2 37.8 TPS, une latence moyenne de 910 ms et une latence dans le pire des cas de 2 ms. Dans notre référence Houdini by SideFX, la 3,093.8 U.XNUMX a obtenu un score de XNUMX XNUMX secondes, ce qui la place dans le bas du classement, mais en ligne avec les autres produits Memblaze. 

Pour VDBench, le Memblaze PBlaze5 910 U.2 avait une latence inférieure à la milliseconde dans tous les tests. Le lecteur avait tendance à se situer au milieu ou au milieu du bas du peloton dans tous les tests. Les principaux résultats incluent 666 4 IOPS en lecture 297K, 4 2.4 IOPS en écriture 64K, 1.1 Go/s en lecture 64K et 177 Go/s en écriture 212K. Les résultats SQL contenaient environ un quart de million d'IOPS, les tests Oracle s'exécutant entre XNUMX XNUMX IOPS et XNUMX XNUMX IOPS. 

Dans l'ensemble, il a donné de bonnes performances, mais les performances ont commencé à baisser par rapport à la génération précédente PBlaze5 900.

Memblaze PBlaze5 910

Discutez de cet avis

Inscrivez-vous à la newsletter StorageReview