Le Micron RealSSD P320h est un accélérateur d'application demi-hauteur, demi-longueur (HHHL) qui exploite SLC NAND et une interface PCIe Gen 2 x8 pour générer des performances citées de 3.2 Go/s en lecture séquentielle et jusqu'à 785,000 320 IOPS en lecture aléatoire. L'architecture P700h s'écarte de la plupart des autres accélérateurs d'applications récents que nous avons examinés et qui généralement RAID associent plusieurs lecteurs flash. L'offre Micron est différente, utilisant à la place RAIN (réseau redondant de NAND indépendant) avec un contrôleur personnalisé, qui est similaire à l'approche adoptée par Fusion-io et Virident. Cette architecture permet à Micron de revendiquer une vitesse et une latence vertigineuses tout en offrant un haut niveau de sécurité des données sur le disque. Dans cette revue, nous testons une paire de cartes de 320 Go et verrons non seulement à quelle vitesse elles vont seules, mais comment le P2012h évolue dans Windows Server XNUMX.
Le Micron RealSSD P320h est un accélérateur d'application demi-hauteur, demi-longueur (HHHL) qui exploite SLC NAND et une interface PCIe Gen 2 x8 pour générer des performances citées de 3.2 Go/s en lecture séquentielle et jusqu'à 785,000 320 IOPS en lecture aléatoire. L'architecture P700h s'écarte de la plupart des autres accélérateurs d'applications récents que nous avons examinés et qui généralement RAID associent plusieurs lecteurs flash. L'offre Micron est différente, utilisant à la place RAIN (réseau redondant de NAND indépendant) avec un contrôleur personnalisé, qui est similaire à l'approche adoptée par Fusion-io et Virident. Cette architecture permet à Micron de revendiquer une vitesse et une latence vertigineuses tout en offrant un haut niveau de sécurité des données sur le disque. Dans cette revue, nous testons une paire de cartes de 320 Go et verrons non seulement à quelle vitesse elles vont seules, mais comment le P2012h évolue dans Windows Server XNUMX.
Comme indiqué, l'architecture des disques et les politiques de gestion NAND jouent un rôle essentiel en termes de performances des appareils du point de vue du débit et de la latence. Avec le P320h, Micron fusionne sa propre IP avec la conception et la fabrication ASIC d'IDT. Le résultat net est un contrôleur ASIC qui inclut l'intelligence propriétaire de Micron autour de la gestion et du contrôle NAND, qui inclut RAIN. L'approche RAIN de Micron est très efficace dans la façon dont elle gère la NAND et cette efficacité est finalement ce qui motive les performances et la protection des données du P320h. Micron utilise ce qui équivaut à une architecture RAID7 1+5P au sein de RAIN. Avec le striping utilisé au niveau 7+1, Micron est capable de fournir les mêmes performances qu'un disque sans parité, tout en offrant la protection des données dont les entreprises ont besoin.
Si le P320h est intéressant grâce aux techniques de gestion Micron NAND, physiquement c'est aussi intéressant. Le PCB HHHL est plein de pièces Micron, y compris le SLC NAND et DDR bien sûr, et il ne nécessite pas de connexion d'alimentation externe pour atteindre des performances maximales. Nos disques de 700 Go ont 64 pièces NAND prises en sandwich sur la carte qui sont mises en évidence par le dissipateur thermique passif sur le contrôleur unique. La conception à contrôleur unique offre de meilleures performances et une meilleure fiabilité que les solutions concurrentes qui reposent sur la combinaison de plusieurs contrôleurs via du matériel et des logiciels. L'utilisation d'un contrôleur spécialement conçu pour Micron NAND donne à Micron un autre avantage en matière d'interopérabilité, de performances et de prise en charge du lecteur. Contrairement à ce qui a été rapporté ailleurs, le lecteur ne prend pas en charge NVMe, mais Micron se dirige définitivement dans cette direction avec ses futurs produits.
Micron propose le P320h en deux capacités SLC uniquement, 350 Go et 700 Go utilisables. Un disque de 350 Go commence par 512 Go RAW, mais après soustraction de 12.5 % pour RAIN, puis de 22 % pour le surprovisionnement, le disque arrive à 350 Go. Le P320h offre jusqu'à 25 Po d'endurance pour le modèle 350 Go et 50 Po pour le 700 Go et est livré avec des outils logiciels pour la gestion des disques et les rapports de santé.
Spécifications du Micron RealSSD P320h
- Capacités
- 350 Go (MTFDGAR350SAH-1N1AB)
- Lecture séquentielle : 3.2 Go/s (128 Ko, en régime permanent)
- Écriture séquentielle : 1.9 Go/s (128 Ko, état stable)
- Lecture aléatoire : 785,000 4 IOPS (XNUMX Ko, état stable)
- Écriture aléatoire : 175,000 4 IOPS (XNUMX Ko, état stable)
- 700 Go (MTFDGAR700SAH-1N1AB)
- Lecture séquentielle : 3.2 Go/s (128 Ko, en régime permanent)
- Écriture séquentielle : 1.9 Go/s (128 Ko, état stable)
- Lecture aléatoire : 785,000 4 IOPS (XNUMX Ko, état stable)
- Écriture aléatoire : 205,000 4 IOPS (XNUMX Ko, état stable)
- 350 Go (MTFDGAR350SAH-1N1AB)
- Latence de disponibilité : <42 µs (512 octets)
- Latence d'écriture : <9µs
- Interface : PCIe Gen2 x8
- Puissance : 25 W maximum, 10 W en veille
- Facteur de forme : HHHL
- Commande native mettant en file d'attente jusqu'à 256 commandes
- Autonomie : 350 Go – 25 Po, 700 Go – 50 Po
- Dimensions: 68.90mm x 167.65mm x 18.71mm
- Température de fonctionnement : 0°C à +50°C
- Compatibilité OS
- Microsoft : Windows Server 2008 R2 SP1 (x86-64), Windows Server 2008 R2 SP1 Hyper-V (x86-64), Windows Server 2012 (x86-64) SP128, Windows Server 2012 Hyper-V (x64)
- Linux : RHEL Linux 5.5, 5.6, 5.7, 5.8 (SP128), 6.1, 6.2 (x86-64), SLES Linux 11 SP1 et SP2 (x86-64)
- GPL open source (Kernel Rev. 2.6.25+)
- Conservation des données en fin de vie 1 an
Vue d'ensemble de la vidéo
Construire et concevoir
Le Micron RealSSD P320h est une carte PCI-Express mi-hauteur mi-longueur x8 dotée de la disposition PCIe AA la plus basique du marché en termes de conception. Avec un seul contrôleur et deux petites cartes filles, c'est plus mince que toute autre solution que nous avons examinée à ce jour, et de loin la moins complexe. Cela fonctionne en faveur de Micron de plusieurs manières. Tout d'abord, la carte s'intègre automatiquement dans presque tous les serveurs du marché prenant en charge les cartes d'extension PCIe, mais elle entre également en jeu lors de la comparaison de la fiabilité globale des solutions d'entreprise. Avec un seul contrôleur et même pas un commutateur PCIe comme on le trouve sur les offres Fusion-io "Duo", il y a moins de pièces qui peuvent tomber en panne. Cela contraste fortement avec les configurations multi-contrôleurs trouvées sur certaines solutions concurrentes qui RAID ensemble plusieurs contrôleurs SandForce. Dans un marché qui déteste éteindre les plates-formes une fois qu'elles sont en production, à l'exception d'un éventuel remplacement ultérieur, savoir que l'appareil que vous avez installé aujourd'hui fonctionnera pendant des années sans causer de problèmes est un énorme avantage.
Au cœur du Micron RealSSD P320h se trouve un contrôleur Micron/IDT ASIC personnalisé qui est unique à cette solution. Sur nos deux échantillons de 700 Go, ce contrôleur est ensuite lié à un pool de 1 To de Micron SLC NAND et tamponné avec 2.25 Go de RAM Micron DDR. Selon la façon dont vous le voyez, ces éléments offrent un énorme avantage à Micron, car ils ont une connaissance très détaillée du fonctionnement de tous ces composants au niveau de base en les ayant en interne.
Le Micron RealSSD P320h est très agile en termes de consommation d'énergie, tirant moins de 25 watts d'un bus PCIe 2.0 x8 ; ne nécessitant aucune connexion d'alimentation externe. Cela donne au P320h plus de flexibilité lorsqu'il s'agit de trouver des plates-formes appropriées à installer, sans nécessiter de câbles d'alimentation supplémentaires ou de serveurs de test pour fournir une alimentation via PCIe-spec.
Logiciel de gestion
Bien que la plupart des accélérateurs d'applications soient livrés avec certains logiciels, la convivialité et l'efficacité de ces outils varient d'excellentes à médiocres. Micron fournit ses outils RealSSD Manager conçus pour rendre la gestion du P320h plus efficace, y compris à la fois une CLI et une interface graphique. Ces outils sont compatibles avec Windows et Linux et offrent un large éventail de fonctionnalités. Les utilisateurs peuvent tirer parti de ces outils logiciels pour mettre à jour le micrologiciel du lecteur, vérifier la santé du PCIe AA, ainsi que lancer un format de périphérique. Au niveau le plus avancé, vous pouvez surveiller l'utilisation et la température actuelles du disque, avec des capacités de journalisation intégrées.
Comparé aux utilitaires inclus par le fabricant que nous avons vus à ce jour, Micron se situe juste en dessous de Fusion-io en termes d'ensemble de fonctionnalités et de conception globale. Bien qu'il lésine un peu sur la conception par rapport à ioSphere, le gestionnaire Micron RealSSD offre bon nombre des mêmes capacités de gestion et de surveillance, mais uniquement au niveau local. Actuellement, il ne prend pas en charge les périphériques de surveillance sur les systèmes distants, mais dans l'ensemble, il offre une énorme amélioration des fonctionnalités par rapport aux outils de gestion LSI ou OCZ.
Contexte des tests et comparables
Lorsqu'il s'agit de tester du matériel d'entreprise, l'environnement est tout aussi important que les processus de test utilisés pour l'évaluer. Chez StorageReview, nous proposons le même matériel et la même infrastructure que ceux que l'on trouve dans de nombreux centres de données auxquels les appareils que nous testons seraient finalement destinés. Cela inclut uniquement les tests avec des serveurs d'entreprise ainsi que des équipements d'infrastructure appropriés tels que la mise en réseau d'entreprise, l'espace de rack, le conditionnement/la surveillance de l'alimentation et du matériel comparable de même classe pour évaluer correctement les performances d'un périphérique. Aucun de nos avis n'est payé ou contrôlé par le fabricant de l'équipement que nous testons ; avec des comparables pertinents choisis à notre discrétion parmi les produits que nous avons dans notre laboratoire.
Plate-forme de test d'entreprise StorageReview :
- 2 x Intel Xeon X5650 (2.66 GHz, cache de 12 Mo)
- Windows Server 2008 Standard Edition R2 SP1 64 bits et CentOS 6.2 64 bits
- Jeu de puces Intel 5500+ ICH10R
- Mémoire – 8 Go (2 x 4 Go) 1333 Mhz DDR3 enregistrés RDIMM
En ce qui concerne le choix des comparables pour cet examen, nous avons choisi les leaders de chaque fabricant, mais uniquement dans les domaines qui avaient du sens par rapport au Micron RealSSD P320h équipé de SLC. Pour cette raison, nous avons abandonné le LSI WarpDrive de première génération car il a été remplacé par le Nytro WarpDrive de deuxième génération, ainsi que l'OCZ Z-Drive R4 qui était trop éloigné de la courbe de latence pour les besoins du marché du stockage d'entreprise performant. .
640GB Fusion-io ioDrive Duo
- Sortie : 1S2009
- Type NAND : MLC
- Contrôleur : 2 x propriétaire
- Visibilité de l'appareil : JBOD, RAID logiciel selon le système d'exploitation
- Fusion-io VSL Windows : 3.1.1
- Fusion-io VSL Linux 3.1.1
200GB LSI Nytro WarpDrive WLP4-200
- Sortie : 1S2012
- Type NAND : SLC
- Contrôleur : 4 x LSI SandForce SF-2500 via LSI SAS2008 PCIe vers SAS Bridge
- Visibilité de l'appareil : RAID0 matériel fixe
- Windows LSI : 2.10.51.0
- LSI Linux : pilote natif CentOS 6.2
700 Go Micron RealSSD P320h
- Sortie : 2S2011
- Type NAND : SLC
- Contrôleur : 1 x propriétaire
- Visibilité de l'appareil : appareil unique
- Micron Windows : 7.03.3452.00
- Micron Linux : 1.3.7-1
Analyse synthétique de la charge de travail d'entreprise (paramètres de stock)
La façon dont nous envisageons les solutions de stockage PCIe va plus loin que la simple analyse des performances traditionnelles en rafale ou en régime permanent. Lorsque vous examinez les performances moyennes sur une longue période, vous perdez de vue les détails des performances de l'appareil sur toute cette période. Étant donné que les performances flash varient considérablement au fil du temps, notre nouveau processus d'analyse comparative analyse les performances dans des domaines tels que le débit total, la latence moyenne, la latence maximale et l'écart type sur l'ensemble de la phase de préconditionnement de chaque appareil. Avec les produits d'entreprise haut de gamme, la latence est souvent plus importante que le débit. Pour cette raison, nous nous efforçons de montrer les caractéristiques de performance complètes de chaque appareil que nous mettons à travers notre Laboratoire de test d'entreprise.
Nous avons également ajouté des comparaisons de performances pour montrer comment chaque périphérique fonctionne sous un ensemble de pilotes différent sur les systèmes d'exploitation Windows et Linux à l'aide du générateur de charge de travail Fio. Pour Windows, nous utilisons les derniers pilotes au moment de l'examen initial, chaque périphérique étant ensuite testé dans un environnement Windows Server 64 R2008 2 bits. Pour Linux, nous utilisons l'environnement CentOS 64 6.2 bits, pris en charge par chaque accélérateur d'application Enterprise PCIe. Notre objectif principal avec ces tests est de montrer en quoi les performances du système d'exploitation diffèrent, car le fait d'avoir un système d'exploitation répertorié comme compatible sur une fiche produit ne signifie pas toujours que les performances entre eux sont égales.
Tous les appareils testés sont soumis à la même politique de test du début à la fin. Actuellement, pour chaque charge de travail individuelle, les appareils sont effacés en toute sécurité à l'aide des outils fournis par le fournisseur, préconditionnés en état stable avec la charge de travail identique avec laquelle l'appareil sera testé sous une charge élevée de 16 threads avec une file d'attente en attente de 16 par thread, et puis testé à des intervalles définis dans plusieurs profils de profondeur de thread/file d'attente pour montrer les performances en cas d'utilisation légère et intensive. Pour les tests avec une activité de lecture à 100 %, le préconditionnement s'effectue avec la même charge de travail, bien qu'il soit basculé sur 100 % d'écriture.
Tests de préconditionnement et d'état stable primaire :
- Débit (agrégat IOPS lecture + écriture)
- Latence moyenne (latence de lecture + écriture moyennée ensemble)
- Latence maximale (latence maximale de lecture ou d'écriture)
- Écart-type de latence (écart-type de lecture + écriture moyenné ensemble)
À l'heure actuelle, Enterprise Synthetic Workload Analysis comprend quatre profils communs, qui peuvent tenter de refléter l'activité du monde réel. Celles-ci ont été choisies pour avoir une certaine similitude avec nos références passées, ainsi qu'un terrain d'entente pour la comparaison avec des valeurs largement publiées telles que la vitesse de lecture et d'écriture maximale de 4K, ainsi que 8K 70/30 couramment utilisé pour les disques d'entreprise. Nous avons également inclus deux charges de travail mixtes héritées, y compris le serveur de fichiers traditionnel et le serveur Web offrant un large éventail de tailles de transfert. Ces deux derniers seront progressivement supprimés avec des benchmarks d'applications dans ces catégories au fur et à mesure de leur introduction sur notre site, et remplacés par de nouvelles charges de travail synthétiques.
- 4K
- 100 % de lecture ou 100 % d'écriture
- 100% 4K
- 8K70/30
- 70 % de lecture, 30 % d'écriture
- Serveur de fichiers
- 80 % de lecture, 20 % d'écriture
- 10 % 512b, 5 % 1k, 5 % 2k, 60 % 4k, 2 % 8k, 4 % 16k, 4 % 32k, 10 % 64k
- webserver
- 100 % lu
- 22 % 512b, 15 % 1k, 8 % 2k, 23 % 4k, 15 % 8k, 2 % 16k, 6 % 32k, 7 % 64k, 1 % 128k, 1 % 512k
Passant à notre premier test qui couvre une charge de travail de préconditionnement d'écriture aléatoire de 4K, le Micron RealSSD P320h démarre haut, avec des vitesses de rafale juste en dessous de 400k IOPS dans notre Lenovo ThinkServer. Les performances se sont stabilisées au-dessus de 200 80 IOPS autour de la barre des 6.2 minutes, avec des performances très similaires entre nos environnements de test CentOS 2008 et Windows Server XNUMX.
En regardant la latence moyenne sur la durée de notre test de préconditionnement 4K, le P320h s'est rapidement installé à un peu plus de 1 ms de latence avec une charge 16T/16Q, bien en deçà du LSI Nytro WarpDrive équipé de SLC.
En comparant la latence maximale de Windows et Linux sur la durée de notre charge de travail de préconditionnement, nous avons constaté que l'environnement Linux offrait le moins de pics de latence élevée, alors que le jeu de pilotes Windows oscillait parfois jusqu'à 1,000 XNUMX ms.
Alors que les pics de 1,000 320 ms peuvent être déconcertants, la comparaison de l'écart type donne une meilleure image globale de la latence globale sur la durée du test. Dans le cas du P2008h, même avec ses pics plus élevés dans Windows Server XNUMX, il a quand même réussi à se classer deuxième derrière lui-même sous Linux.
Après la transition hors de la phase de préconditionnement, nous avons pris un échantillon plus long de chaque accélérateur d'application dans la charge de travail 4K avec une charge 16T/16Q. Le Micron RealSSD P320h offrait de loin les performances les plus élevées, à la fois en lecture aléatoire 4K et en écriture aléatoire, avec l'avantage donné à son ensemble de pilotes Linux. Dans CentOS, nous avons mesuré 417 378 IOPS en lecture contre « seulement » 4 202 IOPS sous Windows. La vitesse d'écriture aléatoire XNUMXK était constante sur les deux plates-formes, mesurant plus de XNUMXk IOPS.
Avec le débit presque incroyable, il n'était pas surprenant de voir le P320h avec la latence moyenne la plus faible. La latence de lecture moyenne est légèrement supérieure à 0.6 ms, avec une latence d'écriture de 1.26 ms.
Lors de la comparaison de la latence de pointe dans notre échantillon final de performances de lecture et d'écriture aléatoires 4K, le Micron RealSSD P320h présentait certains des blips de lecture aléatoire 4K les plus élevés du lot sous Windows et Linux. Les performances d'écriture aléatoire étaient plus divisées, avec une latence de pointe plus élevée du côté Windows et une latence de pointe plus faible sur le segment Linux.
En approfondissant la latence globale, le Micron realSSD P320h offrait de loin les performances 4K aléatoires les plus cohérentes sous Linux, et un peu moins avec ses pilotes Windows.
Notre prochain test déplace l'attention vers notre charge de travail 8K 70/30, où le Micron P320h mène à nouveau le groupe par une large marge de débit. Dans ce segment, les vitesses de rafale sont passées en 30 minutes dans le test, puis se sont stabilisées à un état stable autour de la marque des 120 minutes.
Le P320h offrait une latence moyenne très faible dans notre charge de travail 8K 70/30, mesurant environ 1.5 ms sur la durée du processus de préconditionnement. L'ensemble de pilotes Linux offrait une légère avance, mais dans l'ensemble, vous auriez du mal à remarquer cette différence.
En passant de la latence moyenne à la latence maximale, il existe une différence notable entre le comportement sous Windows et sous Linux. Les pilotes Windows avaient des temps de réponse maximum rebondissant entre 1,000 1,200 et 200 XNUMX ms, tandis que le côté Linux était inférieur à environ XNUMX ms.
Alors que la latence maximale montre les pires temps de réponse unique, notre section suivante examine l'écart type pour voir comment l'image globale de la latence s'est déroulée pendant notre étape de préconditionnement. Sous Linux, le Micron P320h offrait un niveau de cohérence bien supérieur par rapport au côté Windows. Bien que les performances de Windows soient moins constantes, elles se classent toujours au milieu du peloton.
Par rapport à la charge de travail fixe à 16 threads et 16 files d'attente maximales que nous avons effectuée lors du test d'écriture 100 % 4K, nos profils de charge de travail mixtes adaptent les performances à une large gamme de combinaisons thread/file d'attente. Dans ces tests, nous étendons l'intensité de notre charge de travail de 2 threads et 2 files d'attente à 16 threads et 16 files d'attente. Le Micron P320h offrait une avance dominante à des profondeurs de file d'attente plus élevées par rapport aux comparables de ce groupe, tout en n'abandonnant que des performances minimales au niveau 2T/2Q. Sur l'ensemble du spectre, l'ensemble de pilotes Linux offrait un débit plus élevé dans la plupart des domaines avec une petite marge.
Le Micron RealSSD P320h offrait les meilleurs temps de réponse du groupe dans toutes les charges sauf 2T/2Q, et est resté inférieur à 1 ms pour tous sauf le segment 16T/16Q.
Les temps de réponse plus élevés ont commencé à apparaître sur le P320h sous Windows vers le milieu du test, avec plus de 4 threads simultanés. Les pilotes Linux ont conservé ces blips dans tous les tests, sauf les tests QD128 et QD256 efficaces les plus élevés, où ils se sont approchés de 200 ms.
En comparant l'écart type, le Micron RealSSD P320h a offert ses performances les plus constantes sous Linux et s'est classé au milieu du peloton pour son jeu de pilotes Windows.
La charge de travail du serveur de fichiers représente un spectre de taille de transfert plus important pour chaque appareil particulier, donc au lieu de s'installer pour une charge de travail statique de 4k ou 8k, le lecteur doit faire face à des demandes allant de 512b à 64k. Le test de préconditionnement du serveur de fichiers a été le premier domaine dans lequel le Micron P320h n'a pas surpassé les autres modèles en termes de vitesse de rafale, bien qu'il ait continué à s'accélérer à partir de son état d'effacement sécurisé au fur et à mesure que le test se terminait. Tout en commençant en dessous de 80 100 IOPS, après 120 minutes, il a dépassé XNUMX XNUMX IOPS en régime permanent. Cela surpassait de loin les modèles existants dans ce segment.
En ce qui concerne la latence moyenne, alors que le Micron RealSSD P320h s'approchait de l'état stable à une profondeur de file d'attente effective de 256, il a parcouru une moyenne de 2 ms avec ses temps de réponse.
En nous concentrant sur les temps de réponse de pointe, le jeu de pilotes Windows a de nouveau montré des temps de réponse de pointe plus élevés, oscillant autour de 1,000 50 ms tout au long de notre test. Cela a été comparé à l'ensemble de pilotes Linux qui maintenait un niveau de crête ne dépassant pas XNUMX ms.
Bien que les temps de réponse de pointe ne semblent pas nécessairement bons, nous nous concentrons sur l'écart type pour brosser un tableau plus clair de la latence globale du Micron P320h. Dans cette zone, vous pouvez voir quelques blips sur la durée du test du P320h sous Windows, mais il maintient toujours un niveau parmi les plus bas du groupe.
Après avoir terminé notre phase de préconditionnement, nous sommes passés à nos tests primaires avec une charge variant entre 16T/16Q jusqu'à 2T/2Q. Le Micron RealSSD P320h a démarré rapidement et a mené le peloton avec une avance substantielle à mesure que la profondeur effective de la file d'attente augmentait. Finalement, les performances ont dépassé les 130 XNUMX IOPS dans notre serveur à double processeur.
En comparant la latence moyenne, le P320h offrait son débit maximal de 130 16 IOPS à 4T/0.5Q avec une latence moyenne d'environ 1 ms, atteignant 2 à 128 ms aux niveaux EQD256 et EQDXNUMX.
L'image de latence maximale pendant le segment principal de notre test de serveur de fichiers avait les mêmes 1,000 XNUMX ms pendant le segment Windows de notre test que les tests précédents, les pilotes Linux offrant des temps de réponse de pointe beaucoup plus faibles.
En comparant l'écart type de latence, le Micron RealSSD P320h offrait la meilleure latence répartie du groupe sous Linux et se situait vers le milieu du peloton sous Windows.
Dans notre dernière charge de travail synthétique couvrant un profil de serveur Web, qui est traditionnellement un test de lecture à 100 %, nous appliquons une activité d'écriture à 100 % pour préconditionner entièrement chaque lecteur avant nos tests principaux. Dans ce test, le Micron RealSSD P320h est sorti avec les performances en régime permanent les plus rapides, mais la nouveauté de ce test était la nette différence de débit entre les pilotes Windows et Linux. Les performances de Linux sont bien supérieures, tout en offrant de meilleures performances en rafale.
Passant à la latence moyenne, le Micron P320h offrait une courbe plate à partir d'un peu plus de 20 minutes dans le test, les performances Linux ayant une avance de près de 2 ms.
Comparé aux charges de travail mixtes en lecture/écriture des tests précédents qui montraient de fréquentes interruptions de 1,000 320 ms du PXNUMXh, le test de préconditionnement du serveur Web était beaucoup plus calme en comparaison. Cela dit, le côté Linux était encore plus calme, ne montrant aucune latence pendant le processus de préconditionnement.
Comparaison de l'écart type de latence dans notre phase de préconditionnement du serveur Web, le Micron RealSSD P320h offrait de loin la latence la plus constante, même lorsque nous incluons les blips vus par les pilotes Windows. En regardant la rampe de latence très douce alors que le lecteur s'approchait de l'état stable, nous constatons que les performances se sont complètement stabilisées entre 60 et 80 minutes.
Passant au segment principal de notre test de serveur Web avec un profil de lecture à 100 %, le Micron P320h est toujours en tête du peloton dans toutes les catégories, à l'exception des performances de Windows dans la section 2T/2Q de notre test. Un aspect intéressant comparant ses performances est que si le côté Linux offrait de meilleures performances en écriture, l'ensemble de pilotes Windows offrait des performances en lecture plus élevées. Cela a entraîné des performances Windows plus élevées dans toutes les sections avec une profondeur de file d'attente plus importante et une vitesse de pointe beaucoup plus élevée (152k contre 170k IOPS)
La latence moyenne du Micron RealSSD P320h est restée inférieure à 1 ms à toutes les étapes, sauf lorsque la profondeur de file d'attente effective était de 256. En comparant son débit de pointe à la latence moyenne, nous constatons que ce point idéal de la carte dans notre trace de serveur Web se situe entre une profondeur de file d'attente effective de 64 et 128.
Même si les pilotes Windows ont finalement pris le dessus en termes de débit et de latence moyenne, les temps de réponse maximum flottaient toujours autour de 1,000 XNUMX ms sur la plupart des sections du test ; les performances Linux n'avaient pas de pics de latence élevés
En comparant l'écart type de latence entre les disques de ce groupe, le Micron RealSSD sous Linux offrait la meilleure répartition de latence, tandis que les pilotes Windows arrivaient vers le milieu du pack.
Analyse synthétique de la charge de travail d'entreprise (multidisque/réseau)
Équipés de deux accélérateurs d'applications PCIe RealSSD P700h Micron de 320 Go, nous avons configuré un environnement de test composé d'un serveur Supermicro hautes performances exécutant Windows Server 2012. Cette plate-forme de test a été connectée via deux adaptateurs PCIe 3.0 Mellanox InfiniBand distincts à notre commutateur SX6036 IB, à deux Serveurs HP Proliant DL380p Gen8 exécutant également Windows Server 2012. Sur le serveur de stockage Supermicro hautes performances, nous avons créé une baie de stockage simple à l'aide d'espaces de stockage, qui a ensuite été partagée sur SMB. Contrairement à nos benchmarks principaux qui testent l'ensemble de la surface LBA des disques, ces tests ont mis l'accent sur deux segments de 50 Go répartis sur le volume par bandes, étalonnés localement ainsi que sur le réseau InfiniBand.
Nous avons inclus une vidéo de présentation de nos tests InfiniBand ci-dessous :
Plate-forme de test d'entreprise StorageReview 56 Gb/s :
Super micro ordinateur SuperServeur 7047R-TXRF
- Super micro-ordinateur X9DRX+-F
- Deux processeurs Intel E5-2670 (2.6 GHz, 20 Mo de cache)
- Centre de données Windows Server 2012
- 128 Go de RAM (8 Go x 16 Hynix DDR3, 64 Go par processeur)
- Intel Xeon E5-2640 (6 cœurs, 2.50 GHz, 15 Mo, 95 W)
- Windows Server standard 2012
- Jeu de puces Intel C600
- 64 Go (8 x 8 Go) et 16 Go (4 x 4 Go) RDIMM enregistrés DDR1333 à 3 XNUMX MHz
Commutateur et matériel Mellanox SX6036 56Gb/s InfiniBand
- 36 ports FDR 56 Gb/s
- Câbles cuivre QSFP passifs
- Adaptateur InfiniBand Mellanox ConnectX-3 VPI PCIe 3.0 Twin 56Gb/s
Notre infrastructure actuelle de test d'interconnexion hautes performances InfiniBand se compose de deux serveurs HP Proliant DL380p Gen8 équipés d'adaptateurs Mellanox ConnectX-3 VPI PCIe connectés via le commutateur IB 36 ports 56 Gb/s de Mellanox. Cet environnement permet au périphérique de stockage que nous testons d'être le goulot d'étranglement des E/S, au lieu de l'équipement réseau lui-même.
Dans notre section locale de test d'espace simple et InfiniBand, nous nous sommes limités à une sélection limitée de tests, au lieu de notre suite complète. Pour faciliter la comparaison, nous avons utilisé notre charge de travail 8K 70/30 pour montrer la différence de performances entre l'accès local et lorsqu'il est partagé sur le réseau.
En utilisant une empreinte globale plus petite pour tester à partir de nos tests principaux, nous avons constaté que les performances évoluaient extrêmement bien dans un environnement à double carte. Localement, avec deux sessions de générateur de charge de travail exécutées simultanément pour imiter les deux serveurs fonctionnant sur le réseau, nous avons mesuré des performances supérieures à 490 8 IOPS dans notre charge de travail 70K 30/380. En présentant cette baie à bande unique sur deux partages et en y accédant à partir de nos deux serveurs HP Proliant DL8p Gen402, les performances ont chuté à XNUMX XNUMX IOPS. Nous avons pu plus que doubler le débit dans les deux scénarios, tout en maintenant d'excellentes performances par serveur.
En examinant la latence moyenne dans notre environnement à deux P320h, il y avait une certaine différence de latence moyenne entre l'accès local et l'accès à distance sur InfiniBand, mais la latence était toujours inférieure à ce que nous avons mesuré à partir d'un P320h dans notre banc d'essai principal. Étant donné qu'il y avait un impact minimal sur la latence lors du partage de ce périphérique d'E/S élevé entre plusieurs systèmes, cela ouvre vraiment la porte au partage de ressources hautes performances coûteuses entre plusieurs systèmes.
Il n'y avait vraiment aucune différence mesurable dans la latence maximale entre l'accès local et l'accès à distance, ce qui est important sachant que le réseau InfiniBand n'augmente pas de manière significative la latence des périphériques tels que les accélérateurs d'application PCIe.
Comme pour la latence maximale, nous n'avons constaté aucune différence perceptible entre l'écart type de latence observé localement dans un environnement en bandes ou sur notre réseau InfiniBand.
Après avoir constaté que les performances 8K 70/30 avec deux charges simultanées avec une profondeur de file d'attente effective de 256 chacune ont une légère baisse de performances sur le réseau par rapport à localement, nous nous sommes concentrés sur une charge de travail variable allant de 2T/2Q à 16T/16Q . Étant donné que cela s'est produit sur deux serveurs ou deux générateurs de charge de travail locaux en même temps, la charge totale serait de 4T/2Q jusqu'à 32T/16Q. L'accès local et réseau à la baie P320h rayée offrait la même réactivité à une charge croissante. Les deux tests ont montré des modèles presque identiques sur tout le spectre, l'accès local offrant les meilleures performances.
La latence moyenne dans la section principale de notre charge de travail 8K 70/30 sur la configuration P320h en bandes offrait d'excellentes performances localement et sur notre réseau. Le plus impressionnant est les résultats InfiniBand, où chaque serveur a vu moins de 0.8 ms de latence pour plus de 400,000 XNUMX IOPS sur le réseau.
La comparaison de la latence maximale dans la charge de travail 8K 70/30 avec notre configuration double P320h a montré des résultats similaires localement par rapport à distance, les deux ayant des sauts de plus de 1,000 XNUMX ms pendant la durée du test.
Semblable à nos résultats de latence maximale ci-dessus, il y avait très peu de différence entre l'accès local à la baie P320h ou son partage via l'espace de stockage Windows sur notre réseau InfiniBand.
Conclusion
Le Micron RealSSD P320h est tout simplement un excellent exemple d'ingénierie bien exécutée. Tout, de la conception et de la disposition de la carte au contrôleur personnalisé, fait du P320h une véritable unité intégrée, ce qui n'est pas toujours le cas, même dans l'espace de stockage de l'entreprise. Micron trouve des moyens d'ajouter de la valeur à l'ensemble du disque, de l'IP de gestion NAND dans l'ASIC personnalisé à la caractérisation NAND la plus profonde possible qui conduit à des performances et une endurance maximales des composants flash SLC.
Lorsque nous évaluons les performances du P320h, le disque hurle, maintenant une quasi-parité entre nos environnements de test CentOS et Windows Server. En termes de meilleur environnement, Linux a toujours eu l'avantage, en particulier en ce qui concerne la latence optimale. Dire que le Micron P320h est rapide est un euphémisme. Il a largement dépassé toutes les autres solutions que nous avons testées à ce jour, avec des vitesses de rafale supérieures à la plupart et des performances en régime permanent bien supérieures à celles des solutions concurrentes. En plongeant dans sa réactivité, la latence moyenne était impeccable, mais ce qui est encore plus impressionnant, c'est sa nouvelle performance Linux sans faille, avec une latence maximale et un écart type de latence très faibles. Le côté Windows n'était pas trop loin, bien que sa latence maximale et son écart type de latence se classent au milieu du peloton en comparaison.
En ce qui concerne la compatibilité, nous avons constaté que le Micron RealSSD P320h fonctionne parfaitement dans un environnement d'entreprise. Pour nous, cela n'a aucun sens de tester cette offre d'entreprise de premier plan sur une plate-forme grand public, car elle ne serait jamais introduite dans un environnement de production fonctionnant dans une seule. À cette fin, sur les serveurs de niveau 320 sur lesquels nous l'avons testé, il a fonctionné sans problème sur plusieurs systèmes d'exploitation. Le P7047h n'a également eu aucun problème à fonctionner en configuration double disque dans notre Supermicro SuperServer 2012R sous Windows Server XNUMX, comme on peut le voir dans notre vidéo.
Si nous allons nous plaindre beaucoup, c'est que l'environnement Windows a laissé quelques zones mineures nécessitant des améliorations, en particulier lorsque nous avons comparé la latence maximale et l'écart type dans toutes nos charges de travail. Même avec cette latence plus élevée, il a encore dépassé la plupart, sinon la totalité, des accélérateurs d'application PCIe que nous avons testés, mais nous pensons qu'il pourrait encore rester des performances à extraire avec des pilotes plus raffinés. Un autre domaine de plainte mineure concerne les offres de produits SLC uniquement en seulement deux capacités. Les concurrents proposent des disques en MLC ou eMLC, ce qui permet un point d'entrée plus bas sur les coûts, ainsi que des capacités beaucoup plus importantes ; plus de 2 To sur une seule carte dans certains cas. Certes, le marché des entreprises d'entrée qui est intense en lecture n'est pas la cible du P320h, mais une plus grande variété pour répondre à plus de besoins pourrait rendre la famille P320h plus polyvalente.
Avantages
- Accélérateur d'application PCIe le plus rapide que nous ayons testé à ce jour
- Latence moyenne et crête très faible
- Excellente parité des performances dans les environnements Windows et Linux
Inconvénients
- Limité à SLC NAND
- Plafond à 700 Go
Conclusion
Le Micron RealSSD P320h est une offre complète et bien exécutée pour les entreprises qui veulent le meilleur de ce que le stockage PCIe a à offrir. Le P320h est le plus performant de sa catégorie, offrant des performances multi-OS excellentes et cohérentes grâce aux composants Micron et à la propriété intellectuelle de gestion NAND supérieure intégrée au contrôleur.
Discutez de cet avis