Micron RealSSD P320h är en applikationsaccelerator på halv höjd och halv längd (HHHL) som utnyttjar SLC NAND och ett PCIe Gen 2 x8-gränssnitt för att driva prestanda på 3.2 GB/s sekventiell läsning och upp till 785,000 320 slumpmässig läsning IOPS. P700h-arkitekturen är en avvikelse från många av de andra senaste applikationsacceleratorerna vi har granskat som vanligtvis RAID tillsammans flera flashenheter. Microns erbjudande är annorlunda, istället använder man RAIN (redundant array av oberoende NAND) med anpassad styrenhet, vilket liknar tillvägagångssättet från Fusion-io och Virident. Den här arkitekturen låter Micron skryta med några berusande hastighets- och latenskrav samtidigt som den erbjuder en hög nivå av datasäkerhet på enheten. I den här recensionen testar vi ett par av 320 GB-korten och kommer inte bara att se hur snabbt de går på egen hand, utan hur P2012h skalar i Windows Server XNUMX.
Som nämnts spelar enhetsarkitektur och NAND-hanteringspolicyer en avgörande roll när det gäller enhetens prestanda sett ur både genomströmnings- och latensperspektiv. Med P320h smälter Micron ihop sin egen IP med ASIC-design och tillverkning från IDT. Nettoresultatet är en ASIC-kontroller som inkluderar Microns egenutvecklade intelligens kring NAND-hantering och -kontroll, som inkluderar RAIN. Microns RAIN-tillvägagångssätt är mycket effektivt i sättet att hantera NAND och den effektiviteten är i slutändan det som driver P320h:s prestanda och dataskydd. Micron använder vad som motsvarar en 7+1P RAID5-arkitektur inom RAIN. Med striping som används på 7+1-nivån kan Micron leverera samma prestanda som en enhet utan paritet, samtidigt som de ger det dataskydd som företag kräver.
Även om P320h är intressant tack vare Micron NAND-hanteringstekniker, är den också fysiskt intressant. HHHL PCB är full av Micron-delar, inklusive SLC NAND och DDR så klart, och det kräver ingen extern strömanslutning för att nå maximal prestanda. Våra 700 GB-enheter har 64 NAND-bitar inklämda på kortet, vilket framhävs av den passiva kylflänsen på den enda kontrollern. Den enda styrenhetens design möjliggör bättre prestanda och tillförlitlighet än konkurrerande lösningar som är beroende av att kombinera flera styrenheter via hårdvara och mjukvara. Att använda en styrenhet speciellt designad för Micron NAND ger Micron ytterligare en fördel när det gäller interoperabilitet, prestanda och stöd för enheten. I motsats till vad som har rapporterats på andra ställen, stöder inte enheten NVMe, men Micron är definitivt på väg åt det hållet med framtida produkter.
Micron erbjuder P320h i två SLC-kapaciteter, 350 GB och 700 GB användbara. En 350 GB-enhet börjar som 512 GB RAW, men efter att ha subtraherat 12.5 % för RAIN och sedan 22 % för överprovisionering kommer enheten in på 350 GB. P320h levererar upp till 25 PB uthållighet för 350 GB-modellen och 50 PB för 700 GB och levereras med mjukvaruverktyg för hantering av diskar och hälsorapportering.
Specifikationer för Micron RealSSD P320h
- Kapacitet
- 350 GB (MTFDGAR350SAH-1N1AB)
- Sekventiell läsning: 3.2 GB/s (128KB, steady state)
- Sekventiell skrivning: 1.9 GB/s (128KB, steady state)
- Slumpmässig läsning: 785,000 4 IOPS (XNUMXKB, steady state)
- Slumpmässig skrivning: 175,000 4 IOPS (XNUMXKB, steady state)
- 700 GB (MTFDGAR700SAH-1N1AB)
- Sekventiell läsning: 3.2 GB/s (128KB, steady state)
- Sekventiell skrivning: 1.9 GB/s (128KB, steady state)
- Slumpmässig läsning: 785,000 4 IOPS (XNUMXKB, steady state)
- Slumpmässig skrivning: 205,000 4 IOPS (XNUMXKB, steady state)
- 350 GB (MTFDGAR350SAH-1N1AB)
- Klar latens: <42µs (512 byte)
- Skrivfördröjning: <9µs
- Gränssnitt: PCIe Gen2 x8
- Effekt: max 25W, 10W tomgång
- Formfaktor: HHHL
- Inbyggt kommando köar upp till 256 kommandon
- Uthållighet: 350GB – 25PB, 700GB – 50PB
- Dimensioner: 68.90mm x 167.65mm x 18.71mm
- Driftstemperatur: 0°C till +50°C
- Operativsystem
- Microsoft: Windows Server 2008 R2 SP1 (x86-64), Windows Server 2008 R2 SP1 Hyper-V (x86-64), Windows Server 2012 (x86-64) SP128, Windows Server 2012 Hyper-V (x64)
- Linux: RHEL Linux 5.5, 5.6, 5.7, 5.8 (SP128), 6.1, 6.2 (x86-64), SLES Linux 11 SP1 och SP2 (x86-64)
- GPL med öppen källkod (Kernel Rev. 2.6.25+)
- Datalagring vid slutet av livet 1 år
Videoöversikt
Bygg och design
Micron RealSSD P320h är ett halvhögt halvlängd x8 PCI-Express-kort med den mest grundläggande PCIe AA-layouten på marknaden när det gäller design. Med en enda kontroller och två små dotterkort är den tunnare än någon annan lösning vi har granskat hittills, och den i särklass minst komplexa. Detta fungerar till Microns fördel på flera sätt. Först passar kortet automatiskt i nästan alla servrar på marknaden som stöder PCIe-expansionskort, men det spelar också in när man jämför övergripande tillförlitlighet i företagslösningar. Med en enda styrenhet och inte ens en PCIe-switch som finns på Fusion-io "Duo"-erbjudanden, finns det färre delar som kan misslyckas. Detta står i skarp kontrast till multikontrollerkonfigurationerna som finns på vissa konkurrerande lösningar som RAID tillsammans flera SandForce-kontroller. På en marknad som hatar att stänga av plattformar när de väl är i produktion, förutom den eventuella ersättningen på vägen, är det ett stort plus att veta att enheten du installerade idag kommer att fungera i flera år utan att orsaka problem.
I hjärtat av Micron RealSSD P320h är en anpassad Micron/IDT ASIC-kontroller som är unik för denna lösning. På våra två 700 GB-exemplar är denna kontroller sedan länkad till en 1TB-pool av Micron SLC NAND och buffrad med 2.25 GB Micron DDR-RAM. Beroende på hur du ser på det, erbjuder dessa artiklar en stor fördel med Micron, eftersom de har mycket detaljerad kunskap om hur alla dessa komponenter fungerar på en kärnnivå genom att ha dem internt.
Micron RealSSD P320h är mycket pigg när det kommer till strömförbrukning och drar mindre än 25 watt från en PCIe 2.0 x8-buss; kräver ingen extern strömanslutning. Detta ger P320h mer flexibilitet när det kommer till att hitta lämpliga plattformar att installeras i, utan att behöva ytterligare strömkablar eller testservrar för att leverera ström över PCIe-spec.
management Software
Medan de flesta applikationsacceleratorer kommer med viss programvara, varierar användbarheten och effektiviteten för dessa verktyg från utmärkt till dålig. Micron tillhandahåller sina RealSSD Manager-verktyg utformade för att göra hanteringen av P320h mer effektiv, inklusive både en CLI och GUI. Dessa verktyg är kompatibla med både Windows och Linux och erbjuder ett brett utbud av funktioner. Användare kan använda dessa programvaruverktyg för att uppdatera hårddiskens firmware, kontrollera läget för PCIe AA, samt initiera ett enhetsformat. På den mer avancerade nivån kan du övervaka aktuell diskanvändning och temperatur, med inbyggda loggningsmöjligheter.
Jämfört med de verktyg som ingår i tillverkaren vi har sett hittills, kommer Microns in precis under Fusion-io när det gäller funktioner och övergripande design. Även om det snålar lite med design jämfört med ioSphere, erbjuder Micron RealSSD Manager många av samma hanterings- och övervakningsmöjligheter, men bara på lokal nivå. För närvarande stöder den inte övervakningsenheter på fjärrsystem, men ger totalt sett ett enormt steg upp i funktioner jämfört med LSI- eller OCZ-hanteringsverktyg.
Testbakgrund och jämförelser
När det kommer till att testa företagshårdvara är miljön lika viktig som testprocesserna som används för att utvärdera den. På StorageReview erbjuder vi samma hårdvara och infrastruktur som finns i många datacenter där de enheter vi testar i slutändan skulle vara avsedda för. Detta inkluderar endast testning med företagsservrar samt korrekt infrastrukturutrustning som företagsnätverk, rackutrymme, strömkonditionering/övervakning och jämförbar hårdvara av samma klass för att korrekt utvärdera hur en enhet presterar. Ingen av våra recensioner betalas för eller kontrolleras av tillverkaren av utrustningen vi testar; med relevanta jämförbara produkter plockade efter eget gottfinnande från produkter vi har i vårt labb.
StorageReview Enterprise Testing Platform:
- 2 x Intel Xeon X5650 (2.66 GHz, 12 MB cache)
- Windows Server 2008 Standard Edition R2 SP1 64-bitars och CentOS 6.2 64-bitars
- Intel 5500+ ICH10R Chipset
- Minne – 8GB (2 x 4GB) 1333Mhz DDR3-registrerade RDIMM
När det gällde att välja jämförbara för den här recensionen valde vi de främsta från varje tillverkare, men bara på områden som var vettiga mot den SLC-utrustade Micron RealSSD P320h. Av den anledningen släppte vi första generationens LSI WarpDrive eftersom den ersattes av andra generationens Nytro WarpDrive, samt OCZ Z-Drive R4 som föll för långt utanför latenskurvan för behoven på marknaden för prestandaföretagslagring .
640GB Fusion-io ioDrive Duo
- Släppt: 1H2009
- NAND-typ: MLC
- Styrenhet: 2 x Proprietary
- Enhetens synlighet: JBOD, mjukvaru-RAID beroende på OS
- Fusion-io VSL Windows: 3.1.1
- Fusion-io VSL Linux 3.1.1
200GB LSI Nytro WarpDrive WLP4-200
- Släppt: 1H2012
- NAND Typ: SLC
- Styrenhet: 4 x LSI SandForce SF-2500 genom LSI SAS2008 PCIe till SAS Bridge
- Enhetens synlighet: Fast hårdvara RAID0
- LSI Windows: 2.10.51.0
- LSI Linux: Native CentOS 6.2-drivrutin
700 GB Micron RealSSD P320h
- Släppt: 2H2011
- NAND Typ: SLC
- Styrenhet: 1 x Proprietary
- Enhetens synlighet: Enstaka enhet
- Micron Windows: 7.03.3452.00
- Micron Linux: 1.3.7-1
Syntetisk arbetsbelastningsanalys för företag (aktieinställningar)
Sättet vi ser på PCIe-lagringslösningar går djupare än att bara titta på traditionella burst- eller steady-state-prestanda. När man tittar på den genomsnittliga prestandan över en lång tidsperiod, tappar man sikte på detaljerna bakom hur enheten presterar under hela den perioden. Eftersom flashprestanda varierar mycket med tiden, analyserar vår nya benchmarking-process prestandan inom områden inklusive total genomströmning, genomsnittlig latens, toppfördröjning och standardavvikelse över hela förkonditioneringsfasen för varje enhet. Med avancerade företagsprodukter är latens ofta viktigare än genomströmning. Av denna anledning går vi långt för att visa de fulla prestandaegenskaperna för varje enhet vi använder vår Enterprise Test Lab.
Vi har också lagt till prestandajämförelser för att visa hur varje enhet presterar under olika drivrutiner i både Windows- och Linux-operativsystem med hjälp av Fios arbetsbelastningsgenerator. För Windows använder vi de senaste drivrutinerna vid tidpunkten för den ursprungliga granskningen, som varje enhet sedan testas i en 64-bitars Windows Server 2008 R2-miljö. För Linux använder vi 64-bitars CentOS 6.2-miljö, som varje Enterprise PCIe Application Accelerator stöder. Vårt huvudmål med denna testning är att visa hur OS-prestanda skiljer sig, eftersom att ha ett operativsystem listat som kompatibelt på ett produktblad betyder inte alltid att prestanda över dem är lika.
Alla enheter som testas går under samma testpolicy från början till slut. För närvarande, för varje enskild arbetsbelastning, raderas enheter säkert med hjälp av verktygen som tillhandahålls av leverantören, förkonditionerade till steady-state med samma arbetsbelastning som enheten kommer att testas med under tung belastning på 16 trådar med en enastående kö på 16 per tråd, och testades sedan i fastställda intervall i flera gäng-/ködjupsprofiler för att visa prestanda under lätt och tung användning. För tester med 100 % läsaktivitet är förkonditioneringen med samma arbetsbelastning, även om den har vänts till 100 % skrivning.
Förkonditionering och primära stationära tester:
- Genomströmning (Read+Write IOPS Aggregate)
- Genomsnittlig fördröjning (läs+skrivfördröjning i medeltal)
- Max fördröjning (maximal läs- eller skrivfördröjning)
- Latens standardavvikelse (läs+skriv standardavvikelse i genomsnitt)
För närvarande innehåller Enterprise Synthetic Workload Analysis fyra vanliga profiler, som kan försöka återspegla verklig aktivitet. Dessa valdes för att ha viss likhet med våra tidigare riktmärken, samt en gemensam grund för att jämföra med allmänt publicerade värden som max 4K läs- och skrivhastighet, samt 8K 70/30 som vanligtvis används för företagsenheter. Vi inkluderade också två äldre blandade arbetsbelastningar, inklusive den traditionella filservern och webbservern som erbjuder en bred blandning av överföringsstorlekar. Dessa två sista kommer att fasas ut med applikationsriktmärken i dessa kategorier när de introduceras på vår webbplats och ersätts med nya syntetiska arbetsbelastningar.
- 4K
- 100% Läs eller 100% Skriv
- 100 % 4K
- 8K 70/30
- 70 % läser, 30 % skriver
- Fil server
- 80 % läser, 20 % skriver
- 10% 512b, 5% 1k, 5% 2k, 60% 4k, 2% 8k, 4% 16k, 4% 32k, 10% 64k
- webbserver
- 100% läst
- 22% 512b, 15% 1k, 8% 2k, 23% 4k, 15% 8k, 2% 16k, 6% 32k, 7% 64k, 1% 128k, 1% 512k
När vi går in i vårt första test som täcker en 4K slumpmässig skrivprekonditioneringsarbetsbelastning, börjar Micron RealSSD P320h högt, med bursthastigheter som bara ligger utanför 400k IOPS i vår Lenovo ThinkServer. Prestanda planade ut över 200 80 IOPS runt 6.2-minutersstrecket, med mycket liknande prestanda mellan våra CentOS 2008 och Windows Server XNUMX testmiljöer.
Om man tittar på genomsnittlig latens under varaktigheten av vårt 4K-förkonditioneringstest, var P320h snabb att sätta sig in på drygt 1 ms latens med en 16T/16Q-belastning, långt under den SLC-utrustade LSI Nytro WarpDrive.
När vi jämförde Windows och Linux max latens under varaktigheten av vår förkonditioneringsarbetsbelastning fann vi att Linux-miljön erbjöd de minsta spikarna med hög latens, medan Windows-drivrutinerna fladdrade till 1,000 XNUMX ms ibland.
Medan 1,000 320 ms toppar kan vara oroande, ger en jämförelse av standardavvikelsen en bättre övergripande bild av den totala latensen under testets varaktighet. I fallet med P2008h, även med sina högre toppar i Windows Server XNUMX, lyckades den ändå komma på andra plats efter sig själv i Linux.
Efter övergången från förkonditioneringsfasen tog vi ett längre prov av varje applikationsaccelerator i 4K-arbetsbelastningen med en 16T/16Q-belastning. Micron RealSSD P320h erbjöd den överlägset högsta prestandan, både i 4K slumpmässig läsning och slumpmässig skrivning, med fördelen som gavs till dess Linux-drivrutinuppsättning. I CentOS mätte vi 417k IOPS avläst mot "bara" 378k IOPS i Windows. 4K slumpmässig skrivhastighet var konsekvent över båda plattformarna och mätte över 202k IOPS.
Med den nästan otroliga genomströmningen var det ingen överraskning att se P320h med den lägsta genomsnittliga latensen. Den genomsnittliga läsfördröjningen var något över 0.6 ms, med skrivfördröjning på 1.26 ms.
När vi jämför toppfördröjningen i vårt slutliga urval av 4K slumpmässig läs- och skrivprestanda, hade Micron RealSSD P320h några av de högsta 4K slumpmässiga läsblipparna i både Windows och Linux. Slumpmässig skrivprestanda var mer delad, med högre topplatens på Windows-sidan och lägre topplatens på Linux-segmentet.
När man borrade in längre i den övergripande latensen, erbjöd Micron realSSD P320h den överlägset mest konsekventa slumpmässiga 4K-prestandan i Linux, och något mindre med sina Windows-drivrutiner.
Vårt nästa test flyttar fokus till vår 8K 70/30 arbetsbelastning, där Micron P320h återigen leder gruppen med stor marginal i genomströmning. I detta segment övergick spränghastigheterna efter 30 minuter in i testet och planade sedan ut till ett stabilt tillstånd runt 120-minutersstrecket.
P320h erbjöd en mycket låg genomsnittlig latens i vår 8K 70/30 arbetsbelastning, som mätte cirka 1.5 ms under förkonditioneringsprocessen. Linux-drivrutinuppsättningen erbjöd ett litet försprång, men i det övergripande schemat av saker skulle du vara svårt att märka den skillnaden.
Om du byter fokus från genomsnittlig till toppfördröjning finns det en märkbar skillnad mellan beteendet i Windows och i Linux. Windows-drivrutinerna hade maximala svarstider som studsade mellan 1,000 1,200-200 XNUMX ms, medan Linux-sidan var lägre på cirka XNUMX ms.
Medan topplatens visar de värsta enstaka svarstiderna, tittar vårt nästa avsnitt på standardavvikelse för att se hur den övergripande bilden av latens spelade ut under vårt förkonditioneringsskede. I Linux erbjöd Micron P320h mycket högre nivå av konsekvens jämfört med Windows-sidan. Även om Windows-prestandan var mindre konsekvent, rankades den fortfarande i mitten av paketet.
Jämfört med den fasta arbetsbelastningen med 16 trådar och max 16 köer som vi utförde i 100 % 4K-skrivtestet, skalar våra profiler för blandad arbetsbelastning prestandan över ett brett utbud av kombinationer av tråd/kö. I dessa tester spänner vi över vår arbetsbelastningsintensitet från 2 trådar och 2 köer upp till 16 trådar och 16 köer. Micron P320h erbjöd en befallande ledning vid högre ködjup över jämförbara i denna grupp, samtidigt som den endast gav upp minimal prestanda på 2T/2Q-nivån. Över hela spektrumet erbjöd Linux-drivrutinen högre genomströmning i de flesta områden med liten marginal.
Micron RealSSD P320h erbjöd de bästa svarstiderna ur gruppen i alla utom 2T/2Q-belastningen och höll sig under 1ms för alla utom 16T/16Q-segmentet.
De högre svarstiderna började dyka upp på P320h i Windows mot mitten av testet, med mer än 4 samtidiga trådar. Linux-drivrutinerna höll dessa blippar inneslutna till alla utom de högsta effektiva QD128- och QD256-testerna var nära 200ms.
Jämfört med standardavvikelsen erbjöd Micron RealSSD P320h sin mest konsekventa prestanda under Linux, och rankades mitt i paketet för sitt Windows-drivrutinuppsättning.
File Server-arbetsbelastningen representerar ett större spektrum av överföringsstorlekar som träffar varje enskild enhet, så istället för att sätta sig in i en statisk 4k- eller 8k-arbetsbelastning, måste enheten klara förfrågningar som sträcker sig från 512b till 64K. Filserverns förkonditioneringstest var det första området där Micron P320h inte överträffade de andra modellerna i skurhastigheter, även om den bara fortsatte att bli snabbare från sitt säkert raderade tillstånd när testet gick ut. Medan den började under 80k IOPS, överträffade den efter 100 minuter 120k IOPS i steady-state. Detta överträffade vida de befintliga modellerna i detta segment.
När man tittar på genomsnittlig latens, när Micron RealSSD P320h närmade sig steady-state vid ett effektivt ködjup på 256, skummade den med i genomsnitt 2 ms med sina svarstider.
Genom att byta fokus till maximala svarstider, visade Windows-drivrutinuppsättningen återigen högre toppsvarstider och svävade runt 1,000 50 ms under hela vårt test. Detta jämfördes med Linux-drivrutinsuppsättningen som höll en toppnivå som inte översteg XNUMXms.
Även om toppsvarstiderna inte nödvändigtvis ser bra ut, flyttar vi vårt fokus mot standardavvikelse för att måla en tydligare bild av den totala latensen från Micron P320h. I det här området kan du se några blippar under testets varaktighet från P320h i Windows, men den håller fortfarande en nivå som är några av de lägsta från gruppen.
Efter att ha avslutat vår förkonditioneringsfas gick vi in i våra primära tester med en belastning som varierade mellan 16T/16Q ner till 2T/2Q. Micron RealSSD P320h startade snabbt och ledde gänget med ett stort försprång när det effektiva ködjupet ökade. Så småningom toppade prestandan under 130k IOPS i vår server med dubbla processorer.
Jämfört med genomsnittlig latens så erbjöd P320h sin topp 130 16 IOPS-genomströmning vid 4T/0.5Q med en genomsnittlig latens runt 1 ms, vilket ökade till 2-128 ms på EQD256- och EQDXNUMX-nivåerna.
Den maximala latensbilden under huvudsegmentet av vårt filservertest hade samma 1,000 XNUMX ms blips under Windows-segmentet av vårt test som de tidigare testerna, med Linux-drivrutinerna som erbjuder mycket lägre toppsvarstider.
Jämfört med latensstandardavvikelsen erbjöd Micron RealSSD P320h den bästa latensspridningen ur gruppen i Linux, och kom in mot mitten av paketet i Windows.
I vår senaste syntetiska arbetsbelastning som täcker en webbserverprofil, som traditionellt är ett 100 % lästest, tillämpar vi 100 % skrivaktivitet för att helt förbereda varje enhet innan våra huvudtester. I detta test kom Micron RealSSD P320h ut med den snabbaste steady-state-prestandan, men nytt för detta test var den tydliga skillnaden i genomströmning mellan Windows- och Linux-drivrutinerna. Linux-prestandan kom in mycket högre, såväl som bättre burst-prestanda.
Genom att byta fokus till genomsnittlig latens, erbjöd Micron P320h en platt kurva från drygt 20 minuter in i testet, med Linux-prestandan med nästan 2ms ledning.
Jämfört med de blandade läs-/skrivarbetsbelastningarna i tidigare tester som visade frekventa 1,000 320 ms blips från PXNUMXh, var webbserverns förkonditioneringstest mycket lugnare i jämförelse. Med det sagt, var Linux-sidan fortfarande lugnare och visade inga fördröjningar i latens under förkonditioneringsprocessen.
Jämförelse latency standardavvikelse i vår webbserver förkonditioneringsfas, Micron RealSSD P320h erbjöd den överlägset mest konsekventa latensen, även när vi inkluderar blips som ses av Windows-drivrutinerna. Om vi tittar på den mycket milda latensrampen när enheten närmade sig steady-state, ser vi prestandan planade ut helt mellan 60 och 80 minuter.
Genom att byta till huvudsegmentet i vårt webbservertest med en 100 % läsprofil, ledde Micron P320h fortfarande i alla kategorier, förutom Windows-prestandan i 2T/2Q-delen av vårt test. En intressant aspekt som jämför dess prestanda är att medan Linux-sidan erbjöd bättre skrivprestanda, erbjöd Windows-drivrutinuppsättningen högre läsprestanda. Detta resulterade i högre Windows-prestanda i alla sektioner med ett tyngre ködjup och en mycket högre topphastighet (152k vs 170k IOPS)
Genomsnittlig latens från Micron RealSSD P320h höll sig under 1 ms i alla steg utom när det effektiva ködjupet var 256. Jämför vi dess maximala genomströmning med genomsnittlig latens, finner vi att detta korts sweetspot i vår webbserverspår ligger mellan ett effektivt ködjup på 64 och 128.
Även om Windows-drivrutinerna äntligen fick övertaget när det gäller genomströmning och genomsnittlig latens, svävade de maximala svarstiderna fortfarande nära 1,000 XNUMX ms över de flesta delar av testet; Linux-prestandan hade inga höga latenstidstoppar
Genom att jämföra latensstandardavvikelsen mellan enheterna i denna grupp, erbjöd Micron RealSSD i Linux den bästa latensspridningen, medan Windows-drivrutinerna kom in mot mitten av paketet.
Syntetisk arbetsbelastningsanalys för företag (multidrive/nätverk)
Utrustade med två 700 GB Micron RealSSD P320h PCIe Application Acceleratorer, konfigurerade vi en testmiljö bestående av en högpresterande Supermicro-server som körde Windows Server 2012. Denna testplattform kopplades via två separata PCIe 3.0 Mellanox InfiniBand-adaptrar till vår SX6036 IB-switch, till två HP Proliant DL380p Gen8-servrar som också kör Windows Server 2012. På den högpresterande Supermicro-lagringsservern skapade vi en enkel lagringsuppsättning med hjälp av Storage Spaces, som sedan delades över SMB. Till skillnad från våra primära riktmärken som testar hela hårddiskarnas LBA-yta, stressade dessa tester två 50GB-segment spridda över den randiga volymen, jämförda lokalt såväl som över InfiniBand-nätverket.
Vi har inkluderat en översiktsvideo av våra InfiniBand-tester nedan:
StorageReview 56 Gb/s Enterprise Testing Platform:
Super Micro-dator SuperServer 7047R-TXRF
- Super Micro Computer X9DRX+-F
- Dubbla Intel E5-2670-processorer (2.6 GHz, 20 MB cache)
- Windows Server 2012 DataCenter
- 128 GB RAM (8 GB x 16 Hynix DDR3, 64 GB per CPU)
Lagring HP Proliant DL380p Gen8
- Intel Xeon E5-2640 (6 kärnor, 2.50 GHz, 15 MB, 95 W)
- Windows Server Standard 2012
- Intel C600 Chipset
- 64 GB (8 x 8 GB) och 16 GB (4 x 4 GB) 1333 Mhz DDR3-registrerade RDIMM
Mellanox SX6036 56Gb/s InfiniBand Switch och hårdvara
- 36 56Gb/s FDR-portar
- Passiva QSFP kopparkablar
- Mellanox ConnectX-3 VPI PCIe 3.0 Twin 56 Gb/s InfiniBand Adapter
Vår nuvarande InfiniBand högpresterande infrastruktur för interconnect-testning består av två HP Proliant DL380p Gen8-servrar utrustade med Mellanox ConnectX-3 VPI PCIe-adaptrar anslutna via Mellanox 36-portars 56Gb/s IB-switch. Denna miljö tillåter lagringsenheten vi testar att vara I/O-flaskhalsen, istället för själva nätverksutrustningen.
I vårt lokala enkla utrymme och InfiniBand-testsektion, har vi begränsat oss till ett begränsat urval av tester, istället för vår fullständiga svit. För att underlätta jämförelsen använde vi vår 8K 70/30-arbetsbelastning för att visa skillnaden i prestanda mellan lokal åtkomst såväl som när de delas över nätverket.
Genom att använda ett mindre övergripande fotavtryck att testa på från våra primära tester, fann vi att prestanda kan skalas extremt bra i en miljö med dubbla kort. Lokalt, med två arbetsbelastningsgeneratorsessioner som kördes samtidigt för att efterlikna de två servrarna som körs över nätverket, mätte vi prestanda på över 490k IOPS i vår 8K 70/30 arbetsbelastning. Genom att presentera den enda randiga arrayen över två resurser och komma åt den från våra två HP Proliant DL380p Gen8-servrar, sjönk prestandan till 402k IOPS. Vi kunde mer än fördubbla genomströmningen i båda scenarierna och fortfarande upprätthålla utmärkt prestanda per server.
Om man tittar på genomsnittlig latens i vår tvilling-P320h-miljö, fanns det en viss skillnad i genomsnittlig latens jämfört med lokal åtkomst jämfört med fjärråtkomst över InfiniBand, men latensen var fortfarande lägre än vad vi mätte från en P320h i vår primära testbädd. Med tanke på att det var minimal latenspåverkan för att dela denna höga I/O-enhet mellan flera system, öppnar det verkligen upp dörren för att dela kostsamma högpresterande resurser till mer än ett system.
Det fanns egentligen ingen mätbar skillnad i toppfördröjning jämfört med lokal och fjärråtkomst, vilket är viktigt med vetskapen om att InfiniBand-nätverket inte ökar fördröjningen avsevärt för enheter som PCIe Application Accelerators.
I likhet med topplatens såg vi ingen märkbar skillnad mellan latensstandardavvikelsen som ses lokalt i en randig miljö eller över vårt InfiniBand-nätverk.
Efter att ha sett 8K 70/30-prestandan med två samtidiga belastningar med ett effektivt ködjup på 256 vardera ha en liten minskning i prestanda över nätverket jämfört med lokalt, bytte vi fokus till en varierande arbetsbelastning från 2T/2Q upp till 16T/16Q . Eftersom detta hände på två servrar eller två lokala arbetsbelastningsgeneratorer samtidigt, skulle den totala belastningen vara 4T/2Q upp till 32T/16Q. Både lokal och nätverksåtkomst till den randiga P320h-arrayen erbjöd samma känslighet för en ökande belastning. Båda testerna visade nästan identiska mönster över hela spektrumet, med den lokala åtkomsten som gav bäst prestanda.
Genomsnittlig latens i huvuddelen av vår 8K 70/30-arbetsbelastning på den randiga P320h-konfigurationen erbjöd utmärkt prestanda lokalt och över vårt nätverk. Det mest imponerande är InfiniBand-resultaten, där varje server såg under 0.8 ms fördröjning för uppemot 400,000 XNUMX IOPS över nätverket.
Att jämföra maximal latens i 8K 70/30-arbetsbelastningen med vår dual-P320h-inställning visade liknande resultat lokalt jämfört med fjärrkontroll, där båda hade blips uppåt på 1,000 XNUMX ms under testets varaktighet.
I likhet med våra maximala latensresultat från ovan var det väldigt liten skillnad mellan lokal åtkomst till P320h-arrayen, eller att den delas via Windows Storage Space över vårt InfiniBand-nätverk.
Slutsats
Micron RealSSD P320h är helt enkelt ett bra exempel på väl genomförd ingenjörskonst. Allt från kortdesign och layout till den anpassade kontrollern gör P320h till en verklig integrerad enhet, något som inte alltid är fallet även i företagets lagringsutrymme. Micron hittar sätt att lägga till värde genom hela enheten, från NAND-hanterings-IP i den anpassade ASIC-en till den djupaste möjliga NAND-karakteriseringen som leder till maximal prestanda och uthållighet hos SLC-blixtkomponenterna.
När vi utvärderar prestandan för P320h skriker enheten och upprätthåller nära paritet mellan våra testmiljöer för CentOS och Windows Server. När det gäller sin bättre miljö hade Linux alltid fördelen, särskilt när det kom till optimal latens. Att säga att Micron P320h är snabb är dock lite av en underdrift. Den överträffade avsevärt alla andra lösningar som vi har testat hittills, med högre skurhastigheter än de flesta och mycket bättre prestanda i stationärt tillstånd än konkurrerande lösningar. Genom att dyka in i dess lyhördhet var den genomsnittliga latens oklanderlig, men vad som är ännu mer imponerande var dess nya felfria Linux-prestanda, med mycket låg toppfördröjning och latensstandardavvikelse. Windows-sidan var inte alltför långt borta, även om dess högsta latens och latensstandardavvikelse rankades mitt i paketet i jämförelse.
När det gäller kompatibilitet fann vi att Micron RealSSD P320h fungerar felfritt i en företagsmiljö. För oss är det inte meningsfullt att testa detta företagserbjudande på toppnivå i en konsumentplattform, eftersom det aldrig skulle tas in i en produktionsmiljö som körs i en. För det ändamålet, i de tier-one-servrar vi testade det i, fungerade det utan några hickningar över flera operativsystem. P320h hade heller inga problem med att fungera i konfiguration med dubbla enheter i vår Supermicro SuperServer 7047R som körde Windows Server 2012, vilket kan ses i vår video.
Om vi överhuvudtaget ska klaga mycket, så är det att Windows-miljön lämnade några mindre områden som behöver förbättras, särskilt som vi jämförde toppfördröjning och standardavvikelse i alla våra arbetsbelastningar. Även med den högre latensen överträffade den fortfarande många, om inte alla, PCIe Application Acceleratorer vi har testat, men vi känner att det fortfarande kan finnas en del prestanda kvar att pressa ut med mer raffinerade drivrutiner. Ett annat område med mindre klagomål är SLC-bara produkterbjudanden i bara två kapaciteter. Konkurrenter erbjuder enheter i MLC eller eMLC, vilket möjliggör en lägre ingångspunkt för kostnaden, såväl som mycket större kapacitet; över 2TB på ett enda kort i vissa fall. Visserligen är inträdesmarknaden för företag som är läsintensiv inte målet för P320h, men mer variation för att möta fler behov skulle kunna göra P320h-familjen mer mångsidig.
Fördelar
- Snabbaste PCIe Application Accelerator vi har testat hittills
- Mycket lågt medelvärde och maximal latens
- Utmärkt prestandaparitet i Windows- och Linux-miljöer
Nackdelar
- Begränsad till SLC NAND
- Toppar på 700 GB
Bottom Line
Micron RealSSD P320h är ett väl genomfört, komplett erbjudande för företag som vill ha det bästa av vad PCIe-lagring har att erbjuda. P320h är den bästa presterande i sin klass, med utmärkt och konsekvent multi-OS-prestanda tack vare Micron-komponenter och överlägsen NAND-hanterings immateriella rättigheter integrerade i kontrollern.
Diskutera denna recension






Amazon