Hem Företag Memblaze PBlaze5 910 AIC NVMe SSD recension

Memblaze PBlaze5 910 AIC NVMe SSD recension

by Lyle Smith

Memblaze PBlaze5 910 är en högpresterande NVMe SSD designad för att avsevärt förbättra applikationsprestanda. Utrustad med 64-lagers 3D NAND, har PBlaze5 massiv endiskkapacitet på upp till 15.36 TB, vilket är 40 % mer än tidigare modeller. Memblaze indikerar att detta kommer att tillåta deras nya SSD att öka rackdensiteten i lagringsserverapplikationer, vilket sparar utrymme och sänker energikostnaderna. Genom att lägga till allt mer energieffektivitet till datacenter, rapporteras 910-serien också öka prestandan med 38 % per watt och stöder 16 effektlägesinställningar, från 10W till 25W.


Memblaze PBlaze5 910 är en högpresterande NVMe SSD designad för att avsevärt förbättra applikationsprestanda. Utrustad med 64-lagers 3D NAND, har PBlaze5 massiv endiskkapacitet på upp till 15.36 TB, vilket är 40 % mer än tidigare modeller. Memblaze indikerar att detta kommer att tillåta deras nya SSD att öka rackdensiteten i lagringsserverapplikationer, vilket sparar utrymme och sänker energikostnaderna. Genom att lägga till allt mer energieffektivitet till datacenter, rapporteras 910-serien också öka prestandan med 38 % per watt och stöder 16 effektlägesinställningar, från 10W till 25W.

När det gäller prestanda citerar Memblaze 910-serien med upp till 6 GB/s respektive 3.8 GB/s för läsning och skrivning, och 1 miljon IOPS-läsning och 135,000 XNUMX IOPS-skrivning med ihållande slumpmässig genomströmning.

PBlaze5 910-serien stöder AES 256 Data Encryption, Full Data Path Protection och Enhanced Power Failure-skydd för att säkerställa integriteten hos företagsapplikationsdata. Den har också en funktion med dubbla portar, vilket i huvudsak eliminerar problemet med enkelvägsfel, eftersom båda portarna kan nås samtidigt.

Memblaze PBlaze5 910 NVMe SSD-specifikationer

Formfaktor HHHL AIC
Kapacitet 3.84TB 7.68TB
NAND- 3D eTLC
Gränssnitt PCIe 3.0 x 8
Protokoll NVMe 1.2a
Prestation
Sekventiell läsning (128KB) 5.5GB / s 6.0GB / s
Sekventiell skrivning (128KB) 3.1GB / s 3.8GB / s
Hållbar slumpmässig läsning (4KB) 850K IOPS 1 miljon IOPS
Hållbar slumpmässig skrivning (4KB) 99K IOPS 135K IOPS
Latens R/W 87 / 12μs
DWPD 1
UBER <10^-17
MTBF 2 miljoner timmar
Energianvändning  7 ~ 25W

 

Prestation

Testbädd

Våra Enterprise SSD-recensioner använder en Lenovo ThinkSystem SR850 för applikationstester och en Dell PowerEdge R740xd för syntetiska riktmärken. ThinkSystem SR850 är en välutrustad quad-CPU-plattform som erbjuder CPU-kraft långt över vad som behövs för att betona högpresterande lokal lagring. Syntetiska tester som inte kräver mycket CPU-resurser använder den mer traditionella servern med dubbla processorer. I båda fallen är avsikten att visa upp lokal lagring i bästa möjliga ljus som är i linje med lagringsleverantörens maximala enhetsspecifikationer.

Lenovo ThinkSystem SR850

  • 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 kärnor)
  • 16 x 32 GB DDR4-2666Mhz ECC DRAM
  • 2 x RAID 930-8i 12Gb/s RAID-kort
  • 8 NVMe-fack
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x Intel Gold 6130 CPU (2.1 GHz x 16 kärnor)
  • 16 x 16 GB DDR4-2666MHz ECC DRAM
  • 1x PERC 730 2GB 12Gb/s RAID-kort
  • Tillägg NVMe-adapter
  • Ubuntu-16.04.3-desktop-amd64

Testbakgrund och jämförelser

Din StorageReview Enterprise Test Lab ger en flexibel arkitektur för att utföra riktmärken för företagslagringsenheter i en miljö som är jämförbar med vad administratörer möter i verkliga implementeringar. Enterprise Test Lab innehåller en mängd olika servrar, nätverk, strömkonditionering och annan nätverksinfrastruktur som gör att vår personal kan etablera verkliga förhållanden för att noggrant mäta prestanda under våra granskningar.

Vi införlivar dessa detaljer om labbmiljön och protokollen i granskningar så att IT-proffs och de som ansvarar för lagringsanskaffning kan förstå under vilka förutsättningar vi har uppnått följande resultat. Ingen av våra recensioner betalas för eller övervakas av tillverkaren av utrustning vi testar. Ytterligare information om StorageReview Enterprise Test Lab och en översikt över dess nätverkskapacitet finns på respektive sida.

Jämförelser för denna recension:

Analys av applikationens arbetsbelastning

För att förstå prestandaegenskaperna hos företagslagringsenheter är det viktigt att modellera infrastrukturen och applikationens arbetsbelastningar som finns i live-produktionsmiljöer. Våra riktmärken för Memblaze PBlaze5 910 är därför MySQL OLTP-prestanda via SysBench och Microsoft SQL Server OLTP-prestanda med en simulerad TCP-C-arbetsbelastning. För våra applikationsarbetsbelastningar kommer varje enhet att köra 2-4 identiskt konfigurerade virtuella datorer.

SQL Server prestanda

Varje SQL Server VM är konfigurerad med två vDisks: 100 GB volym för uppstart och en 500 GB volym för databasen och loggfiler. Ur ett systemresursperspektiv konfigurerade vi varje virtuell dator med 16 vCPU:er, 64 GB DRAM och utnyttjade LSI Logic SAS SCSI-kontrollern. Medan våra Sysbench-arbetsbelastningar som tidigare testats mättade plattformen i både lagrings-I/O och kapacitet, letar SQL-testet efter latensprestanda.

Det här testet använder SQL Server 2014 som körs på Windows Server 2012 R2 gäst-VM, och betonas av Quests Benchmark Factory for Databases. StorageReview's Microsoft SQL Server OLTP-testprotokoll använder det aktuella utkastet till Transaction Processing Performance Councils Benchmark C (TPC-C), ett riktmärke för transaktionsbearbetning online som simulerar de aktiviteter som finns i komplexa applikationsmiljöer. TPC-C-riktmärket kommer närmare än syntetiska prestandariktmärken att mäta prestandastyrkorna och flaskhalsarna hos lagringsinfrastruktur i databasmiljöer. Varje instans av vår SQL Server VM för denna granskning använder en 333 GB (1,500 15,000 skala) SQL Server-databas och mäter transaktionsprestanda och latens under en belastning på XNUMX XNUMX virtuella användare.

SQL Server-testkonfiguration (per virtuell dator)

  • Windows Server 2012 R2
  • Lagringsutrymme: 600 GB tilldelat, 500 GB använt
  • SQL Server 2014
    • Databasstorlek: 1,500 XNUMX skala
    • Virtuell klientbelastning: 15,000 XNUMX
    • RAM-buffert: 48GB
  • Testlängd: 3 timmar
    • 2.5 timmars förkonditionering
    • 30 minuters provperiod

Memblaze PBlaze5 910 AIC stod för vår SQL Server-transaktionsbenchmark med högsta prestanda med 12,645.1 XNUMX TPS.

910 AIC-modellen hade också den lägsta latensen på bara 1.5 ms, vilket var halva latensen av andraplatsen Huawei ED3000.

Sysbench Performance

Nästa benchmark för ansökan består av en Percona MySQL OLTP-databas mätt via SysBench. Detta test mäter också genomsnittlig TPS (Transactions Per Second), genomsnittlig latens och genomsnittlig 99:e percentil latens.

Varje sysbench VM är konfigurerad med tre vDisks: en för uppstart (~92GB), en med den förbyggda databasen (~447GB), och den tredje för databasen som testas (270GB). Ur ett systemresursperspektiv konfigurerade vi varje virtuell dator med 16 vCPU:er, 60 GB DRAM och utnyttjade LSI Logic SAS SCSI-kontrollern.

Sysbench-testkonfiguration (per virtuell dator)

  • CentOS 6.3 64-bitars
  • Percona XtraDB 5.5.30-rel30.1
    • Databastabeller: 100
    • Databasstorlek: 10,000,000 XNUMX XNUMX
    • Databastrådar: 32
    • RAM-buffert: 24GB
  • Testlängd: 3 timmar
    • 2 timmar förkonditionering 32 trådar
    • 1 timme 32 trådar

Med Sysbenchs transaktionsbenchmark fortsatte AIC 910 sin imponerande prestanda med 9,190.7 XNUMX TPS, vilket placerade den överst på topplistan.

Med Sysbench genomsnittlig latens var AIC 910 återigen den bästa presterande med 13.9 ms.

I vårt värsta tänkbara latensriktmärke befann sig AIC 910 i toppen av paketet med bara 25.9 ms.

Houdini från SideFX

Houdini-testet är speciellt utformat för att utvärdera lagringsprestanda när det gäller CGI-rendering. Testbädden för denna applikation är en variant av kärnan Dell PowerEdge R740xd servertyp vi använder i labbet med dubbla Intel 6130-processorer och 64GB DRAM. I det här fallet installerade vi Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) med ren metall. Resultatet av riktmärket mäts i sekunder att slutföra, och färre är bättre.

Maelstrom-demon representerar en del av renderingspipelinen som belyser lagringskapaciteten genom att demonstrera dess förmåga att effektivt använda växlingsfilen som en form av utökat minne. Testet skriver inte ut resultatdata eller bearbetar punkterna för att isolera väggtidseffekten av latenspåverkan på den underliggande lagringskomponenten. Själva testet är sammansatt av fem faser, varav tre vi kör som en del av benchmark, vilka är följande:

  1. Laddar packade punkter från disken. Det är dags att läsa från disk. Denna är enkelgängad, vilket kan begränsa den totala genomströmningen.
  2. Packar upp punkterna i en enda platt array för att de ska kunna bearbetas. Om punkterna inte är beroende av andra punkter, kan arbetsuppsättningen justeras för att förbli i kärnan. Detta steg är flertrådigt.
  3. (Kör ej) Bearbetar punkterna.
  4. Packar om dem i hinkformade block som lämpar sig för att lagra tillbaka till disken. Detta steg är flertrådigt.
  5. (Kör ej) Skriver tillbaka de bucketade blocken till disken.

Med Houdini-testet placerades 910 AIC från mitten till nedre delen med 3,077.7 2 sekunder, vilket var precis ovanför U.XNUMX-modellen och bland Memblaze-produkterna.

VDBench arbetsbelastningsanalys

När det gäller benchmarking av lagringsenheter är applikationstestning bäst, och syntetiska tester kommer på andra plats. Även om det inte är en perfekt representation av faktiska arbetsbelastningar, hjälper syntetiska tester till baslagringsenheter med en repeterbarhetsfaktor som gör det enkelt att göra jämförelser mellan äpplen och äpplen mellan konkurrerande lösningar. Dessa arbetsbelastningar erbjuder en rad olika testprofiler som sträcker sig från "fyra hörn"-tester, vanliga tester av databasöverföringsstorlekar, till spårningsfångningar från olika VDI-miljöer. Alla dessa tester utnyttjar den vanliga vdBench-arbetsbelastningsgeneratorn, med en skriptmotor för att automatisera och fånga resultat över ett stort beräkningstestkluster. Detta gör att vi kan upprepa samma arbetsbelastningar över ett brett utbud av lagringsenheter, inklusive flash-arrayer och individuella lagringsenheter. Vår testprocess för dessa riktmärken fyller hela enhetens yta med data och partitionerar sedan en enhetssektion som motsvarar 25 % av enhetens kapacitet för att simulera hur enheten kan reagera på applikationsarbetsbelastningar. Detta skiljer sig från fullständiga entropitester som använder 100 % av enheten och tar dem till ett stabilt tillstånd. Som ett resultat kommer dessa siffror att återspegla högre ihållande skrivhastigheter.

profiler:

  • 4K slumpmässig läsning: 100 % läsning, 128 trådar, 0-120 % iorat
  • 4K Random Write: 100% Write, 64 trådar, 0-120% iorate
  • 64K sekventiell läsning: 100 % läsning, 16 trådar, 0-120 % iorat
  • 64K sekventiell skrivning: 100 % skrivning, 8 trådar, 0-120 % iorate
  • Syntetisk databas: SQL och Oracle
  • VDI Full Clone och Linked Clone Traces

I vår första VDBench Workload Analysis, Random 4K Read, kunde Memblaze PBlaze5 910 AIC hålla sig under 1 ms under hela testet med en topp på 814,640 155.9 IOPS och en latens på XNUMX μs, vilket placerade sig väl på första plats.

Återigen visade 4K slumpmässig skrivprestanda återigen under millisekunders latens hela tiden. 910 AIC placerade sig på andra plats bland testkörningarna (PBlaze 900 tog först) med en toppprestanda på 550,864 229.3 IOPS och en latens på XNUMX μs.

Genom att byta till sekventiella arbetsbelastningar placeras 910 AIC överst i paketet i 64K sekventiell läsning med en topppoäng på 50,372 3.14 IOPS eller 317 GB/s med en latens på XNUMXμs.

Genom att byta plats med PBlaze 900 nådde 910 AIC en topp på 42,563 2.66 IOPS eller 370 GB/s med en latens på 64 μs i XNUMXK sekventiell skrivning.

När vi går vidare till SQL-arbetsbelastningar nådde 910 AIC:en en topp på 270,432 117.8 IOPS med endast XNUMX μs latens, vilket placerade den överst på topplistan igen.

SQL 90-10 såg att 910 behöll topplaceringen med stor marginal med en topppoäng på 273,321 116.6 IOPS och en latens på XNUMX μs.

910 AIC nådde en topp på 277,815 114 IOPS med en latens på 80.μs i SQL 20-XNUMX benchmark vilket höll den överst på topplistan.

I vår Oracle-arbetsbelastning fortsatte 910 AIC sin dominans med en topppoäng på 282,326 126.2 IOPS och en latens på XNUMX μs.

För Oracle 90-10 visade 910 AIC en topp på 202,695 108 IOPS och en latens på XNUMXμs för topplacering.

I 80-20 avslutade 910 sin Oracle-testning med en imponerande toppprestanda på 210,228 104 IOPS och en latens på XNUMXμs.

Därefter gick vi vidare till vårt VDI-klonriktmärke, Full and Linked, där 910 AIC visade toppprestanda i de flesta av testerna. För VDI Full Clone Boot hade 910 AIC en toppprestanda på 219,337 158.2 IOPS och en latens på XNUMXμs.

VDI FC Initial Login såg 910 AIC med en toppprestanda på 150,121 197 IOPS och en latens på XNUMXμs för topplacering.

Med VDI FC Monday Login slutade 910 AIC i 2nd plats precis bakom Huawei med 101,128 156.3 IOPS och en latens på XNUMXμs.

När vi bytte till Linked Clone (LC) tittade vi först på starttestet. I det här scenariot kom 910 AIC på första plats med 98,284 161.3 IOPS och en latens på XNUMX μs.

VDI LC Initial Login visade praktiskt taget identisk prestanda mellan 910 AIC och Huawei med 55,061 143.4 IOPS och en latens på XNUMXμs.

I VDI LC Monday Login-testet visade Huawei och 910 AIC återigen hals-och-hals-prestanda med en topp på 77,721 203.8 IOPS och en latens på XNUMX μs, igen på fjärde plats.

Slutsats

Memblazes PBlaze2 5, som består av både U.910- och AIC-formfaktormodeller, är deras senaste NVMe-datacenterenhet som använder 64-lagers 3D NAND. Vi tittade på AIC-modellen för denna recension, som kommer i kapaciteter på 3.84TB och 7.68TB och prestanda som anges för att nå 6.0GB/s läsning och 3.8GB/s skrivning, samtidigt som vi hävdar genomströmningsprestanda på upp till 1 miljon IOPS-läsning. 910 AIC har den kraft som krävs för att utmärka sig i praktiskt taget alla applikationer den används för, tillsammans med en rad skyddsfunktioner inklusive AES 256-datakryptering och TRIM-funktionsstöd upp till 8TB/s.

Dykning in i detaljerna i prestandan visade att 910 AIC var överst på topplistan i många av våra testade arbetsbelastningar. I våra SQL Server-riktmärken kom den först med 12,645.1 1.5 TPS och en genomsnittlig latens på bara 9,190.7 ms. I Sysbench uppträdde körningen överst på topplistan igen med 13.3 25.9 TPS, genomsnittlig latens på 910 ms och en värsta tänkbar latens på 3,077.7 ms. I vårt Houdini by SideFX-riktmärke spelade 2 AIC in 910 4 sekunder, vilket var något bättre än U.5-modellen och bland de andra Memblaze-produkterna. I vårt VDBench-riktmärke upprätthöll 910 AIC en latens på under millisekunder under alla våra tester, där den presterade bäst i de flesta kategorierna. I slumpmässig 814,640K läsning och skrivning, nådde Memblaze PBlaze550,864 3.14 AIC 2.66 277,000 IOPS respektive 270,000 XNUMX IOPS, medan sekventiella arbetsbelastningar lades upp på XNUMX GB/s respektive XNUMX GB/s. SQL-resultaten rymde cirka en kvarts miljon IOPS med Oracle-testerna på mellan XNUMX XNUMX IOPS och XNUMX XNUMX IOPS.

Memblaze PBlaze4 8 går från ett x5- till x910-gränssnitt och erbjuder en enorm prestandahöjning jämfört med U.2-formfaktorversionen i SM-familjen. Över hela linjen visade AIC 910 sina styrkor gentemot gränssnittsbegränsade U.2-modeller och visar kunderna vad som är möjligt om den givna applikationen kan utnyttja den större formfaktorn.

Memblaze PBlaze5 910

Diskutera denna recension

Anmäl dig till StorageReviews nyhetsbrev