Under deras Step Ahead-evenemang i Peking lanserade Memblaze en ny serie med 500 NVME-enheter samt en utbyggnad av dess 900-linje till 910 och 916. Vi kommer att titta på 910-serien i denna recension. De nya 910-enheterna erbjuds i två formfaktorer och utnyttjar 64-lagers 3D NAND, vilket gör att enheterna kan komma i kapaciteter så höga som 16 TB. Denna högre densitet kan leda till tätare rack eller rackkonsolidering i datacentret.
Under deras Step Ahead-evenemang i Peking lanserade Memblaze en ny serie med 500 NVME-enheter samt en utbyggnad av dess 900-linje till 910 och 916. Vi kommer att titta på 910-serien i denna recension. De nya 910-enheterna erbjuds i två formfaktorer och utnyttjar 64-lagers 3D NAND, vilket gör att enheterna kan komma i kapaciteter så höga som 16 TB. Denna högre densitet kan leda till tätare rack eller rackkonsolidering i datacentret.
Förutom att utnyttja 64-lager för att nå högre kapacitet, hävdar Memblaze PBlaze5 910 högre prestanda än tidigare modeller. Företaget uppger att enheten kan nå sekventiell läsning upp till 3.5 GB/s och genomströmning upp till 835K IOPS, samtidigt som den har sub-millisekunders latens. Enheten kommer också med inbyggd hög tillgänglighet, är dubbelportad, vilket gör att en enda felväg tas bort. 910 har 1 DWPD av uthållighet samt två miljoner timmar MTBF. Idealiska användningsfall inkluderar: databas, sökning, indexering, CDN, Cloud and Hyper-scale, SDS, djupinlärning och big data-analys, ERP, SAP HANA, BOSS, bank, skatter, högfrekvent handel och onlinebetalning.
För den här recensionen kommer vi att titta på 3.84TB, U.2 av PBlaze5 910.
Memblaze PBlaze5 910 NVMe SSD-specifikationer
Formfaktor | U.2 | ||
Kapacitet | 3.84TB | 7.68TB | 15.36TB |
NAND- | 3D eTLC | ||
Gränssnitt | PCIe 3.0 x 4 | ||
Protokoll | NVMe 1.2a | ||
Prestation | |||
Sekventiell läsning (128KB) | 3.5GB / s | 3.5GB / s | 3.3GB / s |
Sekventiell skrivning (128KB) | 3.1GB / s | 3.5GB / s | 3.3GB / s |
Hållbar slumpmässig läsning (4KB) | 835K IOPS | 830K IOPS | 826K IOPS |
Hållbar slumpmässig skrivning (4KB) | 99K IOPS | 135K IOPS | 150K IOPS |
Latens R/W | 87 / 12μs | ||
DWPD | 1 | ||
UBER | <10^-17 | ||
MTBF | 2 miljoner timmar | ||
Energianvändning | 7 ~ 25W |
Prestation
Testbädd
Våra Enterprise SSD-recensioner använder en Lenovo ThinkSystem SR850 för applikationstester och en Dell PowerEdge R740xd för syntetiska riktmärken. ThinkSystem SR850 är en välutrustad quad-CPU-plattform som erbjuder CPU-kraft långt över vad som behövs för att betona högpresterande lokal lagring. Syntetiska tester som inte kräver mycket CPU-resurser använder den mer traditionella servern med dubbla processorer. I båda fallen är avsikten att visa upp lokal lagring i bästa möjliga ljus som är i linje med lagringsleverantörens maximala enhetsspecifikationer.
Lenovo ThinkSystem SR850
- 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 kärnor)
- 16 x 32 GB DDR4-2666Mhz ECC DRAM
- 2 x RAID 930-8i 12Gb/s RAID-kort
- 8 NVMe-fack
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x Intel Gold 6130 CPU (2.1 GHz x 16 kärnor)
- 16 x 16 GB DDR4-2666MHz ECC DRAM
- 1x PERC 730 2GB 12Gb/s RAID-kort
- Tillägg NVMe-adapter
- Ubuntu-16.04.3-desktop-amd64
Testbakgrund och jämförelser
Smakämnen StorageReview Enterprise Test Lab ger en flexibel arkitektur för att utföra riktmärken för företagslagringsenheter i en miljö som är jämförbar med vad administratörer möter i verkliga implementeringar. Enterprise Test Lab innehåller en mängd olika servrar, nätverk, strömkonditionering och annan nätverksinfrastruktur som gör att vår personal kan etablera verkliga förhållanden för att noggrant mäta prestanda under våra granskningar.
Vi införlivar dessa detaljer om labbmiljön och protokollen i granskningar så att IT-proffs och de som ansvarar för lagringsanskaffning kan förstå under vilka förutsättningar vi har uppnått följande resultat. Ingen av våra recensioner betalas för eller övervakas av tillverkaren av utrustning vi testar. Ytterligare information om StorageReview Enterprise Test Lab och en översikt över dess nätverkskapacitet finns på respektive sida.
Jämförelser för denna recension:
- Memblaze PBlaze5 3.2TB
- Memblaze PBlaze4 3.2TB
- Intel P3700 2TB
- Intel P4500 2TB
- HGST SN100 3.2TB
- Toshiba PX04 1.6TB
Analys av applikationens arbetsbelastning
För att förstå prestandaegenskaperna hos företagslagringsenheter är det viktigt att modellera infrastrukturen och applikationens arbetsbelastningar som finns i live-produktionsmiljöer. Våra riktmärken för Memblaze PBlaze5 910 är därför MySQL OLTP-prestanda via SysBench och Microsoft SQL Server OLTP-prestanda med en simulerad TCP-C-arbetsbelastning. För våra applikationsarbetsbelastningar kommer varje enhet att köra 2-4 identiskt konfigurerade virtuella datorer.
SQL Server prestanda
Varje SQL Server VM är konfigurerad med två vDisks: 100 GB volym för uppstart och en 500 GB volym för databasen och loggfiler. Ur ett systemresursperspektiv konfigurerade vi varje virtuell dator med 16 vCPU:er, 64 GB DRAM och utnyttjade LSI Logic SAS SCSI-kontrollern. Medan våra Sysbench-arbetsbelastningar som tidigare testats mättade plattformen i både lagrings-I/O och kapacitet, letar SQL-testet efter latensprestanda.
Det här testet använder SQL Server 2014 som körs på Windows Server 2012 R2 gäst-VM, och betonas av Quests Benchmark Factory for Databases. StorageReview's Microsoft SQL Server OLTP-testprotokoll använder det aktuella utkastet till Transaction Processing Performance Councils Benchmark C (TPC-C), ett riktmärke för transaktionsbearbetning online som simulerar de aktiviteter som finns i komplexa applikationsmiljöer. TPC-C-riktmärket kommer närmare än syntetiska prestandariktmärken att mäta prestandastyrkorna och flaskhalsarna hos lagringsinfrastruktur i databasmiljöer. Varje instans av vår SQL Server VM för denna granskning använder en 333 GB (1,500 15,000 skala) SQL Server-databas och mäter transaktionsprestanda och latens under en belastning på XNUMX XNUMX virtuella användare.
SQL Server-testkonfiguration (per virtuell dator)
- Windows Server 2012 R2
- Lagringsutrymme: 600 GB tilldelat, 500 GB använt
- SQL Server 2014
- Databasstorlek: 1,500 XNUMX skala
- Virtuell klientbelastning: 15,000 XNUMX
- RAM-buffert: 48GB
- Testlängd: 3 timmar
- 2.5 timmars förkonditionering
- 30 minuters provperiod
För vårt SQL Server-transaktionsriktmärke kom Memblaze PBlaze5 910 U.2 i botten av paketet med 12,546.5 XNUMX TPS, lägre än tre andra PBlaze-enheter.
Överraskande nog hade 910 också den högsta latensen på 38.8 ms.
Sysbench Performance
Nästa benchmark för ansökan består av en Percona MySQL OLTP-databas mätt via SysBench. Detta test mäter också genomsnittlig TPS (Transactions Per Second), genomsnittlig latens och genomsnittlig 99:e percentil latens.
Varje sysbench VM är konfigurerad med tre vDisks: en för start (~92GB), en med den förbyggda databasen (~447GB) och den tredje för databasen som testas (270GB). Ur ett systemresursperspektiv konfigurerade vi varje virtuell dator med 16 vCPU:er, 60 GB DRAM och utnyttjade LSI Logic SAS SCSI-kontrollern.
Sysbench-testkonfiguration (per virtuell dator)
- CentOS 6.3 64-bitars
- Percona XtraDB 5.5.30-rel30.1
- Databastabeller: 100
- Databasstorlek: 10,000,000 XNUMX XNUMX
- Databastrådar: 32
- RAM-buffert: 24GB
- Testlängd: 3 timmar
- 2 timmar förkonditionering 32 trådar
- 1 timme 32 trådar
Med Sysbench-transaktionsriktmärket gick U.2 910 bättre med 6,664.6 XNUMX TPS och landade ungefär mitt i den testade packningen.
Med Sysbenchs genomsnittliga latens befann sig U.2 910 återigen i mitten av packet med en latens på 19.2 ms.
Vårt benchmark för latens i värsta fall såg att U.2 910 landade igen nära mitten med 37.8 ms.
Houdini från SideFX
Houdini-testet är speciellt utformat för att utvärdera lagringsprestanda när det gäller CGI-rendering. Testbädden för denna applikation är en variant av kärnan Dell PowerEdge R740xd servertyp vi använder i labbet med dubbla Intel 6130-processorer och 64GB DRAM. I det här fallet installerade vi Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) med ren metall. Resultatet av riktmärket mäts i sekunder att slutföra, och färre är bättre.
Maelstrom-demon representerar en del av renderingspipelinen som belyser lagringskapaciteten genom att demonstrera dess förmåga att effektivt använda växlingsfilen som en form av utökat minne. Testet skriver inte ut resultatdata eller bearbetar punkterna för att isolera väggtidseffekten av latenspåverkan på den underliggande lagringskomponenten. Själva testet är sammansatt av fem faser, varav tre vi kör som en del av benchmark, vilka är följande:
- Laddar packade punkter från disken. Det är dags att läsa från disk. Denna är enkelgängad, vilket kan begränsa den totala genomströmningen.
- Packar upp punkterna i en enda platt array för att de ska kunna bearbetas. Om punkterna inte är beroende av andra punkter, kan arbetsuppsättningen justeras för att förbli i kärnan. Detta steg är flertrådigt.
- (Kör ej) Bearbeta punkterna.
- Packar om dem i hinkformade block som lämpar sig för att lagra tillbaka till disken. Detta steg är flertrådigt.
- (Kör inte) Skriv tillbaka de bucketade blocken till disken.
Med Houdini-testet placerade 910 U.2 mitten till nedre änden, men precis i linje med andra Memblaze-produkter med en poäng på 3,093.8 XNUMX sekunder.
VDBench arbetsbelastningsanalys
När det gäller benchmarking av lagringsenheter är applikationstestning bäst, och syntetiska tester kommer på andra plats. Även om det inte är en perfekt representation av faktiska arbetsbelastningar, hjälper syntetiska tester till baslagringsenheter med en repeterbarhetsfaktor som gör det enkelt att göra jämförelser mellan äpplen och äpplen mellan konkurrerande lösningar. Dessa arbetsbelastningar erbjuder en rad olika testprofiler som sträcker sig från "fyra hörn"-tester, vanliga tester av databasöverföringsstorlekar, till spårningsfångst från olika VDI-miljöer. Alla dessa tester utnyttjar den vanliga vdBench-arbetsbelastningsgeneratorn, med en skriptmotor för att automatisera och fånga resultat över ett stort beräkningstestkluster. Detta gör att vi kan upprepa samma arbetsbelastningar över ett brett utbud av lagringsenheter, inklusive flash-arrayer och individuella lagringsenheter. Vår testprocess för dessa riktmärken fyller hela enhetens yta med data och partitionerar sedan en enhetssektion lika med 25 % av enhetens kapacitet för att simulera hur enheten kan reagera på applikationsarbetsbelastningar. Detta skiljer sig från fullständiga entropitester som använder 100 % av enheten och tar dem till ett stabilt tillstånd. Som ett resultat kommer dessa siffror att återspegla högre ihållande skrivhastigheter.
profiler:
- 4K slumpmässig läsning: 100 % läsning, 128 trådar, 0-120 % iorat
- 4K Random Write: 100% Write, 64 trådar, 0-120% iorate
- 64K sekventiell läsning: 100 % läsning, 16 trådar, 0-120 % iorat
- 64K sekventiell skrivning: 100 % skrivning, 8 trådar, 0-120 % iorate
- Syntetisk databas: SQL och Oracle
- VDI Full Clone och Linked Clone Traces
I vår första VDBench Workload Analysis, Random 4K Read, kunde Memblaze PBlaze5 910 U.2 hålla sig under 1ms hela tiden med en topp på 665,679 191.3 IOPS och en latens på XNUMXμs vilket placerade enheten ungefär i mitten.
4K slumpmässig skrivning igen såg under millisekunders latens hela tiden. 910 U.2 placerade sig näst sist med en toppprestanda på 296,639 429.6 IOPS och en latens på XNUMX μs.
Genom att byta till sekventiella arbetsbelastningar hamnade 910 U.2 återigen näst sist i 64K sekventiell läsning med en topppoäng på 38,472 2.4 IOPS eller 415.3 GB/s med en latens på XNUMX μs.
Genom att stanna på näst sista plats nådde 910 U.2 en topp med cirka 18K IOPS eller 1.1GB/s med en latens på ungefär 870μs i 64K-sekventiell skrivning.
När vi går vidare till SQL-arbetsbelastningar nådde 910 U.2 en topp på 243,228 130.4 IOPS med endast XNUMX μs latens, vilket placerade enheten på fjärde plats totalt.
SQL 90-10 såg att 910 behöll fjärdeplatsen med en topppoäng på 232,061 136.5 IOPS och en latens på XNUMX μs.
Fortfarande på fjärde plats nådde 910 U.2 en topp på 220,195 144.6 IOPS med en latens på 80 μs i SQL 20-XNUMX benchmark.
Med vår Oracle-arbetsbelastning fortsatte 910 U.2 att stanna på fjärde plats med en topppoäng på 212,052 168.5 IOPS och en latens på XNUMX μs.
För Oracle 90-10 flyttade 910 U.2 till tredje plats med en topp på 180,723 121.1 IOPS och en latens på XNUMX μs.
I Oracle 80-20 var 910 nästan lika med 900 på tredje plats med en toppprestanda på 177,143 123.5 IOPS och en latens på XNUMX μs.
Därefter går vi vidare till vårt VDI-klontest, Full and Linked. För VDI Full Clone Boot landade 910 U.2 på fjärde plats med en toppprestanda på 176,239 197.9 IOPS och en latens på XNUMX μs.
VDI FC Initial Login såg 910 U.2 på fjärde plats fortfarande men längre efter de tre bästa enheterna med en toppprestanda på 66,925 445.1 IOPS och en latens på XNUMXμs.
Med VDI FC Monday Login slutade 910 U.2 på fjärde plats med 67,309 235.7 IOPS och en latens på XNUMXμs.
När vi byter till Linked Clone (LC) tittar vi först på starttestet. Här kom 910 U.2 på fjärde plats med 83,210 191.2 IOPS och en latens på XNUMXμs.
VDI LC Initial Login hade 910 U.2-hållningen stadig på fjärde plats med 40,035 197.4 IOPS och en latens på XNUMX μs.
Slutligen hade VDI LC Monday Login 910 U.2-toppen vid 45,349 349 IOPS och en latens på XNUMXμs för fjärde plats igen.
Slutsats
Memblaze PBlaze5 910 är företagets nya NVMe-datacenterdisk som utnyttjar 64-lagers 3D NAND. Disken kommer i två formfaktorer (U.2 för denna recension) och i kapaciteter på 3.84TB, 7.68TB och 15.36TB. Memblaze hävdar prestanda på upp till 3.5 GB/s läsning, 3.5 GB/s skrivning och genomströmning på upp till 835 150 IOPS läsning och 256 8 IOPS skrivning. Enheten uppfyller kriterierna för en uppsjö av användningsfall och kommer med säkerhetsalternativ som AES XNUMX datakryptering och stöder TRIM-funktion upp till XNUMXTB/s.
När man tittar på prestanda för analys av applikationers arbetsbelastning kom 910 U.2 på sista plats i våra SQL Server-riktmärken med 12,546.5 38.8 TPS och en genomsnittlig latens på 6,664.6 ms. I Sysbench landade enheten lite bättre i mitten av paketet med 19.2 37.8 TPS och en genomsnittlig latens på 910 ms och en latens i värsta fall på 2 ms. I vårt Houdini by SideFX-riktmärke hade 3,093.8 U.XNUMX en poäng på XNUMX XNUMX sekunder vilket placerade den i den nedre delen av fältet men i linje med andra Memblaze-produkter.
För VDBench hade Memblaze PBlaze5 910 U.2 sub-millisekunders latens genom alla tester. Drivningen tenderade att falla i mitten till mitten av botten av packen i alla tester. Nyckelresultat inkluderar 666K IOPS på 4K-läsning, 297K IOPs på 4K-skrivning, 2.4GB/s vid 64K-läsning och 1.1GB/s på 64K-skrivning. SQL-resultaten rymde omkring en kvarts miljon IOPS med Oracle-testerna på mellan 177K IOPS och 212K IOPS.
Sammantaget gav det bra prestanda, men prestandan började halka jämfört med föregående generation PBlaze5 900.
Anmäl dig till StorageReviews nyhetsbrev