NVMe SSD:er har tagit över som topppresterande över hela linjen. De började med att göra stora steg och gränser över SAS- och SATA-enheter, men de senaste åren har de sakta fått ut lite mer prestanda för varje iteration. Det finns en övre gräns med PCIe 3.0 och de nuvarande enheterna träffar dem. Men nu med andra generationens AMD EPYC 7002-processorer är PCIe 4.0 här, och KIOXIA utnyttjar det med CM6 SSD.
NVMe SSD:er har tagit över som topppresterande över hela linjen. De började med att göra stora steg och gränser över SAS- och SATA-enheter, men de senaste åren har de sakta fått ut lite mer prestanda för varje iteration. Det finns en övre gräns med PCIe 3.0 och de nuvarande enheterna träffar dem. Men nu med andra generationen AMD EPYC 7002 processorer, PCIe 4.0 är här, och KIOXIA utnyttjar det med CM6 SSD.
KIOXIA tillkännagav de nya PCIe 4.0-enheterna, CM6 och CD6, som en demo vid det senaste Flash Memory Summit, tillbaka i de länge bortglömda tiderna av fysiska händelser. Vid den tiden var de de första PCIe 4.0 SSD:erna och när detta skrivs kan CM6 SSD-serien fortfarande vara en av de få om bara PCIe 4.0 SSD:erna för företag. Den stora affären med de nya hårddiskarna kommer att vara högre prestanda: citeras som upp till 6.9 GB/s och 1.4 miljoner IOPS-läsning. Det är några imponerande teoretiska siffror. Diskarna kommer också med in-band NVMe-MI, beständig händelselogg och namnområdesgranularitet.
KIOXIA CM6 är en U.3-formfaktor, SFF-TA-1001-konform, vilket gör att de kan användas i tri-mode-aktiverade bakplan. CM6 kommer i ett brett utbud av kapaciteter från 800 GB hela vägen till 30.72 TB. Diskarna kommer i en läsintensiv (CM6-R) och blandad användning (CM6-V) smak beroende på användarnas behov. Utöver specifika modeller för användningsfall finns det en mängd olika säkra versioner, inklusive en Sanitize Instat Erase (SIE), en Self-Encrypting Drive (SED) och en FIPS 140-2 (Level 2) modell. Enheten är dubbelportad för att ge hög tillgänglighet också.
För den här recensionen tittar vi på en KIOXIA CM6-V med en kapacitet på 6.4 TB.
KIOXIA CM6 PCIe 4.0-specifikationer
Modell | CM6-R (läsintensiv) | CM6-V (blandad användning) |
Formfaktor | 2.5 tum 15 mm Z-höjd | |
kapacitet1 | 960 GB, 1.92 TB, 3.84 TB, 7.68 TB, 15.36 TB, 30.72 TB | 800 GB, 1.6 TB, 3.2 TB, 6.4 TB, 12.8 TB |
Gränssnitt | PCIe Gen3 / 4, 1×4 och 2×2 | |
Compliance | PCIe 4.0 och NVMe 1.4 | |
NAND-typ | KIOXIA BiCS FLASH96-lager 3D TLC | |
Sekventiell läsning | Gen3 = upp till 3,500 XNUMX MB/s Gen4 = upp till 6,900 XNUMX MB/s |
Gen3 = upp till 3,500 XNUMX MB/s Gen4 = upp till 6,900 XNUMX MB/s |
Sekventiell Skriv | Gen3 = upp till 3,100 XNUMX MB/s Gen4 = upp till 4,200 XNUMX MB/s |
Gen3 = upp till 3,100 XNUMX MB/s Gen4 = upp till 4,200 XNUMX MB/s |
Slumpmässig läsning | Gen3 = upp till 800K IOPS Gen4 = upp till 1.4M IOPS |
Gen3 = upp till 800K IOPS Gen4 = upp till 1.4M IOPS |
Slumpmässig Skriv | Gen3 = upp till 155K IOPS Gen4 = upp till 170K IOPS |
Gen3 = upp till 290K IOPS Gen4 = upp till 350K IOPS |
Energiförbrukning | Aktiv: 20W; Tomgång: <5W | |
Endurance | 1 DWPD i 5 år | 3 DWPD i 5 år |
Okorrigerbar BER | 1 sektor per 10^17 bitar avläsning | |
MTTF / AFR | 2.5 miljoner timmar / 0.35 % | |
drifttemperatur | 0 till 70 ° C |
Prestation
Testbädd
Våra nya PCIe Gen4 Enterprise SSD-recensioner utnyttjar en Lenovo ThinkSystem SR635 för applikationstester och syntetiska riktmärken. ThinkSystem SR635 är en välutrustad en-CPU AMD-plattform som erbjuder CPU-kraft långt över vad som behövs för att betona högpresterande lokal lagring. Det är också den enda plattformen i vårt labb (och en av de få på marknaden för närvarande) med PCIe Gen4 U.2-fack. Syntetiska tester kräver inte mycket CPU-resurser men använder fortfarande samma Lenovo-plattform. I båda fallen är avsikten att visa upp lokal lagring i bästa möjliga ljus som är i linje med lagringsleverantörens maximala enhetsspecifikationer.
PCIe Gen4 Synthetic and Application Platform (Lenovo ThinkSystem SR635)
- 1 x AMD 7452 (2.35 GHz x 32 kärnor)
- 8 x 64 GB DDR4-3200MHz ECC DRAM
- CentOS 7.7 1908
- ESXi 6.7u3
PCIe Gen3 Application Platform (Lenovo ThinkSystem SR850)
- 4 x Intel Platinum 8160 CPU (2.1 GHz x 24 kärnor)
- 16 x 32 GB DDR4-2666Mhz ECC DRAM
- 2 x RAID 930-8i 12Gb/s RAID-kort
- 8 NVMe-fack
- VMware ESXI 6.7u3
PCIe Gen3 syntetisk plattform (Dell PowerEdge R740xd)
- 2 x Intel Gold 6130 CPU (2.1 GHz x 16 kärnor)
- 4 x 16 GB DDR4-2666MHz ECC DRAM
- 1x PERC 730 2GB 12Gb/s RAID-kort
- Tillägg NVMe-adapter
- Ubuntu-16.04.3-desktop-amd64
Eftersom vi är den första uppsättningen recensioner på en ny plattform, har vi inkluderat tidigare körresultat, som är nära men inte 100 % äpplens jämförelser med äpplen sedan de testades på en äldre plattform. Våra syntetiska testskillnader kommer inte att ha mycket snedvridning i resultat, men applikationens arbetsbelastningar som fungerar på AMD-plattformen för en enda CPU jämfört med Quad CPU Intel-plattformen kan till viss del. I våra MySQL-tester tog en av de nya Gen4 KIOXIA-produkterna ledningen, men i SQL-servern var latensen genomsnittlig. Med endast två Gen4-enheter som vi har kunnat publicera runt om har vi inte en betydande mängd jämförbar data, men det är något att notera när vi ser dessa resultat. Vi har också utökat våra syntetiska tester för att dra fördel av de snabbare SSD-enheterna, och nu visar testresultat med högre topptrådantal.
Testbakgrund och jämförelser
Smakämnen StorageReview Enterprise Test Lab ger en flexibel arkitektur för att utföra riktmärken för företagslagringsenheter i en miljö som är jämförbar med vad administratörer möter i verkliga implementeringar. Enterprise Test Lab innehåller en mängd olika servrar, nätverk, strömkonditionering och annan nätverksinfrastruktur som gör att vår personal kan etablera verkliga förhållanden för att noggrant mäta prestanda under våra granskningar.
Vi införlivar dessa detaljer om labbmiljön och protokollen i granskningar så att IT-proffs och de som ansvarar för lagringsanskaffning kan förstå under vilka förutsättningar vi har uppnått följande resultat. Ingen av våra recensioner betalas för eller övervakas av tillverkaren av utrustning vi testar. Ytterligare information om StorageReview Enterprise Test Lab och en översikt över dess nätverksfunktioner finns på respektive sidor.
Analys av applikationens arbetsbelastning
För att förstå prestandaegenskaperna hos företagslagringsenheter är det viktigt att modellera infrastrukturen och applikationens arbetsbelastningar som finns i live-produktionsmiljöer. Våra riktmärken för KIOXIA CM6 är därför MySQL OLTP-prestanda via SysBench och Microsoft SQL Server OLTP-prestanda med en simulerad TCP-C-arbetsbelastning. För våra applikationsarbetsbelastningar kommer varje enhet att köra fyra identiskt konfigurerade virtuella datorer.
SQL Server prestanda
Varje SQL Server VM är konfigurerad med två vDisks: 100 GB volym för uppstart och en 500 GB volym för databasen och loggfiler. Ur ett systemresursperspektiv konfigurerade vi varje virtuell dator med 8 vCPU:er, 64 GB DRAM och utnyttjade LSI Logic SAS SCSI-kontrollern. Medan våra Sysbench-arbetsbelastningar som tidigare testats mättade plattformen i både lagrings-I/O och kapacitet, letar SQL-testet efter latensprestanda.
Det här testet använder SQL Server 2014 som körs på Windows Server 2012 R2 gäst-VM, och betonas av Quests Benchmark Factory for Databases. StorageReview's Microsoft SQL Server OLTP-testprotokoll använder det aktuella utkastet till Transaction Processing Performance Councils Benchmark C (TPC-C), ett riktmärke för transaktionsbearbetning online som simulerar de aktiviteter som finns i komplexa applikationsmiljöer. TPC-C-riktmärket kommer närmare än syntetiska prestandariktmärken att mäta prestandastyrkorna och flaskhalsarna hos lagringsinfrastruktur i databasmiljöer. Varje instans av vår SQL Server VM för denna granskning använder en 333 GB (1,500 15,000 skala) SQL Server-databas och mäter transaktionsprestanda och latens under en belastning på XNUMX XNUMX virtuella användare.
SQL Server-testkonfiguration (per virtuell dator)
- Windows Server 2012 R2
- Lagringsutrymme: 600 GB tilldelat, 500 GB använt
- SQL Server 2014
-
- Databasstorlek: 1,500 XNUMX skala
- Virtuell klientbelastning: 15,000 XNUMX
- RAM-buffert: 48GB
- Testlängd: 3 timmar
-
- 2.5 timmars förkonditionering
- 30 minuters provperiod
För vårt SQL Server-transaktionsriktmärke, placerade KIOXIA CM6 fyra totalt med 12,633.6 10.6 TPS, även om det bara var XNUMX TPS under toppprestanda.
Med SQL Servers genomsnittliga latens hade CM6 en genomsnittlig latens på 5.5 ms, samma som dess kusin CD6 SSD.
Sysbench Performance
Nästa benchmark för ansökan består av en Percona MySQL OLTP-databas mätt via SysBench. Detta test mäter också genomsnittlig TPS (Transactions Per Second), genomsnittlig latens och genomsnittlig 99:e percentil latens.
Varje sysbench VM är konfigurerad med tre vDisks: en för uppstart (~92GB), en med den förbyggda databasen (~447GB), och den tredje för databasen som testas (270GB). Ur ett systemresursperspektiv konfigurerade vi varje virtuell dator med 8 vCPU:er, 60 GB DRAM och utnyttjade LSI Logic SAS SCSI-kontrollern.
Sysbench-testkonfiguration (per virtuell dator)
- CentOS 6.3 64-bitars
- Percona XtraDB 5.5.30-rel30.1
-
- Databastabeller: 100
- Databasstorlek: 10,000,000 XNUMX XNUMX
- Databastrådar: 32
- RAM-buffert: 24GB
- Testlängd: 3 timmar
-
- 2 timmar förkonditionering 32 trådar
- 1 timme 32 trådar
Om vi tittar på vårt Sysbench-transaktionsriktmärke, hade KIOXIA CM6 8,632 XNUMX TPS igen och hamnade på fjärde plats i vårt jämförbara paket.
Med Sysbenchs genomsnittliga latens kom CM6 återigen fyran på 14.82 ms.
För vårt värsta scenario latens (99:e percentilen) stannade CM6 där den är bekväm, på fjärde plats, med 29.86ms.
VDBench arbetsbelastningsanalys
När det gäller benchmarking av lagringsenheter är applikationstestning bäst, och syntetiska tester kommer på andra plats. Även om det inte är en perfekt representation av faktiska arbetsbelastningar, hjälper syntetiska tester till baslagringsenheter med en repeterbarhetsfaktor som gör det enkelt att göra jämförelser mellan äpplen och äpplen mellan konkurrerande lösningar. Dessa arbetsbelastningar erbjuder en rad olika testprofiler som sträcker sig från "fyra hörn"-tester, vanliga tester av databasöverföringsstorlekar, till spårningsfångningar från olika VDI-miljöer. Alla dessa tester utnyttjar den vanliga vdBench-arbetsbelastningsgeneratorn, med en skriptmotor för att automatisera och fånga resultat över ett stort beräkningstestkluster. Detta gör att vi kan upprepa samma arbetsbelastningar över ett brett utbud av lagringsenheter, inklusive flash-arrayer och individuella lagringsenheter. Vår testprocess för dessa riktmärken fyller hela enhetens yta med data och partitionerar sedan en enhetssektion som motsvarar 25 % av enhetens kapacitet för att simulera hur enheten kan reagera på applikationsarbetsbelastningar. Detta skiljer sig från fullständiga entropitester som använder 100 % av enheten och tar dem till ett stabilt tillstånd. Som ett resultat kommer dessa siffror att återspegla högre ihållande skrivhastigheter.
profiler:
- 4K slumpmässig läsning: 100 % läsning, 128 trådar, 0-120 % iorat
- 4K Random Write: 100% Write, 128 trådar, 0-120% iorate
- 4K slumpmässig läsning (hög belastning): 100 % läs, 512 trådar, 0-120 % iorat
- 4K Random Write (hög belastning): 100% Write, 512 trådar, 0-120% iorate
- 64K sekventiell läsning: 100 % läsning, 32 trådar, 0-120 % iorat
- 64K sekventiell skrivning: 100 % skrivning, 16 trådar, 0-120 % iorate
- 64K sekventiell läsning (hög belastning): 100 % läsning, 64 trådar, 0-120 % iorat
- 64K sekventiell skrivning (hög belastning): 100 % skrivning, 64 trådar, 0-120 % iorate
- Syntetisk databas: SQL och Oracle
- VDI Full Clone och Linked Clone Traces
Jämförbara:
I vår första VDBench Workload Analysis, Random 4K Read, vände KIOXIA CM6 med en imponerande prestanda som toppade på 846,288 150 IOPS vid en latens på XNUMX µs. Detta placerar drivet i topplaceringen.
De nya PCIe 4.0-diskarna tål en högre belastning och vi skulle vara försumliga om vi inte pressade dem lite hårdare för att se vad de kan göra. Så med en Random 4K Read hög belastning kunde CM6 nå en topp på 1,507,564 337.9 6 IOPS med en latens på XNUMX µs. Mycket bättre än sin CDXNUMX-motsvarighet.
För Random 4K write, tog tredje plats totalt. Den körde med under 100 µs latens till cirka 490K IOPS och toppade på 548,169 226.4 IOPS vid en latens på XNUMX µs.
Slumpmässig 4K-skrivhög belastning såg att CM6 fortsatte med att nå sin topp på 549,103 922 IOPS med en latens på 6 µs efter CDXNUMX den här gången.
Genom att byta över till sekventiella arbetsbelastningar hade CM6 en chans att glänsa igen och ta förstaplatsen i 64K-läsning med en topppoäng på 97,779 6.11 IOPS eller 325 GB/s med en latens på endast XNUMXµs.
Hög belastning 64K sekventiell läsning såg liknande placeringen i 4K läsning med CM6 som toppar på 101,018 6.3 IOPS eller 629 GB/s med en latens på XNUMX µs.
64K-skrivning visade CM6 med en stark topppoäng även om prestanda sjönk efter topp och kom in på tredje plats. Toppprestanda var cirka 49K IOPS eller 3.1 GB/s vid en latens på cirka 50 µs.
High Load 64K sekventiell skrivning såg att CM6 hade en högre topp men sjunker i prestanda efteråt. CM6 nådde en topp på cirka 49K IOPs eller 3.1GB/s med en latens så låg att vi knappt kan se den innan den hoppade av.
Vår nästa uppsättning tester är våra SQL-arbetsbelastningar: SQL, SQL 90-10 och SQL 80-20. Från och med SQL tog KIOXIA CM6 andra plats totalt med en topp på 266,458 119 IOPS vid en latens på XNUMX µs.
För SQL 90-10 tog CM6 tvåa igen med en toppprestanda på 265,276 119.2 IOPS vid en latens på XNUMX µs.
SQL 80-20 gav CM6 chansen att visa upp sig genom att komma först med en toppprestanda på 263,819 119.4 IOPS XNUMXµs.
Nästa upp är våra Oracle-arbetsbelastningar: Oracle, Oracle 90-10 och Oracle 80-20. Från och med Oracle kom CM6 på första plats igen med en toppprestanda på 271,230 128.6 IOPS vid en latens på XNUMX µs.
Oracle 90-10 hade CM6-platsen tvåa med en toppprestanda på 202,341 107.4 IOPS med en latens på endast XNUMXµs.
CM6 glider precis förbi konkurrenterna för att återigen ta första plats i Oracle 80-20 med en topp på 206,733 104.7 IOPS vid en låg latens på XNUMX µs.
Därefter bytte vi till vårt VDI-klontest, Full och Linked. För VDI Full Clone (FC) Boot tog CM6 topplatsen med 223,668 153.5 IOPS och en latens på XNUMX µs.
För VDI FC Initial Login halkade CM6 till tredje plats med en toppprestanda på 154,836 189 IOPS vid en latens på XNUMX µs.
Vår VDI FC Monday Login benchmark såg att CM6 stannade på tredje plats med en topp på 98,867 158.4 IOPS med en latens på XNUMXµs.
För VDI Linked Clone (LC) Boot gick KIOXIA CM6 tillbaka till topplaceringen med en topppoäng på 115,058 137.7 IOPS vid en latens på XNUMX µs.
VDI LC Initial Login är lite svår att läsa i diagrammet, men CM6:an landade i mitten av packet med en topp på 38,848 202.4 IOPS vid en latens på XNUMXµs innan den tappade några.
Slutligen fick VDI LC Monday Login att CM6 återigen presterade bäst med en topppoäng på 96,008 162.5 IOPS och en latens på XNUMX µs.
Slutsats
KIOXIA CM6 var en av, om inte den, första PCIe 4.0 SSD för företaget. De nya enheterna kommer med löfte om högre prestanda, i det här fallet upp till 6.9 GB/s och upp till 1.4 miljoner IOPS. CM6 har dubbla portar, vilket tillför en nivå av hög tillgänglighet till disken. Enheten kommer i ett brett utbud av kapacitet från 800 GB upp till hela 30.72 TB med 9 kapacitetsalternativ däremellan. CM6 har både en läsintensiv och blandad modell med 1 respektive 3 DWPD. Och SSD kommer med en mängd olika säkra modellalternativ.
För prestanda körde vi vårt vanliga flöde av Application Workload Analysis och VDBench med några få undantag. Vi var tvungna att hoppa över Houdini-testet eftersom testplattformen är Intel och KIOXIA-enheterna skulle handikappas av Gen3-portarna. På VDBench lade vi till ett högre belastningstest för att stressa de nya enheterna lite mer eftersom de är designade för att hantera det.
I vår Application Workload Analysis körde vi SQL Server och Sysbench. Med SQL Server kom CM6 på fjärde plats i både TPS och genomsnittlig latens med 12,633.6 5.5 TPS och 8,632 ms, fortfarande mycket bra poäng. Med Sysbench hängde enheten igen på fjärde plats över hela linjen med 14.82 29.86 TPS, XNUMX ms genomsnittlig latens och XNUMX ms i vårt värsta scenario.
I VDBench lyste enheten verkligen. CM6 var den bästa presterande i flera av våra benchmarks. Grundläggande höjdpunkter inkluderar 846K IOPS i 4K läsning, 1.5 miljoner IOPS i 4K läsning hög belastning, 548K IOPS i 4K skrivning, 549K IOPS i 4K skriv hög belastning, 6.1GB/s i 64K läsning, 6.3GB/s i 64K läsning hög belastning, och 3.1 GB/s i både 64K skriv och 64K skriv hög belastning. SQL såg toppar på 266K IOPS, 265K IOPS i SQL 90-10 och 264K IOPS i SQL 80-20. Oracle gav oss toppar på 271K IOPS, 202K IOPS i Oracle 90-10 och 207K IOPS i Oracle 80-20. VDI FC gav oss 224K IOPS-start, 155K IOPS Initial Login och 99K IOPS i måndagsinloggning. VDI LC såg 115K IOPS start, 39K IOPS Initial Login och 96K IOPS Monday Login.
Denna recension och den av CD6 tar en specifik titt på PCIe 4.0 och framtiden för lagringsenheter när fler kommer in på marknaden. Det finns inte många serverleverantörer som producerar front-to-back-stöd för PCIe 4.0, och Lenovo är den enda i vårt labb när detta skrivs. Lenovo var snabbt med att ta tillvara alla fördelar som 2:a generationens AMD EPYC 7002-processorer erbjuder, och förutsåg lagringsprodukter som KIOXIA CM6. Men för KIOXIA placerar det dem i den intressanta platsen att ligga före andra, men den fulla potentialen i deras hårddisk möts bara av nyare, AMD-baserade servrar (tills Intel bestämmer sig för att hoppa in i spelet också). För närvarande kommer CM6 fortfarande att fungera i äldre utrustning och kommer att vara redo att släppa lös mer prestanda när företag uppgraderar.
Engagera dig med StorageReview
Nyhetsbrev | Youtube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | Rssflöde