Home Empreendimento Análise do SSD Memblaze PBlaze5 Série 920 NVMe

Análise do SSD Memblaze PBlaze5 Série 920 NVMe

by Brian Beeler
Membrana PBlaze5 926

Vimos vários SSDs corporativos da Memblaze ao longo dos anos, eles geralmente estão na vanguarda quando se trata de tecnologia e desempenho. Recentemente, eles lançaram um novo conjunto de SSDs na família Memblaze PBlaze5, o Memblaze PBlaze5 920 Series. o o Série 916 antes dele, o PBlaze5 920 Series vem em fatores de forma U.2 e Add-in-Card (AIC). A maior diferença com a Série 920 é que ela usa um novo conjunto de NAND, passando para 96D TLC NAND de 3 camadas de 64 camadas no modelo anterior. Na extremidade superior, os novos SSDs Memblaze são cotados para fornecer 5.9 GB/s e 970,000 IOPS na extremidade superior do espectro de desempenho.

Vimos vários SSDs corporativos da Memblaze ao longo dos anos, eles geralmente estão na vanguarda quando se trata de tecnologia e desempenho. Recentemente, eles lançaram um novo conjunto de SSDs na família Memblaze PBlaze5, o Memblaze PBlaze5 920 Series. o o Série 916 antes dele, o PBlaze5 920 Series vem em fatores de forma U.2 e Add-in-Card (AIC). A maior diferença com a Série 920 é que ela usa um novo conjunto de NAND, passando para 96D TLC NAND de 3 camadas de 64 camadas no modelo anterior. Na extremidade superior, os novos SSDs Memblaze são cotados para fornecer 5.9 GB/s e 970,000 IOPS na extremidade superior do espectro de desempenho.

Membrana PBlaze5 920 926

A Série 920 vem em duas classificações de resistência, 1 unidade de gravação por dia (DWPD) ou 3 DWPD. Isso cria quatro unidades distintas, segmentadas em fator de forma e resistência. Os fatores de forma AIC são designados como C920 e C926, com o C920 sendo a unidade mais centrada na leitura e o C926 carregando essa classificação de resistência de 3 DWPD. Da mesma forma, as unidades U.2 são o D920 e o D926, combinando da mesma forma na resistência. As unidades de menor resistência vêm em capacidades de 3.84 TB e 7.68 TB em ambos os fatores de farm. Da mesma forma, os 3 SSDs DWPD vêm com capacidades de 3.2 TB e 6.4 TB em ambas as famílias. As unidades da série 916 anteriores tinham um modelo de maior capacidade, que o Memblaze abandonou desta vez, provavelmente devido à falta de volume.

Memblaze PBlaze5 920 926 Inferior

O Memblaze possui vários recursos importantes incorporados nesses SSDs. Um dos nossos favoritos é a capacidade de atualizar o firmware da unidade sem redefinir. Isso significa que as unidades podem ser atualizadas sem a necessidade de reinicializar o servidor. O Memblaze também adicionou o que eles chamam de “Quota por Namespace”. As unidades agora suportam 32 namespaces, cada um com uma chave AES-256 diferente para criptografar dados. Dentro desses namespaces, aplicativos não críticos podem ser limitados para garantir QoS de aplicativos mais importantes. As unidades também oferecem suporte a vários recursos para garantir a confiabilidade dos dados, incluindo; Correção de erros LDPC, criptografia de dados AES de 256 bits, proteção completa do caminho de dados, proteção de ponta a ponta T10 PI e proteção aprimorada contra falha de energia.

Aqui está a nossa visão geral do vídeo:

Nosso modelo de análise é o C6.4 de 926 TB.

Especificações da série Memblaze PBlaze 920

Modelo D920 C920 D926 C926
Capacidade do usuário (TB) 3.84 7.68 3.84 7.68 3.2 6.4 3.2 6.4
Interface PCIe 3.0 x 4 PCIe 3.0 x 8 PCIe 3.0 x 4 PCIe 3.0 x 8
Fator de Forma U.2.5 de 2 polegadas HHHL AIC U.2.5 de 2 polegadas HHHL AIC
Leitura sequencial de 128 KB (GB/s) 3.5 3.5 5.6 5.9 3.5 3.5 5.6 5.9
Gravação sequencial de 128 KB (GB/s) 3.3 3.5 3.3 3.7 3.3 3.5 3.3 3.7
IOPS de leitura aleatória sustentada (4 KB) 825K 840K 835K 970K 825K 835K 835K 970K
Gravação aleatória sustentada (4 KB) IOPS (estado estacionário) 140K 150K 140K 150K 280K 300K 280K 300K
Latência de leitura/gravação (μs) 90 / 12
Resistência vitalícia 1DWPD 3DWPD
Taxa de erro de bit incorrigível < 10 -17
Tempo médio entre falhas 2 milhões de horas
Protocolo NVMe 1.2a
Memória flash NAND 3D eTLC NAND
Sistema operacional RHEL, SLES, CentOS, Ubuntu, Windows Server, VMware ESXi
Consumo de energia 7~25w
Suporte a recursos básicos Proteção contra falha de energia, Hot Pluggable, Proteção completa do caminho de dados, SMART, Gerenciamento de energia flexível
Suporte a recursos avançados TRIM, Multi-namespace, AES 256 Data Encryption & Crypto Erase, Dual Port & Reservation (U.2 only), EUI64/NGUID Variable Sector Size Management & T10 PI (DIF/DIX), Atualização de Firmware sem Reset, Quota por Namespace
Suporte de software Ferramenta de gerenciamento de código aberto, ferramenta de depuração CLI driver na caixa do sistema operacional (Fácil integração do sistema)

 Memblaze PBlaze5 C926 Desempenho

Mesa de teste

Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.

Lenovo Think System SR850

  • 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • 2 x placas RAID 930-8i 12 Gb/s
  • 8 compartimentos NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 4 x 16 GB DDR4-2666 MHz ECC DRAM
  • 1 placa RAID PERC 730 2GB 12Gb/s
  • Adaptador NVMe Complementar
  • Ubuntu-16.04.3-desktop-amd64

Histórico de testes e comparáveis

Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nas respectivas páginas.

Comparáveis ​​para esta revisão:

Análise de carga de trabalho do aplicativo

Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Memblaze PBlaze5 916 são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.

Houdini por SideFX

O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para este aplicativo é uma variante do tipo de servidor central Dell PowerEdge R740xd que usamos no laboratório com CPUs Intel 6130 duplas e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.

A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:

  • Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
  • Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
  • (Not Run) Processa os pontos.
  • Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
  • (Não executado) Grava os blocos agrupados de volta no disco.

Aqui, vemos o Memblaze PBlaze5 C926 no terço inferior dos desempenhos “intermediários” com uma renderização de 2,883 segundos, cerca de 44 segundos abaixo do 916.

Memblaze PBlaze5 920 Houdini

Desempenho do SQL Server

Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.

Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.

Configuração de teste do SQL Server (por VM)

  • Windows Server 2012 R2
  • Ocupação de armazenamento: 600 GB alocados, 500 GB usados
  • SQL Server 2014
    • Tamanho do banco de dados: escala 1,500
    • Carga de cliente virtual: 15,000
    • Memória RAM: 48 GB
  • Duração do teste: 3 horas
    • 2.5 horas de pré-condicionamento
    • período de amostra de 30 minutos

Para nosso benchmark transacional do SQL Server, o Memblaze PBlaze5 C926 teve uma pontuação agregada de 12,644.2 TPS com VMs individuais variando entre 3,161 e 3,161.09 TPS. Isso está logo abaixo do 916 que tinha um total de 12,645 TPS.

Membraze PBlaze5 926 SQL

A latência média viu o C926 ter 2 ms em toda a linha. Novamente, um pouco abaixo dos 916ms do 1.25.

Desempenho do Sysbench

O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.

Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tabelas de banco de dados: 100
    • Tamanho do banco de dados: 10,000,000
    • Segmentos de banco de dados: 32
    • Memória RAM: 24 GB
  • Duração do teste: 3 horas
    • 2 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos

Com o benchmark transacional Sysbench, o Memblaze PBlaze5 C926 teve uma pontuação agregada de 8,751.6 TPS em comparação com a pontuação agregada de 916 TPS do 9,298 anterior.

Memblaze PBlaze5 926 Sysbench

A latência média do Sysbench viu o C926 com uma latência agregada de 14.6ms contra os 916ms do 13.8.

Para a latência do nosso pior cenário (99º percentil), o C926 nos mostrou uma latência de 26.4 ms em comparação com a latência do 916 que foi de 25.2 ms.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Em nossa primeira análise de carga de trabalho VDBench, leitura aleatória de 4K, o Memblaze PBlaze5 C926 AIC funcionou bastante perto do 916, mas terminou logo atrás com uma pontuação máxima de 789,134 IOPS com uma latência de 159.8 µs.

Memblaze PBlaze5 926 leitura 4k

Para gravação aleatória de 4K novamente, o C926 seguiu o 916 um pouco antes de diminuir e atingir o pico de 558,945 IOPS com uma latência de 226.3 µs.

Mudando para cargas de trabalho sequenciais, vemos o C926 executado com menor latência e pico mais alto que o 916 na leitura de 64K. A pontuação máxima para o C926 foi de 61,356 IOPS ou 3.83 GB/s com uma latência de 260 µs.

Memblaze PBlaze5 926 leitura 64k

Para gravação sequencial de 64K, o C926 rastreou novamente com o 916 na maior parte antes de atingir um pico mais alto (em cerca de 43K IOPS ou 2.7 GB/s em uma latência de aproximadamente 200 µs) antes de cair um pouco e cair abaixo da outra unidade.

Nosso próximo conjunto de testes são nossas cargas de trabalho SQL: SQL, SQL 90-10 e SQL 80-20. Começando com SQL, o Memblaze PBlaze5 C926 começou com uma latência um pouco mais alta e permaneceu lá até o segundo pico com 238,861 IOPS em uma latência de 133.5 µs.

O SQL 90-10 pintou uma imagem semelhante com o C926 novamente ficando em segundo lugar para o 916 com um desempenho máximo de 249,682 IOPS com uma latência de 127.6 µs antes de cair um pouco.

Com o SQL 80-20, as unidades continuaram a tendência com o C926 atingindo o segundo pico de 250,990 IOPS com uma latência de 126.7 µs.

A seguir estão nossas cargas de trabalho Oracle: Oracle, Oracle 90-10 e Oracle 80-20. Começando com o Oracle, o Memblaze PBlaze5 C926 atingiu o segundo pico com 268,147 IOPS com uma latência de 132.2 µs.

O Oracle 90-10 nos mostrou mais do que acima, o C926 correu logo atrás do 916 e atingiu o pico de 190,557 IOPS 114.9µs.

Com o Oracle 80-20, o C926 atingiu o pico atrás do 916 em 197,016 IOPS com uma latência de 111µs.

Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para inicialização VDI Full Clone (FC), o Memblaze PBlaze5 C926 teve um pico de 209,687 IOPS com uma latência de 165.2 µs, ficando aquém dos 916.

O VDI FC Initial Login viu o C926 ultrapassar o 916 e terminar em primeiro com um pico de 157,217 IOPS com uma latência de 188.2 µs.

Para o VDI FC Monday Login, o C926 e o ​​916 correram lado a lado, desistindo da liderança e retomando-a antes que o C926 avançasse com um pico de finalização de 103,780 IOPS em uma latência de 152.8 µs.

Para VDI Linked Clone (LC) Boot, o C926 caiu para seu lugar familiar de segundo lugar com uma pontuação máxima de 96,226 IOPS com uma latência de 165.7 µs.

O login inicial do VDI LC mostrou o mesmo que o teste FC acima, o C926 avançou para ocupar o primeiro lugar com uma pontuação máxima de 55,977 IOPS em uma latência de 141µs.

Finalmente, com o VDI LC Monday Login, o C926 mais uma vez mal chegou ao topo com 80,393 IOPS com uma latência de 196.6 µs.

Conclusão

A Memblaze expandiu a linha PBlaze5 com a introdução da Série 920. A principal diferença na nova linha de unidades é o NAND passando de 64 camadas para 96 ​​camadas. A nova série é dividida em dois tipos por DWPD, 1 ou 3. É ainda subdividida por fator de forma e capacidade. Para esta revisão específica, analisamos o fator de forma Memblaze PBlaze5 C926 HHHL AIC voltado para aqueles que precisam de maior desempenho e armazenamento de maior resistência.

Para desempenho, comparamos a unidade com outro SSD Membalze AIC, o Memblaze PBlaze5 916 AIC. Embora normalmente se espere que a unidade mais nova tenha um desempenho melhor, especialmente com uma empresa como a Memblaze. No entanto, o 916 anterior venceu o C926 em quase todas as categorias. Não muito, mas avançou. Para Application Workload Analysis, vimos o C926 atingir 2,644.2 TPS com uma latência média de 2 ms no SQL Server. Logo abaixo do 916 em ambos os casos. Para Sysbench, a unidade atingiu 8,751.6 TPS, latência média de 14.6 ms e latência de pior cenário de 26.4 ms, novamente perdendo um pouco para 916 em cada teste.

Nosso teste VDbench foi mais ou menos semelhante ao acima. Na maioria, mas não em todos os casos, o C926 mais recente ficou um pouco atrás do 916. Os destaques incluem: 789K IOPS na leitura de 4K, 559K IOPS na gravação de 4K, 3.83GB/s na leitura de 64K e 2.7GB/s na gravação de 64K onde vencer a unidade mais antiga. As cargas de trabalho SQL atingiram 239 IOPS, 250 IOPS para SQL 90-10 e 251 IOPS em SQL 80-20, perdendo para 916 a cada vez. O mesmo posicionamento próximo foi observado em cargas de trabalho Oracle com 268 IOPS, 191 IOPS no Oracle 90-10 e 197 IOPS no Oracle 80-20. Em nossos testes de VDI Clone, a unidade mais recente foi capaz de vencer a unidade mais antiga nos testes de login inicial e de segunda-feira nos testes Full e Linked Clone.

Enquanto está atrás de uma unidade mais antiga da série PBlaze 5, a nova série Memblaze PBlaze5 920 ainda apresenta bons números. O modelo de placa de borda funciona bem em plataformas de servidor legadas sem compartimentos NVMe de 2.5″ ou servidores que precisam de largura de banda adicional de uma única unidade que os SSDs U.2 PCIe Gen3 não podem igualar. No geral, a Memblaze continua a lançar SSDs corporativos de qualidade, criados para atender às necessidades do mercado convencional.

Página do produto Memblaze

Discuta no Reddit

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed