Home Empreendimento Avaliação do SSD Memblaze PBlaze5 910 AIC NVMe

Avaliação do SSD Memblaze PBlaze5 910 AIC NVMe

by Lyle Smith

O Memblaze PBlaze5 910 é um SSD NVMe de alto desempenho projetado para melhorar significativamente o desempenho do aplicativo. Equipado com NAND 64D de 3 camadas, o PBlaze5 apresenta uma enorme capacidade de disco único de até 15.36 TB, 40% a mais do que os modelos anteriores. A Memblaze indica que isso permitirá que seu novo SSD aumente a densidade do rack em aplicativos de servidor de armazenamento, economizando espaço e reduzindo os custos de energia. Adicionando cada vez mais eficiência energética aos data centers, a série 910 também aumenta o desempenho em 38% por watt e oferece suporte a 16 configurações de modo de energia, variando de 10 W a 25 W.


O Memblaze PBlaze5 910 é um SSD NVMe de alto desempenho projetado para melhorar significativamente o desempenho do aplicativo. Equipado com NAND 64D de 3 camadas, o PBlaze5 apresenta uma enorme capacidade de disco único de até 15.36 TB, 40% a mais do que os modelos anteriores. A Memblaze indica que isso permitirá que seu novo SSD aumente a densidade do rack em aplicativos de servidor de armazenamento, economizando espaço e reduzindo os custos de energia. Adicionando cada vez mais eficiência energética aos data centers, a série 910 também aumenta o desempenho em 38% por watt e oferece suporte a 16 configurações de modo de energia, variando de 10 W a 25 W.

No que diz respeito ao desempenho, o Memblaze cita a série 910 com até 6 GB/s e 3.8 GB/s para leituras e gravações, respectivamente, e 1 milhão de IOPS de leitura e 135,000 IOPS de gravação em taxa de transferência aleatória sustentada.

A série PBlaze5 910 suporta criptografia de dados AES 256, proteção completa do caminho de dados e proteção aprimorada contra falha de energia para ajudar a garantir a integridade dos dados de aplicativos corporativos. Ele também possui uma função de porta dupla, essencialmente eliminando o problema de falha de caminho único, pois ambas as portas podem ser acessadas simultaneamente.

Especificações Memblaze PBlaze5 910 NVMe SSD

Fator de forma HHHL AIC
Capacidade 3.84TB 7.68TB
NAND eTLC 3D
Interface PCIe 3.0 x 8
Protocolo NVMe 1.2a
Desempenho
Leitura sequencial (128 KB) 5.5GB / s 6.0GB / s
Gravação sequencial (128 KB) 3.1GB / s 3.8GB / s
Leitura aleatória sustentada (4 KB) IOPS 850K 1 milhão de IOPS
Gravação aleatória sustentada (4 KB) IOPS 99K IOPS 135K
Latência R/W 87 / 12μs
DWPD 1
UBER <10^-17
MTBF 2 milhões de horas
Consumo de energia  7 ~ 25W

 

Desempenho

Mesa de teste

Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.

Lenovo Think System SR850

  • 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • 2 x placas RAID 930-8i 12 Gb/s
  • 8 compartimentos NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 16 x 16 GB DDR4-2666 MHz ECC DRAM
  • 1 placa RAID PERC 730 2GB 12Gb/s
  • Adaptador NVMe Complementar
  • Ubuntu-16.04.3-desktop-amd64

Histórico de testes e comparáveis

Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nas respectivas páginas.

Comparáveis ​​para esta revisão:

Análise de carga de trabalho do aplicativo

Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Memblaze PBlaze5 910 são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.

Desempenho do SQL Server

Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.

Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.

Configuração de teste do SQL Server (por VM)

  • Windows Server 2012 R2
  • Ocupação de armazenamento: 600 GB alocados, 500 GB usados
  • SQL Server 2014
    • Tamanho do banco de dados: escala 1,500
    • Carga de cliente virtual: 15,000
    • Memória RAM: 48 GB
  • Duração do teste: 3 horas
    • 2.5 horas de pré-condicionamento
    • período de amostra de 30 minutos

Para nosso benchmark transacional do SQL Server, o Memblaze PBlaze5 910 AIC apresentou o melhor desempenho com 12,645.1 TPS.

O modelo 910 AIC também teve a menor latência de apenas 1.5 ms, metade da latência do segundo colocado Huawei ED3000.

Desempenho do Sysbench

O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.

Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tabelas de banco de dados: 100
    • Tamanho do banco de dados: 10,000,000
    • Segmentos de banco de dados: 32
    • Memória RAM: 24 GB
  • Duração do teste: 3 horas
    • 2 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos

Com o benchmark transacional Sysbench, o AIC 910 manteve seu impressionante desempenho com 9,190.7 TPS, o que o colocou no topo da tabela de classificação.

Com a latência média do Sysbench, o AIC 910 novamente foi o melhor desempenho com 13.9 ms.

Em nosso benchmark de latência de pior cenário, o AIC 910 se encontrou no topo do pacote com apenas 25.9 ms.

Houdini por SideFX

O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para esta aplicação é uma variante do núcleo Dell PowerEdge R740xd tipo de servidor que usamos no laboratório com duas CPUs Intel 6130 e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.

A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:

  1. Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
  2. Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
  3. (Not Run) Processa os pontos.
  4. Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
  5. (Não executado) Grava os blocos agrupados de volta no disco.

Com o teste de Houdini, o 910 AIC ficou do meio para o final inferior com 3,077.7 segundos, logo acima do modelo U.2 e entre os produtos Memblaze.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Em nossa primeira análise de carga de trabalho VDBench, leitura aleatória de 4K, o Memblaze PBlaze5 910 AIC conseguiu ficar abaixo de 1ms durante todo o teste com um pico de 814,640 IOPS e uma latência de 155.9μs, ficando em primeiro lugar.

Novamente, o desempenho de gravação aleatória de 4K mostrou novamente latência abaixo de milissegundos. O 910 AIC ficou em segundo lugar entre os test drives (o PBlaze 900 ficou em primeiro) com um desempenho máximo de 550,864 IOPS e uma latência de 229.3 μs.

Mudando para cargas de trabalho sequenciais, o 910 AIC ficou no topo do pacote em leituras sequenciais de 64K com pontuação máxima de 50,372 IOPS ou 3.14 GB/s com latência de 317 μs.

Mudando de lugar com o PBlaze 900, o 910 AIC atingiu o pico de 42,563 IOPS ou 2.66 GB/s com uma latência de 370μs na gravação sequencial de 64K.

Passando para cargas de trabalho SQL, o 910 AIC atingiu o pico de 270,432 IOPS com apenas 117.8 μs de latência, o que o colocou no topo da tabela de classificação mais uma vez.

O SQL 90-10 viu o 910 reter o primeiro lugar por uma grande margem com uma pontuação máxima de 273,321 IOPS e uma latência de 116.6 μs.

O 910 AIC atingiu o pico de 277,815 IOPS com uma latência de 114,μs no benchmark SQL 80-20, mantendo-o no topo da tabela de classificação.

Em nossa carga de trabalho Oracle, o 910 AIC continuou seu domínio com uma pontuação máxima de 282,326 IOPS e uma latência de 126.2 μs.

Para o Oracle 90-10, o 910 AIC mostrou um pico de 202,695 IOPS e uma latência de 108 μs para o primeiro lugar.

Em 80-20, o 910 encerrou seus testes Oracle com um desempenho máximo impressionante de 210,228 IOPS e uma latência de 104μs.

Em seguida, passamos para nosso benchmark de clone VDI, Full and Linked, onde o 910 AIC mostrou desempenho superior na maioria dos testes. Para VDI Full Clone Boot, o 910 AIC teve um desempenho máximo de 219,337 IOPS e uma latência de 158.2 μs.

O VDI FC Initial Login viu o 910 AIC com um desempenho máximo de 150,121 IOPS e uma latência de 197μs para o primeiro lugar.

Com o VDI FC Monday Login, o 910 AIC terminou em 2nd fica logo atrás da Huawei com 101,128 IOPS e uma latência de 156.3μs.

Mudando para Linked Clone (LC), primeiro examinamos o teste de inicialização. Nesse cenário, o 910 AIC ficou em primeiro lugar com 98,284 IOPS e latência de 161.3μs.

O VDI LC Initial Login mostrou desempenho virtualmente idêntico entre o 910 AIC e o Huawei com 55,061 IOPS e uma latência de 143.4 μs.

No teste VDI LC Monday Login, o Huawei e o 910 AIC novamente mostraram desempenho igual, com um pico de 77,721 IOPS e uma latência de 203.8μs, ficando novamente em quarto lugar.

Conclusão

Composto por modelos de fator de forma U.2 e AIC, o PBlaze5 910 da Memblaze é sua mais nova unidade de data center NVMe que usa NAND 64D de 3 camadas. Analisamos o modelo AIC para esta análise, que vem com capacidades de 3.84 TB e 7.68 TB e desempenho cotado para atingir 6.0 GB/s de leitura e 3.8 GB/s de gravação, ao mesmo tempo em que reivindica desempenho de taxa de transferência de até 1 milhão de IOPS de leitura. O 910 AIC tem o poder necessário para se destacar em praticamente qualquer aplicação para a qual é usado, juntamente com uma variedade de recursos de proteção, incluindo criptografia de dados AES 256 e suporte à função TRIM de até 8 TB/s.

Mergulhar nos detalhes do desempenho mostrou o 910 AIC no topo da tabela de classificação em muitas de nossas cargas de trabalho testadas. Em nossos benchmarks do SQL Server, ele ficou em primeiro lugar com 12,645.1 TPS e uma latência média de apenas 1.5ms. No Sysbench, o drive teve desempenho no topo da tabela de classificação novamente com 9,190.7 TPS, latência média de 13.3ms e uma latência de pior cenário de 25.9ms. Em nosso benchmark Houdini by SideFX, o 910 AIC registrou 3,077.7 segundos, o que foi um pouco melhor que o modelo U.2 e entre os outros produtos Memblaze. Em nosso benchmark VDBench, o 910 AIC manteve uma latência abaixo de um milissegundo em todos os nossos testes, onde foi o melhor desempenho na maioria das categorias. Na leitura e gravação aleatória de 4K, o Memblaze PBlaze5 910 AIC atingiu 814,640 IOPS e 550,864 IOPS, respectivamente, enquanto as cargas de trabalho sequenciais registraram 3.14 GB/s e 2.66 GB/s, respectivamente. Os resultados do SQL mantiveram cerca de um quarto de milhão de IOPS com os testes Oracle rodando entre 277,000 IOPS e 270,000 IOPS.

Passando de uma interface x4 para x8, o Memblaze PBlaze5 910 oferece um grande aumento no desempenho em comparação com a versão de fator de forma U.2 na família sme. Em geral, o AIC 910 mostrou seus pontos fortes em relação aos modelos U.2 com interface limitada e mostra aos clientes o que é possível se o aplicativo fornecido puder aproveitar o fator de forma maior.

Membrana PBlaze5 910

Discuta esta revisão

Inscreva-se no boletim informativo StorageReview