A Memblaze lançou uma série de SSDs 64D NAND NVMe de 3 camadas na série PBlaze5 910-916. As unidades foram lançadas nos formatos U.2 e AIC, com o 910 indo até 15.36 TB de capacidade. A versão de maior resistência da unidade é o 916. Anteriormente, analisamos o SSD 916 U.2 e agora estão focando na versão HHHL AIC de alto desempenho.
A Memblaze lançou uma série de SSDs 64D NAND NVMe de 3 camadas na série PBlaze5 910-916. As unidades foram lançadas nos formatos U.2 e AIC, com o 910 indo até 15.36 TB de capacidade. A versão de maior resistência da unidade é o 916. Anteriormente, analisamos o SSD 916 U.2 e agora estão focando na versão HHHL AIC de alto desempenho.
O Memblaze PBlaze5 916 AIC SSD vem com todos os benefícios da versão U.2, incluindo AES 256 Data Encryption, Full Data Path Protection e Enhanced Power Failure protection. As versões 916 também têm maior resistência, suportando 3 DWPD contra o 910 que suporta apenas 1 DWPD. O 916 AIC aproveita as quatro pistas extras para aumentar ainda mais o desempenho com velocidades cotadas de até 5.9 GB/s de leitura e 2.8 GB/s de gravação com taxa de transferência de até 1 milhão de IOPS de leitura e 303 mil IOPS de gravação.
O SSD Memblaze PBlaze5 916 AIC vem em 3.2 TB e 6.4 TB, para esta análise, estamos analisando a versão de 6.4 TB.
Memblaze PBlaze5 Série 916 Especificações AIC
Capacidade do usuário (TB) | 3.2, 6.4 |
Fator de Forma | HHHL AIC |
Interface: | PCIe 3.0 x 8 |
Leitura sequencial (128 KB) (GB/s) | 5.5, 5.9 |
Gravação sequencial (128 KB) (GB/s) | 3.1, 3.8 |
IOPS de leitura aleatória sustentada (4 KB) | 850K, 1,000K |
Gravação aleatória sustentada (4 KB) IOPS (estado estacionário) | 210K, 303K |
Latência de Leitura/Gravação | 87/11μs |
Resistência vitalícia | 3 DWPD |
UBER | <10-17 |
MTBF | 2 milhões de horas |
Protocolo | NVMe 1.2a |
Memória flash NAND | 3D eTLC NAND |
Sistema operacional | RHEL, SLES, CentOS, Ubuntu, Windows Server, VMware ESXi |
Consumo de energia | 7 ~ 25 W |
Suporte a recursos básicos | Proteção contra falha de energia, Hot Pluggable, Proteção completa do caminho de dados, SMART: TRIM, Multi-namespace, AES 256 Data Encryption, Fast Reboot, Crypto Erase, |
Suporte a recursos avançados | TRIM, Multi-namespace, criptografia de dados AES 256, reinicialização rápida, apagamento de criptografia, porta dupla |
Suporte de software | Ferramenta de gerenciamento de código aberto, ferramenta de depuração CLI, driver nativo do sistema operacional (Fácil integração do sistema) |
Desempenho
Mesa de teste
Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.
Lenovo Think System SR850
- 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- 2 x placas RAID 930-8i 12 Gb/s
- 8 compartimentos NVMe
- VMware ESXI 6.5
Dell PowerEdge R740xd
- 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 4 x 16 GB DDR4-2666 MHz ECC DRAM
- 1 placa RAID PERC 730 2GB 12Gb/s
- Adaptador NVMe Complementar
- Ubuntu-16.04.3-desktop-amd64
Histórico de testes e comparáveis
A Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.
Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nas respectivas páginas.
Comparáveis para esta revisão:
- Memblaze PBlaze5 3.2TB
- Elemento Líquido AIC 7.68 TB
- SSD Intel DC P4610 1.6 TB
- Huawei ES3000 V5 3.2 TB
- SSD Intel DC P4510 2 TB, 8 TB
- Memblaze PBlaze5 910 AIC 7.68 TB
Análise de carga de trabalho do aplicativo
Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Memblaze PBlaze5 916 são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.
Desempenho do SQL Server
Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.
Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.
Configuração de teste do SQL Server (por VM)
- Windows Server 2012 R2
- Ocupação de armazenamento: 600 GB alocados, 500 GB usados
- SQL Server 2014
- Tamanho do banco de dados: escala 1,500
- Carga de cliente virtual: 15,000
- Memória RAM: 48 GB
- Duração do teste: 3 horas
- 2.5 horas de pré-condicionamento
- período de amostra de 30 minutos
Para nosso benchmark transacional do SQL Server, o Memblaze PBlaze5 916 AIC ficou em terceiro lugar com 12,645.0 TPS, embora estivesse a apenas 1.1 TPS do primeiro lugar.
Para obter uma melhor compreensão do desempenho, a latência também precisa ser observada. Aqui o 916 AIC ficou em segundo lugar com apenas 1.3 ms, superando o resto da série 910/916.
Desempenho do Sysbench
O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.
Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.
Configuração de teste do Sysbench (por VM)
- CentOS 6.3 64 bits
- Percona XtraDB 5.5.30-rel30.1
- Tabelas de banco de dados: 100
- Tamanho do banco de dados: 10,000,000
- Segmentos de banco de dados: 32
- Memória RAM: 24 GB
- Duração do teste: 3 horas
- 2 horas de pré-condicionamento 32 tópicos
- 1 hora 32 tópicos
Com o benchmark transacional Sysbench, o 916 AIC ficou em segundo lugar com 9,298 TPS.
Para latência média do Sysbench o 916 AIC ficou em segundo lugar com 13.8ms.
Para a latência do pior cenário (99º percentil), o 916 AIC ficou em primeiro lugar com apenas 25.2ms de latência.
Houdini por SideFX
O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para esta aplicação é uma variante do núcleo Dell PowerEdge R740xd tipo de servidor que usamos no laboratório com duas CPUs Intel 6130 e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.
A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:
- Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
- Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
- (Not Run) Processa os pontos.
- Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
- (Não executado) Grava os blocos agrupados de volta no disco.
Com o teste de Houdini, o 916 AIC teve uma pontuação de 3,070.7 segundos parando no ponto morto das unidades não Optane e bem contra o 910 AIC.
Análise de Carga de Trabalho do VDBench
Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.
perfis:
- Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
- Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
- Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
- Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
Em nossa primeira VDBench Workload Analysis, Random 4K Read, o Memblaze PBlaze5 916 AIC foi comparado a dois outros drives AIC: o Memblaze PBlaze5 910 e o Liqid Element. Aqui, o 916 correu pescoço a pescoço logo atrás do 910, com o Liquid saindo na liderança. O 916 começou em 81,010 IOPS com 99μs e atingiu o pico em 809,069 IOPS com uma latência de 157μs.
A gravação aleatória de 4K mostrou o mesmo posicionamento para o 916, por último. Aqui o 916 começou com 64,157 IOPS com apenas 17.7μs. A unidade conseguiu ficar abaixo de 100μs, na verdade 25μs, até cerca de 578K IOPS, onde atingiu o pico antes de cair.
Mudando para cargas de trabalho sequenciais, primeiro examinamos as leituras sequenciais de 64K. Aqui, o 916 mais uma vez entrou no final do nosso pacote, apenas atrás do 910. O 916 atingiu o pico de 50,011 IOPS ou 3.13 GB/s com uma latência de 319 μs.
A gravação de 64K viu o 916 deslizar para o segundo lugar logo atrás do 910. Aqui, o 916 começou com 4,308 IOPS ou 256 MB/s e montou a linha de latência de 50μs até 30K IOPS ou 1.85 GB/s antes de chegar ao pico de 42,319 IOPS ou 2.65 GB/s com latência de 370μs.
Em seguida, temos nossas cargas de trabalho SQL, aqui novamente o 916 estava na parte inferior, mas apenas um pouco do 916. O 916 começou em 27,120 IOPS com latência de 100.9 μs e atingiu o pico em 269,845 IOPS com uma latência de 118.1 μs. Apenas uma diferença de latência de 18μs do começo ao fim.
Para o SQL 90-10, o 916 ficou em terceiro, começando com 27,381 IOPS e uma latência de 97.7μs. O 916 ultrapassou 100μs a cerca de 82K IOPS e atingiu o pico de 273,081 IOPS com uma latência de 116.3μs.
Com o SQL 80-20, o posicionamento do 916 foi o mesmo, começando com 28,023 IOPS e 88.9μs de latência e atingiu o pico de 277,572 IOPS com uma latência de 114.6μs.
Para nossa carga de trabalho Oracle, o 916 mal superou o 910. Aqui, a unidade começou em 30,716 IOPS com uma latência de 91.2 μs e atingiu o pico em 282,888 IOPS com uma latência de 126.2 μs.
O Oracle 90-10 viu o 916 cair para durar, por pouco. Aqui, a unidade começou em 40,494 IOPS com uma latência de 98.2 μs e atingiu o pico em 202,512 IOPS com uma latência de 107.9 μs.
Para o Oracle 80-20, vemos o 916 novamente mal ocupando o segundo lugar do 910. A unidade começou em 42,276 IOPS com uma latência de 87.6μs e permaneceu abaixo de 100μs até cerca de 169K IOPS chegando ao pico de 210,628 IOPS com uma latência de 103.8μs .
Em seguida, passamos para nosso teste de clone VDI, Full and Linked. Para VDI Full Clone Boot, o 916 ficou em terceiro, começando com 22,788 IOPS com latência de 107.9 μs e atingiu o pico de 218,323 IOPS com 158.9 μs de latência.
Para VDI FC Initial Login, o 916 ficou em segundo lugar para o 910 começando em 15,487 IOPS com uma latência de 69.7μs e permaneceu abaixo de 100μs até cerca de 65K IOPS. A unidade atingiu um pico de 147,777 IOPS e uma latência de 199.4 μs.
O VDI FC Monday Login teve a tomada 916 primeiro, começando em 10,213 IOPS e uma latência de 89.4 μs. A unidade permaneceu abaixo de 100μs até cerca de 35K IOPS e atingiu o pico de 101,673 IOPS com uma latência de 155.5μs.
Para o VDI Linked Clone (LC), começamos mais uma vez com o teste de inicialização. Aqui, o 916 ficou em terceiro lugar, começando com 9,598 IOPS com latência de 127μs e atingiu o pico de 98,621 IOPS com uma latência de 161.6μs.
No VDI LC Initial Login, o 916 superou o 910 para ficar em segundo. Aqui, a unidade começou em 5,599 IOPS com uma latência de 94.2 μs e ultrapassou 100 μs com cerca de 20 IOPS. O 916 atingiu um pico de 55,416 IOPS com uma latência de 142.1 μs.
Finalmente, o VDI LC Monday Login viu o 916 ser o primeiro com um desempenho máximo de 78,483 IOPS e uma latência de 201.3 μs.
Conclusão
O Memblaze PBlaze5 916 é um dos SSDs 64D NAND NVMe de 3 camadas da empresa. Para esta revisão em particular, analisamos o fator de forma AIC. O fator de forma AIC permite todos os mesmos benefícios da linha 916, criptografia de dados AES 256, proteção completa do caminho de dados, proteção aprimorada contra falha de energia e maior resistência, enquanto fornece desempenho ainda maior do que sua contraparte U.2. O 916 AIC tem velocidades cotadas de até 5.9 GB/s de leitura e 2.8 GB/s de gravação com taxa de transferência de até 1 milhão de IOPS de leitura e 303K IOPS de gravação junto com 3DWPD.
Para nossa análise de carga de trabalho do aplicativo, o Memblaze PBlaze5 916 AIC mostrou forte desempenho no SQL Server e no Sysbench. A unidade ficou em terceiro lugar na saída do SQL Server com 12,645 TPS e uma latência média de 1.3 ms, colocando-a em segundo lugar. Para o Sysbench, o 916 AIC teve 9,298 TPS, uma latência média de 13.8ms e ocupou o primeiro lugar em nossa latência de pior cenário com 25.2ms. Houdini mostrou um desempenho menos forte com 3070.7 segundos.
Para o nosso VDBench, testamos o 916 AIC contra dois outros modelos AIC, o Memblaze PBlaze5 910 AIC e o Liqid Element AIC. Aqui o desempenho foi bom, mas o posicionamento fez com que parecesse misto. Freqüentemente, o 916 chegava em último contra os outros dois drives, mas estava perto do 910 todas as vezes. Os destaques incluem uma pontuação de leitura aleatória de 4K de 809K IOPS, uma pontuação de gravação aleatória de 4K de 578K IOPS, uma pontuação sequencial de 64K de 3.13 GB/s e uma pontuação de gravação sequencial de 2.65 GB/s. O que é mais interessante aqui foi a latência. Mesmo no pico, 370μs foi o mais alto com a unidade executando abaixo de 25μs durante a maior parte da gravação aleatória de 4K. O SQL apresentou pontuações máximas acima de um quarto de milhão de IOPS em cada teste e a latência variou de 88.9μs a apenas 118.1μs, muito baixa e consistente em todos os testes. As pontuações de pico do Oracle não foram tão fortes quanto as do SQL (embora o primeiro tenha sido de 283K IOPS), mas apresentou outra demonstração de baixa latência consistente, variando de 87.6 μs a 126.2 μs no pico mais alto.
O Memblaze PBlaze5 916 AIC é a escolha ideal para aplicações que precisam de latência consistente e baixa. Embora a natureza do Add In Card faça com que ele desista da capacidade de troca a quente (tornando-o uma manutenção potencialmente mais alta - embora também tenha alta resistência), ele mais do que compensa isso no desempenho, especialmente no desempenho de latência.
Inscreva-se no boletim informativo StorageReview