ArmazenamentoReview.com

Análise do SSD DapuStor H3201 E1.S

Empreendimento  ◇  SSD

O Dapustor Haishen3 H3200 é um SSD NVMe com baixo consumo de energia, destinado a uma variedade de aplicações diferentes. Hoje, veremos a iteração da régua (E1.S) da linha H3200 (especificamente rotulada como H3201), que vem em duas capacidades com KIOXIA 112D Enterprise NAND de 3 camadas e um controlador Marvell. Anteriormente revisamos o DapuStor H3200— o modelo de fator de forma U.2. Embora o fator de forma U.2 seja mais adequado para uso pesado, como em data centers, vigilância por vídeo e computação de borda, a versão E1.S foi projetada principalmente para dar aos hiperescaladores alguma flexibilidade em relação ao desempenho e densidade, tudo dentro de um pequeno (ou seja, , apenas um pouco maior do que um fator de forma de unidade M.2).

DapuStor H3201

DapuStor H3201

No que diz respeito à sua pegada física, os benefícios do E1.S são substanciais. Com a versão U.2 do H3200, você pode realmente colocar apenas 10-12 deles dentro de um chassi de servidor 1U (sem ter que usar midplanes ou outros métodos demorados). Com o H3200 E1.S, você pode acomodar 24 unidades montadas na frente no mesmo sistema 1U, todas com hot-swappable com recursos de nível empresarial. Isso é extremamente importante para OEM e hiperescala. Como resultado, o modelo E1.S permitirá que as organizações criem um servidor 1U significativamente mais denso.

Controlador DapuStor H3201

O DapuStor H3201 é destacado por recursos de segurança, como proteção de dados de ponta a ponta no caminho do firmware e do hardware, incluindo DDR ECC, LDPC, proteção contra perda de energia. Em termos de desempenho, o DapuStor H3.84 de 3201 TB é cotado para atingir velocidades sequenciais de até 3,400 MB/s de leitura e 2,500 MB/s de gravação, enquanto o desempenho aleatório de 4K deve atingir até 720,000 IOPS de leitura e 105,000 IOPS de gravação.

Para confiabilidade, o H3201 apresenta uma classificação de resistência de 1 DWPD. A DapuStor oferece outro modelo E1.S em um ponto de capacidade de 3.2 TB, apelidado de “H3101”. Esta versão é o modelo de maior resistência, que oferece melhor desempenho de gravação aleatória (220 IOPS) e uma vida útil muito mais longa com 3 gravações de unidade por dia.

Todos os modelos da linha DapuStor H3200 possuem garantia de 5 anos.

DapuStor H3201 E1.S Especificações

Modelo No. DapuStore H3201
Capacidade (TB1) 3.84TB
Esboço E1.S
Protocolo de Interface PCle3.0×4 NVMe 1.3, porta dupla
Tipo de flash KIOXIA 3D NAND, TLC empresarial de 112 camadas e 2 planos
Largura de banda de leitura (128 KB) MB/s 3,400MB / s
Largura de banda de gravação (128 KB) MB/s 2,500MB / s
Leitura Aleatória (4KB) KIOPS 720,000 IOPS
Gravação Aleatória (4KB) KIOPS 105,000 IOPS
Consumo de energia 8.0 W típico / 10.5 W máximo
Latência aleatória de 4K (Típico) R/R < 85 μs
Latência Sequencial 4K (Típico) R/W μs < 15 μs
Tempo de vida 1 DWPD
Taxa de erro de bit incorrigível (UBER) 1 setor por 10^17 bits lidos
Tempo médio entre falhas (MTBF) 2 milhões de horas
Garantia 5 Anos

Desempenho DapuStor H3201 E1.S

Mesa de teste

Nossas análises de SSD PCIe Gen4 Enterprise aproveitam um Lenovo Think System SR635 para testes de aplicativos e benchmarks sintéticos. O ThinkSystem SR635 é uma plataforma AMD de CPU única bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. É também a única plataforma em nosso laboratório (e uma das poucas no mercado atualmente) com baias PCIe Gen4 U.2. Os testes sintéticos não exigem muitos recursos da CPU, mas ainda utilizam a mesma plataforma Lenovo. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.

PCIe Gen4 sintético e plataforma de aplicativos (Lenovo ThinkSystem SR635)

  • 1 x AMD 7742 (2.25 GHz x 64 núcleos)
  • 8 x 64 GB DDR4-3200 MHz ECC DRAM (1 x 64 GB para Houdini)
  • CentOS 7.7 1908
  • Ubuntu 20.10-desktop
  • ESXi 6.7u3

Histórico de testes e comparáveis

Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nessas respectivas páginas.

Análise de carga de trabalho do aplicativo

Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o DapuStor H3200 são, portanto, os Desempenho OLTP do MySQL via SysBench e  Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.

Desempenho do SQL Server

Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.

Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.

Configuração de teste do SQL Server (por VM)

  • Windows Server 2012 R2
  • Ocupação de armazenamento: 600 GB alocados, 500 GB usados
  • SQL Server 2014
    • Tamanho do banco de dados: escala 1,500
    • Carga de cliente virtual: 15,000
    • Memória RAM: 48 GB
  • Duração do teste: 3 horas
    • 2.5 horas de pré-condicionamento
    • período de amostra de 30 minutos

Para nosso benchmark transacional do SQL Server, o DapuStor H3201 E1.S teve uma pontuação média de 12,650 TPS em 4 VMs, o que foi uma pontuação sólida. A versão U.2 teve média de 12,646 TPS.

Na latência média, o DapuStor H3200 apresentou outro resultado sólido com 2.5ms, enquanto a versão U.2 apresentou uma média significativamente maior de 126.5ms.

Desempenho do Sysbench

O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.

Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tabelas de banco de dados: 100
    • Tamanho do banco de dados: 10,000,000
    • Segmentos de banco de dados: 32
    • Memória RAM: 24 GB
  • Duração do teste: 3 horas
    • 2 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos

Observando nosso benchmark transacional Sysbench, o DapuStor H3200 E1.S apresentou uma sólida pontuação agregada de 8,646, muito melhor do que o TPS médio de 3200 do modelo H2 U.7,879.

O E1.S H3200 continuou seu bom desempenho com latência média Sysbench, onde atingiu 14.8 ms. O modelo H3200 U.2 voltou a ficar atrás com uma média de 23.3ms.

Para nossa latência de pior cenário (99º percentil), o H3200 teve uma latência impressionante de 27.61ms, enquanto a versão H3200 U.2 teve 31.18ms.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Comparáveis:

Nossa primeira análise de carga de trabalho VDBench é uma leitura aleatória de 4K. Aqui, o H3201 E1.S registrou uma pontuação máxima de 719,236 IOPS lida a 709.2 µs. Em comparação, a versão H3200 U.2 atingiu o pico de 788,774 IOPS com uma latência muito menor de 161µs.

Para gravação aleatória de 4K, o H3201 E1.S atingiu 312,913 IOPS a 1,623.4 µs, enquanto o modelo H3200 U.2 atingiu 274,362 IOPS a uma latência de 463 µs.

Mudando para cargas de trabalho sequenciais de 64k, o H3201 apresentou ótimos resultados com desempenho máximo de 50,344 IOPS (ou 3.15 GB/s) com latência de 1,269.6 µs, enquanto o modelo H3200 U.2 atingiu o pico de 52,860 IOPS (ou 3.3 GB/s ) com latência de 301.8µs.

Na gravação de 64k, o modelo DapuStor H3201 ES.1 atingiu o pico de 20,251 IOPS (ou 1.27 GB/s); no entanto, sofreu um grande impacto na latência no final do teste, terminando em 3,147.5µs. A versão H3200 U.2 atingiu 22,654 IOPS (ou 1.42 GB/s) e 699.3 ms.

Nosso próximo conjunto de testes são nossas cargas de trabalho SQL: SQL, SQL 90-10 e SQL 80-20. Começando com SQL, e como esperado, o modelo DapuStor H3200 U.2 apresentou resultados visivelmente melhores, onde atingiu um pico de 281,512 IOPS com uma latência de apenas 113.2µs. O modelo H3201 E1.S atingiu o pico de 219,870 IOPS com uma latência de 144.1µs.

No SQL 90-10, o H3201 E1.S apresentou um pico de 200,283 IOPS a 158.3 µs, enquanto o modelo H3200 U.2 registrou 259,351 IOPS e 118.3 µs.

Com o SQL 80-20, o H3201 E1.S atingiu o pico de 182,944 a 173.2µs, enquanto o modelo H3200 U.2 apresentou 247,053 IOPS com uma latência de 129µs.

A seguir estão nossas cargas de trabalho Oracle: Oracle, Oracle 90-10 e Oracle 80-20. Começando com Oracle, o DapuStor H3201 E1.S atingiu um pico de 174,220 IOPS com uma latência de 204.1µs. O modelo H3200 U.2 atingiu 263,217 IOPS com uma latência de 132.8 µs.

Olhando para o Oracle 90-10, o modelo DapuStor H3201 E1.S atingiu o pico de 164,870 IOPS com 131µs de latência, enquanto o modelo H3200 U.2 atingiu 218,213 IOPS a 100.4µs.

Com o Oracle 80-20, o H3201 E1.S atingiu o pico de 155,614 a 139.7 µs, enquanto o modelo H3200 U.2 atingiu o pico de 212,157 IOPS com uma latência de 103.1 µs.

Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para inicialização VDI Full Clone (FC), o DapuStor H3201 E1.S teve um pico de 135,628 IOPS a 255µs, enquanto o modelo H3200 U.2 atingiu 191,069 IOPS a uma latência de 179.1µs.

O login inicial do VDI FC viu o DapuStor H3201 E1.S atingir o pico de 68,248 IOPS a 439.1 µs, enquanto o modelo H3200 U.2 atingiu 115,354 IOPS com uma latência de 259.2 µs.

Para VDI FC Monday Login, o H3201 atingiu o pico de 53,529 IOPS a 293.9 µs, enquanto o modelo H3200 U.2 atingiu 87,136 IOPS a uma latência de 182.6 µs.

Para VDI Linked Clone (LC) Boot, o H3201 E1.S atingiu o pico de 69,288 IOPS a 229.7 µs, enquanto o drive H3200 U.2 foi capaz de atingir 95,726 IOPS com uma latência de 166.5 µs.

O VDI LC Initial Login mostrou uma pontuação máxima de 17,926 IOPS a 443.1 µs, enquanto o modelo H3200 U.2 atingiu um pico de 50,750 IOPS com uma latência de 154.9 µs.

Por fim, com o VDI LC Monday Login, o DapuStor H3201 E1.S mostrou um desempenho muito instável ao se aproximar de 20K IOPS, com picos que chegaram a um máximo de pouco menos de 40K e perto da marca de 400µs. O modelo H3200 U.2 apresentou desempenho muito estável, com pico de 66,846 IOPS a 236.9 µs.

Conclusão

O DapuStor H3201 é uma solução Gen3 NVMe SSD que apresenta NAND 112D de 3 camadas da KIOXIA e um controlador Marvell. Ele vem apenas no formato E1.S em uma capacidade (3.84 TB), tornando-o principalmente uma unidade para ambientes de hiperescala no momento. Aqueles que procuram maior resistência têm a opção do modelo H3201, que apresenta desempenho de gravação aprimorado e uma classificação DWPD mais alta.

DapuStor H3201 de volta

Durante nossos testes, comparamos o drive com o H3200, a versão U.2 da linha DapuStor Haishen3. Para Application Workload Analysis, o DapuStor H3201 nos deu alguns resultados bastante sólidos, atingindo 12,646 TPS em 4 VMs e 2.5 ms em latência média. Para Sysbench, a unidade atingiu 8,646 TPS, 14.8ms em latência média e 27.61ms para latência de pior cenário, todos com desempenho de nível superior.

Durante nosso teste VDbench, o desempenho diminuiu em relação ao modelo U.2. Os destaques incluídos: 719,236 IOPS na leitura de 4K, 312,913 IOPS na gravação de 4K, 3.15 GB/s na leitura de 64 K e 1.27 GB/s na gravação de 64 K. Em cargas de trabalho SQL, atingiu 219,870 IOPS enquanto atingiu 200,283 IOPS para SQL 90-10 e 182,944 IOPS para SQL 80-20. Para nossas cargas de trabalho Oracle, atingiu um pico de 174,220 IOPS, 164,870 IOPS no Oracle 90-10 e 155,614 IOPS no Oracle 80-20. Em nossos testes VDI Full Clone, o H3200 atingiu 135,628 (inicialização), 68,248 IOPS (login inicial), 53,529 IOPS (login de segunda-feira), enquanto o Linked Clone registrou 69,288 IOPS (inicialização), 17,926 IOPS (login inicial) e um pico muito instável de ~40K IOPS (login na segunda-feira).

Embora os casos de uso de aplicativos para a régua sejam bastante limitados no momento (por exemplo, hiperescala), especialmente para essas unidades finas sem sincronização de calor, Servidores E1.S estão prestes a se tornar mainstream. Isso aumentará significativamente o número de slots de unidade disponíveis para servidores corporativos e, por sua vez, resultará em novos servidores e sistemas de armazenamento baseados em IOPS de alta densidade e com um grande foco na capacidade de manutenção. O DapuStor H3201 usa uma interface Gen3 mais antiga, mas o desempenho é promissor e esta deve ser uma boa plataforma para o DapuStor avançar para os SSDs Gen4 e Gen5 E1.S.

DapuStorGenericName

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram: | Twitter | TikTok | RSS feed

Lyle Smith

Lyle é redator de longa data da StorageReview, cobrindo um amplo conjunto de tópicos de TI para usuários finais e empresas.