A interface NVMe, especificamente PCIe 3.0 NVMe 1.3, tem sido a interface SSD preferível para praticamente qualquer caso de uso por um tempo. Essa interface tem sido usada repetidamente à medida que os fornecedores continuam a melhorar o desempenho a cada nova geração. O PCIe agora entrou na versão 4.0, trazendo consigo enormes ganhos em desempenho sequencial e aleatório. O KIOXIA CD6 é o mais recente SSD a chegar ao mercado (e um dos primeiros PCIe 4.0 para empresas), com foco em desempenho consistente em ambientes exigentes 24 horas por dia, 7 dias por semana. Isso o torna ideal para data centers com uso misto e necessidades de resistência de leitura intensiva. Os SSDs KIOXIA CD6 também são compatíveis com SFF-TA-1001, o que permite conectividade com unidades SAS, SATA e NVMe no mesmo backplane (assim como controladores Tri-mode). A linha KIOXIA apresenta capacidades que variam de 800GB a 15.36TB e estão disponíveis em diversas opções de segurança e resistência.
A interface NVMe, especificamente PCIe 3.0 NVMe 1.3, tem sido a interface SSD preferível para praticamente qualquer caso de uso por um tempo. Essa interface tem sido usada repetidamente à medida que os fornecedores continuam a melhorar o desempenho a cada nova geração. O PCIe agora entrou na versão 4.0, trazendo consigo enormes ganhos em desempenho sequencial e aleatório. O KIOXIA CD6 é o mais recente SSD a chegar ao mercado (e um dos primeiros PCIe 4.0 para empresas), com foco em desempenho consistente em ambientes exigentes 24 horas por dia, 7 dias por semana. Isso o torna ideal para data centers com uso misto e necessidades de resistência de leitura intensiva. Os SSDs KIOXIA CD6 também são compatíveis com SFF-TA-1001, o que permite conectividade com unidades SAS, SATA e NVMe no mesmo backplane (assim como controladores Tri-mode). A linha KIOXIA apresenta capacidades que variam de 800GB a 15.36TB e estão disponíveis em diversas opções de segurança e resistência. O CD6 também vem em fatores de forma Z de 2.5 polegadas e 15 mm de altura e é alimentado pelo controlador proprietário da KIOXIA, firmware e memória BiCS FLASH 96D TLC de 3 camadas. Ele usa um design de porta única (ou seja, há um caminho de dados do host para o SSD).
ATUALIZAÇÃO 4/2/22 – Revisamos o Kióxia CD6 com firmware mais maduro
O desempenho do PCIe 4.0 tem potencial para atingir números incríveis, e o KIOXIA CD6 certamente não é exceção. A KIOXIA cita sua nova linha de drive para oferecer desempenho sequencial de até 6.2 GB/s e 4.0 GB/s em leituras e gravações, respectivamente, enquanto o desempenho aleatório tem o potencial de atingir até um milhão de IOPS em leituras e 250,000 IOPS em gravações. Estes são números impressionantes para dizer o mínimo.
Ele também possui uma gama de funcionalidade de confiabilidade integrada, incluindo recuperação de falha de unidade de 6ª geração e proteção de dupla paridade e proteção contra perda de energia (PLP), correção de dados de ponta a ponta para confiabilidade extra. O KIOXIA CD6 é compatível com NVMe 1.4, o que traz alguns recursos importantes para a unidade. Isso inclui logs de eventos persistentes, melhorias na limpeza e granularidade de namespace e proteção contra gravação de namespace.
Especificações KIOXIA CD6
Desempenho KIOXIA CD6
Mesa de teste
Nossas novas análises de SSD PCIe Gen4 Enterprise aproveitam um Lenovo Think System SR635 para testes de aplicativos e benchmarks sintéticos. O ThinkSystem SR635 é uma plataforma AMD de CPU única bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. É também a única plataforma em nosso laboratório (e uma das poucas no mercado atualmente) com baias PCIe Gen4 U.2. Os testes sintéticos não exigem muitos recursos da CPU, mas ainda utilizam a mesma plataforma Lenovo. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.
PCIe Gen4 sintético e plataforma de aplicativos (Lenovo ThinkSystem SR635)
- 1 x AMD 7452 (2.35 GHz x 32 núcleos)
- 8 x 64 GB DDR4-3200 MHz ECC DRAM
- CentOS 7.7 1908
- ESXi 6.7u3
Plataforma de aplicativos PCIe Gen3 (Lenovo Think System SR850)
- 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
- 16 x 32GB DDR4-2666Mhz ECC DRAM
- 2 x placas RAID 930-8i 12 Gb/s
- 8 compartimentos NVMe
- VMware ESXI 6.7u3
Plataforma Sintética PCIe Gen3 (Dell PowerEdge R740xd)
- 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
- 4 x 16 GB DDR4-2666 MHz ECC DRAM
- 1 placa RAID PERC 730 2GB 12Gb/s
- Adaptador NVMe Complementar
- Ubuntu-16.04.3-desktop-amd64
Sendo o primeiro conjunto de análises em uma nova plataforma, incluímos os resultados anteriores da unidade, que são comparações aproximadas, mas não 100% de maçãs para maçãs, pois estavam sendo testadas em uma plataforma mais antiga. Nossas diferenças de teste sintético não terão muita distorção nos resultados, mas as cargas de trabalho de aplicativos trabalhando na plataforma AMD de CPU única versus plataforma Intel de CPU quádrupla podem até certo ponto. Em nossos testes MySQL, um dos novos produtos Gen4 KIOXIA assumiu a liderança, mas a latência do servidor SQL foi média. Com apenas duas unidades Gen4 que pudemos publicar, não temos uma quantidade significativa de dados comparáveis, mas é algo a observar ao visualizar esses resultados. Também aumentamos nossos testes sintéticos para aproveitar os SSDs mais rápidos, agora mostrando resultados de teste com contagens de thread de pico mais altas.
Histórico de testes e comparáveis
A Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.
Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nas respectivas páginas.
Análise de carga de trabalho do aplicativo
Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Kioxia CD6 são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativo, cada unidade executará 4 VMs configuradas de forma idêntica.
Desempenho do SQL Server
Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 8 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.
Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.
Configuração de teste do SQL Server (por VM)
- Windows Server 2012 R2
- Ocupação de armazenamento: 600 GB alocados, 500 GB usados
- SQL Server 2014
-
- Tamanho do banco de dados: escala 1,500
- Carga de cliente virtual: 15,000
- Memória RAM: 48 GB
- Duração do teste: 3 horas
- 2.5 horas de pré-condicionamento
- período de amostra de 30 minutos
Para nosso benchmark transacional do SQL Server, o KIOXIA CD6 obteve uma pontuação de 12,633.7 TPS em 4 VMs.
A latência média viu o KIOXIA CD6 ter 5.5 ms em 4 VMs (o mesmo que o CD6), colocando-o um pouco atrás das unidades Huawei e Memblaze.
Desempenho do Sysbench
O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.
Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 8 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.
Configuração de teste do Sysbench (por VM)
- CentOS 6.3 64 bits
- Percona XtraDB 5.5.30-rel30.1
-
- Tabelas de banco de dados: 100
- Tamanho do banco de dados: 10,000,000
- Segmentos de banco de dados: 32
- Memória RAM: 24 GB
- Duração do teste: 3 horas
- 2 horas de pré-condicionamento 32 tópicos
- 1 hora 32 tópicos
Passando para o benchmark transacional Sysbench, o KIOXIA postou uma pontuação de liderança de 9,333 TPS em 4VMs.
Na latência média do Sysbench, vimos o CD6 com uma latência de apenas 13.71ms em 4VMs, novamente liderando o grupo.
Para nossa latência de pior cenário (99º percentil), o CD6 atingiu 27.48 ms em 4 VMs, desta vez atrás do Huawei por um fio de cabelo (27.22 ms).
Análise de Carga de Trabalho do VDBench
Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.
perfis:
- Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
- Gravação aleatória em 4K: 100% de gravação, 128 threads, 0-120% de atualização
- Leitura aleatória de 4K (carga alta): 100% de leitura, 512 threads, 0-120% iorado
- 4K Random Write (alta carga): 100% Write, 512 threads, 0-120% iorate
- Leitura sequencial de 64K: 100% de leitura, 32 threads, 0-120% iorado
- Gravação sequencial de 64K: 100% gravação, 16 threads, 0-120% iorado
- Leitura sequencial de 64K (carga alta): 100% de leitura, 64 threads, 0-120% iorado
- Gravação sequencial de 64K (carga alta): 100% Gravação, 64 threads, 0-120% iorado
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
Comparáveis:
Em nossa primeira análise de carga de trabalho VDBench, leitura aleatória de 4K, o KIOXIA CD6 teve uma pontuação máxima de 760,160 IOPS com uma latência de 165.5 µsDurante uma carga alta em Random 4K Read, vimos o KIOXIA CD6 desacelerar um pouco perto da marca de 1 milhão de IOPS, terminando com um pico de 1,067,840 IOPS a 472 µs.
Para gravação aleatória em 4K, o CD6 teve o melhor desempenho, atingindo um pico de 579,919 IOPS com uma latência de 211.1 µs.
Em uma carga de gravação alta, o KIOXIA CD6 mostrou um pico impressionante de 709,547 IOPS com 713.3 µs de latência.
Mudando para cargas de trabalho sequenciais, o CD6 mostrou resultados sólidos com um pico de 68,413 IOPS (ou 4.28 GB/s) a 465.6 µs (o outro KIOXIA era o melhor drive em leituras).
Durante uma carga alta em leituras sequenciais, o CD6 atingiu o pico de 75,598 IOPS (4.72 GB/s) antes de desacelerar, atingindo uma latência de até 843.5 ms.
Para gravação sequencial de 64K, o KIOXIA CD6 novamente mostrou que é uma potência em gravações, postando um pico de 53,402 IOPS (ou 3.33 GB/s) com uma latência de 291.6 ms antes de cair um pouco no final.
Em uma carga de gravação alta, o KIOXIA CD6 atingiu o pico de 42,299 IOPS (ou 2.58 GB/s) com uma latência de apenas 65.1 ms.
Nosso próximo conjunto de testes são nossas cargas de trabalho SQL: SQL, SQL 90-10 e SQL 80-20. Começando com SQL, o KIOXIA CD6 teve um pico sólido de 241,700 IOPS e uma latência de 131.1 ms.
No SQL 90-10, o CD6 teve praticamente o mesmo desempenho da unidade Memblaze, com pico de 243,292 IOPS e 129.9 ms de latência.
No SQL 80-20, as unidades de desempenho superior apresentaram desempenho bastante semelhante, com o CD6 registrando um pico de 244,857 IOPS com uma latência de 128.3 ms.
A seguir estão nossas cargas de trabalho Oracle: Oracle, Oracle 90-10 e Oracle 80-20. Começando com o Oracle, o KIOXIA CD6 alcançou o terceiro lugar com sólidos 253,635 IOPS e uma latência de 137.5 µs.
O Oracle 90-10 nos mostrou mais do que acima, o CD6 atingiu o pico de 168,000 IOPS com 116.8 µs de latência.Com o Oracle 80-20, as 4 principais unidades apresentaram desempenho muito semelhante, já que o CD6 atingiu o pico de 192,663 com uma latência de 112.3 ms.
Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para VDI Full Clone (FC) Boot, o KIOXIA CD6 teve um pico de 196,584 IOPS com uma latência de 172.3 µs para o terceiro lugar.
VDI FC Initial Login, o KIOXIA CD6 teve o melhor desempenho com um pico de 169,412 IOPS a 172.6 ms.
VDI FC Monday Login, o CD6 apresentou o melhor desempenho mais uma vez, com um pico de 109,488 IOPS a 142.7 ms.
Para VDI Linked Clone (LC) Boot, o CD6 mostrou impressionantes 100,678 IOPS a 157 ms de latência, atrás apenas do KIOXIA CM6.
O login inicial do VDI LC mostrou números ímpares durante o perfil de login inicial, chegando a 25,235 IOPS e 313.8 ms de latência antes de sofrer uma grande queda no desempenho.
Por fim, com o VDI LC Monday Login, o KIOXIA CD6 encerrou nossos testes com outro bom desempenho, com 84,903 IOPS a 184.3 ms.
Conclusão
O KIOXIA CD6 é o mais novo SSD de data center de alto desempenho a chegar ao mercado, aproveitando a nova interface PCIe 4.0. Ele foi desenvolvido especificamente para ambientes exigentes 24 horas por dia, 7 dias por semana, especificamente aqueles com uso misto e necessidades de resistência intensiva de leitura. A nova unidade KIOXIA está disponível no formato Z de 2.5 polegadas e 15 mm de altura, apresenta KIOXIA BiCS FLASH 96D TLC de 3 camadas e está disponível em uma ampla gama de capacidades de 960 GB a 15.36 TB. Ele também vem com uma gama de opções de segurança.
Para desempenho, comparamos o CD6 com outros SSDs de classe semelhante, incluindo o KIOXIA CM6. Para Application Workload Analysis, vimos o CD6 atingir 12,633.7 TPS com uma latência média de 5.5 ms no SQL Server, ficando logo abaixo dos drives Memblaze e Huawei. Para Sysbench, a unidade atingiu 9,333 TPS, latência média de 13.71ms e latência de pior cenário de 27.48m.
Nosso teste VDbench obteve um desempenho mais sólido do KIOXIA. Na maioria dos casos, no entanto, ele seguia a unidade CM6. Os destaques incluem: 760,160 IOPS em leitura 4K (alta carga de 1,067,840 IOPS), 579,919 IOPS em gravação 4K (alta carga de 709,547 IOPS), 4.28 GB/s em leitura de 64 K (alta carga de 4.72 GB/s) e 3.33 GB/s em 64 K gravação (carga alta de 2.58 GB/s). As cargas de trabalho SQL atingiram 242 IOPS, 243 IOPS para SQL 90-10 e 245 IOPS em SQL 80-20. No Oracle, as unidades de melhor desempenho tiveram um desempenho muito semelhante (o CD6 entre elas), registrando cargas de trabalho com 254 IOPS, 168K IOPS no Oracle 90-10 e 192K IOPS no Oracle 80-20. Em nosso teste VDI Clone, o CD6 mostrou um desempenho impressionante em todos os aspectos, destacado por seu desempenho superior em nossos testes VDI FC Monday Login e VDI FC Initial Login.
O foco desta análise está no desempenho do CD6, que reúne um placar impressionante. Talvez a história maior seja o futuro do PCIe Gen4. A Lenovo é a primeira a sair com um servidor que suporta PCIe Gen4 da frente para trás. A maioria dos outros servidores suporta apenas Gen4 na parte de trás, o que é uma decisão de design fundamental. Era mais fácil e rápido pular as baias frontais. A Lenovo escolheu o caminho mais abrangente e desenvolveu seus servidores Rome para poder aproveitar tudo o que a AMD tinha a oferecer. O resultado líquido é que a Lenovo pode tirar proveito da nova tecnologia, como o CD6 da KIOXIA, onde a maioria dos outros não pode. Isso coloca a KIOXIA em um cenário de ovo/galinha, pelo menos até que a Intel lance suas CPUs de servidor de próxima geração. Pode-se dizer que estar à frente da curva de TI neste caso é bom, porém, o CD6 funcionará bem com plataformas legadas, pronto para dar mais quando os sistemas PCIe Gen4 estiverem disponíveis. Por enquanto, espere ver benchmarks em abundância divulgando os benefícios dos servidores AMD, especialmente quando os sistemas de CPU dupla da Lenovo entrarem no mercado.
ATUALIZAÇÃO 4/2/22 – Revisamos o Kióxia CD6 com firmware mais maduro
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed