Home Empreendimento Revisão do SSD ScaleFlux CSD 3000

Revisão do SSD ScaleFlux CSD 3000

by Charles P. Jefferies

O ScaleFlux concentra-se exclusivamente no armazenamento computacional em escala. Seu novo Dispositivo de Armazenamento Computacional (CSD) 3000 é um SSD Gen4 com mecanismos integrados de compactação e descompactação de dados, que, segundo a empresa, podem quadruplicar a capacidade e dobrar o desempenho. Nós estaremos colocando essas reivindicações para o teste.

O ScaleFlux concentra-se exclusivamente no armazenamento computacional em escala. Seu novo Dispositivo de Armazenamento Computacional (CSD) 3000 é um SSD Gen4 com mecanismos integrados de compactação e descompactação de dados, que, segundo a empresa, podem quadruplicar a capacidade e dobrar o desempenho. Nós estaremos colocando essas reivindicações para o teste.

ScaleFlux CSD3000

Especificações do ScaleFlux CSD 3000

Para obter informações sobre armazenamento computacional, nosso Revisão do ScaleFlux CSD 2000 (a versão anterior do CSD 3000 analisada aqui) vale a pena ler. Resumindo, o armazenamento computacional integra recursos de computação no próprio armazenamento, em vez de depender dos recursos de computação do sistema host.

O poder computacional do CSD 3000 vem do processador de armazenamento SFX 3000, um chip SoC ARM personalizado com aceleração de hardware dedicada. Esta unidade está disponível no fator de forma U.2.5 de 2 polegadas em capacidades de 3.2 TB, 3.84 TB, 6.4 GB e 7.68 TB. Ele usa uma interface PCIe Gen4 x4, uma melhoria em relação à interface Gen2000 do CSD 3.

Porta ScaleFlux CSD 3000

O ScaleFlux oferece um drive semelhante, o NSD 3000. Ele possui compactação integrada, mas não possui o multiplicador de capacidade do CSD 3000.

As principais especificações do CSD 3000 estão na tabela abaixo.

Fator de Forma 2.5″ U.2 (15 mm)
Capacidades padrão 3.2 TB, 3.84 TB, 6.4 TB, 7.68 TB
Interface Host PCIe Gen4 x4
Virtualização SR-IOV com 15 funções virtuais
Segurança

 

TCG Opal 2.0 com aceleração de segurança HW

 

Gestão de Sistemas NVMe-MI 1.1 sobre SMBus

 

Energia <20W típico, <5W ocioso

 

Confiabilidade Proteção de caminho de dados de ponta a ponta, perda de energia

Proteção, correção de erros LDPC, NAND Die RAID

Leitura Seqüencial 7.2 GB / s
Escrita Seqüencial 4.8 GB/s*
Leitura aleatória (4kB) 1450 kIOPS
Gravação Aleatória (4kB) 380 kIOPS*
Sustentado 70/30 4kB aleatório Ler/escrever com 2:1 compressível Dados 1020 kIOPS

Histórico de testes e comparáveis ​​do ScaleFlux CSD 3000

O StorageReview Enterprise Test Lab fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir.

Base de teste ScaleFlux CSD 3000

Usamos um sistema diferente de nosso banco de teste regular para revisar o CSD 3000. Com a unidade tão única quanto esta e a plataforma de teste diferente aproveitada, não iremos compará-la frente a frente com os SSDs Gen4 NVMe tradicionais. Esta análise aproveita nosso servidor Intel OEM Scalable Gen3, que está bem equipado com processadores Intel 8380 duplos, oferecendo potência de CPU bem acima do que é necessário para enfatizar o armazenamento local de alto desempenho. Suas especificações de alto nível incluem o seguinte:

  • 2 x Intel escalável Gen3 8380
  • 32x32GB DDR4 3200MHz
  • Ubuntu 20.04.2 Live Server (cargas de trabalho sintéticas)
  • VMware ESXi 7.0u2 (cargas de trabalho de aplicativos)
  • 8 baias PCI Gen4 U.2 NVMe

Para medir o desempenho do ScaleFlux CSD 3000, utilizamos o VDbench, que pode ter o nível de compactação ajustado antes de cada carga de trabalho. Normalmente, essa configuração é mantida em 0% por padrão, mas aumentamos para 50% para um fator de compactação de 2:1 ao testar este SSD. Essas duas execuções são refletidas nos gráficos abaixo.

Desempenho do ScaleFlux CSD 3000

Note: Depois de analisarmos o ScaleFlux CSD 3000, recebemos dois modelos mais novos com firmware de produção. Atualizamos a análise com os resultados mais recentes desses dois pontos de capacidade.

Análise de Carga de Trabalho do VDBench

Em relação aos dispositivos de armazenamento de referência, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não sejam uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam os dispositivos de armazenamento de linha de base com um fator de repetibilidade que facilita a comparação de soluções concorrentes.

Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos" e testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais.

Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso difere dos testes de entropia completos, que usam 100% da unidade e os levam a um estado estável. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

 

A singularidade dessa unidade significa que estaremos apenas comparando-a consigo mesma. Para comparação, veremos o ScaleFlux CSD 3000 com VDBench enviando dados incompressíveis e dados compressíveis 2:1.

Em nosso primeiro benchmark, leitura aleatória de 4K, o desempenho compactado do CSD 3000 subiu constantemente para 909K IOPS com latência de 139µs para o modelo de 7.68 TB (o modelo de 3.85 TB estava um pouco atrás dos outros). A unidade foi um pouco mais lenta sem compactação e com a mesma capacidade, chegando a 886K IOPS a 142.4µs .

Desempenho de leitura aleatória do ScaleFlux C3000 O CSD 3000 não compactado mostrou uma curva semelhante a uma montanha-russa em nosso próximo teste, gravação aleatória de 4K, com o modelo de 7.68 TB mostrando os melhores resultados dos dois: chegando a 454 K IOPS com latência de 275.7 µs. A unidade compactada mostrou resultados muito melhores terminando em torno de 735K IOPS e 168.2 µs.

Desempenho de gravação aleatória do ScaleFlux C3000

Passando para os testes sequenciais de 64K, começamos com o desempenho de leitura, que conta uma história semelhante (os drives compactados novamente com números impressionantes). Ambas as capacidades tiveram desempenho praticamente idêntico, com o modelo de 3.84 TB superando ligeiramente a maior capacidade de 113K IOPS (ou 7.06 GB/s) a 282 µs. A unidade não compactada superior (7.68 TB) atingiu 98 K IOPS a 326.8 µs.

Desempenho de leitura sequencial do ScaleFlux C3000

A gravação sequencial de 64K, os resultados foram ainda mais favoráveis ​​com as versões compactadas. Ambas as capacidades novamente tiveram desempenho idêntico (embora, como você pode ver, o 3.84 TB superou ligeiramente a capacidade maior com 96K IOPS em 154µs de latência, ficando bem abaixo de 100µs até se aproximar de 90K IOPS. Pelo contrário, a unidade não compactada viu picos graves, terminando em 29K IOPS a 534µs para a capacidade de 7,68TB e 25K IOPS a 616.6µs ​​para a capacidade de 3.85TB.

Desempenho de gravação sequencial ScaleFlux C3000

Nosso próximo conjunto de testes são nossas cargas de trabalho SQL: SQL, SQL 90-10 e SQL 80-20. O teste de carga de trabalho SQL é o primeiro; o CSD 3000 mostra uma curva semelhante quando compactado e não compactado com os modelos de alta capacidade, embora a versão compactada seja um pouco melhor com 310K IOPS com uma latência de 101.9µs.

Desempenho da carga de trabalho SQL do ScaleFlux C3000 Com SQL 90-10, o CSD 7.68 compactado de 3000 TB foi novamente o drive com melhor desempenho, completando o teste em 311K IOPS e uma latência de 101.3 µs. Em comparação, a melhor unidade não compactada (também 7.68 TB) terminou com 285 K IOPS e 110.8 µs de latência.

No SQL 80-20, vemos ambas as capacidades do CSD 3000 compactado ocupando os primeiros lugares, com o modelo de 7.68 TB terminando em 319 IOPS com latência de 98.3 µs. O descompactado de 7.68 TB ficou visivelmente atrás (embora muito próximo do modelo de pequena capacidade) com 277 K IOPS a 113.5 µs.

A seguir estão nossas cargas de trabalho Oracle: Oracle, Oracle 90-10 e Oracle 80-20. Aqui, as unidades CSD 3000 compactadas continuaram com seu desempenho geral superior. Começando com o teste de carga de trabalho Oracle, a melhor exibição foi a unidade de compactação de 7.68 TB com 336 K IOPS com uma latência de 103.9 µs. A unidade compactada de 7.68 TB estava bem atrás, com pico de 279K IOPS com latência de 126 µs.

Desempenho da carga de trabalho do oráculo ScaleFlux C3000 No Oracle 90-10; a unidade compactada de 7.86 TB terminou em 229 K IOPS com uma latência de 94.7 µs. As unidades de 3.84 TB (compactadas) e 7.68 TB (não compactadas) apresentaram desempenho idêntico, com 214 K IOPS a 101.4 µs de latência.

Passar para o Oracle 80-20 contou uma história semelhante mais uma vez. A unidade não compactada de 7.68 TB terminou em 237 K IOPS com uma latência de 91 µs, enquanto a unidade compactada de 7.68 TB foi arrastada com 213 IOPS com uma latência de apenas 101.9 µs.

Em seguida, mudamos para nossos testes de clone VDI, Full Clone (FC) e Linked Clone (LC). Todas as unidades mostraram instabilidade menor no final do VDI FC Boot. Comprimido, o CSD 7.68 de 3000 TB terminou no topo novamente com 270K IOPS com uma latência de 126.9µs; compactado, sua capacidade de desempenho superior da unidade de 7.68 TB novamente (que na verdade ultrapassou a unidade compactada de 3.84 TB) com 242 K IOPS a uma latência de 141.9 µs.

Desempenho de inicialização ScaleFlux C3000 VDI O VDI FC Initial Login conta uma história diferente, já que as unidades compactadas eram muito melhores, enquanto as unidades não compactadas estavam em todo lugar. A unidade compactada de 7.68 TB atingiu o pico de 244 K IOPS com 117.2 µs de latência, enquanto o modelo de 3.84 TB atingiu o pico de 210 K IOPS com 137.2 µs de latência. As unidades não compactadas terminaram em 127K IOPS com uma latência de 231.1µs (7.68TB) e 94K IOPS com uma latência de 312.4µs (3.84TB).

O CSD 3000 compactado continuou a impressionar em nosso último teste de FC, Monday Login, onde seu melhor número foi de 144K IOPS com uma latência de 106.9µs (7.68TB). A unidade de 7.68 TB não compactada mostrou 100 K IOPS com uma latência de 154.6 µs.

Agora vamos passar para os testes LC, onde todas as unidades mostraram linhas estáveis ​​no teste de inicialização. As unidades compactadas continuaram a dominar (especialmente a de 7.68 TB, que apresentou 131 K IOPS e uma latência de 120.1 µs). A unidade não compactada superior (7.68 TB) conseguiu atingir 110 IOPS a 144.4 µs.

Vemos um comportamento instável das unidades descompactadas no LC Initial Login quando ele se aproxima de 20,000 IOPS; seu número final foi de 49K IOPS/157.1µs (3.84TB) e 56K IOPS/138µs (7.68TB). Como sempre, os drives compactados apresentaram melhor desempenho e estabilidade, completando o teste em 73K IOPS/103.1µs (3.84TB) e 80K IOPS/94.4µs (7.68TB).

Em nosso último teste, as unidades não compactadas ainda apresentam baixo desempenho em comparação com as versões compactadas. No LC Monday Login, que novamente mostrou alguns picos de latência estranhos para as unidades compactadas, 3.84 TB e 7.68 TB terminaram em 62K IOPS/250.1µs e 75K IOPS/207.5µs, respectivamente. O número final da unidade compactada foi muito melhor em 109K IOPS/140.9µs (3.84TB) e 124K IOPS/123.5µs (7.68TB).

Conclusão

ScaleFlux continua a se concentrar no armazenamento computacional. O drive CSD 3000 que examinamos nesta análise melhora o CSD 2000 anterior principalmente por oferecer uma interface PCIe Gen4, que oferece um potencial de desempenho muito maior.

Testamos o CSD 3000 no Linux em nosso servidor escalável Intel OEM Gen3 em um estado descompactado e novamente em um estado compactado 2:1 para aproveitar as vantagens dos mecanismos de compressão integrados da unidade. A unidade mostrou desempenho superior e menor latência em todos os testes usando dados compressíveis, geralmente com deltas de desempenho de dois dígitos.

Os destaques de desempenho (melhores resultados/capacidade) com dados compactados incluem 909K IOPS em leitura aleatória de 4K para 7.68TB (versus 886K IOPS não compactado), 735K IOPS em gravação aleatória de 4K para 7.68TB (454K IOPS não compactado), 7.06GB/s em Leitura sequencial de 64 K para 3.85 TB (6.12 GB/s não compactado) e 6 GB/s em gravação sequencial de 64 K (1.82 GB/s não compactado).

O CSD 3000 mostrou números compactados e não compactados semelhantes em nossos testes SQL e Oracle, embora a unidade compactada fosse mais consistente. Em um exemplo, SQL 80-20, a unidade compactada atingiu 319 IOPS com latência de 98.3 µs (modelo de 7.68 TB), enquanto o modelo não compactado ficou visivelmente atrás com 277 K IOPS a 113.5 µs

Por fim, nossos testes de clone VDI Full e Linked observaram as diferenças mais notáveis ​​entre o CSD 3000 executando dados compactados e não compactados – ou seja, os dados compactados tiveram um desempenho muito melhor e mais consistente. Para escolher um exemplo, o VDI LC Initial Login mostrou as unidades não compactadas com desempenho máximo de 49K IOPS/157.1µs (3.84TB) e 56K IOPS/138µs (7.68TB), enquanto as unidades compactadas mostraram que concluíram o teste em 73K IOPS/103.1µs ( 3.84 TB) e 80K IOPS/94.4 µs (7.68 TB).

Em uma nota de advertência, vimos alguns picos de latência inexplicáveis ​​e desempenho reduzido durante a execução de dados não compactados. Isso ocorreu em nossos testes de 4K/64K, SQL/Oracle e VDI FC/LC, portanto, não foi apenas isolado em um cenário.

Os pontos fortes do CSD3000 serão melhor demonstrados quando ele puder trabalhar com alguns dados compressíveis, pois é aí que ele terá as vantagens mais significativas em geral sobre os SSDs tradicionais. ScaleFlux também adicionou suporte VMWare com esta versão, que não tinha quando analisamos o CSD 2000 anterior. Isso é uma grande vantagem, mas ainda falta suporte para virtualização do Windows. No entanto, vale a pena considerar o CSD 3000 da ScaleFlux se você puder alinhar suas cargas de trabalho com suporte de plataforma e as forças de compressão substanciais da unidade.

Página do produto ScaleFlux

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed