O ScaleFlux concentra-se exclusivamente no armazenamento computacional em escala. Seu novo Dispositivo de Armazenamento Computacional (CSD) 3000 é um SSD Gen4 com mecanismos integrados de compactação e descompactação de dados, que, segundo a empresa, podem quadruplicar a capacidade e dobrar o desempenho. Nós estaremos colocando essas reivindicações para o teste.
O ScaleFlux concentra-se exclusivamente no armazenamento computacional em escala. Seu novo Dispositivo de Armazenamento Computacional (CSD) 3000 é um SSD Gen4 com mecanismos integrados de compactação e descompactação de dados, que, segundo a empresa, podem quadruplicar a capacidade e dobrar o desempenho. Nós estaremos colocando essas reivindicações para o teste.
Especificações do ScaleFlux CSD 3000
Para obter informações sobre armazenamento computacional, nosso Revisão do ScaleFlux CSD 2000 (a versão anterior do CSD 3000 analisada aqui) vale a pena ler. Resumindo, o armazenamento computacional integra recursos de computação no próprio armazenamento, em vez de depender dos recursos de computação do sistema host.
O poder computacional do CSD 3000 vem do processador de armazenamento SFX 3000, um chip SoC ARM personalizado com aceleração de hardware dedicada. Esta unidade está disponível no fator de forma U.2.5 de 2 polegadas em capacidades de 3.2 TB, 3.84 TB, 6.4 GB e 7.68 TB. Ele usa uma interface PCIe Gen4 x4, uma melhoria em relação à interface Gen2000 do CSD 3.
O ScaleFlux oferece um drive semelhante, o NSD 3000. Ele possui compactação integrada, mas não possui o multiplicador de capacidade do CSD 3000.
As principais especificações do CSD 3000 estão na tabela abaixo.
Fator de Forma | 2.5″ U.2 (15 mm) |
Capacidades padrão | 3.2 TB, 3.84 TB, 6.4 TB, 7.68 TB |
Interface Host | PCIe Gen4 x4 |
Virtualização | SR-IOV com 15 funções virtuais |
Segurança
|
TCG Opal 2.0 com aceleração de segurança HW
|
Gestão de Sistemas | NVMe-MI 1.1 sobre SMBus
|
Energia | <20W típico, <5W ocioso
|
Confiabilidade | Proteção de caminho de dados de ponta a ponta, perda de energia
Proteção, correção de erros LDPC, NAND Die RAID |
Leitura Seqüencial | 7.2 GB / s |
Escrita Seqüencial | 4.8 GB/s* |
Leitura aleatória (4kB) | 1450 kIOPS |
Gravação Aleatória (4kB) | 380 kIOPS* |
Sustentado 70/30 4kB aleatório Ler/escrever com 2:1 compressível Dados | 1020 kIOPS |
Histórico de testes e comparáveis do ScaleFlux CSD 3000
O StorageReview Enterprise Test Lab fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.
Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir.
Base de teste ScaleFlux CSD 3000
Usamos um sistema diferente de nosso banco de teste regular para revisar o CSD 3000. Com a unidade tão única quanto esta e a plataforma de teste diferente aproveitada, não iremos compará-la frente a frente com os SSDs Gen4 NVMe tradicionais. Esta análise aproveita nosso servidor Intel OEM Scalable Gen3, que está bem equipado com processadores Intel 8380 duplos, oferecendo potência de CPU bem acima do que é necessário para enfatizar o armazenamento local de alto desempenho. Suas especificações de alto nível incluem o seguinte:
- 2 x Intel escalável Gen3 8380
- 32x32GB DDR4 3200MHz
- Ubuntu 20.04.2 Live Server (cargas de trabalho sintéticas)
- VMware ESXi 7.0u2 (cargas de trabalho de aplicativos)
- 8 baias PCI Gen4 U.2 NVMe
Para medir o desempenho do ScaleFlux CSD 3000, utilizamos o VDbench, que pode ter o nível de compactação ajustado antes de cada carga de trabalho. Normalmente, essa configuração é mantida em 0% por padrão, mas aumentamos para 50% para um fator de compactação de 2:1 ao testar este SSD. Essas duas execuções são refletidas nos gráficos abaixo.
Desempenho do ScaleFlux CSD 3000
Note: Depois de analisarmos o ScaleFlux CSD 3000, recebemos dois modelos mais novos com firmware de produção. Atualizamos a análise com os resultados mais recentes desses dois pontos de capacidade.
Análise de Carga de Trabalho do VDBench
Em relação aos dispositivos de armazenamento de referência, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não sejam uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam os dispositivos de armazenamento de linha de base com um fator de repetibilidade que facilita a comparação de soluções concorrentes.
Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos" e testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais.
Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso difere dos testes de entropia completos, que usam 100% da unidade e os levam a um estado estável. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.
perfis:
- Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
- Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
- Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
- Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
- Banco de Dados Sintético: SQL e Oracle
- Clone completo de VDI e rastreamentos de clone vinculados
A singularidade dessa unidade significa que estaremos apenas comparando-a consigo mesma. Para comparação, veremos o ScaleFlux CSD 3000 com VDBench enviando dados incompressíveis e dados compressíveis 2:1.
Em nosso primeiro benchmark, leitura aleatória de 4K, o desempenho compactado do CSD 3000 subiu constantemente para 909K IOPS com latência de 139µs para o modelo de 7.68 TB (o modelo de 3.85 TB estava um pouco atrás dos outros). A unidade foi um pouco mais lenta sem compactação e com a mesma capacidade, chegando a 886K IOPS a 142.4µs .
O CSD 3000 não compactado mostrou uma curva semelhante a uma montanha-russa em nosso próximo teste, gravação aleatória de 4K, com o modelo de 7.68 TB mostrando os melhores resultados dos dois: chegando a 454 K IOPS com latência de 275.7 µs. A unidade compactada mostrou resultados muito melhores terminando em torno de 735K IOPS e 168.2 µs.
Passando para os testes sequenciais de 64K, começamos com o desempenho de leitura, que conta uma história semelhante (os drives compactados novamente com números impressionantes). Ambas as capacidades tiveram desempenho praticamente idêntico, com o modelo de 3.84 TB superando ligeiramente a maior capacidade de 113K IOPS (ou 7.06 GB/s) a 282 µs. A unidade não compactada superior (7.68 TB) atingiu 98 K IOPS a 326.8 µs.
A gravação sequencial de 64K, os resultados foram ainda mais favoráveis com as versões compactadas. Ambas as capacidades novamente tiveram desempenho idêntico (embora, como você pode ver, o 3.84 TB superou ligeiramente a capacidade maior com 96K IOPS em 154µs de latência, ficando bem abaixo de 100µs até se aproximar de 90K IOPS. Pelo contrário, a unidade não compactada viu picos graves, terminando em 29K IOPS a 534µs para a capacidade de 7,68TB e 25K IOPS a 616.6µs para a capacidade de 3.85TB.
Nosso próximo conjunto de testes são nossas cargas de trabalho SQL: SQL, SQL 90-10 e SQL 80-20. O teste de carga de trabalho SQL é o primeiro; o CSD 3000 mostra uma curva semelhante quando compactado e não compactado com os modelos de alta capacidade, embora a versão compactada seja um pouco melhor com 310K IOPS com uma latência de 101.9µs.
Com SQL 90-10, o CSD 7.68 compactado de 3000 TB foi novamente o drive com melhor desempenho, completando o teste em 311K IOPS e uma latência de 101.3 µs. Em comparação, a melhor unidade não compactada (também 7.68 TB) terminou com 285 K IOPS e 110.8 µs de latência.
No SQL 80-20, vemos ambas as capacidades do CSD 3000 compactado ocupando os primeiros lugares, com o modelo de 7.68 TB terminando em 319 IOPS com latência de 98.3 µs. O descompactado de 7.68 TB ficou visivelmente atrás (embora muito próximo do modelo de pequena capacidade) com 277 K IOPS a 113.5 µs.
A seguir estão nossas cargas de trabalho Oracle: Oracle, Oracle 90-10 e Oracle 80-20. Aqui, as unidades CSD 3000 compactadas continuaram com seu desempenho geral superior. Começando com o teste de carga de trabalho Oracle, a melhor exibição foi a unidade de compactação de 7.68 TB com 336 K IOPS com uma latência de 103.9 µs. A unidade compactada de 7.68 TB estava bem atrás, com pico de 279K IOPS com latência de 126 µs.
No Oracle 90-10; a unidade compactada de 7.86 TB terminou em 229 K IOPS com uma latência de 94.7 µs. As unidades de 3.84 TB (compactadas) e 7.68 TB (não compactadas) apresentaram desempenho idêntico, com 214 K IOPS a 101.4 µs de latência.
Passar para o Oracle 80-20 contou uma história semelhante mais uma vez. A unidade não compactada de 7.68 TB terminou em 237 K IOPS com uma latência de 91 µs, enquanto a unidade compactada de 7.68 TB foi arrastada com 213 IOPS com uma latência de apenas 101.9 µs.
Em seguida, mudamos para nossos testes de clone VDI, Full Clone (FC) e Linked Clone (LC). Todas as unidades mostraram instabilidade menor no final do VDI FC Boot. Comprimido, o CSD 7.68 de 3000 TB terminou no topo novamente com 270K IOPS com uma latência de 126.9µs; compactado, sua capacidade de desempenho superior da unidade de 7.68 TB novamente (que na verdade ultrapassou a unidade compactada de 3.84 TB) com 242 K IOPS a uma latência de 141.9 µs.
O VDI FC Initial Login conta uma história diferente, já que as unidades compactadas eram muito melhores, enquanto as unidades não compactadas estavam em todo lugar. A unidade compactada de 7.68 TB atingiu o pico de 244 K IOPS com 117.2 µs de latência, enquanto o modelo de 3.84 TB atingiu o pico de 210 K IOPS com 137.2 µs de latência. As unidades não compactadas terminaram em 127K IOPS com uma latência de 231.1µs (7.68TB) e 94K IOPS com uma latência de 312.4µs (3.84TB).
O CSD 3000 compactado continuou a impressionar em nosso último teste de FC, Monday Login, onde seu melhor número foi de 144K IOPS com uma latência de 106.9µs (7.68TB). A unidade de 7.68 TB não compactada mostrou 100 K IOPS com uma latência de 154.6 µs.
Agora vamos passar para os testes LC, onde todas as unidades mostraram linhas estáveis no teste de inicialização. As unidades compactadas continuaram a dominar (especialmente a de 7.68 TB, que apresentou 131 K IOPS e uma latência de 120.1 µs). A unidade não compactada superior (7.68 TB) conseguiu atingir 110 IOPS a 144.4 µs.
Vemos um comportamento instável das unidades descompactadas no LC Initial Login quando ele se aproxima de 20,000 IOPS; seu número final foi de 49K IOPS/157.1µs (3.84TB) e 56K IOPS/138µs (7.68TB). Como sempre, os drives compactados apresentaram melhor desempenho e estabilidade, completando o teste em 73K IOPS/103.1µs (3.84TB) e 80K IOPS/94.4µs (7.68TB).
Em nosso último teste, as unidades não compactadas ainda apresentam baixo desempenho em comparação com as versões compactadas. No LC Monday Login, que novamente mostrou alguns picos de latência estranhos para as unidades compactadas, 3.84 TB e 7.68 TB terminaram em 62K IOPS/250.1µs e 75K IOPS/207.5µs, respectivamente. O número final da unidade compactada foi muito melhor em 109K IOPS/140.9µs (3.84TB) e 124K IOPS/123.5µs (7.68TB).
Conclusão
ScaleFlux continua a se concentrar no armazenamento computacional. O drive CSD 3000 que examinamos nesta análise melhora o CSD 2000 anterior principalmente por oferecer uma interface PCIe Gen4, que oferece um potencial de desempenho muito maior.
Testamos o CSD 3000 no Linux em nosso servidor escalável Intel OEM Gen3 em um estado descompactado e novamente em um estado compactado 2:1 para aproveitar as vantagens dos mecanismos de compressão integrados da unidade. A unidade mostrou desempenho superior e menor latência em todos os testes usando dados compressíveis, geralmente com deltas de desempenho de dois dígitos.
Os destaques de desempenho (melhores resultados/capacidade) com dados compactados incluem 909K IOPS em leitura aleatória de 4K para 7.68TB (versus 886K IOPS não compactado), 735K IOPS em gravação aleatória de 4K para 7.68TB (454K IOPS não compactado), 7.06GB/s em Leitura sequencial de 64 K para 3.85 TB (6.12 GB/s não compactado) e 6 GB/s em gravação sequencial de 64 K (1.82 GB/s não compactado).
O CSD 3000 mostrou números compactados e não compactados semelhantes em nossos testes SQL e Oracle, embora a unidade compactada fosse mais consistente. Em um exemplo, SQL 80-20, a unidade compactada atingiu 319 IOPS com latência de 98.3 µs (modelo de 7.68 TB), enquanto o modelo não compactado ficou visivelmente atrás com 277 K IOPS a 113.5 µs
Por fim, nossos testes de clone VDI Full e Linked observaram as diferenças mais notáveis entre o CSD 3000 executando dados compactados e não compactados – ou seja, os dados compactados tiveram um desempenho muito melhor e mais consistente. Para escolher um exemplo, o VDI LC Initial Login mostrou as unidades não compactadas com desempenho máximo de 49K IOPS/157.1µs (3.84TB) e 56K IOPS/138µs (7.68TB), enquanto as unidades compactadas mostraram que concluíram o teste em 73K IOPS/103.1µs ( 3.84 TB) e 80K IOPS/94.4 µs (7.68 TB).
Em uma nota de advertência, vimos alguns picos de latência inexplicáveis e desempenho reduzido durante a execução de dados não compactados. Isso ocorreu em nossos testes de 4K/64K, SQL/Oracle e VDI FC/LC, portanto, não foi apenas isolado em um cenário.
Os pontos fortes do CSD3000 serão melhor demonstrados quando ele puder trabalhar com alguns dados compressíveis, pois é aí que ele terá as vantagens mais significativas em geral sobre os SSDs tradicionais. ScaleFlux também adicionou suporte VMWare com esta versão, que não tinha quando analisamos o CSD 2000 anterior. Isso é uma grande vantagem, mas ainda falta suporte para virtualização do Windows. No entanto, vale a pena considerar o CSD 3000 da ScaleFlux se você puder alinhar suas cargas de trabalho com suporte de plataforma e as forças de compressão substanciais da unidade.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed