Home Empreendimento Revisão do ScaleFlux CSD 2000

Revisão do ScaleFlux CSD 2000

by Adam Armstrong

A ScaleFlux é uma empresa focada exclusivamente em armazenamento computacional, mais especificamente armazenamento computacional em escala. A empresa está fazendo isso principalmente com suas unidades de armazenamento computacional ScaleFlux (CSD). Como você deve ter adivinhado pelo nome, o CSD é um SSD NVMe integrado com mecanismos de computação que podem melhorar o desempenho da unidade e do sistema. Mas armazenamento computacional significa muitas coisas diferentes, dependendo de com quem você está falando. Nesta revisão, temos uma amostra da perspectiva do ScaleFlux, com o ScaleFlux CSD 2000.

A ScaleFlux é uma empresa focada exclusivamente em armazenamento computacional, mais especificamente armazenamento computacional em escala. A empresa está fazendo isso principalmente com suas unidades de armazenamento computacional ScaleFlux (CSD). Como você deve ter adivinhado pelo nome, o CSD é um SSD NVMe integrado com mecanismos de computação que podem melhorar o desempenho da unidade e do sistema. Mas armazenamento computacional significa muitas coisas diferentes, dependendo de com quem você está falando. Nesta revisão, temos uma amostra da perspectiva do ScaleFlux, com o ScaleFlux CSD 2000.

ScaleFlux CSD2000

O que é armazenamento computacional?

Na verdade, escrevemos sobre armazenamento computacional há vários anos aqui no StorageReview. Resumindo, o armazenamento computacional está pegando recursos de computação (que não são a arquitetura de computação e/ou memória do sistema) e colocando-os dentro do próprio armazenamento.

Às vezes, esses recursos de computação também são colocados entre o host e o armazenamento. Isso pode reduzir a movimentação de dados, reduzir a pressão sobre os recursos de computação do sistema e potencialmente aumentar o desempenho ou, pelo menos, a consistência do desempenho. Existem muitos fornecedores participando do armazenamento computacional, portanto, é importante entender que o termo “armazenamento computacional” pode significar coisas muito diferentes, dependendo do produto.

ScaleFlux CSD 2000 e armazenamento computacional

O ScaleFlux CSD se destaca pela introdução de mecanismos de compactação/descompactação de caminho de dados. De acordo com a empresa, isso pode efetivamente quadruplicar a capacidade e dobrar o desempenho. Claro, isso pressupõe que os dados sejam compressíveis, algo fundamental para que esta plataforma funcione bem. Supondo que as condições sejam adequadas, a capacidade efetiva torna-se um forte ponto de venda.

ScaleFlux CSD 2000 de volta

Há também um argumento de custo e densidade a ser feito. Ao compactar os dados e obter uma capacidade mais efetiva, o ScaleFlux calcula que as organizações podem economizar até 50% no custo do flash. Eles também podem oferecer “mais” flash no mesmo slot graças à compressão.

Custo e eficiência significam pouco sem desempenho, quais reivindicações do ScaleFlux podem ser duplicadas em relação aos SSDs tradicionais? A unidade vem em uma versão Data Center e Data Scale, mas vamos ver os principais números aqui. O número máximo com uma compactação de dados 1:1 é 750K IOPS em leitura 4K e 490K IOPS em gravação 4K para uma compactação de dados 2:1. Para velocidades sequenciais, a unidade é cotada para atingir 3 GB/s em qualquer compactação e até 2.3 GB/s para gravação em compactação 1:1.

Algumas outras diferenças com o CSD são que ele possui FTL/FM sintonizável que permite aos usuários otimizar o desempenho e o preço por GB. A execução de alto desempenho pode levar a problemas de energia e temperatura, embora estes possam ser limitados para evitar o superaquecimento. A proteção de dados parece estar sempre nas notícias e, nesse sentido, o CSD reivindica proteção de dados de ponta a ponta e ECC em todas as memórias internas no caminho de dados, bem como proteção contra perda de energia.

Para entrar nessa ação CSD com ScaleFlux, existem algumas desvantagens. Uma é que a unidade que estamos analisando é Gen 3, em um momento em que os SSDs tradicionais migraram para PCIe Gen 4. Esse é um problema solucionável. Outro sucesso é o atualmente, o suporte ao driver é limitado ao Linux. Windows e VMware estão fora. A virtualização localizada seria um caso de uso interessante e adequado para benefícios de redução de dados. Esperançosamente, um suporte mais amplo está por vir.

Especificações principais do ScaleFlux CSD 2000

Fatores de Forma PCIe AIC e 2.5” U.2
Interface PCIe Gen3 x4 Dispositivo de armazenamento em bloco de baixa latência
Mídia NAND TLC 3D e QLC 3D
Proteção contra perda de energia Sim
Proteção de dados
  • Proteção End-to-End
  • ECC em todas as memórias
  • CRC de caminho de dados completo
  • LDPC e proteção RAID em nível de matriz
Energia
  • 18Watt Típico Ativo
  • 25W no máximo
  • 12W att inativo (latência de saída zero)
Temperatura de Operação 50°C a 200LFM (AIC) 35°C a 200LFM (U.2)
Proteção de temperatura Estrangulamento Térmico Ativado
MTTF 2 milhões de horas
Capacidade de computação
  • Compressão de caminho de dados transparente
  • Desempenho Acelerado
  • Capacidade ampliada
Compatibilidade de Software Linux OS 2.6 Kernel ou posterior Somente

  • Suporte de repositório: Ubuntu 16/18/20, RedHat/CentOS 6/7/8

Compressão com ScaleFlux

Desde o início, queríamos entender como a compactação é implementada. Para começar no Linux, você precisa carregar o driver personalizado para visualizar e interagir com a unidade, que é uma ramificação do conjunto de ferramentas nvme-cli comum. Isso permite que você visualize a unidade como está, formate-a, bem como interaja e/ou modifique a capacidade utilizável com base no conjunto de dados atual. Abaixo está um exemplo rápido da saída antes e depois do nosso teste de carga de trabalho. O primeiro comando de “sfx-nvme list” mostra a unidade instalada.

root@storagereview:~# lista sfx-nvme
Formato de uso do namespace do modelo SN do nó FW Rev BUS:slot:func
/dev/sfdv0n1 UC1945A7112M CSDU3RF040B1 1 3.20 TB / 3.20 TB 512 B + 0 B 4870 0000:d8:00.0

Após nossa primeira rodada de benchmarks com dados totalmente incompressíveis (nosso conjunto de dados de trabalho normal), vemos a unidade mostrando uma taxa de compressão de 1.00.

root@storagereview:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
espaço_livre tamanho_físico tamanho_lógico comp_ratio provisioned_cap space_flag
2736 6251231232 6251231312 1.00 6251233968 0

Em seguida, mudamos o nível de compactação vdbench para 4x, permitindo que a unidade trabalhe um pouco de sua mágica nos bastidores. Depois de concluído e consultamos o SSD novamente, vemos o tamanho aumentado e a taxa de compactação de 4.10. Portanto, a boa notícia é que, com esse abalo básico, as unidades fazem o que afirmam fazer, em termos de funcionalidade de compactação.

root@storagereview:~# cat /sys/block/sfdv*/sfx_smart_features/sfx_capacity_stat
espaço_livre tamanho_físico tamanho_lógico comp_ratio provisioned_cap space_flag
4728607824 1522626144 6251231312 4.10 6251233968 0

Desempenho do ScaleFlux CSD 2000

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes.

Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais.

Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os levam a um estado estável. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Para comparação, veremos o SSD ScaleFlux com VDBench enviando dados incompressíveis e dados compressíveis 4x. Em 4K aleatório, o CSD incompressível começou abaixo de 100µs e atingiu o pico de 588,893 IOPS com uma latência de 216µs. Com compactação, o drive ficou apenas um pouco mais lento com um pico de 573,460 IOPS em uma latência de 222µs.

Leitura ScaleFlux CSD 2000 4k

A gravação aleatória de 4K viu o pico da unidade incompressível em cerca de 355K IOPS em aproximadamente 325µs antes de cair um pouco. Com compactação, a unidade ficou abaixo de 100µs na maior parte com um pico de cerca de 572K IOPS com 168µs de latência.

Mudando para cargas de trabalho sequenciais de 64K, para leitura, a unidade incompressível atingiu um pico de 33,785 IOPS ou 2.11 GB/s com uma latência de 473 µs. Com compactação, vimos a unidade atingir 47,489 IOPS ou 2.97 GB/s com uma latência menor de 336 µs.

Leitura ScaleFlux CSD 2000 64k

Na gravação de 64K, ambas as configurações rodaram abaixo de 100µs durante uma grande parte do teste. A configuração incompressível atingiu o pico de 24,074 IOPS ou 1.5 GB/s com uma latência de 643 µs. Com compressão 4x, vimos um pico de 36,364 IOPS ou 2.27 GB/s com uma latência de 397 µs.

ScaleFlux CSD 2000sql

Nosso próximo conjunto de testes são nossas cargas de trabalho SQL: SQL, SQL 90-10 e SQL 80-20. Começando com o SQL, ambas as configurações de dados eram muito semelhantes. O incompressível atingiu um pico de 188,269 IOPS e 167µs de latência, enquanto os dados compactados indo para o drive atingiram um pico de 190,370 IOPS com uma latência também de 167µs.

No SQL 90-10, o ScaleFlux CSD 2000 incompressível atingiu um pico de 185,310 IOPS com uma latência de 172µs. Com compressão 4x indo para a unidade, atingiu um pico de 220,615 IOPS e uma latência de 144µs.

O SQL 80-20 teve o pico de unidade incompressível em 179,482 IOPS com uma latência de 177µs. Observando a compressão indo para o CSD, vimos um pico de 221,851 IOPS com uma latência de 143µs.

A seguir estão nossas cargas de trabalho Oracle: Oracle, Oracle 90-10 e Oracle 80-20. Começando com o Oracle, o incompressível atingiu um pico de 184,048 IOPS e uma latência de 194µs. Olhando para a unidade com compressão, vimos um pico de 245,385 IOPS e uma latência de 135 µs.

Oráculo ScaleFlux CSD 2000

O Oracle 90-10 começou quase o mesmo em desempenho e latência. A versão incompressível atingiu o pico de 155,641 IOPS com uma latência de 141µs. Com a versão compactada atingindo um pico de 175,681 IOPS com uma latência de 125µs.

As configurações da unidade de cabine Oracle 80-20 começaram abaixo de 100 µs. Com dados incompressíveis, o pico foi de 151,983 IOPS a 144µs para latência. Com dados compactados, vimos um desempenho máximo de 182,640 IOPs com uma latência de 120µs.

Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para inicialização VDI Full Clone (FC), o ScaleFlux CSD 2000 sem dados incompressíveis, a unidade atingiu um pico de 127,616 IOPS com uma latência de 263 µs. O envio da compressão 4x aumentou o desempenho até 161,543 IOPS com 216µs para latência.

Inicialização ScaleFlux CSD 2000 vdi fc

VDI FC Initial Login nos deu picos de 78,125 IOPS a 379µs com dados incompressíveis e 154,077 IOPS a 189µs com dados compactados.

Para VDI FC Monday, a unidade incompressível atingiu o pico de 62,922 IOPS com uma latência de 251 µs. Com compressão 4x, houve um pico muito maior em 100,680 IOPS com uma latência de apenas 156µs.

Para a inicialização VDI Linked Clone (LC), os dados incompressíveis para a unidade atingiram um pico de 58,705 IOPS com latência de 271µs. Quando enviamos compressão 4x para o drive, ele atingiu o pico de 81,137 IOPPS e latência de 196µs.

Inicialização ScaleFlux CSD 2000 vdi lc

O VDI LC Initial Login tinha a unidade com dados incompressíveis atingindo o desempenho máximo de 36,537 IOPS com uma latência de 215µs. Quando os dados compactados 4x atingiram a unidade, atingiram um pico de 56,739 IOPS e uma latência de 137µs.

Por fim, com o VDI LC Monday Login, a unidade incompressível atingiu um pico de 48,814 IOPS com uma latência de 323 µs. Com compactação, o SSD atingiu um pico de 81,799 IOPS com latência de 192µs.

Conclusão

ScaleFlux se concentra exclusivamente no armazenamento computacional. Isso é feito principalmente por meio de seus SSDs, conhecidos como ScaleFlux Computational Storage Drives (CSD). São SSDs PCIe Gen3 com mecanismos de computação para melhorar o desempenho e a eficiência dos dados. A empresa tem um punhado de unidades diferentes, mas para esta revisão, analisamos o ScaleFlux CSD 2000.

O principal diferenciador entre a unidade ScaleFlux e outro armazenamento computacional é o mecanismo de compactação/descompactação do caminho de dados. ScaleFlux reivindica uma capacidade quadruplicada enquanto dobra o desempenho, graças à sua tecnologia computacional. Isso não apenas atinge um ângulo de desempenho, mas também pode reduzir o custo por TB de armazenamento SSD devido à eficiência de armazenamento quando os dados são altamente compressíveis.

A principal preocupação é se o mecanismo de compressão funciona? Foi um sim fácil, pois manipulamos a compressão em nossos testes desde o início. Começamos com dados totalmente incompressíveis e, como esperado, vimos uma proporção da unidade de 1:1. Mudar para uma taxa de compressão de 4X nos rendeu uma taxa de compressão de 4.1:1 na unidade. A primeira etapa crítica recebeu uma marca de seleção antes de analisar o desempenho.

Primeiro, vamos examinar a unidade sem que dados incompressíveis sejam enviados a ela. Os destaques incluem 589K IOPS na leitura de 4K, 355K IOPS na gravação de 4K, 2.11GB/s na leitura de 64K e 1.5GB/s na gravação de 64K. No SQL, vimos picos de 188K IOPS, 185K IOPS no SQL 90-10 e 179K IOPS no SQL 80-20. Para nossas cargas de trabalho Oracle, vimos picos de 184 IOPS, 156 IOPS no Oracle 90-10 e 152 IOPS no Oracle 80-20. Com nossos testes de VDI Clone, o CSD 2000 sem compactação nos deu 128K IOPS na inicialização, 78K IOPS no login inicial e 63K IOPS no login de segunda-feira para clone completo. Para Linked Clone, a unidade nos deu 59K IOPS na inicialização, 37K IOPS no login inicial e 49K IOPS no login de segunda-feira.

Assim que enviamos dados compactados 4X, ficamos agradavelmente surpresos ao ver o salto de desempenho em todos os testes, exceto leitura 4K, onde não estava tão distante. Os destaques incluem 573K IOPS na leitura de 4K, 572K IOPS na gravação de 4K, 2.97GB/s na leitura de 64K e 2.27GB/s na gravação de 64K. No SQL, vimos picos de 190K IOPS, 221K IOPS no SQL 90-10 e 222K IOPS no SQL 80-20. Para Oracle, vimos picos de 245K IOPS, 176K IOPS no Oracle 90-10 e 183K IOPS no Oracle 80-20. Com nossos testes de clone VDI, o ScaleFlux com compactação nos deu 162 IOPS na inicialização, 154 IOPS no login inicial e 101 IOPS no login de segunda-feira para clone completo. Para Linked Clone, a unidade nos deu 81K IOPS na inicialização, 57K IOPS no login inicial e 82K IOPS no login de segunda-feira.

O ScaleFlux CSD 2000 é realmente um produto interessante e aponta para uma potencial mudança no espaço SSD tradicional à medida que o armazenamento computacional ganha força. O refrigerante já existe há muitos anos, então o conceito não é novo. O que provavelmente está faltando é a execução. De sua parte, ScaleFlux é o primeiro de qualquer um dos caras do CSD a obter algo em nosso laboratório. A confiança por si só não leva o dia, a unidade tem que funcionar.

Nesse caso, o desempenho não é apenas os números que você vê em nossos gráficos, embora tenha funcionado bem lá. A prova neste pudim de SSD está em sua capacidade de funcionar bem em dados compressíveis. Ele faz isso exatamente como esperado em nossos testes, até mesmo apresentando um pequeno aumento de desempenho em todos os perfis de teste, exceto um. Para que este SSD faça sentido, o caso de uso só precisa de alinhamento. Dados compressíveis se beneficiarão muito com a tecnologia ScaleFlux, sem dúvida. Contanto que você não precise de suporte de virtualização VMware ou Windows agora, definitivamente vale a pena explorar o CSD 2000 em uma PoC para ver o quanto sua carga de trabalho pode se beneficiar.

EscalaFlux

Agende uma PoC com ScaleFlux

Envolva-se com a StorageReview

Newsletter | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTokRSS feed