Home Empreendimento Análise do SSD Intel Optane DC P4800X

Análise do SSD Intel Optane DC P4800X

by Brian Beeler

A série Optane SSD DC P4800X da Intel foi lançado em março de 2017 com a promessa de trazer uma nova mídia de memória de classe de armazenamento (SCM) chamada 3D XPoint (marca Intel Optane) para o mercado. O P4800X foi lançado como uma unidade NVMe tradicional de 2.5″ (U.2) e também como uma placa de expansão PCIe. As capacidades iniciais começaram em 375 GB com planos de chegar a 1.5 TB até o final de 2017. Essa meta de capacidade não se concretizou, mas a Intel lançou Modelos Optane de 750 GB em novembro. Independentemente da capacidade, o P4800X tem uma tarefa: fornecer o armazenamento de maior velocidade possível para aplicativos sensíveis à latência no data center.


A série Optane SSD DC P4800X da Intel foi lançado em março de 2017 com a promessa de trazer uma nova mídia de memória de classe de armazenamento (SCM) chamada 3D XPoint (marca Intel Optane) para o mercado. O P4800X foi lançado como uma unidade NVMe tradicional de 2.5″ (U.2) e também como uma placa de expansão PCIe. As capacidades iniciais começaram em 375 GB com planos de chegar a 1.5 TB até o final de 2017. Essa meta de capacidade não se concretizou, mas a Intel lançou Modelos Optane de 750 GB em novembro. Independentemente da capacidade, o P4800X tem uma tarefa: fornecer o armazenamento de maior velocidade possível para aplicativos sensíveis à latência no data center.

Dada a menor capacidade das unidades, é menos provável que a empresa preencha JBODs com SSDs P4800X para usar como armazenamento primário. Embora isso certamente seja possível como uma solução pontual para aplicativos que podem se beneficiar de um armazenamento mais rápido, como pequenos conjuntos de dados analíticos e casos de uso de BI. Os fornecedores de matriz corporativa também não se apressaram em adotar o Optane em quantidade em seus projetos de sistema, novamente em grande parte por causa das limitações de capacidade. A HPE, no entanto, explorou o uso do Optane como um cache para sistemas 3PAR e outros certamente estão procurando integrar essa classe de armazenamento em seus sistemas à medida que a tecnologia amadurece. Há, no entanto, um conjunto imediato de excelentes casos de uso para SSDs baseados em Optane no mundo do armazenamento definido por software, onde os designs têm mais flexibilidade para dar conta dessa nova classe de armazenamento.

O VMware vSAN é talvez o mais visível neste espaço, pois oferece suporte dia 0 para o P4800X e ter uma liderança de comando no espaço HCI. O vSAN também está bem posicionado para aproveitar essas unidades menores porque elas operam em uma arquitetura de dois níveis. O armazenamento do vSAN é coordenado em grupos de discos, com uma camada para todas as atividades de gravação de entrada, bem como uma camada de leitura orientada à capacidade. Atualmente, o vSAN aproveita apenas até 600 GB por unidade no nível de gravação, portanto, as capacidades menores do P4800X não são realmente uma limitação. Para usuários do vSAN, isso significa que, para implantações com o P4800X atuando como uma unidade de cache, as gravações ocorrem na velocidade mais rápida possível nos clusters do vSAN.

Esta análise é do P4800X no formato U.375 de 2 GB. Embora trabalhe principalmente como parte de um grupo de discos para nosso próxima análise do vSAN, pudemos executar um subconjunto de nossos testes normais de SSD corporativo para fornecer uma imagem mais completa do perfil de desempenho do P4800X.

Especificações Intel Optane SSD DC P4800X

Fator de forma AIC HHHL, U.2
Capacidade 375GB, 750GB
Interface PCIe 3x4, NVMe
Latência <10μs
QoS
4 KB aleatório, profundidade de fila 1, leitura/gravação <60/100μs
4 KB aleatório, profundidade de fila 16, R/W <150/200μs
Produtividade
4 KB aleatório, profundidade de fila 16, R/W até 550/500 IOPS
4 KB aleatório, profundidade de fila 16, misto 70/30 R/W até 500 IOPS
resistencia
DWPD  30
Petabytes escritos
375GB 20.5PBW
750GB 41PBW

Desempenho

Mesa de teste

Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.

Lenovo Think System SR850

  • 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • 2 x placas RAID 930-8i 12 Gb/s
  • 8 compartimentos NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 16 x 16 GB DDR4-2666 MHz ECC DRAM
  • 1 placa RAID PERC 730 2GB 12Gb/s
  • Adaptador NVMe Complementar
  • Ubuntu-16.04.3-desktop-amd64

Histórico de testes e comparáveis

Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nas respectivas páginas.

Comparáveis ​​para esta revisão:

Houdini por SideFX

O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para esta aplicação é uma variante do núcleo Dell PowerEdge R740xd tipo de servidor que usamos no laboratório com duas CPUs Intel 6130 e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.

A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:

  1. Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
  2. Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
  3. (Not Run) Processa os pontos.
  4. Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
  5. (Não executado) Grava os blocos agrupados de volta no disco.

O Intel Optane SSD DC P4800X ficou em primeiro lugar no teste Houdini com 1,520.4 segundos. O P4800X teve o melhor desempenho de qualquer uma das unidades Optane, bem como o melhor no geral.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não sejam uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação “maçãs com maçãs” entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Para desempenho aleatório de pico de 4K, o Intel Optane SSD DC P4800X (referido como P4800X daqui em diante) começou com latência muito menor do que as outras unidades antes de aumentar logo após 500K IOPS e terminar em último com 585,754 IOPS com uma latência de 213μs .

Com desempenho de gravação de pico de 4K, o P4800X teve uma exibição melhor, terminando em segundo lugar com um desempenho de pico de aproximadamente 554K IOPS e uma latência de apenas 155μs.

Mudando para cargas de trabalho sequenciais, em nossa leitura de 64K, vimos um padrão semelhante à leitura de 4K. O P4800X começou com uma latência muito menor do que as outras unidades antes de atingir cerca de 35 IOPS e atingir o pico de 40,558 IOPS ou 2.53 GB/s com uma latência de 394 μs. Isso colocou a unidade em quarto lugar geral.

Para a gravação de 64K, o P4800X ficou em segundo lugar com um desempenho máximo de aproximadamente 34,700 IOPS ou 2.17 GB/s com uma latência de 380 μs antes de cair ligeiramente.

Com nossa carga de trabalho SQL, vemos o P4800X saltar para a frente por uma ampla margem com uma pontuação máxima de 286,548 IOPS com uma latência de apenas 111μs.

Em nosso SQL90-10, o P4800X continuou seu reinado com uma pontuação máxima de 276,530 IOPS com uma latência de 114μs.

Permanecendo em primeiro lugar no SQL 80-20, o P4800X atingiu um pico de aproximadamente 266K IOPS com uma latência de aproximadamente 111μs antes de uma pequena queda.

Passando para nossas cargas de trabalho Oracle, o P4800X ficou em segundo lugar com uma pontuação máxima de quase 248K IOPS e uma latência de 127μs.

No Oracle 90-10, o P4800X superou os outros drives com desempenho máximo de 276,703 IOPS com latência de apenas 79μs.

Novamente no Oracle 80-20, vimos o P4800X sair na frente com 265,769 IOPS e latência de apenas 82μs.

Em seguida, mudamos para nosso teste de clone VDI, Full Clone (FC) e Linked Clone (LC). Para o VDI FC Boot, o P4800X começou extremamente forte antes de saltar e ocupar o terceiro lugar com um desempenho máximo de 167,856 IOPS e uma latência de 199μs.

Com o VDI FC Initial Login, o P4800X ficou em terceiro novamente com 108,159 IOPS e uma latência de 274μs.

Para VDI FC Monday Login, o P4800X saltou para o segundo lugar com desempenho máximo de 97,198 IOPS e latência de 163 μs.

Passando para o VDI LC Boot, o P4800X conseguiu ocupar o primeiro lugar com uma pontuação de 93,095 IOPS e uma latência de 171μs.

O VDI LC Initial Login teve outro lugar de destaque para o P4800X com uma pontuação de 66,463 IOPS e uma latência de 118 μs.

Por fim, nosso teste VDI LC Monday Login teve o P4800X em segundo lugar com 67,085 IOPS com uma latência de 235μs.

Conclusão

O Intel Optane SSD DC P4800X é mais uma unidade lançada com a tecnologia 3D XPoint da Intel. Como o nome indica, a unidade é projetada especificamente para o centro de dados e vem em fatores de forma comuns U.2 e AIC HHHL. Uma das desvantagens que imediatamente se torna aparente é que a unidade é oferecida apenas em capacidades de 375 GB e 750 GB. Por um lado, isso limita seus casos de uso, mas, por outro lado, seus casos de uso são predominantemente voltados para cargas de trabalho e aplicativos em que a baixa latência é fundamental em relação à capacidade. A esse respeito, a tecnologia Optane provou ser a líder do setor em cargas de trabalho corporativas e de usuários finais.

A pequena capacidade do P4800X é o motivo pelo qual temos um pequeno buraco em nossa barragem normal de benchmarks. A capacidade da unidade não era grande o suficiente para executar SQL ou Sysbench, portanto, eles estão ausentes nesta análise de unidade única. Na primeira carga de trabalho de análise de aplicativo que pudemos executar, Houdini da SideFX, o P4800X teve o melhor desempenho geral com 1,520.4 segundos. Em nosso VDBench, o P4800X dominou em toda a linha em baixas profundidades de fila. O desempenho de ponta foi mais misturado com o P4800X, onde alguns produtos NVMe tradicionais o superaram em desempenho. No entanto, superou outros em áreas como SQL e Oracle 90-10 e 80-20. Os destaques do P4800X incluem mais de meio milhão de IOPS em ambos os testes 4K, 2.53 GB/s na leitura de 64 K e 2.17 GB/s na gravação de 64 K. Em todos os três testes SQL, o P4800X ultrapassou um quarto de milhão de IOPS e foi igual ou superior a 250 IOPS em nossos testes Oracle. Mas deixando de lado o desempenho máximo, o Intel Optane P4800X teve latências extremamente baixas. Em todos os testes, a latência começou muito baixa, normalmente muito menor do que todas as outras unidades. E, em alguns casos, o P4800X teve desempenho máximo com latência tão baixa quanto 79μs no Oracle 90-10 e 82μs no Oracle 80-20.

Para cargas de trabalho de baixa latência, atualmente não há nada que se aproxime do Intel Optane SSD DC P4800X. Embora existam áreas em que os produtos NVMe tradicionais podem superá-lo em largura de banda geral e IOPS, em geral, o P4800X não se encaixaria nesses casos de uso com base em suas métricas de preço/capacidade. É empolgante, porém, pensar nas possibilidades da tecnologia Intel Optane assim que as unidades corporativas atingirem os pontos de maior capacidade; especialmente algo na classe de 2 TB, que ainda é a favorita dos fornecedores de array, apesar de SSDs SAS de 30 TB estarem comumente disponíveis. Em nosso caso de uso específico em relação ao vSAN, o P4800X oferece o desempenho mais rápido possível para a camada de cache de gravação. Para quem deseja obter o máximo do vSAN, o P4800X é o padrão de fato.

Página do produto Intel P4800X

Discutir esta revisão

Inscreva-se no boletim informativo StorageReview