Home Empreendimento Análise do SSD Intel DC P4510

Análise do SSD Intel DC P4510

by Adam Armstrong

Introduzido no início deste ano, a série DC P4510 é o novo SSD NVMe de data center da Intel. Projetado especificamente para a nuvem (com o slogan “Inspirado na nuvem. Armazenamento otimizado.”), o P4510 é o primeiro SSD NAND 64D de 3 camadas da Intel. Aproveitando essa tecnologia, a empresa foi capaz de aumentar a capacidade da unidade para até 8 TB, ao mesmo tempo em que foi capaz de encaixá-la em um fator de forma U.2 de 15 mm.


Introduzido no início deste ano, a série DC P4510 é o novo SSD NVMe de data center da Intel. Projetado especificamente para a nuvem (com o slogan “Inspirado na nuvem. Armazenamento otimizado.”), o P4510 é o primeiro SSD NAND 64D de 3 camadas da Intel. Aproveitando essa tecnologia, a empresa foi capaz de aumentar a capacidade da unidade para até 8 TB, ao mesmo tempo em que foi capaz de encaixá-la em um fator de forma U.2 de 15 mm.

A capacidade expandida pode ajudar as empresas a consolidar cargas de trabalho ou suportar melhor cargas de trabalho de nuvem mais amplas, permitindo que os provedores de serviços aumentem o número de usuários e melhorem os níveis de serviço de dados. Juntamente com a alta capacidade, a unidade melhorou a QoS que utiliza um algoritmo de firmware inteligente que mantém os dados de leitura/gravação do host e do plano de fundo em um equilíbrio ideal. O P4510 apresentou desempenho de leitura de 3.2 GB/s e gravação de 3 GB/s, bem como leitura de 637K IOPS e gravação de 139K IOPs.

A série de unidades também minimiza as interrupções de serviço por meio do monitoramento SMART aprimorado da integridade e do status da unidade, usando um mecanismo dentro da banda e acesso fora da banda. Isso ajuda no caso de perda repentina de energia, bem como para evitar que os dados sejam perdidos junto com ela. O P4510 possui aprimoramentos de firmware incorporados em seu novo 3D NAND que prioriza as cargas de trabalho do host, garantindo assim melhores níveis de serviço.

O Intel DC P4510 vem em capacidades de 1 TB, 2 TB, 4 TB e 8 TB e usa a especificação NVMe 1.2. Para esta revisão, veremos os modelos de 2 TB e 8 TB. 

Especificações Intel DC P4510

Capacidade 1TB 2TB 4TB 8TB
Interface PCIe 3.1x4, NVMe 1.2
Fator de forma U.2 2.5” 15mm
NAND Tecnologia Intel 3D NAND, 64 camadas, TLC
Desempenho
128k leitura sequencial até 3,200 MB / s
gravação sequencial de 128k até 3,000 MB / s
4k leitura aleatória até 637,000 IOPS
4k gravação aleatória até 139,000 IOPS
Latência de leitura/gravação 110μs
Confiabilidade
Gravação vitalícia 13.88PB
DWPD 1
MTBF 2 milhões de horas
UBER 1 setor por 10^17 bits lidos
vibração
Operativo 2.17 GRMS (5-700 Hz)
Não operacional 3.13 GRMS (5-800 Hz)
Choque 1000G (0.5ms)
Energia  
Ativo 16W
inativo 5W

 

Desempenho

Mesa de teste

Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.

Lenovo Think System SR850

  • 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • 2 x placas RAID 930-8i 12 Gb/s
  • 8 compartimentos NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 16 x 16 GB DDR4-2666 MHz ECC DRAM
  • 1 placa RAID PERC 730 2GB 12Gb/s
  • Adaptador NVMe Complementar
  • Ubuntu-16.04.3-desktop-amd64

Histórico de testes e comparáveis

Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nas respectivas páginas.

Comparáveis ​​para esta revisão:

Análise de carga de trabalho do aplicativo

Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Intel P4510 são, portanto, os Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica.

Desempenho do SQL Server

Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.

Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.

Configuração de teste do SQL Server (por VM)

  • Windows Server 2012 R2
  • Ocupação de armazenamento: 600 GB alocados, 500 GB usados
  • SQL Server 2014
    • Tamanho do banco de dados: escala 1,500
    • Carga de cliente virtual: 15,000
    • Memória RAM: 48 GB
  • Duração do teste: 3 horas
    • 2.5 horas de pré-condicionamento
    • período de amostra de 30 minutos

Para nosso benchmark transacional do SQL Server, o P4510 ficou em terceiro lugar com 12,625.4 TPS, 10.7 atrás do melhor desempenho, o PBlaze4.

Para a latência média do SQL, o P4510 novamente ficou em terceiro com 9ms. 

Desempenho do Sysbench

O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.

Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tabelas de banco de dados: 100
    • Tamanho do banco de dados: 10,000,000
    • Segmentos de banco de dados: 32
    • Memória RAM: 24 GB
  • Duração do teste: 3 horas
    • 2 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos

Com o benchmark transacional Sysbench, o P4510 ficou em segundo e terceiro lugar com 7,346.8 TPS para 8 TB e 6,537 TPS para 2 TB.

Com latência média, o P4510 teve a mesma colocação dos anteriores com o 8TB em segundo com latência de 17.4ms e o 2TB em terceiro com 19.6ms

Nosso benchmark de latência de pior cenário mais uma vez teve a mesma colocação com o P8 de 4510 TB em segundo com 30.9 ms e a versão de 2 TB em terceiro com 35.6 ms. 

Houdini por SideFX

O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para esta aplicação é uma variante do núcleo Dell PowerEdge R740xd tipo de servidor que usamos no laboratório com duas CPUs Intel 6130 e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.

A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:

  1. Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
  2. Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
  3. (Não Executar) Processe os pontos.
  4. Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
  5. (Não executado) Grave os blocos agrupados de volta no disco.

O Intel P4510 se saiu muito bem no teste Houdini, ficando em segundo lugar entre as unidades não Optane com 2,595.7 segundos. No geral, ficou em sétimo lugar. O de 2 TB não se saiu tão bem com 2,845.6 segundos.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Em nossa primeira análise de carga de trabalho VDBench, leitura aleatória de 4K, o Intel DC P8 de 4510 TB teve um desempenho máximo de 642,149 IOPS e uma latência de 198 µs. Isso colocou o terceiro drive atrás do Memblaze PBlaze5 e logo atrás do Toshiba PX04. A versão de 2 TB ficou em quarto lugar com desempenho máximo de 621,469 IOPS e latência de 205µs.

Para gravação aleatória de 4K, o P8 de 4510 TB atingiu o pico em torno de 433K IOPS com 36µs. No entanto, imediatamente houve uma queda no desempenho e um aumento na latência, colocando-o no mesmo nível do P3700 e em terceiro lugar. O de 2 TB ficou em penúltimo lugar, com desempenho máximo de 233,299 IOPS com latência de 540µs.

Mudando para cargas de trabalho sequenciais, o P8 de 4510 TB conseguiu superar o Toshiba PX04 pelo segundo lugar em leituras de 64K com uma pontuação máxima de 39,502 IOPS ou 2.5 GB/s com uma latência de 396 µs. O 2TB novamente ficou em quarto lugar com 37,582 IOPS ou 2.35 GB/s e uma latência de 425µs.

Para gravações de 64K, o P8 de 4510 TB ficou em terceiro mais uma vez com desempenho máximo de 26,150 IOPS ou 1.63 GB/s e latência de 605 µs. Mais uma vez, o de 2 TB teve um desempenho de gravação muito mais ruim, ficando em penúltimo lugar com 15,453 IOPS ou 966 MB/s e uma latência de 1.02 ms.

Em seguida, examinamos as cargas de trabalho do SQL. No primeiro benchmark, o P8 de 4510 TB ficou em segundo lugar por pouco, com desempenho máximo de 241,242 IOPS e latência de 132 µs. O P2 de 4510 TB ficou em quarto lugar com desempenho máximo de 188,170 IOPS e 170 µs.

No SQL 90-10, novamente a unidade de 8 TB ficou em segundo lugar, atingindo um pico de 213,390 IOPS com uma latência de 146 µs antes de cair abaixo de 200 IOPS e a latência aumentar ligeiramente. A versão de 2 TB teve desempenho máximo de 182,868 IOPS com latência de 196µs, ficando em quarto lugar.

No SQL 80-20, vimos o mesmo posicionamento com um efeito semelhante do P8 de 4510 TB com pico de 204,683 IOPS com latência de 156 µs antes de cair um pouco. A versão de 2 TB atingiu o pico de 150,201 IOPS com uma latência de 209 µs antes de cair ligeiramente no desempenho, ficando em terceiro lugar. 

Nosso próximo lote de benchmarks analisa as cargas de trabalho da Oracle. O primeiro mostrou o P8 de 4510 TB em segundo lugar com desempenho máximo de 191,472 IOPS e latência de 188µs. O 2TB atingiu o desempenho máximo de 136,675 IOPS com uma latência de 237µs ficando em quarto lugar.

Para Oracle 90-10, o P8 de 4510 TB perdeu por pouco a ultrapassagem do PBlaze5 com desempenho máximo de 177,256 IOPS e latência de 124µs. A versão de 2 TB atingiu um pico de 137,302 IOPS com uma latência de 160µs.

Com o teste Oracle 80-20, o P8 de 4510 TB mais uma vez ficou em segundo lugar com desempenho máximo de 177,851 IOPS e latência de 130 µs. A unidade de 2 TB atingiu um pico de 127,888 IOPS e uma latência de 171 µs, colocando-a em terceiro lugar.

Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para VDI Full Clone Boot, o P8 de 4510 TB ficou em segundo lugar com desempenho máximo de 160,678 IOPS e latência de 215 µs. A versão de 2 TB estava empatada com o drive Toshiba com um desempenho máximo de 138,821 IOPS e uma latência de 244µs.

Com VDI FC Initial Login, o P8 de 4510 TB atingiu o pico de 79,306 IOPS com uma latência de 375 µs antes de cair um pouco no desempenho. Mais uma vez ficou em segundo lugar. A versão de 2 TB foi a penúltima com desempenho máximo de 54,562 IOPS e latência de 546µs.

O VDI FC Monday Login viu o P8 de 4510 TB ficar em segundo lugar com um desempenho máximo de 67,351 IOPS e uma latência de 236 µs. O P2 de 4510 TB ficou em terceiro lugar com desempenho máximo de 51,803 IOPS e latência de 307 µs.

No teste VDI LC Boot, vimos o P8 de 4510 TB ficar em terceiro aqui atrás do Memblaze e Toshiba com um desempenho máximo de 75,572 IOPS e uma latência de 211µs. Logo atrás estava o P2 de 4510 TB com 65,274 IOPS e uma latência de 244µs.

O VDI LC Initial Login obteve um melhor posicionamento para o P8 de 4510 TB, ficando em segundo lugar com um desempenho máximo de 48,495 IOPS e uma latência de 205µs. Em terceiro lugar ficou a versão de 2TB com 31,468 IOPS e latência de 252µs.

E, finalmente, nosso VDI LC Monday Login teve o P8 de 4510 TB em segundo lugar com um desempenho máximo de 48,324 IOPS e uma latência de 328 µs. A unidade de 2 TB caiu para a penúltima com 35,999 IOPS e 439µs de latência. 

Conclusão

A série Intel DC P4510 NVMe SSD é a nova unidade de data center da empresa projetada com a nuvem em mente. As unidades vêm em um fator de forma U.2 com uma impressionante capacidade máxima de 8 TB, aproveitando o 64D NAND de 3 camadas da Intel. Essa capacidade se traduz em cargas de trabalho de nuvem mais amplas, mais usuários e melhores níveis de serviço. O P4510 possui uma QoS aprimorada que equilibra as leituras e gravações do host e do plano de fundo. Ele também monitora a integridade e o status da unidade para ajudar a garantir a disponibilidade e a proteção dos dados. 

Observando o desempenho em nossa análise de carga de trabalho de aplicativos, o SSD Intel DC P4510 apresentou bons números em nosso teste SQL Server com 12,625.4 TPS e latência média de 9ms. Ambas as unidades Memblaze venceram por uma pequena margem. Com o Sysbench, o P8 de 4510 TB ficou em segundo lugar com 7,346.8 TPS, latência média de 17.4 ms e pior cenário de 30.9 ms, enquanto o de 2 TB atingiu 6,537 TPS, latência média de 17.4 ms e pior de 35.6 ms. cenário do caso. Com o teste de Houdini, o P8 de 4510 TB ficou em segundo lugar para uma unidade não Optane com 2,595.7 segundos, ficando em sétimo lugar geral. A versão de 2 TB conseguiu atingir 2,845.6 segundos.

Para análise de carga de trabalho VDBench, o P8 de 4510 TB ficou em segundo ou terceiro lugar em todos os benchmarks. Ele apresentou números impressionantes, embora, por exemplo, em 4K aleatório, tenha conseguido atingir mais de 642K IOPS de leitura e 433K IOPS de gravação (embora tenha visto uma queda acentuada no desempenho após atingir o pico). Em cargas de trabalho sequenciais, a unidade atingiu 2.5 GB/s de leitura e 1.63 GB/s de gravação. Para cargas de trabalho SQL, o P4510 conseguiu atingir mais de 241 IOPS, 213 IOPS para 90-10 e mais de 204 IOPS para 80-20. Para nossas cargas de trabalho Oracle, a unidade Intel conseguiu atingir mais de 191 IOPS, bem como 177 IOPS para 90-10 e 80-20. No Oracle 90-10, a Intel quase alcançou o líder, PBlaze5. Para nossos testes VDI FC, a unidade conseguiu atingir mais de 160 IOPS para inicialização, 79 IOPS para login inicial e 67 IOPS para login na segunda-feira. Para VDI LC, a unidade atingiu mais de 75 IOPS para inicialização, 48 IOPS para login inicial e 48 IOPS para login na segunda-feira.

O P4510 se saiu bem na maioria dos benchmarks, melhorando facilmente em relação ao P4500 anterior. Com a variedade de ofertas de capacidade e fatores de forma, a Intel posicionou bem o P4510 para ser seu burro de carga NVMe, especialmente com o modelo de 8 TB de capacidade mais alta. 

Concluindo!

O Intel SSD DC P4510 é um SSD NVMe com capacidades de até 8 TB e amplo desempenho para permitir que os provedores de serviços façam mais com seus serviços de dados.

SSD Intel DC P4510

Discuta esta avaliação

Inscreva-se no boletim informativo StorageReview