Home Empreendimento Análise da série Intel DC P4610 SSD

Análise da série Intel DC P4610 SSD

by Lyle Smith

O Intel SSD DC P4610 Series é a mais nova linha de unidades de data center da empresa, construída especificamente para desempenho, QoS e capacidade. Aproveitando a especificação NVMe 1.2 dentro de um fator de forma U.2 de 2.5”, esse foco na eficiência de armazenamento permite que as organizações minimizem as interrupções de serviço e gerenciem efetivamente seus data centers "em escala". A nova linha Intel também ajuda a melhorar a agilidade e a utilização do servidor e acelera os aplicativos em uma variedade de diferentes cargas de trabalho na nuvem.


O Intel SSD DC P4610 Series é a mais nova linha de unidades de data center da empresa, construída especificamente para desempenho, QoS e capacidade. Aproveitando a especificação NVMe 1.2 dentro de um fator de forma U.2 de 2.5”, esse foco na eficiência de armazenamento permite que as organizações minimizem as interrupções de serviço e gerenciem efetivamente seus data centers "em escala". A nova linha Intel também ajuda a melhorar a agilidade e a utilização do servidor e acelera os aplicativos em uma variedade de diferentes cargas de trabalho na nuvem.

Desta vez, a Intel usa a tecnologia TLC 64D NAND de 3 camadas, o que permitiu aumentar a capacidade máxima da série P4610 em até 20% em comparação com a linha anterior (P4600). A Intel indica que isso adicionará mais aplicativos de carga de trabalho, incluindo mais usuários para provedores de serviços corporativos e de nuvem e níveis de serviço de dados aprimorados.

No que diz respeito ao desempenho, espera-se que a série DC P4610 atinja velocidades sequenciais de leitura e gravação de até 3,200 MB/s e 2,100 MB/s, respectivamente, enquanto leituras e gravações aleatórias são cotadas em 620,000 IOPS e 200,000 IOPS. A Intel afirma que isso se traduzirá em taxa de gravação 35% mais rápida, resistência aprimorada de até 35% por unidade e até quatro vezes a redução do tempo de serviço em uma métrica de QoS de 99.99% de disponibilidade para carga de trabalho de acesso aleatório

O Intel SSD DC P4610 Series vem em capacidades de 1.6 TB, 3.2 TB, 6.4 TB e 7.68 TB. Estaremos olhando para o SSD de menor capacidade nesta análise.

Especificações da série Intel DC P4610 SSD

Fator de forma U.2
Capacidade 1.6TB 3.2TB 6.4TB 7.68TB
NAND NAND TLC 64D de 3 camadas
Interface PCIe NVMe 3.1x4
Protocolo NVMe 1.2
Desempenho
Leitura sequencial (128 KB) 3,200MB / s 3,200MB / s 3,000MB / s 3,200MB / s
Gravação sequencial (128 KB) 3,200 MB / s 3,000MB / s 2,900MB / s 3,200MB / s
Leitura aleatória sustentada (4 KB) 640000 IOPS 640000 IOPS 640000 IOPS 640000 IOPS
Gravação aleatória sustentada (4 KB) 220000 IOPS 200000 IOPS 220000 IOPS 220000 IOPS
Latência de leitura 77 μs
Tempo médio entre falhas (MTBF) 2 milhões
Peso 139g
Garantia 5 Anos
Consumo de energia (ativo/inativo) 5W / 13.3W 5W / 13.8W 5W / 14.6W 5W / 14.8W

Desempenho

Mesa de teste

Nossas análises de SSD corporativo utilizam um Lenovo ThinkSystem SR850 para testes de aplicativos e um Dell PowerEdge R740xd para benchmarks sintéticos. O ThinkSystem SR850 é uma plataforma quad-CPU bem equipada, oferecendo potência de CPU bem acima do necessário para enfatizar o armazenamento local de alto desempenho. Os testes sintéticos que não exigem muitos recursos da CPU usam o servidor de processador duplo mais tradicional. Em ambos os casos, a intenção é mostrar o armazenamento local da melhor maneira possível, de acordo com as especificações máximas de unidade do fornecedor de armazenamento.

Lenovo Think System SR850

  • 4 x CPU Intel Platinum 8160 (2.1 GHz x 24 núcleos)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • 2 x placas RAID 930-8i 12 Gb/s
  • 8 compartimentos NVMe
  • VMware ESXI 6.5

Dell PowerEdge R740xd

  • 2 x CPU Intel Gold 6130 (2.1 GHz x 16 núcleos)
  • 16 x 16 GB DDR4-2666 MHz ECC DRAM
  • 1 placa RAID PERC 730 2GB 12Gb/s
  • Adaptador NVMe Complementar
  • Ubuntu-16.04.3-desktop-amd64

Histórico de testes e comparáveis

Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nessas respectivas páginas.

Principais comparáveis ​​para esta revisão:

Análise de carga de trabalho do aplicativo

Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o Intel P4610 são, portanto, os Desempenho OLTP do MySQL via SysBench. Para nossas cargas de trabalho de aplicativos, cada unidade executará de 2 a 4 VMs configuradas de forma idêntica. Nota: O modelo de 1.6 TB não era grande o suficiente para a carga de trabalho do nosso aplicativo SQL, por isso não foi incluído nesta análise.

Desempenho do Sysbench

O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.

Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tabelas de banco de dados: 100
    • Tamanho do banco de dados: 10,000,000
    • Segmentos de banco de dados: 32
    • Memória RAM: 24 GB
  • Duração do teste: 3 horas
    • 2 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos

Com o benchmark transacional Sysbench, o Intel 4610 atingiu um patamar sólido de 7,471.3 TPS em quinto lugar.

Com a latência média do Sysbench, o Intel 4610 novamente ficou em quinto lugar entre os comparáveis ​​com uma latência de 17.1ms.

Nosso benchmark de latência de pior cenário viu o Intel 4610 pousar novamente em quinto lugar com 30.5 ms.

Houdini por SideFX

O teste Houdini foi projetado especificamente para avaliar o desempenho do armazenamento no que se refere à renderização CGI. O banco de teste para esta aplicação é uma variante do núcleo Dell PowerEdge R740xd tipo de servidor que usamos no laboratório com duas CPUs Intel 6130 e DRAM de 64 GB. Nesse caso, instalamos o Ubuntu Desktop (ubuntu-16.04.3-desktop-amd64) executando bare metal. A saída do benchmark é medida em segundos para ser concluída, com menos sendo melhor.

A demonstração do Maelstrom representa uma seção do pipeline de renderização que destaca os recursos de desempenho do armazenamento, demonstrando sua capacidade de usar efetivamente o arquivo de troca como uma forma de memória estendida. O teste não grava os dados do resultado nem processa os pontos para isolar o efeito do tempo decorrido do impacto da latência no componente de armazenamento subjacente. O teste em si é composto por cinco fases, três das quais executamos como parte do benchmark, que são as seguintes:

  1. Carrega pontos compactados do disco. Este é o momento de ler do disco. Isso é de thread único, o que pode limitar a taxa de transferência geral.
  2. Descompacta os pontos em uma única matriz plana para permitir que sejam processados. Se os pontos não tiverem dependência de outros pontos, o conjunto de trabalho pode ser ajustado para permanecer no núcleo. Esta etapa é multiencadeada.
  3. (Não Executar) Processe os pontos.
  4. Reempacota-os em blocos agrupados adequados para armazenamento em disco. Esta etapa é multiencadeada.
  5. (Não executado) Grave os blocos agrupados de volta no disco.

Com o teste de Houdini, o Intel P4610 se posicionou na parte superior central do pacote.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI. Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 64 threads, 0-120% de atualização
  • Leitura sequencial de 64K: 100% de leitura, 16 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 8 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Em nossa primeira análise de carga de trabalho VDBench, leitura aleatória de 4K, o Intel P4610 ficou abaixo de 1ms com um pico de 610,532 IOPS e uma latência de 208.3μs, ficando na parte inferior do pacote.

Em gravações aleatórias de 4K, o P4610 novamente viu latência abaixo de milissegundos ao ficar em terceiro lugar. Especificamente, teve um desempenho máximo de 375,251 IOPS e uma latência de 338.3 μs.

Mudando para cargas de trabalho sequenciais, o P4610 caiu para durar novamente em leituras de 64K com uma pontuação máxima de 34,336 IOPS (ou 2.15 GB/s) com uma latência de 464.6 μs.

O P4610 mais uma vez ficou em terceiro lugar em desempenho de gravação em nosso teste sequencial de 64K com 25,661 IOPS (ou 1.6 GB/s) com 611.6 μs.

Passando para cargas de trabalho SQL, o P4610 atingiu o pico de 188,997 IOPS com latência de 168.9 μs, caindo para o fundo do pacote.

O SQL 90-10 viu o P4610 manter o quarto lugar com uma pontuação máxima de 187,357 IOPS e uma latência de 169.5 μs, colocando-o bem no meio do pacote.

O P4610 atingiu um pico de 186,197 IOPS com uma latência de 170.6 μs no benchmark SQL 80-20.

Com nossa carga de trabalho Oracle, o P4610 continuou atrás do Memblaze e do Huawei com 184,659 OPS e uma latência de 190.7 μs.

Para o Oracle 90-10, o P4610 teve um pico de 151,174 IOPS e uma latência de 145μs, colocando-o em penúltimo lugar.

No meio do pacote, o P4610 teve desempenho máximo de 150,698 IOPS e latência de 144.2μs em nosso Oracle 80-20.

Em seguida, passamos para nossos testes de clone de VDI completo e vinculado. Para VDI Full Clone Boot, o P4610 teve um desempenho máximo de 137,610 IOPS e uma latência de 248 μs.

No VDI FC Initial Login, o P4610 teve um desempenho máximo de 84,026 IOPS e uma latência de 353.9μs, ficando em terceiro lugar.

Com o VDI FC Monday Login, o P4610 atingiu o pico de 74,635 IOPS e uma latência de 212.5 μs.

Mudando para Linked Clone (LC), primeiro olhamos para o teste de inicialização, onde o P4610 ficou em 74,635 IOPS e uma latência de 275.7 μs.

O VDI LC Initial Login teve o P4610 com desempenho máximo de 40,236 IOPS e uma latência de 196.3 μs.

Por fim, o VDI LC Monday Login teve o pico P4610 em 56,350 IOPS e uma latência de 281.4 μs para o terceiro lugar.

Conclusão

O Intel SSD DC P4610 Series oferece um modelo novo e aprimorado para a linha de unidades de data center NVMe voltadas para o desempenho. O novo P4610 apresenta NAND 64D de 3 camadas, vem no fator de forma U.2 e está disponível em capacidades de 1.6 TB, 3.2 TB, 6.4 TB e 7.68 TB, o primeiro que testamos para esta análise. A Intel afirma ter melhor desempenho em relação à linha de última geração com velocidades de leitura e gravação citadas de até 3,200 MB/s e 2,100 MB/s, respectivamente, e leitura e gravação aleatórias de 620,000 IOPS e 200,000 IOPS. A Intel construiu a linha de SSD P4610 para se destacar especificamente em níveis de serviço exigentes, ao mesmo tempo em que oferece suporte a cargas de trabalho de nuvem maiores para reduzir os custos. 

Olhando para o desempenho de nosso aplicativo sysbench, o P4610 mostrou sólidos 7,471.3 TPS, uma latência média de 17.1 ms e latência de pior cenário de 30.5 ms, atrás de várias outras unidades. Em nosso benchmark Houdini by SideFX, o novo drive Intel teve 2,870.3 segundos, colocando-o no meio do campo. O tamanho da amostra de 1.6 TB não era grande o suficiente para nosso teste do SQL Server, por isso não foi realizado para esta revisão.

Para VDBench, o P4610 mostrou latência abaixo de milissegundos em todos os testes. Os principais resultados incluem 610,532 IOPS na leitura de 4K, 375,251 IOPS na gravação de 4K, 2.15GB/s na leitura de 64K e 1.6GB/s na gravação de 64K. O Oracle apresentou 184,659 IOPS, 151,174 IOPS e 150,698 IOPS para carga de trabalho, 90-10 e 8020, respectivamente, enquanto os testes SQL rodaram entre 186K IOPS e 189K IOPS.

No geral, o Intel P4610 mostrou desempenho médio a abaixo do esperado, dependendo do aplicativo em que você se concentrou. Em nosso benchmark de renderização Houdini, ele foi mais lento que o P4510 centrado na leitura. Em nossas cargas de trabalho com foco no desempenho de leitura, ficou aquém em comparação com outras unidades de carga de trabalho mistas nesta categoria. Em benchmarks com alguma concentração de comportamento de gravação, o desempenho melhorou, mas para níveis mais intermediários. Dependendo do custo, porém, o P4610 ainda pode se tornar um bom investimento para aplicativos que não são muito sensíveis à latência.

Intel P4610

Discuta esta revisão

Inscreva-se no boletim informativo StorageReview