Home Empreendimento Confronto de SSD empresarial Intel P5510 vs Samsung PM9A3

Confronto de SSD empresarial Intel P5510 vs Samsung PM9A3

by Brian Beeler

A Intel lançou o P5510 SSD NVMe em dezembro do ano passado, o primeiro SSD corporativo a ser comercializado com TLC NAND de 144 camadas. Vimos as unidades em nosso laboratório extensivamente desde então, elas são extremamente populares devido à sua agressiva relação preço/desempenho. Quase ao mesmo tempo, a Samsung lançou seu SSD PM9A3. Baseado em um NAND de camada 1xx menos transparente, o PM9A3 é, como a Intel, uma solução SSD integrada verticalmente. Com ambas as empresas distribuindo amplamente o popular fator de forma U.2 na capacidade de 7.68 TB, decidimos colocar esses gigantes frente a frente para ver quem leva vantagem nas guerras de SSD corporativo.

A Intel lançou o P5510 SSD NVMe em dezembro do ano passado, o primeiro SSD corporativo a ser comercializado com TLC NAND de 144 camadas. Vimos as unidades em nosso laboratório extensivamente desde então, elas são extremamente populares devido à sua agressiva relação preço/desempenho. Quase ao mesmo tempo, a Samsung lançou seu SSD PM9A3. Baseado em um NAND de camada 1xx menos transparente, o PM9A3 é, como a Intel, uma solução SSD integrada verticalmente. Com ambas as empresas distribuindo amplamente o popular fator de forma U.2 na capacidade de 7.68 TB, decidimos colocar esses gigantes frente a frente para ver quem leva vantagem nas guerras de SSD corporativo.

Grupo Intel P5510Intel P5510

O problema de comparar SSDs é que os fornecedores enfatizam especificações que nem sempre refletem cenários do mundo real. Por exemplo, quase todas as folhas de especificações são feitas para uma única unidade, em condições operacionais muito boas.

Nesse caso, vemos estatísticas de alto nível, como 900,000 IOPS de leitura aleatória e leituras sequenciais de até 6,500 MB/s do PM9A3. Passando para a Intel, o P5510 reivindica 930,000 IOPS e 7000 MB/s de largura de banda. Embora chamativos, esses números não nos dão uma imagem completa.

Samsung PM9A3Samsung PM9A3

O que fizemos para tentar obter uma visão mais profunda do desempenho foi pegar oito SSDs de cada um e colocá-los em um servidor líder do setor para uma análise mais aprofundada. Nossa ênfase de teste está centrada em cargas de trabalho mistas, já que os SSDs corporativos raramente se concentram em uma única carga de trabalho. Também avaliamos um cenário de vizinho barulhento com vários namespaces e, por último, analisamos como as unidades funcionam sob forte pressão de gravação.

Antes de irmos muito longe, vamos definir o cenário em termos de onde essas unidades estão. Ambos são oferecidos nos principais fatores de forma U.2. A Samsung oferece o PM9A3 adicionalmente como E1.S, E1.L e U.3. O PM9A3 também vem em um fator de forma M.2, embora com um perfil de desempenho muito reduzido, pois o fator de forma M.2 tem um envelope de energia muito menor. A Intel oferece o P4510 no formato de régua curta, é razoável que eles também ofereçam o P5510 dessa forma.

Olhando para a capacidade, a Intel optou pelas capacidades principais de 3.84 TB e 7.68 TB. A Samsung adotou uma abordagem mais ampla, adicionando capacidades de 960 GB, 1.92 TB e 15.36 TB, embora nem todas estejam disponíveis em todos os formatos.

O último fator importante a ser considerado é a resistência. Tanto a P5510 quanto a PM9A3 são classificadas para uma gravação de unidade por dia, colocando-as no que se tornou a categoria de carga de trabalho mista principal. Quando se trata de garantia, a Intel oferece uma garantia de cinco anos, enquanto a Samsung oferece uma garantia de três anos. Na verdade, isso é muito importante, pois significa que a Intel tem uma resistência efetiva mais alta, pois entrega o 1DWPD por mais dois anos.

Intel P55120 x Samsung PM9A3

Desempenho Intel P5510 x Samsung PM9A3

Para essa comparação, selecionamos um Dell Power Edge R750, que suporta oito SSDs NVMe nesta configuração. Ambos os lotes de SSDs foram testados de maneira idêntica no mesmo servidor.

As especificações de alto nível incluem:

  • 2 x Intel escalável Gen3 8380
  • 32x32GB DDR4 3200MHz
  • Ubuntu 20.04.2 Live Server (cargas de trabalho sintéticas)
  • VMware ESXi 7.0u2 (cargas de trabalho de aplicativos)
  • 8 baias PCI Gen4 U.2 NVMe

Os benchmarks foram realizados usando VDbench e FIO para benchmarks sintéticos, bem como Percona Sysbench e Benchmark Factory para SQL Server.

Banco de dados VD: cada grupo de 8 SSDs NVMe é apagado com segurança e, em seguida, toda a superfície do disco é gravada com uma operação de gravação de 64K, seguida por uma carga de trabalho de pré-condicionamento sequencial de 64K de uma hora. Uma vez concluído, cada unidade recebe uma partição de 25% da superfície do disco (partição de 2 TB para um SSD de 8 TB).

Em seguida, focamos em um grupo de perfis de carga de trabalho comuns, consistindo em cargas de trabalho aleatórias de leitura e gravação, bem como cargas de trabalho mistas comuns. Também usamos nossos padrões de I/O projetados para replicar cargas de trabalho SQL, Oracle e VDI. Antes do início dos padrões de E/S aleatórios, realizamos 1 hora adicional de atividade de gravação aleatória de 4K.

Perfis de carga de trabalho

  • Leitura e gravação aleatória de 4K
  • 4K aleatório 70/30
  • 8K aleatório 70/30
  • 16K aleatório 70/30
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Começando com uma carga de trabalho de leitura aleatória de 4K, medimos o desempenho do grupo de oito SSDs Intel P5510 variando de 669K IOPS a uma latência de 70 microssegundos, até um pico de 6.67M IOPS a 151 microssegundos. Em comparação, o Samsung PM9A3 ficou para trás ao medir 581K IOPS a 75 microssegundos no início, antes de atingir o pico de 5.76M IOPS a 173 microssegundos.

Na carga de trabalho de gravação aleatória de 4K, o Samsung PM9A3 teve a vantagem no desempenho de gravação, medindo 404K IOPS a 16 microssegundos de latência e atingiu o pico de 4.03M IOPS a 239 microssegundos. O Intel P5510 veio com 362K IOPS a 18 microssegundos no início e escalado para 3.5M IOPS a 235 microssegundos de latência à medida que a carga de trabalho aumentava.

As cargas de trabalho puras de leitura ou gravação geralmente não mostram a imagem completa de um SSD, que é onde as cargas de trabalho mistas ajudam a mostrar uma imagem melhor em condições mais realistas. Nesta carga de trabalho de 4K com uma mistura de leitura de 70%, o desempenho do Intel P5510 passou de 392K IOPS a 57 microssegundos no início antes de atingir o máximo de 4M IOPS a 116 microssegundos. O Samsung PM9A3 começou em 393K IOPS em 60 microssegundos e foi escalado para 3.91M IOPS em 129 microssegundos.

Aumentando o tamanho do bloco para 8K com a mesma mistura de leitura de 70%, o Intel P5510 mostrou uma dispersão maior do Samsung PM9A3. Aqui, o Intel P5510 mediu 247K IOPS a 70 microssegundos no início, escalando até 2.57M IOPS a 188 microssegundos. O Samsung PM9A3 começou em 215K IOPS em 68 microssegundos e aumentou para 2.18M IOPS em 216 microssegundos.

Movendo-se para uma carga de trabalho de leitura aleatória de 16% de 70K ainda maior, o spread continuou a crescer entre as unidades Intel e Samsung. A Intel começou com uma latência mais alta em 142K IOPS em 87 microssegundos, antes de aumentar para 1.49M IOPS em 312 microssegundos. O Samsung PM9A3, em comparação, começou com 115K IOPS em 76 microssegundos, antes de chegar a 1.17M IOPS em 359 microssegundos.

Em nossa carga de trabalho sintética SQL, mudamos novamente para um perfil de dados misto. O Intel P5510 escalado de 225K IOPS 79 microssegundos até 2.30M IOPS em 110 microssegundos. O Samsung PM9A3 variou de 230K IOPS a 80 microssegundos até 2.25M IOPS a 109 microssegundos.

Com a carga de trabalho SQL em um perfil de leitura de 80%, vimos o Intel P5510 variar de 214K IOPS a 69 microssegundos até 2.14M IOPS a 117 microssegundos em seu pico. O Samsung PM9A3 começou em 207K IOPS em 71 microssegundos e aumentou para 2.04M IOPS em 117 microssegundos.

Nossa última carga de trabalho SQL passa para um perfil de leitura de 90% com menos atividade de gravação. Aqui, o Intel P5510 começou com 220 IOPS em 74 microssegundos e aumentou para 2.27M IOPS em 111 microssegundos. O Samsung PM9A3 variou de 226K IOPS a 76 microssegundos e chegou ao máximo com 2.20M IOPS a 109 microssegundos, um fio de cabelo abaixo do SSD Intel.

Na carga de trabalho sintética da Oracle, o Intel P5510 ainda manteve uma ligeira vantagem sobre o Samsung PM9A3. Aqui vimos o Intel P5510 começar com 210K IOPS em 69 microssegundos e chegar ao máximo com 2.08M IOPS em 120 microssegundos. O Samsung PM9A3, em comparação, variou de 191K IOPS a 71 microssegundos e aumentou para 1.91M IOPS a 121 microssegundos.

Com uma mistura de gravação mais pesada em nosso perfil de banco de dados sintético Oracle com uma mistura de leitura de 80%, vimos outro cruzamento entre os dois modelos de SSD. O Intel P5510 escalado de 175K IOPS em 67 microssegundos até 1.76M IOPS em 98 microssegundos. O Samsung PM9A3 começou em 179K IOPS em 70 microssegundos e subiu para 1.76M IOPS em 96 microssegundos.

Nosso último perfil de banco de dados sintético Oracle se move para uma mistura de leitura de 90%. Aqui, o Intel P5510 começa em 180K IOPS em 72 microssegundos e escala até 1.81M IOPS em 96 microssegundos. O Samsung PM9A3, que estava na cola da Intel, começou com 183K IOPS a 75 microssegundos e atingiu o máximo de 1.80M IOPS a 95 microssegundos.

À medida que avançamos para o final de nossas cargas de trabalho Vdbench, nossos últimos seis perfis giram em torno de perfis VDI que abrangem inicialização, login inicial e login de segunda-feira para cenários de clone completo e clone vinculado.

Em nosso perfil Full Clone Boot, o Intel P5510 passou de 169K IOPS a 85 microssegundos para 1.72M IOPS a 147 microssegundos. O Samsung PM9A3 começou em 163K IOPS em 82 microssegundos e aumentou para 1.62M IOPS em 143 microssegundos.

Nosso próximo perfil de clone completo abrange um caso de uso de Login inicial. Aqui, o Intel P5510 escalado de 90K IOPS em 50 microssegundos até 900K IOPS em 176 microssegundos. Em comparação, o Samsung PM9A3 começou em 88K IOPS em 47 microssegundos e atingiu o pico em 879K IOPS em 208 microssegundos.

 

Nosso último perfil VDI de clone completo abrange um cenário de login na segunda-feira. Aqui, o Intel P5510 começou com uma latência mais alta do que a Samsung com 66K IOPS em 77 microssegundos e chegou a 677K IOPS em 147 microssegundos. O Samsung PM9A3 variou de 59K IOPS a 65 microssegundos até 597K IOPS a 161 microssegundos.

Mudando para nossos perfis VDI de clone vinculado, nosso primeiro é Boot. O Samsung PM9A3 teve uma clara vantagem neste teste, onde escalou de 78K IOPS em 102 microssegundos antes de chegar a 757K IOPS em 137 microssegundos. O Intel P5510 variou de 59K IOPS a 147 microssegundos até 584K IOPS a 181 microssegundos.

Na carga de trabalho de login inicial de clone vinculado, a lacuna entre os dois SSDs diminuiu. O Samsung PM9A3 começou em 36K IOPS em 74 microssegundos e atingiu o máximo em 362K IOPS em 129 microssegundos. O Intel P5510 começou com 36K IOPS em 87 microssegundos e aumentou para 339K IOPS em 139 microssegundos.

Nosso último perfil de carga de trabalho do Vdbench abrange o perfil de login do VDI Monday de clone vinculado. O Intel P5510 começou com 50.4 K IOPS em 91 microssegundos e atingiu o pico com 506 K IOPS em 194 microssegundos. O Samsung PM9A3 começou com 44.4 K IOPS em 76 microssegundos e atingiu o máximo em 464 K IOPS em 208 microssegundos.

Teste de Pressão de Gravação FIO

As cargas de trabalho de armazenamento estão ficando mais complexas à medida que os SSDs acompanham as solicitações simultâneas de leitura/gravação em um nível de uso máximo. A capacidade de atender um IO sob pressão de gravação simultânea torna-se mais interessante do que fazer leituras onde não há gravações. Os fornecedores podem manter a atividade em segundo plano baixa o suficiente para mostrar um “benchmark” como resposta de leitura em condições descarregadas. Mas não é assim que IO do mundo real funciona.

Essa carga de trabalho também demonstra como o SSD em seu firmware principal e nível de componente NAND pode pausar ou preparar gravações e priorizar a leitura. A prioridade de leitura pode direcionar o requisito de SLA para determinadas ofertas de aplicativos. Assim, a motivação de um teste de pressão de gravação é impulsionada pela necessidade de testar IO simultânea e a resiliência e QoS de um produto SSD.

Em nosso teste de pressão de gravação, executamos a carga de trabalho em oito unidades nos grupos de teste Intel P5510 e Samsung PM9A3. Ao testar dispositivos flash, vimos em muitos casos que os testes de unidade individuais nem sempre refletem como essa unidade pode responder em um sistema mais ativo. Para mostrar como o desempenho foi refletido, extraímos resultados de duas unidades em cada grupo, que neste caso correspondem às unidades um e cinco em cada grupo de teste.

A primeira métrica que analisamos neste caso é como a latência média de conclusão se compara entre o Intel P5510 e o Samsung PM9A3 com uma carga de trabalho de pressão de gravação sendo aplicada de um nível de 10 MB/s a 700 MB/s. As duas amostras de SSD Intel começaram com uma latência de conclusão (CLAT) de 78 microssegundos e aumentaram para 211 microssegundos em um nível de 700 MB/s. O Samsung PM9A3, em comparação, começou em 82 microssegundos e aumentou para 251 microssegundos a 700 MB/s. A 800 MB/s, o P5510 tinha uma vantagem de 108 microssegundos sobre o PM9A3.

O próximo foco se move para a latência do percentil 99, que mostra uma imagem melhor da margem superior dos tempos de resposta. Vemos o Intel P5510 com um tempo de resposta um pouco maior, começando em 388 microssegundos a 10 MB/s, mas que cai e fica abaixo do Samsung PM9A3 a 110 MB/s, continuando até 709 microssegundos a uma taxa de dados solicitada de 700 MB/s. O Samsung PM9A3 começa em 151 microssegundos a 10 MB/s e escala até 930 microssegundos a 700 MB/s solicitados. A 800 MB/s, o P5510 ofereceu uma melhoria de 196 microssegundos em relação ao PM9A3.

 

Teste de vizinho barulhento FIO

Tradicionalmente, para ver como os SSDs operam sob cargas de trabalho simultâneas variadas, você aplica cargas de trabalho de leitura e gravação ao dispositivo ao mesmo tempo. Essas cargas de trabalho também podem incluir tamanhos de blocos variados e outros elementos. Os SSDs NVMe trouxeram um novo conceito à mistura, onde podem oferecer provisionamento de namespace multilocatário, em vez de particionamento comum.

Em uma situação em que vários locatários estão usando seus namespaces provisionados com diferentes cargas de trabalho, é importante que a latência não aumente a ponto de o armazenamento não responder mais a cada locatário. No teste de vizinhança ruidosa, aplicamos cargas de trabalho de gravação mistas a três dos seis namespaces provisionados e rastreamos a latência de leitura dos três namespaces restantes para ver como cada unidade lida com a atividade simultânea de gravação e leitura.

Comparando o Intel P5510 com o Samsung PM9A3, vemos que o Intel SSD tem vantagem sobre o Samsung SSD em termos de latência desde a conclusão média até 4 9's de tempos de resposta de latência. Comparando as latências de conclusão das cargas de trabalho de leitura NS4, NS5 e NS6, vemos que o Intel P5510 mede 132, 141 e 162 microssegundos, respectivamente. Isso contrasta com o Samsung PM9A3, que mediu 136, 145 e 168 microssegundos para suas respectivas cargas de trabalho de namespace.

 

Subindo para 99º, medimos o Intel P5510 em 469, 482 e 502 microssegundos para NS4, NS5 e NS6, em comparação com o Samsung PM9A3 em 523, 545 e 594 microssegundos. Em 99.9, o Intel P5510 mede 652, 660 e 685 microssegundos, contra o Samsung PM9A3 em 816, 832 e 881 microssegundos. Em 99.99, a Intel ainda tem uma forte liderança com 816, 832 e 848 microssegundos contra o Samsung PM9A3 com 1020, 1037 e 1090 microssegundos.

Desempenho do SQL Server

O protocolo de teste OLTP do Microsoft SQL Server da StorageReview emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados.
Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste SQL procura desempenho de latência.

Configuração de teste do SQL Server (por VM)

  • Windows Server 2012 R2
  • Ocupação de armazenamento: 600 GB alocados, 500 GB usados
  • SQL Server 2014
  • Tamanho do banco de dados: escala 1,500
  • Carga de cliente virtual: 15,000
  • Memória RAM: 48 GB
  • Duração do teste: 3 horas
    • 2.5 horas de pré-condicionamento
    • período de amostra de 30 minutos

Ao focar na latência média de leitura em nossa carga de trabalho SQL Server TPC-C em uma carga de 8 VMs (1 VM por SSD), tanto o Intel P5510 quanto o Samsung PM9A3 maximizaram a carga de trabalho com um tempo de resposta de 1.0 ms.

Desempenho do Sysbench MySQL

Nosso teste Sysbench aproveita um Percona para direcionar I/O para um banco de dados MySQL OLTP. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.
Cada VM do Sysbench é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 16 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
  • Tabelas de banco de dados: 100
  • Tamanho do banco de dados: 10,000,000
  • Segmentos de banco de dados: 32
  • Memória RAM: 24 GB
  • Duração do teste: 3 horas
    • 2 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos

Com uma carga de 16 VMs (2 VMs por SSD), medimos 38,838 TPS do grupo de oito SSDs Intel P5510, enquanto o grupo Samsung PM9A3 mediu 38,717 TPS. Essa carga de trabalho também saturou as CPUs na plataforma de teste. Reduzindo a carga para 8 VMs ou 1 por SSD, o grupo Intel P5510 mediu 30,337 TPS, enquanto o grupo Samsung PM9A3 mediu 29,438 TPS.

Comparando a latência média para cada grupo de 8 SSDs NVMe, medimos a carga de trabalho Intel P5510 16VM em 13.18ms e a carga de trabalho de 8VM em 8.44ms. O grupo Samsung PM9A3 mediu 13.23 ms em 16 VMs e 8.69 ms em 8 VMs.

Em nossa carga de trabalho final com foco na latência de percentil 99 no Sysbench, medimos o grupo de SSDs Intel P5510 em 25.35 ms executando 16 VMs e 14.50 ms com uma carga de trabalho de 8 VMs. Isso contrastava com os SSDs Samsung PM9A3 medindo 26.21 ms em 16 VMs e 14.74 ms em 8 VMs.

 

Conclusão

Este exercício é bastante interessante. A premissa de onde começamos era que as folhas de especificações para um único SSD corporativo não são muito úteis. Eles geralmente se concentram no desempenho de ponta para uma carga de trabalho muito pequena e específica. Na empresa, porém, fora de um lâmina executando duas unidades, os sistemas aproveitam muitos SSDs e, embora a largura de banda seja relevante, a latência é fundamental. À medida que percorremos esse plano de teste longo e, às vezes, extremamente intensivo, o impacto da latência se torna evidente. Em termos práticos, isso pode ser a diferença em quantas VMs um sistema host pode suportar ou na capacidade de resposta de um aplicativo para os usuários finais.

Olhando para o desempenho real em geral, o Intel P5510 e o Samsung PM9A3 pintam um quadro interessante. Em benchmarks sintéticos, o Intel P5510 teve vantagem na maioria das cargas de trabalho focadas em perfis de dados mistos, com uma lacuna cada vez maior à medida que a carga de trabalho se tornava mais baseada em gravação. Ele também teve uma vantagem ao subir nos tamanhos de bloco, onde vemos sua liderança crescente passando de tamanhos de transferência de 4K para 8K para 16K.

Embora o foco no desempenho bruto seja uma coisa, a latência é outra parte da história. É aqui que analisamos a latência em um teste de pressão de gravação. Aqui, o Intel P5510 mostrou uma vantagem em relação à latência, pois uma carga de trabalho de gravação aplicada aumentou em incrementos de 10 MB/s até 850 MB/s. Perto da faixa superior desse teste a 800 MB/s, o Intel P5510 teve uma vantagem de 108 microssegundos sobre o Samsung PM9A3 na latência de conclusão e uma vantagem de 196.5 microssegundos na latência do 99º percentil.

Nosso último teste mediu o desempenho dos SSDs em uma carga de trabalho vizinha ruidosa, com três namespaces em uma carga de trabalho de gravação e três com cargas de trabalho de leitura. O P5510 continuou a manter uma latência de leitura mais baixa, com uma lacuna crescente à medida que você olhava para quatro 9s de capacidade de resposta de latência.

Passando para nossa carga de trabalho de aplicativos no grupo de 8 SSDs Intel P5510 e Samsung PM9A3, ambas as unidades conseguiram saturar nosso teste SQL Server em até 1 ms de tempo de resposta total. No entanto, no Sysbench, enquanto as CPUs estavam sendo totalmente utilizadas, o P5510 manteve a vantagem sobre o PM9A3 em cargas de trabalho de 8 VM e 16 VM.

No geral, é uma batalha e tanto entre os dois drives. E quando você apenas olha para os números da folha de especificações, as unidades são bastante semelhantes. Mas neste teste, as unidades Intel mostraram consistentemente melhor latência nas situações mais exigentes. Junte isso aos dois anos extras de garantia e o P5510 oferece um pacote bastante atraente.

Página do produto Intel P5510

Documento Samsung PM9A3

Este relatório é patrocinado pela Intel Corporation. Todas as visões e opiniões expressas neste relatório são baseadas em nossa visão imparcial do(s) produto(s) em consideração.

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | Facebook | RSS feed