Home Empreendimento Análise do SSD Samsung PM1735

Análise do SSD Samsung PM1735

by Brian Beeler
Samsung PM1735

A Samsung lançou quase vinte iterações de sua família SSD corporativa PCIe Gen4 no outono de 2019. O PM1733 e o PM1735 foram projetados para aproveitar ao máximo as ofertas de throughput Gen4. Agora que os fornecedores de servidores estão incluindo portas Gen4 em suas ofertas de servidores baseados em AMD e Intel, esses SSDs estão finalmente chegando ao mercado em volume. O PM1733 é um modelo de gravação de unidade única por dia, enquanto o PM1735 oferece três gravações de unidade por dia. Nesta análise, analisamos uma variante HPE PM1735 com capacidade de 3.2 TB (HPE P16499-B21).

A Samsung lançou quase vinte iterações de sua família SSD corporativa PCIe Gen4 no outono de 2019. O PM1733 e o PM1735 foram projetados para aproveitar ao máximo as ofertas de throughput Gen4. Agora que os fornecedores de servidores estão incluindo portas Gen4 em suas ofertas de servidores baseados em AMD e Intel, esses SSDs estão finalmente chegando ao mercado em volume. O PM1733 é um modelo de gravação de unidade única por dia, enquanto o PM1735 oferece três gravações de unidade por dia. Nesta análise, analisamos uma variante HPE PM1735 com capacidade de 3.2 TB (HPE P16499-B21).

Samsung PM1735

Samsung PM1735 versus PM1733

Conforme observado, o PM1733 é amplamente diferenciado do PM1735 pela resistência; ou seja, o primeiro é cotado com 1 DWPD (gravações de unidade por dia), enquanto o último triplica esse número com 3 DWPD. Ambas as unidades são cotadas com as mesmas velocidades de gravação sequencial (por exemplo, 3,800 MB/s para seus modelos de maior capacidade). A atividade de leitura é um pouco diferente, no entanto, já que o PM1735 oferece um potencial de 8,000 MB/s para seus modelos de 12.8 TB, 3.2 TB e 6.4 TB versus 7,000 MB/s para todos os modelos PM1733.

Também deve ser observado que, com a maioria dos fornecedores de servidores, os SSDs terão firmware específico para o fornecedor, HPE, por exemplo, neste caso. Essas unidades também podem não estar disponíveis no varejo, pois são voltadas para OEMs. A Samsung oferece o 1.3 DWPD PM9A3 para varejo. O PM9A3 é uma unidade de datacenter de porta única oferecida em uma variedade de fatores de forma, incluindo M.2, U.2, E1.L e E1.S.

Samsung PM1735 de volta

Especificações Samsung PM1735

Número do produto (SKU) P16499-B21
Gravações vitalícias 17,520TB
DWPD de resistência (gravações de unidade por dia) 3
Ler IOPS IOPS de leitura aleatória (4KiB, Q=16): 180,000

IOPS máximo de leitura aleatória (4KiB): 950,000@Q256

Gravar IOPS IOPS de gravação aleatória (4KiB, Q=16) 350,000

Max Random Write IOPS (4KiB) 350,000@T16

Potência (Watts) 14
Altura 15mm
Tipo de plugue Conectável a quente
Garantia Garantia padrão 3/0/0

Desempenho Samsung PM1735

Histórico de testes e comparáveis

Laboratório de teste StorageReview Enterprise fornece uma arquitetura flexível para realizar benchmarks de dispositivos de armazenamento corporativo em um ambiente comparável ao que os administradores encontram em implantações reais. O Enterprise Test Lab incorpora uma variedade de servidores, redes, condicionamento de energia e outras infraestruturas de rede que permitem que nossa equipe estabeleça condições do mundo real para avaliar com precisão o desempenho durante nossas análises.

Incorporamos esses detalhes sobre o ambiente de laboratório e protocolos em revisões para que os profissionais de TI e os responsáveis ​​pela aquisição de armazenamento possam entender as condições em que alcançamos os resultados a seguir. Nenhuma de nossas análises é paga ou supervisionada pelo fabricante do equipamento que estamos testando. Detalhes adicionais sobre o Laboratório de teste StorageReview Enterprise e uma visão geral de seus recursos de rede estão disponíveis nessas respectivas páginas.

Como o HPE PM1735 é oferecido em uma versão U.3-ONLY, nós o testamos dentro do servidor HPE ProLiant DL365 Gen10 Plus.

Configuração do HPE ProLiant DL365 Gen10 Plus:

  • 2 x 7713 CPUs AMD Epyc Gen 3 (64 núcleos, 2 GHz)
  • 16x16GB DDR4 3200MHz
  • 1 x HPE Samsung PM1735 3.2 GB U.3 Gen4 SSD
  • ESXi 7.0u1

Análise de carga de trabalho do aplicativo

Para entender as características de desempenho dos dispositivos de armazenamento corporativo, é essencial modelar a infraestrutura e as cargas de trabalho de aplicativos encontradas em ambientes de produção ao vivo. Nossos benchmarks para o HPE/Samsung PM1735 incluem o Desempenho OLTP do MySQL via SysBench e Desempenho OLTP do Microsoft SQL Server com uma carga de trabalho TCP-C simulada. Para nossas cargas de trabalho de aplicativo, cada unidade comparável executará 4 VMs configuradas de forma idêntica. Com o PM1735 sendo uma variante U.3-ONLY, nós o testamos no HPE DL365 Gen10 Plus enquanto os outros modelos estavam em nosso Lenovo ThinkSystem SR635.

Desempenho do SQL Server

Cada VM do SQL Server é configurada com dois vDisks: volume de 100 GB para inicialização e um volume de 500 GB para o banco de dados e arquivos de log. Do ponto de vista dos recursos do sistema, configuramos cada VM com 8 vCPUs, 64 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI. Embora nossas cargas de trabalho Sysbench testadas anteriormente tenham saturado a plataforma tanto em E/S de armazenamento quanto em capacidade, o teste de SQL procura desempenho de latência.

Este teste usa o SQL Server 2014 em execução em VMs convidadas do Windows Server 2012 R2 e é enfatizado pelo Benchmark Factory para bancos de dados da Quest. StorageReview's Protocolo de teste OLTP do Microsoft SQL Server emprega o rascunho atual do Benchmark C (TPC-C) do Transaction Processing Performance Council, um benchmark de processamento de transações on-line que simula as atividades encontradas em ambientes de aplicativos complexos. O benchmark TPC-C chega mais perto do que os benchmarks sintéticos de desempenho para medir os pontos fortes de desempenho e os gargalos da infraestrutura de armazenamento em ambientes de banco de dados. Cada instância de nossa VM SQL Server para esta revisão usa um banco de dados SQL Server de 333 GB (escala 1,500) e mede o desempenho transacional e a latência sob uma carga de 15,000 usuários virtuais.

Configuração de teste do SQL Server (por VM)

  • Windows Server 2012 R2
  • Ocupação de armazenamento: 600 GB alocados, 500 GB usados
  • SQL Server 2014
    • Tamanho do banco de dados: escala 1,500
    • Carga de cliente virtual: 15,000
    • Memória RAM: 48 GB
  • Duração do teste: 3 horas
    • 2.5 horas de pré-condicionamento
    • período de amostra de 30 minutos

Para nosso benchmark transacional do SQL Server, o PM1735 ficou logo atrás da unidade Kioxia com 12,625.56 TPS.

TPS do servidor SQL Samsung PM1735

Com latência média do SQL Server, o PM1735 teve uma latência média de 11.25ms, dobrando a dos drives Kioxia.

Latência do SQL Server Samsung PM1735

Desempenho do Sysbench

O próximo benchmark de aplicativo consiste em um Banco de dados MySQL OLTP Percona medida via SysBench. Este teste mede o TPS (transações por segundo) médio, a latência média e também a latência média do 99º percentil.

Cada sysbench A VM é configurada com três vDisks: um para inicialização (~92 GB), um com o banco de dados pré-construído (~447 GB) e o terceiro para o banco de dados em teste (270 GB). Do ponto de vista dos recursos do sistema, configuramos cada VM com 8 vCPUs, 60 GB de DRAM e aproveitamos o controlador LSI Logic SAS SCSI.

Configuração de teste do Sysbench (por VM)

  • CentOS 6.3 64 bits
  • Percona XtraDB 5.5.30-rel30.1
    • Tabelas de banco de dados: 100
    • Tamanho do banco de dados: 10,000,000
    • Segmentos de banco de dados: 32
    • Memória RAM: 24 GB
  • Duração do teste: 3 horas
    • 2 horas de pré-condicionamento 32 tópicos
    • 1 hora 32 tópicos

Olhando para nosso benchmark transacional Sysbench, o PM1735 tinha 7,869.21 TPS, colocando-o bem atrás das unidades Kioxia.

Com a latência média do Sysbench, o PM1735 registrou 16.26 ms, logo atrás dos dois drives Kioxia.

Para nossa latência de pior cenário (99º percentil), o PM1735 mostrou 28.90 ms, colocando-o entre as unidades Kioxia CM6 e CD6.

Análise de Carga de Trabalho do VDBench

Quando se trata de dispositivos de armazenamento de comparação, o teste de aplicativo é o melhor e o teste sintético vem em segundo lugar. Embora não seja uma representação perfeita das cargas de trabalho reais, os testes sintéticos ajudam a estabelecer a linha de base dos dispositivos de armazenamento com um fator de repetibilidade que facilita a comparação entre soluções concorrentes. Essas cargas de trabalho oferecem uma variedade de perfis de teste diferentes, desde testes de "quatro cantos", testes comuns de tamanho de transferência de banco de dados até capturas de rastreamento de diferentes ambientes VDI.

Todos esses testes utilizam o gerador de carga de trabalho vdBench comum, com um mecanismo de script para automatizar e capturar resultados em um grande cluster de teste de computação. Isso nos permite repetir as mesmas cargas de trabalho em uma ampla variedade de dispositivos de armazenamento, incluindo arrays flash e dispositivos de armazenamento individuais. Nosso processo de teste para esses benchmarks preenche toda a superfície da unidade com dados e, em seguida, particiona uma seção da unidade igual a 25% da capacidade da unidade para simular como a unidade pode responder às cargas de trabalho do aplicativo. Isso é diferente dos testes de entropia total, que usam 100% da unidade e os colocam em estado estacionário. Como resultado, esses números refletirão velocidades de gravação sustentadas mais altas.

perfis:

  • Leitura aleatória em 4K: 100% de leitura, 128 threads, 0-120% de atualização
  • Gravação aleatória em 4K: 100% de gravação, 128 threads, 0-120% de atualização
  • Leitura aleatória de 4K (carga alta): 100% de leitura, 512 threads, 0-120% iorado
  • 4K Random Write (alta carga): 100% Write, 512 threads, 0-120% iorate
  • Leitura sequencial de 64K: 100% de leitura, 32 threads, 0-120% iorado
  • Gravação sequencial de 64K: 100% gravação, 16 threads, 0-120% iorado
  • Leitura sequencial de 64K (carga alta): 100% de leitura, 64 threads, 0-120% iorado
  • Gravação sequencial de 64K (carga alta): 100% Gravação, 64 threads, 0-120% iorado
  • Banco de Dados Sintético: SQL e Oracle
  • Clone completo de VDI e rastreamentos de clone vinculados

Comparáveis:

Em nossa primeira análise de carga de trabalho VDBench, Random 4K Read, o PM1735 mostrou desempenho fraco em comparação com as unidades Kioxia, atingindo um pico de apenas 631,959,288 IOPS com uma latência de 800.7 µs sob uma carga alta. A carga normal mostrou pouco mais de 400K e 319.6ms em desempenho máximo. Isso coloca a unidade bem atrás dos líderes.

Samsung PM1735 Leitura sequencial 4K

Para gravação aleatória de 4K, a unidade Samsung teve um bom desempenho atrás das unidades Kioxia novamente. Sob uma carga alta, o PM1735 atingiu o pico de 195,953 IOPS com uma latência de 2,605µs antes de um leve pico. Em carga normal, registrou 227,664 IOPS com latência de 557.6 ms.

Samsung PM1735 Gravação sequencial 4KK

As cargas de trabalho sequenciais relataram algo semelhante, pois o PM1735 ficou para trás novamente na leitura de 64K com uma pontuação máxima de 75,598 IOPS (ou 4.72 GB/s) em uma latência de apenas 761.7 µs antes de sofrer uma grande queda no desempenho (terminando em 3.9 GB/s). s). Para uma carga normal, leia o PM1735 com pico de 59,915 IOPS ou 3.74 GB/s com uma latência de 532.8 µs.

Samsung PM1735 Leitura sequencial 64K

Em gravações de 64K, o PM1735 mostrou um desempenho máximo de 35,160K IOPS ou 2.3GB/s com uma latência de cerca de 445µs. A gravação sequencial de alta carga de 64K viu o PM1735 em cerca de 33,643 IOPS ou 2.1 GB/s em uma latência de 1.88 ms.

Samsung PM1735 Gravação sequencial 64K

Nosso próximo conjunto de testes são nossas cargas de trabalho SQL: SQL, SQL 90-10 e SQL 80-20. Começando com o SQL, o Samsung PM1735 acabou logo ao lado do drive Kioxia CD6, com pico de 241,721 IOPS e latência de 131µs.

Para SQL 90-10, o PM1735 mostrou desempenho de pico semelhante ao CD6 novamente com um desempenho de pico de 241,804 IOPS em uma latência de 130.8 µs.

Com o SQL 80-20, os resultados se espalham um pouco mais, colocando o PM1735 ligeiramente atrás em 3rd lugar com um desempenho máximo de 225,753 IOPS 139.7µs.

A seguir estão nossas cargas de trabalho Oracle: Oracle, Oracle 90-10 e Oracle 80-20. Começando com o Oracle, o PM1735 apresentou um desempenho máximo de 229,702 IOPS com uma latência de 155.1µs, ficando um pouco atrás dos drives Kioxia.

No Oracle 90-10, o PM1735 finalmente ficou acima de uma das unidades Kioxia pelo segundo lugar (e logo atrás do CM6) com um desempenho máximo de 199,587 IOPS com uma latência de apenas 109µs.

O PM1735 ficou em segundo novamente no Oracle 80-20 com um pico de 197,236 IOPS em uma baixa latência de 110.1µs.

Em seguida, mudamos para nosso teste de clone VDI, Full and Linked. Para VDI Full Clone, a unidade Samsung ficou bem atrás em todas as categorias. A primeira é a inicialização (FC), onde o PM1735 atingiu o pico de 110,816 IOPS e uma latência de 313.4 µs.

Para VDI FC Initial Login, o PM1735 permaneceu muito atrás das unidades Kioxia com um desempenho máximo de apenas 51,903 IOPS com uma latência de 571.8 µs (antes de atingir outro pico de desempenho).

Nosso benchmark VDI FC Monday Login viu o PM1735 ficar um pouco mais próximo das unidades Koxia com um desempenho máximo de 68,023 IOPS com uma latência de 230 µs.

Para VDI Linked Clone (LC) Boot, o PM1735 voltou bem com uma pontuação máxima de 78,481 IOPS em uma latência de 202 µs.

VDI LC Initial Login, o PM1735 realmente terminou bem à frente das unidades Kioxia com um pico de pouco menos de 50K IOPS em uma latência de 159.4µs antes de cair um pouco.

Por fim, o VDI LC Monday Login colocou o PM1735 de volta no final do pacote com uma pontuação máxima de 55,088 IOPS e uma latência de 285.1 µs.

Conclusão

O Samsung PM1735 é um SSD PCIe Gen4 projetado para cargas de trabalho empresariais exigentes. Com sua resistência de 3 DWPD e perfil de desempenho de 8 GB/s para leituras e 3.8 GB/s para gravações, no papel, a unidade parece adequada para o trabalho. Esse é um grande motivo pelo qual a HPE o está incluindo em seus servidores habilitados para Gen4 mais recentes sob o número de peça HPE P16499-B21. A propósito, como os fornecedores de servidores fornecem vários componentes, esse número de peça também inclui o KIOXIA CM6 e o ​​Intel P4610 na categoria “SFF de uso misto de alto desempenho”.

Samsung PM1735 pn Servidor HPE

Para desempenho, colocamos a nova unidade Samsung em nosso desafio usual de Application Workload Analysis e VDBench. Além disso, como as análises de unidades KIOXIA que publicamos anteriormente, adicionamos um teste de carga mais alto no VDBench para estressá-lo um pouco mais, pois eles foram projetados para lidar com isso.

Para nossos testes de Application Workload Analysis, executamos o SQL Server e o Sysbench. Com o SQL Server, o PM1735 teve um TPS e latência média de 12,625.56 e 11.25 ms, ambos próximos ao final da tabela de classificação. Com o Sysbench, ele registrou 7,869.21 TPS (bem atrás das unidades KIOXIA), latência média de 16.26 ms e latência de 28.90 ms em nosso pior cenário.

No VDBench, a unidade Samsung realmente lutou. Os destaques básicos incluem pouco mais de 400K em leitura de 4K, 632K IOPS em alta carga de leitura em 4K, 228K IOPS em gravação em 4K, 196K IOPS em alta carga de gravação em 4K, 1.55GB/s em leitura de 64K, 2.47GB/s em alta carga de leitura em 64K, e 2.3 GB/s em gravação de 64 K e 2.1 GB/s em alta carga de gravação de 64 K. O SQL teve picos de 242K IOPS, 242K IOPS no SQL 90-10 e 226K IOPS no SQL 80-20.

A Oracle nos deu picos de 230K IOPS, 200K IOPS no Oracle 90-10 e 197K IOPS no Oracle 80-20. O VDI FC nos deu 111 IOPS de inicialização, 52 IOPS de login inicial e 68 IOPS no login de segunda-feira. O VDI LC registrou inicialização de 78 IOPS, login inicial de 50 IOPS e login de segunda-feira de 55 IOPS. Em todas essas cargas de trabalho, onde os outros modelos que testamos absorveram facilmente as cargas de trabalho adicionais aumentadas, o Samsung PM1735 atolou.

Em última análise, a mudança para Gen4 deu aos fornecedores de SSD empresariais muitas oportunidades de desempenho. Embora o PM1735 tenha se saído razoavelmente bem em alguns pontos, ele apresentou um perfil de desempenho bastante desigual. Casos de uso do mundo real podem não notar, dependendo de qual hardware eles estão vindo. Isso é especialmente verdadeiro se as cargas de trabalho forem controladas por banco de dados, onde a unidade funcionou bem. Mas, dada a escolha de unidades em plataformas HPE, o CM6 é claramente uma opção melhor.

Envolva-se com a StorageReview

Newsletter | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTokRSS feed