ArmazenamentoReview.com

Análise do Micron 9550 MAX: desempenho equilibrado para IA, banco de dados e análise

Empreendimento  ◇  SSD

Em julho de 2024, a Micron anunciou a Família de SSDs NVMe 9550, uma plataforma Gen5 desenvolvida para a próxima onda de implantações de armazenamento corporativo. Na ocasião, cobrimos o lançamento e destacamos os dois níveis de produto: o PRO para ambientes com uso intensivo de leitura e o MAX para cargas de trabalho de uso misto. Desde então, a Micron nos forneceu uma amostra do 9550 MAX, permitindo-nos submeter o membro de maior resistência da família aos nossos rigorosos testes de laboratório corporativo.

Micron 9550 Max 12.8 TB frontal.

O 9550 MAX foi desenvolvido especificamente para cargas de trabalho de uso misto, onde leituras e gravações são balanceadas, tornando a resistência e o desempenho sustentado tão importantes quanto a taxa de transferência bruta. Isso o torna ideal para bancos de dados, análises, pipelines de treinamento de IA/ML e aplicações financeiras que envolvem altas taxas de transação contínuas.

As capacidades variam de 3.2 TB a 25.6 TB, abrangendo uma ampla gama de cenários de implantação, desde unidades de aplicativos menores até consolidação de alta capacidade em nós de armazenamento densos. O 9550 MAX está disponível nos formatos U.2 e E3.S, oferecendo flexibilidade às empresas na transição da infraestrutura estabelecida de 2.5 polegadas para plataformas EDSFF de última geração.

Em comparação com a linha PRO, que prioriza o desempenho de leitura com menor resistência, o MAX oferece até três gravações de disco por dia (DWPD), tornando-se a escolha certa para ambientes com cargas de trabalho balanceadas ou com alta carga de gravação. As linhas Pro e Max contam com desempenho PCIe Gen5, NVMe 2.0 e compatibilidade com (OCP) 2.0-2.5; os SSDs da série 9550 se destacam como uma unidade projetada para velocidade e confiabilidade em escala.

Posicionado acima do Série Micron 7600 SSDs, que atendem às principais cargas de trabalho de data center com latência e eficiência energética excepcionais, a série 9550 oferece maior resistência, opções de capacidade mais amplas e desempenho sustentado superior para ambientes com uso intensivo de dados que exigem consistência e rendimento máximos sob carga

Especificações do Micron 9550 MAX

A tabela abaixo descreve os SSDs da série Micron 9550 MAX, destacando seus formatos, métricas de desempenho, classificações de resistência e opções de capacidade nos modelos U.2 e E3.S.

Especificações do Micron 9550 MAX (U.2 / E3.S)
Caso de uso Uso misto (3 gravações de unidade por dia)
Interface / Protocolo PCIe Gen5 x4, NVMe v2.0b
NAND NAND TLC 232D de 3 camadas de mícron
Conformidade com o OCP OCP 2.0 (r21)
Confiabilidade MTTF: 2.0 milhões de horas a 0–55°C; 2.5 milhões de horas a 0–50°C | UBER < 1 setor por 1017 bits lidos | garantia de 5 anos
Potência (RMS médio) ≤ 18 W leitura sequencial; ≤ 18 W gravação sequencial
Temperatura de Operação 0 – 70 ° C
Capacidades e desempenho (9550 MAX)
Capacidade Seq. Leitura (MB/s) Seq. Gravação (MB/s) Rand. Leia (K IOPS) Rand. Escreva (K IOPS) 70/30 R/W (K IOPS)
3.2TB 14,000 10,000 3,000 540 640
6.4TB 14,000 10,000 3,300 640 720
12.8TB 14,000 10,000 3,300 820 1,000
25.6TB 14,000 10,000 3,300 1,200 1,300
Latência típica (µs)
Leia 60
Escreva 15
Resistência (Total de Bytes Escritos, TB)
Capacidade RND TBW SEQ TBW Notas
3.2TB 17,520 37,200 MÁX. (3 DWPD)
6.4TB 35,040 74,200 MÁX. (3 DWPD)
12.8TB 70,080 143,100 MÁX. (3 DWPD)
25.6TB 140,160 282,600 MÁX. (3 DWPD)

Projeto e construção do Micron 9550 MAX

A Micron posiciona o 9550 MAX como um SSD empresarial de uso misto, projetado para cargas de trabalho balanceadas de leitura/gravação a 3 DWPD. Ele combina uma interface PCIe Gen5 x4 com suporte ao protocolo NVMe 2.0b e a tecnologia NAND 3D TLC de 232 camadas da Micron para enfatizar a latência consistente sob carga sustentada.

Fisicamente, a família de unidades abrange os formatos U.2 e E3.S, oferecendo aos operadores a flexibilidade de se adaptar aos compartimentos NVMe de 2.5 polegadas atuais ou migrar para implantações EDSFF mais densas sem precisar trocar de plataforma. Essa versatilidade é reforçada pela conformidade com OCP 2.0 e 2.5, alinhando o 9550 MAX às expectativas mecânicas, térmicas e de gerenciamento comuns em servidores corporativos e de hiperescala modernos.

Micron 9550 Max traseiro.

Do ponto de vista energético e térmico, a Micron especifica uma média de ≤18 W RMS para operações de leitura e gravação sequenciais, o que se enquadra perfeitamente nos envelopes de resfriamento típicos do compartimento frontal para sistemas U.2 e E3.S e ajuda a manter a consistência do desempenho durante cargas de trabalho longas e mistas. A temperatura operacional é classificada entre 0 e 70 °C, proporcionando aos administradores uma margem de manobra confortável em uma variedade de designs de fluxo de ar do gabinete.

As metas de confiabilidade refletem o foco em resistência da linha MAX: MTTF de até 2.5 milhões de horas (2.0 milhões de horas em temperatura ambiente mais alta), UBER < 1e-17 e garantia de cinco anos. As capacidades variam de 3.2 TB a 25.6 TB, e a Micron publica números de latência típica baixa (60 µs de leitura / 15 µs de gravação), juntamente com classificações de throughput Gen5 (até 14 GB/s de leitura / 10 GB/s de gravação) e números substanciais de E/S mistas. Essas características são mais importantes do que as especificações de pico em implantações reais de uso misto.

Desempenho do Micron 9550 MAX

Plataforma de teste de direção

Escolhemos um Dell PowerEdge R760 com Ubuntu 22.04.02 LTS como plataforma de teste para todas as cargas de trabalho nesta análise. Equipado com JBOF Gen5 da Serial Cables, Oferece ampla compatibilidade com SSDs U.2, E1.S, E3.S e M.2. Nossa configuração de sistema de teste está descrita abaixo.

  • 2 x Intel Xeon Gold 6430 (32 núcleos, 2.1 GHz)
  • 16 x 64GB DDR5-4400
  • SSD Dell BOSS de 480 GB
  • Cabos seriais Gen5 JBOF
Unidades comparadas

Benchmark de ponto de verificação DLIO

Para avaliar o desempenho real de SSDs em ambientes de treinamento de IA, utilizamos a ferramenta de benchmark Data and Learning Input/Output (DLIO). Desenvolvido pelo Argonne National Laboratory, o DLIO foi projetado especificamente para testar padrões de E/S em cargas de trabalho de aprendizado profundo. Ele fornece insights sobre como os sistemas de armazenamento lidam com desafios como pontos de verificação, ingestão de dados e treinamento de modelos. O gráfico abaixo ilustra como ambas as unidades lidam com o processo em 36 pontos de verificação. Ao treinar modelos de aprendizado de máquina, os pontos de verificação são essenciais para salvar periodicamente o estado do modelo, evitando a perda de progresso durante interrupções ou falhas de energia. Essa demanda de armazenamento exige um desempenho robusto, especialmente sob cargas de trabalho sustentadas ou intensivas. Utilizamos o benchmark DLIO versão 2.0, lançado em 13 de agosto de 2024.

Para garantir que nosso benchmarking refletisse cenários do mundo real, baseamos nossos testes na arquitetura do modelo LLAMA 3.1 405B. Implementamos pontos de verificação usando torch.save() para capturar parâmetros do modelo, estados do otimizador e estados da camada. Nossa configuração simulou um sistema com oito GPUs, implementando uma estratégia de paralelismo híbrido com paralelismo tensorial de 4 vias e processamento paralelo de pipeline bidirecional distribuído entre as oito GPUs. Essa configuração gerou tamanhos de pontos de verificação de 1,636 GB, refletindo os requisitos para o treinamento de modelos modernos de linguagem de grande porte.

Neste benchmark, o Micron 9550 MAX de 12.8 TB emergiu como o líder absoluto. Ao longo de toda a execução de 18 pontos de verificação, ele manteve os menores tempos médios de conclusão, variando de 457 s a 575 s. O disco apresentou estabilidade excepcional com variação mínima entre os pontos de verificação, indicando um design de firmware bem balanceado e otimizado para cargas de trabalho mistas de leitura/gravação.

Logo atrás, o Micron 7600 MAX de 6.4 TB apresentou tempos entre 459 s e 586 s. Embora sua média tenha permanecido competitiva, o disco apresentou breve oscilação de desempenho entre os pontos de verificação 4 e 7, antes de se estabilizar no final do teste. Apesar disso, permaneceu firme no topo da lista, demonstrando excelente eficiência para cargas de trabalho sustentadas de IA e HPC.

O Micron 9550 de 7.68 TB teve desempenho logo atrás dos dois modelos principais, com resultados variando de 458 a 582 TB. Ele manteve um dimensionamento consistente e permaneceu competitivo com as unidades MAX de ponta, reforçando a força da plataforma Micron 9550 subjacente.

Entre os outros SSDs empresariais testados, o Solidigm PS1010, o SanDisk SN861 e o Kingston DC3000ME ocuparam a faixa intermediária, concluindo a maioria dos pontos de verificação na faixa de 450 a 610 segundos. O Pascari X200P apresentou o desempenho menos consistente, atingindo mais de 690 segundos no meio da execução antes de se estabilizar no final.

Neste teste de média de aprovação, o Solidigm PS1010 7.68 TB liderou o grupo com os tempos médios de conclusão mais rápidos, variando de 458 s a 564 s nas três execuções. O disco apresentou excelente consistência, mantendo baixa variação entre as execuções e demonstrando forte eficiência sob cargas de trabalho de E/S mistas.

O SanDisk SN861 7.68 TB veio logo atrás, apresentando resultados quase idênticos com médias entre 461 s e 553 s, confirmando sua capacidade de fornecer desempenho de checkpoint confiável com degradação mínima.

O Micron 9550 de 7.68 TB veio em seguida, com tempos entre 461 s e 559 s nas mesmas passagens. Seu desempenho permaneceu bastante competitivo, ficando logo atrás dos líderes, mantendo escalabilidade estável e rendimento sólido em todas as iterações.

O Micron 9550 MAX 12.8 TB e o Micron 7600 MAX 6.4 TB completaram os cinco primeiros, registrando médias ligeiramente mais altas de 462–555 s e 464–567 s, respectivamente. Ambos mantiveram um comportamento consistente ao longo do tempo, mas ficaram atrás do Micron de menor capacidade e dos dois principais drives de Solidigma e SanDisk.

Entre o resto do grupo, o Kingston DC3000ME e Pascari O X200P apresentou os tempos gerais mais altos, com média de 580 s e 660 s, respectivamente. Esses resultados refletem uma lacuna de desempenho maior em condições de checkpointing sustentado, especialmente para cargas de trabalho que exigem gravações frequentes em armazenamento persistente.

Referência de desempenho da FIO

Para medir o desempenho de armazenamento de cada SSD com base em métricas comuns do setor, utilizamos a FIO. Cada unidade passa pelo mesmo processo de teste, que inclui uma etapa de pré-condicionamento com dois preenchimentos completos da unidade com uma carga de trabalho de gravação sequencial, seguida por uma medição de desempenho em estado estacionário. À medida que cada tipo de carga de trabalho medida muda, executamos outro preenchimento de pré-condicionamento com esse novo tamanho de transferência.

Nesta seção, nos concentramos nos seguintes benchmarks de FIO:

  • 128K sequencial
  • 64K aleatório
  • 16K aleatório
  • 4K aleatório

Gravação sequencial de 128K (IODepth 16 / NumJobs 1)

Passando para o teste de Gravação Sequencial de 128K, os resultados foram quase idênticos aos observados durante o pré-condicionamento. O Micron 9550 Max (12.8 TB) liderou novamente por ampla margem, mantendo 10,957.9 MB/s, mantendo-se firme no topo do grupo. O Kingston DC3000ME (7.68 TB) veio em segundo lugar, com 8,477.4 MB/s, seguido pelo Pascari X200P (7.68 TB), logo atrás, com 8,369.7 MB/s.

Mais atrás ficaram o Solidigm PS1010 (7,126.5 MB/s) e o SanDisk DC SN861 (7,116.5 MB/s), enquanto o Micron 7600 Max (6.4 TB) ficou na parte inferior do gráfico com 6,960.6 MB/s.

Latência de gravação sequencial de 128K (IODepth 16 / NumJobs 1)

Passando para a latência, o teste de Gravação Sequencial de 128K foi executado a uma profundidade de E/S de 16 com uma única tarefa, em comparação com a profundidade de fila mais pesada de 256 usada no pré-condicionamento. Como esperado, a latência caiu significativamente em todos os discos. O Micron 9550 Max (12.8 TB) novamente liderou o campo com a menor latência, 0.18 ms, demonstrando sua capacidade de sustentar a taxa de transferência máxima com atraso mínimo.

O Kingston DC3000ME (7.68 TB) veio logo atrás, com 0.24 ms, seguido pelo Pascari X200P (7.68 TB), com 0.24 ms. Enquanto isso, o Solidigm PS1010 (0.28 ms) e o SanDisk DC SN861 (0.28 ms) apresentaram resultados semelhantes, enquanto o Micron 7600 Max (6.4 TB) ficou na retaguarda, com 0.29 ms.

Leitura sequencial de 128K (IODepth 64 / NumJobs 1)

Passando para as leituras, o teste de Leitura Sequencial de 128K apresentou resultados muito mais próximos entre os discos concorrentes. O Pascari X200P (7.68 TB) liderou a lista com 14,242.1 MB/s, à frente do Solidigm PS1010 (7.68 TB) com 14,163.3 MB/s, e do Micron 9550 Max (12.8 TB) logo atrás, com 14,047.5 MB/s. Esses três discos ficaram efetivamente dentro de uma margem estreita, apresentando diferenças mínimas na taxa de transferência de leitura sequencial sustentada.

O Kingston DC3000ME (7.68 TB) ficou ligeiramente atrás do trio líder, com 13,513.8 MB/s, enquanto o SanDisk DC SN861 (7.68 TB) apresentou 12,631.2 MB/s. Na extremidade inferior, o Micron 7600 Max (6.4 TB) atingiu 11,240.5 MB/s, sendo o único disco do grupo a ficar abaixo do limite de 12 GB/s.

Latência de leitura sequencial de 128K (IODepth 64 / NumJobs 1)

Analisando a latência, o teste de Leitura Sequencial de 128K (IODepth 64 / NumJobs 1) destacou o quão acirrada era a competição entre os melhores desempenhos. O Pascari X200P (7.68 TB) liderou com 0.56 ms, quase igualado pelo Solidigm PS1010 (0.56 ms) e pelo Micron 9550 Max (12.8 TB) com 0.57 ms. Esses três discos estavam praticamente empatados, refletindo a estreita diferença observada na taxa de transferência.

O Kingston DC3000ME (7.68 TB) veio em seguida com 0.59 ms, enquanto o SanDisk DC SN861 (7.68 TB) chegou a 0.63 ms. O Micron 7600 Max (6.4 TB) ficou em último com 0.71 ms, consistente com sua menor largura de banda de leitura sequencial.

Gravação aleatória 64K

No teste de gravação aleatória de 64K, o Micron 9550 Max (12.8 TB) demonstrou uma ampla faixa de desempenho, desde valores mínimos em torno de 2.45 GB/s até um pico de 10.6 GB/s, com uma média de 7.34 GB/s em toda a varredura. Isso não apenas o tornou o de melhor desempenho, mas também o único disco a ultrapassar consistentemente a marca de 10 GB/s em profundidades de fila mais altas. O Micron 7600 Max (6.4 TB) mostrou consistência sólida, mas com um teto de desempenho mais baixo, variando de 2.39 GB/s a 6.8 GB/s, com média de 5.16 GB/s. Isso o colocou firmemente no segundo nível, atrás do 9550 Max, mas à frente da maioria dos outros concorrentes na tabela.

Analisando o restante do grupo, o Kingston DC3000ME (7.68 TB) e o SanDisk DC SN861 (7.68 TB) se estabeleceram na faixa de 4 a 6 GB/s, geralmente competitivos, mas incapazes de atingir os níveis da Micron. O Solidigm PS1010 (7.68 TB) e o Pascari X200P (7.68 TB) ficaram no nível mais baixo, frequentemente agrupados na faixa de 2 a 4 GB/s, ficando atrás de ambos os discos da Micron por uma margem significativa.

Latência de gravação aleatória de 64K

Em termos de latência, o Micron 9550 Max (12.8 TB) apresentou os resultados mais consistentes, com média de apenas 0.30 ms, com picos abaixo de 1.71 ms, mesmo em profundidades de fila mais altas. O Micron 7600 Max (6.4 TB) seguiu com uma média ligeiramente superior de 0.41 ms e um máximo de 2.3 ms, ainda mantendo um controle razoável sob carga. O Kingston DC3000ME e o SanDisk DC SN861 caíram na camada intermediária, com latência geralmente variando de 0.05 ms a 2.7 ms. Ao mesmo tempo, o Pascari X200P e o Solidigm PS1010 apresentaram a volatilidade mais significativa, atingindo 4.1 ms e 6.0 ms, respectivamente, em profundidades de fila mais altas.

Leitura aleatória 64K

No teste de leitura aleatória de 64K, ambos os discos Micron apresentaram resultados excelentes, com médias muito próximas. O Micron 9550 Max (12.8 TB) variou de 0.49 GB/s na extremidade inferior até um pico de 13.7 GB/s, com uma média de 6.96 GB/s. O Micron 7600 Max (6.4 TB) apresentou um perfil semelhante, começando com uma velocidade ligeiramente superior a 0.61 GB/s, atingindo um pico de 11.0 GB/s e uma média de 6.94 GB/s em toda a varredura.

No gráfico mais amplo, vemos que unidades como o Solidigm PS1010 e o Pascari X200P conseguiram atingir a faixa de 13-14 GB/s em profundidades de fila mais altas, o que lhes dá uma ligeira vantagem em pico de taxa de transferência sobre os Microns. O Kingston DC3000ME seguiu de perto na faixa de 12-13 GB/s, enquanto o SanDisk DC SN861 ficou um pouco abaixo, estabilizando em torno de 12.3 GB/s.

Latência de leitura aleatória de 64K

No teste de leitura aleatória de 64K, o Micron 9550 Max (12.8 TB) manteve um perfil de latência robusto, com média de 0.25 ms, com mínimas de 0.12 ms e picos de até 1.14 ms sob cargas mais pesadas. O Micron 7600 Max (6.4 TB) apresentou números muito semelhantes, com média de 0.26 ms, chegando a 0.10 ms, mas subindo ligeiramente até um máximo de 1.42 ms. Ambos os Microns apresentaram latência geral estável, mantendo-se em um grupo próximo ao restante da concorrência durante grande parte do período.

Analisando o gráfico, o Solidigm PS1010 e o Pascari X200P apresentaram latências ligeiramente maiores em rajadas, geralmente entre 0.1 e 1.2 ms. Ao mesmo tempo, o Kingston DC3000ME e o SanDisk DC SN861 seguiram de perto na mesma faixa, atingindo um pico de pouco mais de 1.2 ms. Entre todos os discos testados, os Microns permaneceram competitivos e consistentes, com apenas pequenas diferenças os separando do restante da linha superior.

Gravação sequencial de 16K

No teste de gravação sequencial de 16K, o Micron 9550 Max (12.8 TB) dominou mais uma vez, com taxa de transferência variando de 0.85 GB/s na extremidade inferior inicial até um pico de 10.7 GB/s, com média de 7.75 GB/s em toda a varredura. O Micron 7600 Max (6.4 TB) seguiu com uma faixa de desempenho mais estreita, variando de 0.84 GB/s a 6.8 GB/s, com média de 5.63 GB/s, o que o colocou firmemente atrás do 9550, mas ainda à frente da maioria dos outros discos.

No gráfico mais amplo, o Kingston DC3000ME e o Pascari X200P se agruparam na faixa de 6 a 8 GB/s em profundidades de fila mais altas, trocando golpes, mas geralmente ficando atrás do 9550 Max. O Micron 7600 Max também se destacou nesse nível, mas se inclinou para a extremidade inferior da dispersão. O Solidigm PS1010 se estabeleceu um pouco abaixo, na faixa de 5 a 6 GB/s, enquanto o SanDisk DC SN861 apresentou o desempenho geral mais fraco, frequentemente caindo abaixo de 4 GB/s e chegando a 1 GB/s.

Latência de gravação sequencial de 16K

No teste de latência de gravação sequencial de 16K, o Micron 9550 Max (12.8 TB) demonstrou novamente excelente capacidade de resposta, com latência média de 0.12 ms, caindo para 0.018 ms e atingindo o pico de 0.75 ms sob carga. O Micron 7600 Max (6.4 TB) seguiu com uma média ligeiramente superior de 0.18 ms, um mínimo semelhante de 0.018 ms e picos de até 1.15 ms.

Observando o gráfico, o Kingston DC3000ME e o Pascari X200P permaneceram na faixa intermediária, geralmente variando entre 0.05 e 1.2 ms, enquanto o Solidigm PS1010 subiu, ultrapassando 1.5 ms nas profundidades mais altas da fila. O SanDisk DC SN861 apresentou o perfil de latência mais fraco no geral, subindo acima de 2.0 ms sob estresse.

Leitura sequencial de 16K

No teste de leitura sequencial de 16K, ambos os discos Micron apresentaram desempenho sólido com perfis ligeiramente diferentes. O Micron 9550 Max (12.8 TB) variou de 1.02 GB/s na extremidade inferior até um pico de 12.5 GB/s, com uma taxa de transferência média de 5.59 GB/s. O Micron 7600 Max (6.4 TB) começou de forma semelhante com 1.03 GB/s, atingiu o pico de 11.0 GB/s e teve uma média ligeiramente superior, de 6.08 GB/s em toda a varredura, colocando-o ligeiramente à frente do 9550 Max em termos de consistência ao longo de todo o processamento.

No gráfico mais amplo, o Kingston DC3000ME saltou para a frente do grupo em profundidades de fila mais altas, ultrapassando brevemente 12.8 GB/s, enquanto o Pascari X200P e o Solidigm PS1010 também chegaram à faixa de 12 GB/s. O SanDisk DC SN861 ficou ligeiramente atrás do grupo, fixando-se logo abaixo de 10 GB/s na extremidade superior.

Latência de leitura sequencial de 16K

No teste de Leitura Sequencial de 16K, o Micron 9550 Max (12.8 TB) apresentou um perfil de latência variando de 0.015 ms na extremidade inferior a um pico de 0.78 ms, com uma média de 0.15 ms em toda a varredura. O Micron 7600 Max (6.4 TB) teve um desempenho ligeiramente mais preciso, começando em 0.014 ms, atingindo o pico de 0.71 ms e uma média de 0.13 ms, o que lhe confere uma ligeira vantagem em termos de eficiência sobre seu irmão maior.

Observando o gráfico, o Kingston DC3000ME e o Pascari X200P seguiram um padrão de médio alcance semelhante, com média na faixa de 0.1 a 0.2 ms, com picos pouco acima de 0.8 ms. O Solidigm PS1010 foi ligeiramente mais irregular, atingindo 0.75 ms, enquanto o SanDisk DC SN861, em geral, acompanhou de perto o Kingston, mas apresentou maior variabilidade à medida que a profundidade da fila aumentava.

Gravação aleatória 16K

No teste de leitura aleatória de 16K, o Micron 9550 Max (12.8 TB) atingiu um pico de pouco mais de 900 mil IOPS, com mínimos em torno de 18 mil IOPS e uma taxa de transferência média de aproximadamente 420 mil IOPS em toda a varredura. O Micron 7600 Max (6.4 TB) demonstrou maior consistência, mas seu escalonamento máximo foi ligeiramente menor, atingindo um pico de cerca de 720 mil IOPS. A variação foi de 17 mil IOPS no ponto mais baixo a aproximadamente 350 mil IOPS no geral.

No gráfico, o Pascari X200P e o Solidigm PS1010 escalaram de forma impressionante, com o Pascari se aproximando do Micron 9550 Max na extremidade superior e atingindo pouco menos de 900 mil IOPS, enquanto o Solidigm se fixou na faixa de 820 a 850 mil IOPS. O Kingston DC3000ME inicialmente acompanhou de perto os líderes, mas atingiu o pico em torno de 620 mil IOPS com o avanço do escalonamento. O SanDisk DC SN861 ficou para trás, terminando com pouco mais de 500 mil IOPS.

Latência de gravação aleatória de 16K

No teste de gravação aleatória de 16K, o Micron 9550 Max (12.8 TB) novamente apresentou a disciplina de latência mais forte, mantendo-se entre 0.015 ms e 0.77 ms, com uma média de 0.13 ms em toda a varredura. O Micron 7600 Max (6.4 TB) foi um pouco menos agressivo, com uma faixa de 0.016 ms a 1.26 ms e uma média de 0.21 ms. Isso posicionou o 9550 Max como o mais eficiente sob pressão, com o 7600 Max ainda mantendo um perfil competitivo em relação aos demais concorrentes.

No gráfico, o Kingston DC3000ME e o Pascari X200P se situaram na faixa intermediária, geralmente operando na faixa de 0.2 a 1.5 ms, enquanto o SanDisk DC SN861 apresentou picos mais intensos em profundidades de fila altas, ultrapassando 1.8 ms. O Solidigm PS1010 foi o que mais sofreu neste teste, atingindo latências bem acima de 3 ms em seus piores momentos, mostrando dificuldade em manter a consistência em escala.

Leitura aleatória 16K

No teste de leitura aleatória de 16K, o Micron 9550 Max (12.8 TB) apresentou uma ampla faixa de desempenho, começando com aproximadamente 16.7K IOPS e atingindo um pico de 904K IOPS, com uma taxa de transferência média de 433K IOPS em toda a varredura. O Micron 7600 Max (6.4 TB) apresentou uma escala ligeiramente menor, mas forte consistência, variando de 17.1K IOPS a 720K IOPS, com uma média geral de 362K IOPS.

Em comparação com os concorrentes, o Pascari X200P igualou o Micron 9550 em quase igual proporção, atingindo um pico de 900 mil IOPS quase idêntico. O Solidigm PS1010 ficou um pouco atrás, atingindo o pico na faixa de 820 a 850 mil IOPS, enquanto o Kingston DC3000ME atingiu um patamar mais alto, atingindo o máximo em torno de 620 mil IOPS. O SanDisk DC SN861 completou o grupo com pouco mais de 500 mil IOPS, apresentando escalonamento mais fraco em profundidades de fila mais altas.

Latência de leitura aleatória de 16K

No teste de leitura aleatória de 16K, o Micron 9550 Max (12.8 TB) apresentou um perfil de latência que variou de 0.073 ms na extremidade inferior a 0.57 ms no pico, com uma média de 0.12 ms ao longo da execução. O Micron 7600 Max (6.4 TB) apresentou desempenho semelhante, mas atingiu uma escala ligeiramente superior, começando em 0.065 ms, atingindo o pico em 0.71 ms e uma média de 0.14 ms. Ambos os Microns apresentaram respostas estáveis ​​e de baixa latência, com o 9550 Max apresentando a curva mais fechada em profundidades de fila mais altas.

Em comparação com o restante do grupo, o Pascari X200P e o Kingston DC3000ME permaneceram competitivos na faixa intermediária, geralmente entre 0.1 e 0.3 ms durante boa parte do teste, antes de se aproximarem da faixa de 0.8 ms na extremidade superior. O SanDisk DC SN861 e o Solidigm PS1010 apresentaram maior variabilidade, com o Solidigm em particular apresentando picos de velocidade próximos a 0.6 ms e 0.65 ms, ficando atrás dos líderes Micron e Pascari.

Gravação aleatória 4K

No teste de gravação aleatória em 4K, o Micron 9550 Max (12.8 TB) liderou, entregando de 320K a 1.56M IOPS, com escalonamento constante em toda a varredura e forte consistência em altas profundidades de fila. O Micron 7600 Max (6.4 TB) seguiu de perto, mostrando uma aceleração impressionante acima da faixa intermediária e atingindo um pico ligeiramente mais alto de 1.78M IOPS, tornando-se o escalonador mais agressivo neste teste. Ambos os discos Micron demonstraram controle de nível empresarial sob carga, com progressão suave e quedas mínimas entre combinações de threads.

Entre os concorrentes, o SanDisk DC SN861 e o Kingston DC3000ME tiveram um bom desempenho, mas ficaram atrás dos discos Micron, chegando a quase 1.3 milhão de IOPS e 960 mil IOPS, respectivamente. O Pascari X200P apresentou consistência moderada, atingindo cerca de 1.6 milhão de IOPS em seu pico, enquanto o Solidigm PS1010 ficou consideravelmente para trás, não conseguindo manter a estabilidade acima de 550 mil IOPS na maioria dos cenários de alta profundidade.

Latência de gravação aleatória de 4K

No teste de gravação aleatória em 4K, o Micron 9550 Max (12.8 TB) apresentou excelente controle de latência, variando de apenas 0.013 ms na extremidade inferior a 0.37 ms no pico, com uma média de 0.06 ms em toda a varredura. O Micron 7600 Max (6.4 TB) seguiu de perto, começando em 0.012 ms e subindo para 0.29 ms, com média geral de 0.05 ms. Ambas as unidades apresentaram tempos de resposta consistentemente baixos, com o 9550 Max apresentando estabilidade ligeiramente maior em profundidades de fila mais altas.

No gráfico, o Kingston DC3000ME e o Pascari X200P apresentaram maior variabilidade, frequentemente na faixa de 0.1 a 0.5 ms e com picos acima de 0.5 ms na extremidade superior. O SanDisk DC SN861 ficou em uma faixa semelhante, com alguns picos intermediários. Ao mesmo tempo, o Solidigm PS1010 foi o que mais sofreu, apresentando volatilidade e picos superiores a 0.7 ms, ficando atrás do restante do grupo em capacidade de resposta.

Leitura aleatória 4K

No teste de leitura aleatória em 4K, o Micron 9550 Max (12.8 TB) atingiu 2.2 M de IOPS, com média de 1.3 M de IOPS em toda a varredura. O Micron 7600 Max (6.4 TB) veio logo em seguida, com pico de pouco mais de 2.0 M de IOPS e média de 1.4 M de IOPS, apresentando excelente escalabilidade sob carga. Ambas as unidades Micron se mostraram muito competitivas, alternando a liderança dependendo da profundidade da fila e da contagem de threads.

O gráfico mostra que o SanDisk DC SN861 atingiu o pico, ultrapassando 2.5 milhões de IOPS, mas também apresentou variabilidade significativa, com quedas sob carga pesada. O Pascari X200P e o Kingston DC3000ME se estabilizaram na faixa de 2.0 milhões de IOPS no pico, apresentando resultados fortes, mas menos consistentes do que os da Micron. O Solidigm PS1010 apresentou um escalonamento decente na faixa intermediária, mas estabilizou mais cedo, chegando mais perto de 2.1 milhões de IOPS.

Latência de leitura aleatória de 4K

Nos resultados de latência de gravação aleatória em 4K, o Micron 9550 Max (12.8 TB) manteve alguns dos menores tempos de resposta sob carga, com média de 0.03 a 0.05 ms na parte inicial da varredura e subindo gradualmente para a faixa de 0.35 a 0.38 ms na pressão máxima. O Micron 7600 Max (6.4 TB) seguiu de perto, com variância ligeiramente maior, mas ainda competitivo, chegando a pouco menos de 0.30 ms em sua taxa de transferência máxima.

Em comparação, o SanDisk DC SN861 e o Pascari X200P apresentaram picos de latência mais acentuados à medida que a taxa de transferência aumentava, com o SanDisk ultrapassando 0.40 ms e o Pascari estendendo-se para mais de 0.50 ms nas maiores profundidades de fila. O Kingston DC3000ME ficou atrás desses dois, atingindo um pico pouco acima de 0.50 ms, mas mantendo-se relativamente consistente em cargas de trabalho mais baixas. O Solidigm PS1010 foi o que mais ficou para trás, com picos iniciais já na faixa de 0.10 ms+ e atingindo um pico de 0.73 ms, refletindo instabilidade sob maior pressão de gravação aleatória.

Armazenamento direto da GPU

Um dos testes que conduzimos neste testbench foi o teste Magnum IO GPU Direct Storage (GDS). GDS é um recurso desenvolvido pela NVIDIA que permite que GPUs ignorem a CPU ao acessar dados armazenados em unidades NVMe ou outros dispositivos de armazenamento de alta velocidade. Em vez de rotear dados pela CPU e pela memória do sistema, o GDS permite a comunicação direta entre a GPU e o dispositivo de armazenamento, reduzindo significativamente a latência e melhorando a taxa de transferência de dados.

Como funciona o armazenamento direto da GPU

Tradicionalmente, quando uma GPU processa dados armazenados em uma unidade NVMe, os dados precisam primeiro passar pela CPU e pela memória do sistema antes de chegar à GPU. Esse processo cria gargalos, pois a CPU atua como intermediária, adicionando latência e consumindo recursos valiosos do sistema. O GPU Direct Storage elimina essa ineficiência, permitindo que a GPU acesse os dados diretamente do dispositivo de armazenamento por meio do barramento PCIe. Esse caminho direto reduz a sobrecarga de movimentação de dados, permitindo transferências de dados mais rápidas e eficientes.

Cargas de trabalho de IA, especialmente aquelas que envolvem aprendizado profundo, são altamente intensivas em dados. Treinar grandes redes neurais requer o processamento de terabytes de dados, e qualquer atraso na transferência de dados pode levar a GPUs subutilizadas e tempos de treinamento mais longos. O GPU Direct Storage aborda esse desafio garantindo que os dados sejam entregues à GPU o mais rápido possível, minimizando o tempo ocioso e maximizando a eficiência computacional.

Além disso, o GDS é particularmente benéfico para cargas de trabalho que envolvem streaming de grandes conjuntos de dados, como processamento de vídeo, processamento de linguagem natural ou inferência em tempo real. Ao reduzir a dependência da CPU, o GDS acelera a movimentação de dados e libera recursos da CPU para outras tarefas, aprimorando ainda mais o desempenho geral do sistema.

Taxa de transferência de leitura sequencial GDSIO

Em nossos testes de leitura sequencial GDSIO, começando com pequenas transferências de blocos a 16K, a taxa de transferência do Micron 9550 Max começou em torno de 0.5 GiB/s em profundidades de fila baixas e aumentou gradualmente para aproximadamente 1.9 GiB/s em QD128. A mudança para tamanhos de bloco de 128K aumentou substancialmente o desempenho, atingindo 1.4 GiB/s em QD1 e atingindo o pico em torno de 5.3 GiB/s em QD64.–128. Nos testes de bloco de 1M, a unidade apresentou seus melhores resultados, escalando de 2.0 GiB/s em filas rasas para 6.1 GiB/s em QD128, mostrando crescimento consistente e eficiência sólida em todas as profundidades.

Comparado ao Micron 7600 Max, o 9550 Max seguiu uma trajetória semelhante, com pico de transferência ligeiramente superior. O 7600 Max iniciou seus testes de 16K em torno de 0.5 GiB/s e atingiu um pico próximo a 1.9 GiB/s, quase idêntico ao 9550 Max em cargas de trabalho de blocos pequenos. Em 128K, ele começou mais forte, com 2.2 GiB/s, mas atingiu o pico em cerca de 5.0 GiB/s, enquanto seus resultados de blocos de 1M atingiram cerca de 5.6 GiB/s. A conclusão geral é que ambas as unidades proporcionaram escalonamento previsível e forte desempenho sequencial, com o 9550 Max mantendo uma vantagem leve, mas consistente, em profundidades de fila maiores e tamanhos de bloco maiores.

Olhando para as outras unidades empresariais testadas, incluindo a Pascari X200P, Kingston DC3000ME, Solidigma Os resultados de throughput do PS1010 e do SanDisk DC SN861 geralmente variaram entre 5.0 GiB/s e 6.1 GiB/s na extremidade superior. A variação entre todos os modelos permaneceu relativamente estreita, demonstrando a eficiência com que os SSDs empresariais atuais lidam com cargas de trabalho diretas da GPU. Nesse grupo, os discos Micron se classificaram consistentemente entre os de melhor desempenho, com o 9550 Max mantendo uma ligeira vantagem em profundidades de fila mais altas. Em contraste, os outros seguiram de perto, com alcance de alguns décimos de GiB/s, dependendo da intensidade da carga de trabalho.

Latência de leitura sequencial GDSIO

Em testes de latência de leitura sequencial, ambos os discos Micron demonstraram tempos de resposta precisos e consistentes em todos os tamanhos de bloco e profundidades de fila. O Micron 9550 Max começou com latência muito baixa em tamanhos de bloco menores, medindo cerca de 31 µs em QD1 para transferências de 16, aumentando gradualmente para cerca de 1.0 ms em QD128. Em tamanhos de bloco de 128, a latência variou de 86 µs a 3.0 ms, enquanto as cargas de trabalho de 1 milhão aumentaram de 482 µs em filas rasas para 20.6 ms em QD128.

O Micron 7600 Max demonstrou um padrão semelhante, começando um pouco mais rápido nos blocos menores, com 27 µs em QD1, e terminando em aproximadamente 1.0 ms em QD128. Em 128 mil blocos, a latência variou de 54 µs a 3.1 ms, e em 1 milhão de blocos, variou de 391 µs em QD1 a 22.3 ms em QD128.

Quando analisados ​​em todo o grupo de teste, todos os discos mantiveram quase a paridade em tamanhos de bloco pequenos e médios, antes de subir naturalmente para cargas de trabalho de 1 milhão de unidades conforme a profundidade da fila aumentava. O Micron 9550 Max e o 7600 Max permaneceram agrupados de forma compacta, refletindo um escalonamento de latência estável e variação mínima em comparação com concorrentes como o Pascari X200P, Kingston DC3000ME e Solidigma PS1010.

Taxa de transferência de gravação sequencial GDSIO

Nos testes de gravação sequencial GDSIO, o Micron 9550 Max apresentou uma taxa de transferência consistentemente alta em todas as cargas de trabalho. Em blocos menores de 16K, o desempenho começou em torno de 0.5 GiB/s e subiu para aproximadamente 1.5 GiB/s em QD32, antes de diminuir ligeiramente na profundidade de fila mais alta. Em blocos de 128K, a taxa de transferência melhorou significativamente, passando de 2.3 GiB/s em QD1 para um pico de 5.3 GiB/s em QD32.–64. Os resultados do bloco de 1M permaneceram na mesma faixa de alto desempenho, começando perto de 4.7 GiB/s e sustentando entre 5.0 GiB/s e 5.4 GiB/s em profundidades de fila moderadas, caindo então ligeiramente em QD128.

O Micron 7600 Max seguiu uma curva quase idêntica, começando em 0.5 GiB/s a 16K e chegando a 1.5 GiB/s para transferências menores. A 128K, apresentou uma subida constante de 2.2 GiB/s para 5.2 GiB/s, enquanto as cargas de trabalho de bloco de 1M mantiveram a taxa de transferência entre 4.1 GiB/s e 5.4 GiB/s em profundidades de fila intermediárias. Ambas as unidades apresentaram excelente consistência, com variação mínima de desempenho mesmo com o aumento das profundidades de fila, o que destaca a eficiência do ajuste de firmware da Micron em cargas de trabalho diretas da GPU.

Analisando o conjunto de dados mais amplo, a taxa de transferência geral em todos os discos corporativos testados convergiu para uma faixa estreita de 4.0 a 5.4 GiB/s em carga máxima. Discos como o Pascari X200P e o Micron 7600 Max ficaram próximos da faixa superior, enquanto outros, como o Kingston DC3000ME, o Solidigm PS1010 e o SanDisk DC SN861, seguiram de perto.

Latência de gravação sequencial GDSIO

Em testes de latência de gravação sequencial, ambos os discos Micron demonstraram tempos de resposta estáveis ​​e previsíveis, que escalaram linearmente com a profundidade da fila e o tamanho do bloco. O Micron 9550 Max começou com desempenho de baixa latência quase idêntico ao do 7600 Max em transferências menores, registrando 30 µs em QD1 para 16 mil blocos e escalando para 2.7 ms em QD128. Em 128 mil blocos, a latência aumentou gradualmente de 52 µs para 3.2 ms, enquanto cargas de trabalho de 1 milhão de blocos apresentaram 207 µs em QD1 e atingiram cerca de 40 ms na profundidade máxima da fila.

O Micron 7600 Max seguiu o mesmo comportamento, com apenas pequenas variações. Registrou 30 µs em QD1 para 16 mil blocos e atingiu o máximo de 1.5 ms em QD128. Em 128 mil, a latência variou entre 54 µs e 3.0 ms, e para transferências de 1 milhão, subiu de 237 µs em QD1 para 40.7 ms em QD128.

Na comparação entre grupos, todas as unidades apresentaram comportamento consistente com o aumento da profundidade da fila, mantendo padrões de dimensionamento semelhantes. As unidades Micron se alinharam estreitamente com o Pascari X200P e Kingston DC3000ME em quase toda a faixa, e ambos exibiram excelentes características de baixa latência em tamanhos de bloco menores, ao mesmo tempo em que sustentaram aumentos previsíveis sob condições de gravação sequencial mais pesadas.

Conclusão

O Micron 9550 Max dá continuidade à sólida trajetória da Micron no segmento de SSDs empresariais, oferecendo um equilíbrio refinado entre resistência, rendimento e eficiência para as atuais cargas de trabalho com uso intensivo de dados. Projetado para ambientes de uso misto, demonstrou a capacidade de sustentar alto desempenho em operações sequenciais e aleatórias, com estabilidade de latência e resistência de gravação de até 3 DWPD.

Durante nossos testes, o 9550 Max provou que pode lidar com pipelines corporativos e de IA/ML com facilidade, oferecendo escalonamento previsível em ambientes de armazenamento direto da GPU, FIO e DLIO. Seu perfil de desempenho permanece consistente em diferentes cargas de trabalho e profundidades de fila, refletindo a maturidade da plataforma Gen5 da Micron e a otimização do firmware. Comparado ao 7600 Max, o 9550 Max oferece uma pequena, mas mensurável melhoria na taxa de transferência e na capacidade de resposta, especialmente em profundidades mais altas, mantendo as mesmas características de baixa latência que tornam ambos os modelos fortes concorrentes em seus respectivos níveis.

Visão traseira lateral e plana do Micron 9550 Max.

Do ponto de vista da implantação, a flexibilidade dos formatos U.2 e E3.S garante uma adoção tranquila em infraestruturas legadas e de próxima geração. A eficiência energética e a conformidade com o OCP aprimoram ainda mais sua adequação a implantações em data centers densos.

No geral, o Micron 9550 Max se destaca como um SSD empresarial completo que combina desempenho sustentado para cargas de trabalho mistas com eficiência operacional e confiabilidade. É um avanço claro para organizações que buscam a compatibilidade com PCIe Gen5 sem sacrificar a estabilidade ou a longevidade, tornando-o um dos SSDs de uso misto mais capazes. NVMe soluções atualmente disponíveis.

Página do produto

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed

Dylan Dougherty

Administrador de rede K-12 com experiência em redes Cisco, segurança IP e soluções NAC. Entusiasta de UniFi e labber doméstico, testando e revisando produtos de rede e segurança.