O novo DC3000ME da Kingston é o mais recente SSD NVMe de nível empresarial da empresa, com formato U.2 de 2.5", projetado para cargas de trabalho de data center e servidores. Construído na interface PCIe 5.0 x4, ele combina alta taxa de transferência de dados com 3D eTLC NAND para confiabilidade robusta e dimensionamento de capacidade. Disponível em configurações de 3.84 TB, 7.68 TB e 15.36 TB, o disco foi projetado para ambientes de alta demanda, como infraestrutura de hiperescala, clusters de IA e HPC, serviços em nuvem e sistemas transacionais.
Kingston DC3000ME Perfil de desempenho
O DC3000ME mantém o mesmo desempenho de leitura sequencial em todas as capacidades, com cada SKU fornecendo até 14,000 MB/s. Essa velocidade é ideal para cargas de trabalho que dependem fortemente de acesso rápido a dados, independentemente da capacidade escolhida. No entanto, as velocidades de gravação sequencial variam significativamente. O modelo de 3.84 TB é limitado a 5,800 MB/s, enquanto a variante de 7.68 TB apresenta um aumento substancial para 10,000 MB/s. O modelo de 15.36 TB fica ligeiramente atrás, com 9,700 MB/s.
Considerando o desempenho aleatório, o modelo de 7.68 TB é o mais rápido do grupo, com um máximo de 2.8 milhões de IOPS para leituras e 500,000 IOPS para gravações. Isso supera os discos de 3.84 TB e 15.36 TB, que têm um limite de 2.7 milhões de IOPS para leituras. Em termos de gravação, o modelo de 3.84 TB fica atrás, com 300,000 IOPS, enquanto o modelo de 15.36 TB atinge 400,000 IOPS. A versão de 7.68 TB é a mais capaz entre as variantes para lidar com tarefas intensas e de alta demanda.
Do ponto de vista de desempenho por capacidade, o modelo de 7.68 TB também oferece a combinação mais equilibrada de taxa de transferência e IOPS, tornando-o ideal para aplicações com uso intensivo de gravação, como registro em log, bancos de dados OLTP ou treinamento de modelos de IA ativa. O modelo de 3.84 TB é provavelmente mais adequado para cargas de trabalho com uso intenso de leitura ou mistas, onde a capacidade não é uma prioridade, e a versão de 15.36 TB troca o pico de IOPS de gravação pela densidade bruta de armazenamento.
Kingston DC3000ME Recursos corporativos
O DC3000ME vem com alguns recursos úteis de nível empresarial, essenciais em sistemas de produção. A proteção contra perda de energia (PLP) está integrada para proteger os dados em caso de queda repentina de energia. Ele também inclui criptografia AES-256 com suporte a TCG Opal para proteger dados em repouso. O DC3000ME suporta até 128 namespaces, o que é particularmente útil para casos de uso virtualizados ou em contêineres. Esse nível de suporte a namespaces é compatível com SSDs U.2 avançados e é particularmente valioso para ambientes virtualizados de grande escala. A Kingston também incorporou ferramentas de telemetria para monitorar a integridade da unidade, o desgaste da mídia e a temperatura operacional, proporcionando aos administradores visibilidade da confiabilidade a longo prazo.
O consumo de energia varia de 8 W em modo inativo a um máximo de 24 W durante atividade de gravação completa, o que parece típico para SSDs U.2 densos sob carga pesada. A Kingston especifica uma potência máxima de leitura de 8.2 W, que se alinha estreitamente com o valor em modo inativo, mostrando uma estreita diferença de potência sob cargas de trabalho com leitura intensa. As classificações de resistência correspondem ao que se esperaria de um disco corporativo, com suporte para uma gravação completa de disco por dia durante um período de cinco anos. Isso equivale a entre 7,008 TBW e 28,032 TBW, dependendo da capacidade.
O Kingston DC3000ME conta com uma classificação MTBF de dois milhões de horas e garantia limitada de cinco anos da Kingston, além de suporte técnico gratuito.
Especificações do Kingston DC3000ME
| Especificação | Detalhes |
| Fator de Forma | U.2, 2.5″ x 15 mm |
| Interface | PCIe NVMe Gen5 x4 (compatível com versões anteriores do Gen4) |
| Capacidades | 3.84 TB, 7.68 TB, 15.36 TB |
| Tipo NAND | 3D eTLC NAND |
| Leitura / gravação sequencial (MB / s) | 3.84 TB – 14,000 / 5,800 7.68 TB – 14,000 / 10,000 15.36 TB – 14,000 / 9,700 |
| IOPS de leitura/gravação aleatória (4K) | 3.84 TB – 2,700,000 / 300,000 7.68 TB – 2,800,000 / 500,000 15.36 TB – 2,700,000 / 400,000 |
| Latência QoS (99%) | Leitura: <10µs, Escrita: <70µs |
| Nivelamento de desgaste estático e dinâmico | Sim |
| Proteção contra perda de energia | Sim (capacidade de energia) |
| Criptografia | TCG Opal 2.0, criptografia AES de 256 bits |
| Gerenciamento de namespace | Até 128 namespaces suportados |
| Diagnóstico empresarial | Telemetria, desgaste da mídia, temperatura, saúde, etc. |
| Resistência (TBW / DWPD, 5 anos) | 3.84 TB – 7,008 TBW, 1 DWPD 7.68 TB – 14,016 TBW, 1 DWPD 15.36 TB – 28,032 TBW, 1 DWPD |
| Consumo de energia | Inativo: 8 W, Leitura máx.: 8.2 W, Gravação máx.: 24 W |
| Temperatura de Operação | 0 ° C a 70 ° C |
| Dimensões | 100.50mm x 69.8mm x 14.8mm |
| Peso | 3.84 TB - 146.2 g 7.68 TB - 151.3 g 15.36 TB - 152.3 g |
| Vibração (não operacional) | Pico 10G (10–1000Hz) |
| MTBF | 2 milhões de horas |
| Garantia e Suporte | Garantia limitada de 5 anos com suporte técnico gratuito |
Teste de desempenho do Kingston DC3000ME
Plataforma de teste de direção
Utilizamos um Dell PowerEdge R760 com Ubuntu 22.04.02 LTS como plataforma de teste para todas as cargas de trabalho nesta análise. Equipado com um Cabos seriais Gen5 JBOF, oferece ampla compatibilidade com SSDs U.2, E1.S, E3.S e M.2. Nossa configuração de sistema está descrita abaixo:
-
-
- 2 x Intel Xeon Gold 6430 (32 núcleos, 2.1 GHz)
- 16 x 64GB DDR5-4400
- SSD Dell BOSS de 480 GB
- Cabos seriais Gen5 JBOF
-
Unidades comparadas
Desempenho do CDN
Para simular uma carga de trabalho realista de CDN com conteúdo misto, os SSDs foram submetidos a uma sequência de benchmarking multifásica projetada para replicar os padrões de E/S de servidores de borda com alto conteúdo. O procedimento de teste abrange uma variedade de tamanhos de bloco, incluindo grandes e pequenos, distribuídos em operações aleatórias e sequenciais, com diferentes níveis de simultaneidade.
Antes dos principais testes de desempenho, cada SSD completou um preenchimento total do dispositivo com uma passagem de gravação sequencial de 100% usando blocos de 1 MB. Esse processo utilizou E/S síncronas e uma profundidade de fila de quatro, permitindo quatro tarefas simultâneas. Essa fase garante que a unidade entre em uma condição de estado estável representativa do uso no mundo real. Após o preenchimento sequencial, um estágio secundário de saturação de gravação aleatória de três horas foi executado usando uma distribuição ponderada de tamanho de bloco (tamanho do bloco/porcentagem), com forte preferência por transferências de 128 K (98.51%), seguidas por contribuições menores de blocos abaixo de 128 K até 8 K. Essa etapa emula padrões de gravação fragmentados e irregulares, frequentemente observados em ambientes de cache distribuído.
O conjunto principal de testes concentrou-se em operações de leitura e gravação aleatórias escalonadas para medir o comportamento da unidade em profundidades de fila variáveis e simultaneidade de tarefas. Cada teste durou cinco minutos (300 segundos) e foi seguido por um período de inatividade de três minutos, permitindo que mecanismos internos de recuperação estabilizassem as métricas de desempenho.
- Executado usando uma distribuição de tamanho de bloco fixo, favorecendo 128K (98.51%), com os 1.49% restantes das operações compostos por tamanhos de transferência menores, variando de 64K a 8K. Cada configuração variou entre 1, 2 e 4 tarefas simultâneas, com profundidades de fila de 1, 2, 4, 8, 16 e 32, para analisar a escalabilidade da taxa de transferência e a latência em condições típicas de gravação em borda.
- Foi utilizado um perfil de tamanho de bloco bastante misto, que imita a recuperação de conteúdo de CDN, começando com um componente dominante de 128K (83.21%) e seguido por uma longa cauda de mais de 30 tamanhos de bloco menores, abrangendo de 4K a 124K, cada um com representação de frequência fracionada. Essa distribuição reflete os diversos padrões de solicitação encontrados durante a busca de segmentos de vídeo, acesso a miniaturas e consultas de metadados. Esses testes também foram executados em toda a matriz de contagens de tarefas e profundidades de fila.
Essa combinação de pré-condicionamento, saturação e testes de acesso randomizado de tamanho misto foi projetada para revelar como os SSDs lidam com ambientes sustentados semelhantes aos de CDN, enfatizando a capacidade de resposta e a eficiência em cenários com uso intenso de largura de banda e altamente paralelizados.
Leitura de carga de trabalho CDN 1
Em nossos testes de leitura de carga de trabalho de CDN (1 tarefa), o Kingston DC3000ME apresentou desempenho sólido, que se expandiu eficientemente com o aumento da profundidade da fila. No QD1, atingiu uma velocidade de 940 MB/s, ficando aproximadamente 861% atrás do SanDisk SN26. No entanto, com o aumento da profundidade da fila, o DC3000ME diminuiu a diferença e ultrapassou vários discos Gen5. No QD4, o Kingston DC3000ME atingiu 3,390 MB/s, aproximadamente 42% mais rápido que o Micron 9550, 40% à frente do Pascari X200P e cerca de 25% mais rápido que o Solidigm PS1010, embora esteja ligeiramente atrás do SanDisk SN861 em cerca de 2.6%. No QD16, o DC3000ME atingiu 9,645 MB/s, superando o Solidigm PS1010 em aproximadamente 13% e o Micron 9550 em cerca de 20%. Na profundidade máxima do teste, no QD32, a Kingston obteve uma taxa de transferência de 14,131 MB/s, igualando efetivamente o Micron 9550 e superando o Solidigm PS1010 em aproximadamente 15% e o SanDisk SN861 em quase 10%.
Leitura de carga de trabalho CDN 2
Na carga de trabalho de leitura de CDN de 2 tarefas, o Kingston DC3000ME novamente manteve um desempenho sólido em todas as profundidades de fila. No primeiro trimestre, registrou 1 MB/s. Isso foi 1,854% mais rápido que o Micron 9550 (1,548 MB/s), 20% que o Pascari X200P (1,519 MB/s) e aproximadamente 22% que o Solidigm PS1010 (2,011 MB/s), embora tenha ficado 8% atrás do SanDisk SN861 (2,487 MB/s).
No quarto trimestre, a Kingston atingiu 4 MB/s, significativamente melhor que a Micron (6,335 MB/s), a Pascari (5,337 MB/s) e a Solidigm (5,249 MB/s). No entanto, ainda ficou atrás da SanDisk, que ficou em primeiro lugar com 5,609 MB/s.
No QD16, a Kingston atingiu 14,131 MB/s, liderando o grupo nesse ponto. No último ponto de teste, QD32, obteve um ligeiro aumento para 14,336 MB/s, ficando atrás da Pascari (15,257 MB/s) e da Micron (15,052 MB/s) em aproximadamente 6% e 5%, respectivamente, mantendo uma sólida liderança sobre a SanDisk (13,619 MB/s) e a Solidigm (13,721 MB/s).
Leitura de carga de trabalho CDN 4
Com quatro tarefas ativas, o Kingston DC3000ME manteve seu desempenho de leitura de CDN. No primeiro trimestre, atingiu 1 MB/s, superando o Micron 3,639 (9550 MB/s) e o Pascari X3,070P (200 MB/s), mas ainda 2,982% atrás do SanDisk SN22, que liderou esse nível com 861 MB/s. No quarto trimestre, a Kingston atingiu 4,443 MB/s, uma melhoria de 4% em relação ao Micron (10,854 MB/s), 15% à frente do Pascari (9,427 MB/s) e ligeiramente acima do Solidigm (20 MB/s). No entanto, ainda ficou atrás dos 9,070 MB/s da SanDisk.
No QD8, a Kingston registrou 13,926 MB/s, quase idêntico ao da Micron e praticamente em linha com a SanDisk (13,619 MB/s) e a Solidigm (12,800 MB/s). No QD16 e QD32, a taxa de transferência atingiu um patamar em torno de 14,131–14,233 MB/s para a Kingston, ligeiramente atrás da Micron e da Pascari (ambas em torno de 15,052–15,257 MB/s), mas ainda confortavelmente à frente da SanDisk (13,619 MB/s) e da Solidigm (13,721 MB/s).
Carga de trabalho CDN Gravação 1
Em nossa carga de trabalho de gravação em CDN (1 tarefa), o Kingston DC3000ME apresentou escalonamento consistente em todas as profundidades de fila. No QD1, atingiu 2,118 MB/s, mais rápido que o Micron 9550 (2,004 MB/s), o Pascari X200P (1,885 MB/s) e o Solidigm PS1010 (1,718 MB/s), ficando atrás do SanDisk SN861 por apenas um fio (2,164 MB/s). No QD4, a Kingston registrou 4,318 MB/s, 55% mais rápido que o Solidigm (2,789 MB/s), 26% mais rápido que o Pascari (3,437 MB/s), mas 10% mais lento que o Micron (4,807 MB/s) e 19% atrás do SanDisk (5,353 MB/s).
No trimestre de 16, a velocidade máxima era de 5,880 MB/s, superando a Pascari (4,921 MB/s) em 20% e mais que dobrando a Solidigm (2,664 MB/s), mas ainda 11% atrás da Micron (6,686 MB/s) e 15% atrás da SanDisk (6,939 MB/s). No trimestre de 32, a Kingston atingiu o limite de 5,987 MB/s, novamente próxima da Pascari (5,913 MB/s), mas atrás da Micron (7,422 MB/s) e da SanDisk (7,521 MB/s) em aproximadamente 20% e 25%, respectivamente.
Carga de trabalho CDN Gravação 2
Na carga de trabalho de gravação de CDN de duas tarefas, o Kingston DC2ME demonstrou desempenho consistente, embora tenha ficado atrás dos SSDs de classe empresarial Gen3000 mais rápidos. No primeiro trimestre de 5, registrou 1 MB/s, um pouco abaixo do Micron 2,651 (9550 MB/s) e do Pascari X2,813P (200 MB/s), e cerca de 2,762% atrás do SanDisk SN33 (861 MB/s).
À medida que a profundidade da fila aumentava, o DC3000ME acompanhou o ritmo. No quarto trimestre de 4, atingiu 4,807 MB/s, cerca de 23% mais lento que o Micron 9550 (5,902 MB/s) e 13% atrás do SanDisk SN861 (5,508 MB/s), mas à frente do Solidigm PS1010, com 3,154 MB/s.
No QD16, a Kingston apresentou 5,772 MB/s, ainda atrás da Micron (7,896 MB/s) e da SanDisk (6,709 MB/s), mas continuando a superar concorrentes de nível inferior, como o Solidigm PS1010 (3,820 MB/s) e o Pascari X200P (5,417 MB/s). No QD32, o DC3000ME atingiu o pico de 5,870 MB/s, cerca de 32% atrás do Micron 9550 (8,670 MB/s) e 22% abaixo do SanDisk SN861 (7,537 MB/s), mas ainda à frente do Solidigm PS1010 (2,817 MB/s) e do Pascari (4,585 MB/s).
Carga de trabalho CDN Gravação 4
Na carga de trabalho de gravação de CDN de 4 tarefas, o Kingston DC3000ME apresentou desempenho estável em todas as profundidades de fila, embora tenha ficado atrás dos dois principais discos Gen5. No QD1, atingiu 2,202 MB/s, ficando atrás do Pascari X200P (2,845 MB/s), Micron 9550 (2,703 MB/s) e SanDisk SN861 (3,544 MB/s), mas à frente do Solidigm PS1010 (2,020 MB/s). No QD2, a Kingston atingiu 3,165 MB/s, novamente atrás do SanDisk (4,863 MB/s) e do Micron (4,457 MB/s), mas ainda mantendo a liderança sobre o Solidigm (2,872 MB/s).
Em profundidades de fila intermediárias, o Kingston DC3000ME atingiu 3,647 MB/s em QD4 e 4,410 MB/s em QD8. Embora tenha apresentado um escalonamento decente, permaneceu atrás do disco Micron (5,539 MB/s e 6,478 MB/s) e do disco SanDisk (5,177 MB/s e 5,575 MB/s) em ambos os pontos de teste. Em QD16, a Kingston apresentou 4,865 MB/s, um ganho modesto em relação ao QD8, mas ainda atrás do disco SanDisk (6,011 MB/s) e do disco Micron (7,474 MB/s). No QD32, o DC3000ME atingiu seu pico de 5,307 MB/s, mantendo-se bem à frente da Solidigm (3,894 MB/s), mas significativamente atrás da Micron (7,941 MB/s) e da SanDisk (7,212 MB/s). Embora não seja líder em desempenho, o disco rígido da Kingston manteve escalabilidade e eficiência consistentes.
Benchmark de ponto de verificação DLIO
Para avaliar o desempenho real de SSDs em ambientes de treinamento de IA, utilizamos a ferramenta de benchmark Data and Learning Input/Output (DLIO). Desenvolvido pelo Argonne National Laboratory, o DLIO foi projetado especificamente para testar padrões de E/S em cargas de trabalho de aprendizado profundo. Ele fornece insights sobre como os sistemas de armazenamento lidam com desafios como pontos de verificação, ingestão de dados e treinamento de modelos. O gráfico abaixo ilustra como ambas as unidades lidam com o processo em 36 pontos de verificação. Ao treinar modelos de aprendizado de máquina, os pontos de verificação são essenciais para salvar o estado do modelo periodicamente, evitando a perda de progresso durante interrupções ou falhas de energia. Essa demanda de armazenamento exige um desempenho robusto, especialmente sob cargas de trabalho sustentadas ou intensivas. Utilizamos o benchmark DLIO versão 2.0, lançado em 13 de agosto de 2024.
Para garantir que nosso benchmarking refletisse cenários do mundo real, baseamos nossos testes na arquitetura do modelo LLAMA 3.1 405B. Implementamos pontos de verificação usando torch.save() para capturar parâmetros do modelo, estados do otimizador e estados da camada. Nossa configuração simulou um sistema com oito GPUs, implementando uma estratégia de paralelismo híbrido com paralelismo tensorial de 4 vias e processamento paralelo de pipeline bidirecional distribuído entre as oito GPUs. Essa configuração resultou em tamanhos de pontos de verificação de 2 GB, representativos dos requisitos modernos de treinamento de modelos de linguagem de grande porte.
Nos resultados de média de aprovações do DLIO, o Kingston DC3000ME de 7.68 TB ficou ligeiramente atrás dos principais concorrentes, ficando no meio do grupo de cinco unidades. Os tempos de checkpoint tiveram uma média de 465.04 segundos na primeira aprovações, 584.38 segundos na segunda aprovações e 590.30 segundos na terceira aprovações. Embora tenha sido consistentemente mais rápido que o Pascari X200P de 7.68 TB, que registrou os tempos mais altos em todas as três aprovações (atingindo 674.48 segundos na terceira aprovações), o Kingston DC3ME ficou atrás do Micron 3000 de 9550 TB e do Solidigm PS7.68 de 1010 TB, ambos permanecendo abaixo de 7.68 segundos na última aprovações.
Como mostrado no gráfico abaixo, o Kingston DC3000ME teve um início forte, com tempos nos pontos de verificação iniciais muito próximos aos dos concorrentes de ponta. No ponto de verificação 1, registrou 469.27 segundos, logo atrás do Micron 9550, com 464.01 segundos, e à frente do Pascari X200P, com 472.65 segundos. Do ponto de verificação 2 ao 4, manteve uma faixa estável entre 461.92 e 465.44 segundos, novamente próximo ao Micron 9550 e ao Solidigm PS1010, ambos na faixa de 453 a 465 segundos.
No meio do teste (pontos de verificação 5 a 8), o Kingston DC3000ME apresentou um aumento nos tempos de ponto de verificação, atingindo um pico de 613.01 segundos no ponto de verificação 7. Esse tempo foi superior ao do Micron 9550 (570.42 s) e do SanDisk SN861 de 7.68 TB (559.56 s), embora ainda significativamente melhor que o Pascari X200P, que atingiu 694.38 segundos no mesmo intervalo. Perto do final do teste, o Kingston DC3000ME se estabilizou ligeiramente, terminando em 571.36 segundos no ponto de verificação 12, que foi cerca de 28 segundos mais lento que o Micron 9550, mas ainda superando o Pascari X200P, que fechou em 689.68 segundos. No geral, o Kingston DC3000ME 7.68 TB demonstrou desempenho consistente e permaneceu dentro de uma faixa competitiva durante toda a carga de trabalho de verificação, colocando-o no meio do grupo.
Referência de desempenho da FIO
Para medir o desempenho de armazenamento de cada SSD com base em métricas comuns do setor, utilizamos a FIO. Cada unidade passa pelo mesmo processo de teste, que inclui uma etapa de pré-condicionamento com dois preenchimentos completos da unidade com uma carga de trabalho de gravação sequencial, seguida pela medição do desempenho em estado estacionário. À medida que cada tipo de carga de trabalho medida muda, executamos outro preenchimento de pré-condicionamento com esse novo tamanho de transferência.
Nesta seção, nos concentramos nos seguintes benchmarks de FIO:
- 128K sequencial
- 64K aleatório
- 16K aleatório
- 4K aleatório
Com SSDs QLC de alta capacidade projetados para grandes tamanhos de transferência, nossos testes de velocidade de gravação são limitados a 16K aleatórios. Para 4K, aproveitamos o estado pré-preenchido da carga de trabalho de 16K para medir apenas o desempenho de leitura aleatória de 4K.
Pré-condição sequencial de 128K (IODepth 256 / NumJobs 1)
Neste teste de pré-condicionamento intensivo de profundidade de fila, o Kingston DC3000ME manteve uma largura de banda de gravação estável em 8,944.9 MB/s durante toda a execução de 1,000 segundos (embora tenha concluído o teste pouco depois da marca de 800 segundos). Embora não tenha sido o mais rápido (ficando ligeiramente atrás do Micron 9550, que atingiu um pico de 10.3 GB/s), o Kingston DC3000ME demonstrou uma taxa de transferência consistente com variação mínima.
Latência de pré-condição sequencial de 128K (IODepth 256 / NumJobs 1)
No teste de latência de pré-condição de gravação sequencial de 128K, o Kingston DC3000ME mostrou uma latência média de 3.577 ms (permanecendo estável ao longo do tempo com flutuação mínima), ficando em segundo lugar, atrás do drive Micron.
Gravação sequencial de 128K (IODepth 16 / NumJobs 1)
No Teste de Gravação Sequencial de 128K, o Kingston DC3000ME atingiu 8,477.4 MB/s, ficando logo atrás do Micron 9550, que liderou o grupo com 10,354.6 MB/s. O Kingston DC3000ME superou o Pascari X200P e manteve uma sólida liderança sobre o Solidigm PS1010 e o SanDisk SN861, com cada um girando em torno de 7,100 MB/s. O desempenho da Kingston indica um forte equilíbrio entre velocidade e consistência.
Latência de gravação sequencial de 128K (IODepth 16 / NumJobs 1)
No teste de Latência de Gravação Sequencial de 128K, o Kingston DC3000ME apresentou um resultado sólido, com latência média de 235.6 µs. Isso o coloca à frente do SanDisk SN861 e do Solidigm PS1010, que apresentaram latências de 280.7 µs e 280.3 µs, respectivamente. Embora não tão rápido quanto o Micron 9550, que liderou com 192.9 µs, o Kingston DC3000ME permaneceu competitivo e também superou ligeiramente o Pascari X200P com 238.6 µs.
Leitura sequencial de 128K (IODepth 64 / NumJobs 1)
No teste de Leitura Sequencial de 128K com uma profundidade de fila de 64 com uma única tarefa, o Kingston DC3000ME atingiu 13,513.8 MB/s. Embora isso o coloque em quarto lugar entre os discos testados, ele ainda apresentou uma taxa de transferência robusta (com diferenças mínimas no mundo real). Ele ficou atrás do Pascari X200P (14,242.1 MB/s) em cerca de 5.1%, do Solidigm PS1010 (14,163.3 MB/s) em 4.6% e do Micron 9550 (14,050.1 MB/s) em aproximadamente 3.8%. Ele também superou confortavelmente o SanDisk SN861, que atingiu uma velocidade menor de 12,631.2 MB/s. Mesmo assim, os resultados do Kingston DC3000ME foram excelentes, com queda mínima em comparação com os discos mais testados.
Latência de leitura sequencial de 128K (IODepth 64 / NumJobs 1)
Em termos de latência, o Kingston DC3000ME registrou uma latência média de 591.6 µs, o que o colocou no meio do grupo. Esse resultado foi 5.4% superior ao do Micron 9550 (569.0 µs) e 5.4% inferior ao do Solidigm PS1010 (564.5 µs). O Pascari X200P liderou marginalmente com 561.4 µs, enquanto o SanDisk SN861 apresentou a resposta mais lenta com 633.0 µs. No final das contas, o Kingston DC3000ME manteve uma latência relativamente baixa em condições de leitura com alta profundidade de fila.
Gravação aleatória 64K
No teste de gravação aleatória de 64K, o Kingston DC3000ME apresentou alto desempenho consistentemente em diversas profundidades de fila e combinações de threads, atingindo um pico de 6,649 MB/s na configuração 32 (profundidade de E/S)/8 (numjobs). Este resultado está entre os mais altos entre todas as cargas de trabalho e pontos de teste.
Ao longo do gráfico, o Kingston DC3000ME manteve uma tendência de largura de banda estável entre 4,000 e 5,000 MB/s, com resultados particularmente fortes em configurações de simultaneidade média a alta, como 32/4 (5,380 MB/s) e 16/8 (5,017 MB/s). Mesmo em condições mais brandas, como 1/4 e 2/4, manteve-se acima de 4200 MB/s. Comparado a outros discos rígidos, o Kingston DC3000ME geralmente liderou ou permaneceu próximo do topo do grupo na maioria dos pontos de teste, oferecendo alta taxa de transferência de pico e desempenho consistente durante todo o teste.
Latência de gravação aleatória de 64K
No teste de Latência de Gravação Aleatória de 64K, o Kingston DC3000ME apresentou tempos de resposta consistentemente baixos na maioria das profundidades de fila e combinações de trabalhos, demonstrando alta eficiência de gravação mesmo sob carga pesada. Por exemplo:
- Em 4/1, mostrou 49µs
- Em 8/1, a latência permaneceu baixa em 102µs
- Em 16/4, mediu 1,486µs
- E na carga máxima testada, 32/8, atingiu 2,402µs
Esses resultados indicam que o Kingston DC3000ME foi dimensionado de forma previsível, evitando os picos severos de latência vistos em outras unidades, especialmente as unidades Pascari e Solidigm, que exibiram saltos erráticos acima de 3,000–6,000 µs (mais notavelmente em 16/8).
Leitura aleatória 64K
No teste de leitura aleatória de 64K, o Kingston DC3000ME apresentou desempenho sólido e consistente em toda a matriz IOdepth/NumJobs, terminando em quarto lugar ao final do teste (por uma pequena margem). A largura de banda máxima atingiu 13,515 MB/s em 32/4, com taxa de transferência igualmente alta em 16/4 (13,482 MB/s) e 32/8 (13,512 MB/s), demonstrando excelente escalabilidade sob cargas de trabalho pesadas de leitura paralela. Em cargas mais baixas, como 1/4 e 2/2, o Kingston DC3000ME registrou 2,298 MB/s e 2,234 MB/s, respectivamente.
Latência de leitura aleatória de 64K
A latência do Kingston DC3000ME 64K permaneceu relativamente baixa em todos os pontos de teste. Todos os discos apresentaram desempenho semelhante, embora o SanDisk SN861 tenha atingido um pico visivelmente mais alto do que todos os outros discos testados ao final do teste. Começando em 1/2, o Kingston DC3000ME registrou 106 µs, seguido por 108 µs em 1/4, 131 µs em 8/1, 133 µs em 4/4 e 177 µs em 8/4. Em simultaneidade mais alta, aumentou para 305 µs em 16/4, 174 µs em 32/1, 301 µs em 32/2 e atingiu o pico de 1,184 µs em 32/8, alinhando-se com o restante do grupo. No geral, o perfil de latência do Kingston DC3000ME acompanhou de perto os desempenhos dos melhores, com jitter mínimo ou picos atípicos (o que foi o caso de todas as unidades testadas).
Gravação aleatória 16K
No teste de gravação aleatória de 16K, o Kingston DC3000ME apresentou forte largura de banda em toda a gama de profundidades de fila e contagens de threads, terminando o teste em segundo lugar entre os discos concorrentes. Ele atingiu o máximo de 427,592 IOPS na configuração 32/16. Outros pontos de alto desempenho incluíram 338,521 IOPS em 32/8, 251,428 IOPS em 16/4 e 226,606 IOPS em 1/8, todos mostrando excelente eficiência do controlador sob cargas paralelas variáveis. Mesmo em configurações de carga moderadas, como 2/16 e 1/4, o disco atingiu 218,300 IOPS e 204,867 IOPS, respectivamente. No geral, o Kingston DC3000ME atingiu consistentemente IOPS acima de 160,000 em toda a matriz de teste (exceto em algumas áreas), tornando-o um dos discos mais equilibrados nesta carga de trabalho.
Latência de gravação aleatória de 16K
O desempenho de latência de gravação do Kingston DC3000ME 16K foi muito sólido, terminando o teste no topo da tabela de classificação (com o disco Pascari logo atrás). Os destaques do Kingston DC3000ME incluíram 14 µs a 1/1, 18 µs a 2/1, 19 µs a 1/4 e 29 µs a 1/2. À medida que a carga aumentava, a Kingston manteve um forte perfil de latência: 126 µs a 8/4, 146 µs a 2/16, 254 µs a 16/4 e 575 µs a 16/8. Mesmo na configuração mais pesada, 32/16, a latência permaneceu sob controle em 1,197 µs.
16K Leitura aleatória
Em condições de leitura aleatória de 16K, o Kingston DC3000ME demonstrou um desempenho consistentemente forte até atingir 8/8, quando começou a ficar ligeiramente para trás. O pico de IOPS ficou em pouco menos de 800K (648,686) no QD32 com quatro jobs, seguido por 641K IOPS no QD4 com 16 jobs e 623K no QD16 com quatro jobs. Infelizmente, o Kingston DC3000ME terminou o teste perto do final da tabela de classificação, junto com o disco SanDisk.
Latência de leitura aleatória de 16K
No pico de throughput (QD8/8), a latência do Kingston DC3000ME foi de apenas 99 µs e permaneceu dentro de uma faixa estreita e de baixa latência na maioria das configurações até por volta de 16/8, quando começou a apresentar falhas. A melhor latência foi observada em QD1/4 (74 µs), com vários outros resultados abaixo de 80 µs em profundidades de fila baixas a moderadas. Em cargas mais pesadas, como QD32/16, o Kingston DC3000ME registrou 826 µs, significativamente maior do que os outros discos testados (exceto o SanDisk).
Leitura aleatória 4K
No teste de leitura aleatória em 4K, o Kingston DC3000ME apresentou excelente escalabilidade em toda a faixa de teste, atingindo um pico de 1,957.92K IOPS na configuração 16/16. Manteve alta taxa de transferência de 1,923.42K IOPS em 32/8, 1,361.32K IOPS em 8/16 e 1326.03K IOPS em 16/8, classificando-se consistentemente no topo da tabela de classificação, ao lado da Solidigm e da Micron.
Latência de leitura aleatória de 4K
O Kingston DC3000ME manteve baixa latência durante todo o teste de leitura aleatória de 4K, começando em 60 µs na configuração 1/1. Em 1/4, melhorou ligeiramente para 61 µs e, em 1/8, permaneceu estável em 63 µs. À medida que a simultaneidade aumentava, a latência aumentava previsivelmente com o Kingston DC3000ME: 66 µs em 2/4, 67 µs em 2/16, 71 µs em 4/4 e 80 µs em 8/4. Configurações mais pesadas apresentaram aumentos modestos, com 94 µs em 16/4, 99 µs em 16/8, 135 µs em 32/8 e um pico de 266 µs em 32/16.
Gravação aleatória 4K
Em gravação aleatória em 4K, o Kingston DC3000ME apresentou um desempenho sólido, com um máximo de 979,636 IOPS em 32/16 e 979.173 IOPS em 32/8, ficando bem atrás do seu melhor desempenho, o Pascari X200P, que ultrapassou 1.6 milhão de IOPS no pico. Dito isso, o Kingston DC3000ME apresentou números decentes em cargas de médio porte, como 879 mil IOPS em 8/16, 944 mil IOPS em 16/16 e 745 mil IOPS em 16/4.
Latência de gravação aleatória de 4K
Em latência de gravação aleatória, o Kingston DC3000ME começou com 11 µs abaixo de 1/1, permaneceu em torno de 20–50 µs até atingir a profundidade de 8/8 e escalou para 261 µs em 32/8 e 522 µs em 32/16. Embora não seja o menor em latência, o Kingston DC3000ME manteve um escalonamento previsível e moderado, sem os picos observados em drives como o Solidigm e o Pasarci, que apresentaram maior volatilidade além de 16 threads.
Armazenamento direto da GPU
Um dos testes que conduzimos neste testbench foi o teste Magnum IO GPU Direct Storage (GDS). GDS é um recurso desenvolvido pela NVIDIA que permite que GPUs ignorem a CPU ao acessar dados armazenados em unidades NVMe ou outros dispositivos de armazenamento de alta velocidade. Em vez de rotear dados pela CPU e pela memória do sistema, o GDS permite a comunicação direta entre a GPU e o dispositivo de armazenamento, reduzindo significativamente a latência e melhorando a taxa de transferência de dados.
Como funciona o armazenamento direto da GPU
Tradicionalmente, quando uma GPU processa dados armazenados em uma unidade NVMe, os dados devem primeiro viajar pela CPU e pela memória do sistema antes de chegar à GPU. Esse processo introduz gargalos, pois a CPU se torna um intermediário, adicionando latência e consumindo recursos valiosos do sistema. O GPU Direct Storage elimina essa ineficiência ao permitir que a GPU acesse dados diretamente do dispositivo de armazenamento por meio do barramento PCIe. Esse caminho direto reduz a sobrecarga associada à movimentação de dados, permitindo transferências de dados mais rápidas e eficientes.
Cargas de trabalho de IA, especialmente aquelas que envolvem aprendizado profundo, são altamente intensivas em dados. Treinar grandes redes neurais requer o processamento de terabytes de dados, e qualquer atraso na transferência de dados pode levar a GPUs subutilizadas e tempos de treinamento mais longos. O GPU Direct Storage aborda esse desafio garantindo que os dados sejam entregues à GPU o mais rápido possível, minimizando o tempo ocioso e maximizando a eficiência computacional.
Além disso, o GDS é particularmente benéfico para cargas de trabalho que envolvem streaming de grandes conjuntos de dados, como processamento de vídeo, processamento de linguagem natural ou inferência em tempo real. Ao reduzir a dependência da CPU, o GDS acelera a movimentação de dados e libera recursos da CPU para outras tarefas, aprimorando ainda mais o desempenho geral do sistema.
Taxa de transferência de leitura
Em nossos testes de leitura sequencial GDSIO, o Kingston DC3000ME demonstrou escalonamento de throughput consistente e eficiente nos tamanhos de bloco de 16K, 128K e 1MB, embora as tendências de desempenho tenham variado ligeiramente de acordo com o tamanho da transferência. Com blocos de 16K, o throughput aumentou de forma constante com o aumento da contagem de threads, com o Kingston DC3000ME atingindo o pico de 3.70GiB/s em 32 threads, antes de cair gradualmente para 3.41GiB/s em 128 threads. Para transferências de 128K, o disco atingiu seu melhor resultado de 5.88GiB/s em 16 threads e manteve esse nível em 32 threads, antes de cair para cerca de 5.35GiB/s em 128 threads. Com 1 MB de tamanho, a taxa de transferência do Kingston DC3000ME atingiu um patamar mais alto, atingindo 6.54 GiB/s em 16 threads e diminuindo modestamente para 5.91 GiB/s em 128 threads.
Latência de leitura
Em termos de latência, o DC3000ME apresentou escalonamento previsível (o que ocorreu com todos os discos testados): contagens de threads mais baixas resultaram em tempos de resposta mais curtos em todos os tamanhos de bloco, com a latência aumentando à medida que as threads aumentavam de tamanho. A 16K, a latência começou em 504µs e aumentou gradualmente para 582µs em 128 threads. Para 128K, a latência do Kingston DC3000ME começou em 2,60µs e aumentou para 3,228µs na contagem de threads mais alta. Com blocos de 1 MB, a latência apresentou um salto maior devido à carga útil mais pesada, começando em 2,609µs com uma thread e aumentando para 2,703µs em 128 threads.
Taxa de transferência de gravação
Para operações de leitura, a latência média com blocos de 16K começou em 2,247 µs com uma única thread e diminuiu para 504 µs com 128 threads, demonstrando um escalonamento eficiente sob simultaneidade. Para o bloco de 128K, a latência começou inicialmente em 4,035 µs e diminuiu gradualmente para 2,601 µs com 128 threads. Com blocos de 1M, o Kingston DC3000ME apresentou a menor latência geral, começando em 2,609 µs com uma thread e permanecendo na faixa de 2,500 a 2,700 µs com 128 threads, demonstrando uma capacidade de resposta consistente para grandes leituras sequenciais.
Gravar Latência
A latência média permaneceu relativamente estável entre as contagens de threads de 1 a 16, oscilando entre 12,234 e 14,247 µs. Com 32 threads, a latência aumentou ligeiramente para 15,559 µs e subiu para 20,944 µs com 64 threads. Um pico notável ocorreu com 128 threads, onde a latência do Kingston DC3000ME saltou para 28,725 µs, mais que o dobro do nível anterior.
Conclusão
O Kingston DC3000ME se posiciona como uma solução prática para implantações corporativas e de data center convencionais, onde confiabilidade, desempenho consistente e um conjunto sólido de recursos empresariais são requisitos essenciais. Este disco rígido atende às necessidades de integradores de sistemas, revendedores de valor agregado (VARs) e equipes de TI em ambientes de PMEs e PMEs que constroem e gerenciam sua infraestrutura. Seu formato U.2 e suporte a PCIe Gen5 oferecem ampla compatibilidade e largura de banda pronta para o futuro, tornando-o um forte candidato para implantações orientadas por canal.
Em termos de desempenho, o DC3000ME oferece throughput e eficiência competitivos em uma variedade de cargas de trabalho. Seus pontos fortes residem em leituras sequenciais sólidas, boa consistência de gravação e escalonamento de latência consistente em cargas de trabalho mistas e aleatórias. Embora ocasionalmente fique atrás de concorrentes de alto desempenho da Gen5, como Micron e SanDisk, em certos benchmarks de CDN pesado ou checkpointing, ele permanece competitivo, especialmente em cenários de carga mista sustentada e simultaneidade moderada.
No geral, o DC3000ME é uma opção ideal para cargas de trabalho corporativas de uso geral, atendendo às necessidades de organizações que buscam implantar armazenamento de alto desempenho sem depender de soluções OEM altamente personalizadas. VARs e desenvolvedores de sistemas encontrarão muito o que valorizar, principalmente ao equilibrar custo, desempenho e escalabilidade em implantações práticas de infraestrutura.


Leitura de carga de trabalho CDN 2
Latência de leitura aleatória de 4K

Amazon