ArmazenamentoReview.com

Análise da Estação de IA HP ZGX Nano G1n: Um nó de IA seguro e sustentável para uso em mesas.

Consumidores   ◇  Workstation

A plataforma DGX Spark já nos é familiar. Analisamos o Dell, ASUS, Acer e Gigabyte assume Design de referência GB10 Grace Blackwell da NVIDIAE os principais componentes são consistentes em todos eles: 1,000 TOPS de computação FP4, 128 GB de memória LPDDR5x unificada e rede dupla de 200 GbE em um chassi de 150 mm. A estação de IA ZGX Nano G1n da HP se baseia nessa fundação, mas a maneira como a HP a desenvolveu diferencia esta unidade do restante da linha Spark.

Moldura frontal do HP ZGX Nano G1n

As diferenças mais visíveis estão nos materiais e na construção. A HP reveste o ZGX Nano com um chassi feito com até 75% de alumínio reciclado e 20% de aço reciclado, com embalagens que contêm até 93% de material reciclado. O layout interno divide o chassi em metades superior e inferior, facilitando o acesso a componentes como o SSD e a bateria tipo moeda, em comparação com várias unidades Spark que testamos. Em termos de temperatura, a HP classifica o sistema com 22 dBA em repouso e 27.6 dBA sob cargas de trabalho intensivas, um nível de ruído baixo para um sistema que dissipa aproximadamente 780 BTU/h em pico.

A segurança é o ponto forte da HP, que vai além da plataforma de referência. O ZGX Nano vem com TPM 2.0 operando em modo certificado FIPS 140-2, atende aos critérios Common Criteria EAL4+ e inclui inicialização segura em nível de BIOS e controles PXE. O armazenamento é instalado de fábrica como uma unidade OPAL NVMe com criptografia automática. Em conjunto, a HP posiciona esta unidade não apenas como um nó de IA para desenvolvedores, mas também como um sistema capaz de operar em ambientes regulamentados, onde certificações da cadeia de suprimentos, criptografia em repouso e resistência à adulteração são essenciais para a aquisição.

Especificação Estação de IA HP ZGX Nano G1n
Visão geral
Nome do Produto Estação de IA HP ZGX Nano G1n
Fator de Forma Mini
Sistema Operacional NVIDIA DGX OS 7/Ubuntu 24.04
NOTA: Este produto não é compatível com o Microsoft Windows.
Hardware
Subcontratante Superchip NVIDIA GB10 Grace Blackwell
GPU com arquitetura Blackwell
Processador Arm de 20 núcleos (10x Cortex-X925 + 10x Cortex-A725)
Núcleos CUDA da Blackwell
Núcleos Tensor de 5ª geração
Núcleos RT de 4ª geração
1x NVENC
1x NVDEC
Memória 128 GB LPDDR5x, unificado, 16 canais, soldado
Largura de banda de memória 273 GB / s
Armazenamento (E/S interna) 1x M.2 PCIe Gen5 x4
Opções: NVMe PCIe Gen4 x4 de 2 TB ou 4 TB (2242, SED OPAL TLC)
Redes e E/S
Portas de E/S traseiras 1x alimentação USB-C (240 W)
3 portas USB-C de 20 Gbps (DisplayPort 1.4a, 30 W no total)
1x HDMI 2.1a
1x 10GbE RJ-45
2x QSFP 200GbE (ConnectX-7)
Controladores de rede Realtek RTL8127-CG 10GbE
NVIDIA ConnectX-7 200GbE
Wi-Fi e Bluetooth AzureWave AW-EM637
Wi-Fi 7 + Bluetooth 5.4
Desempenho
Computação de IA Até 1,000 TOPS (FP4)
Capacidade do modelo Até 200B parâmetros
Físico e Poder
Dimensões (H x W x D) 2.01″ (sem pés) / 2.1″ (com pés)
5.9 "x 5.9"
Peso A partir de 1.25 kg (2.76 libras)
Fonte de alimentação do laboratório Adaptador externo USB-C de 240 W, eficiência de 89%, PFC ativo.

Construir e projetar

O HP ZGX Nano G1n adota uma abordagem visivelmente diferente do design do DGX Spark em comparação com os outros sistemas que analisamos até agora (veja nosso [link para a análise]). Dell/ASUS/Acer/Gigabyte Em vez da construção mais comum, onde os componentes internos ficam acomodados sob uma tampa superior, a HP divide o chassi em metades superior e inferior, facilitando a compreensão do layout interno. O que inicialmente parece mais complexo revela-se bastante prático, com acesso direto a componentes como a bateria tipo moeda e o SSD após a remoção de apenas alguns parafusos. Essa estrutura interna mais bem pensada também se estende à construção externa, onde a HP dá maior ênfase à forma como o sistema é construído e aos materiais utilizados.

Dito isso, a HP o envolve em uma elegante caixa preta com dimensões de 150 mm² e utiliza amplamente materiais reciclados. Especificamente, a construção utiliza até 75% de alumínio reciclado, 20% de aço reciclado e quantidades significativas de plásticos reciclados pós-consumo. Até mesmo a embalagem reflete esse compromisso. Os materiais de papelão ondulado contêm até 93% de conteúdo reciclado e as embalagens plásticas incorporam pelo menos 30% de conteúdo reciclado.

Termicamente, o sistema depende de refrigeração por ar forçado. Esta é uma escolha de engenharia notável, dada a densidade do Superchip NVIDIA GB10 Grace Blackwell. Apesar de seu tamanho compacto, A HP especifica um envelope térmico completo.Sob carga máxima, o sistema dissipa até aproximadamente 780 BTU/h, dependendo da configuração. O consumo máximo de energia do sistema atinge cerca de 228 W. Além disso, a HP anuncia níveis de ruído relativamente baixos, classificados em 22 dBA em modo ocioso e 27.6 dBA sob cargas de trabalho intensivas.

HP ZGX Nano G1n inferior

Fisicamente, a unidade mede 5.9 x 5.9 x 2.01 cm sem os pés, o que a classifica firmemente como ultracompacta. A HP afirma explicitamente que a unidade não pode ser montada em rack, reforçando seu papel como um nó de IA para uso em mesa, em vez de uma infraestrutura tradicional de data center. A facilidade de manutenção é mínima por design. Os usuários precisam de uma chave de fenda Phillips nº 1 para acessar os componentes internos, e a maioria dos componentes, incluindo a memória, não pode ser substituída pelo usuário.

Seção de ventoinha interna do HP ZGX Nano G1n

Internamente, a ZGX Nano utiliza o design de placa de referência da NVIDIA, assim como muitos outros fabricantes de equipamentos originais (OEMs) que utilizam a plataforma DGX Spark. A memória LPDDR5x é soldada diretamente à placa e opera a até 8533 MHz. No geral, a plataforma prioriza eficiência e densidade em detrimento da modularidade.

Segurança e capacidade de atualização

A HP projetou o ZGX Nano G1n para oferecer segurança reforçada. Ele possui um módulo TPM 2.0 integrado que opera em modo certificado FIPS 140-2, atende às especificações do Trusted Computing Group e possui certificação Common Criteria EAL4+. As proteções em nível de BIOS incluem controles de inicialização segura, recursos de inicialização remota baseados em PXE e a capacidade de desativar completamente a inicialização a partir de mídias removíveis.

HP ZGX Nano G1n com a tampa inferior removida.

Do ponto de vista do hardware, a HP é explícita: este sistema não é atualizável. Os 128 GB de memória unificada LPDDR5x estão soldados diretamente à placa-mãe. Além disso, os compradores devem selecionar o armazenamento no momento da compra. Embora o único slot M.2 suporte PCIe Gen5 x4 eletricamente, as configurações de fábrica são enviadas com SSDs NVMe PCIe Gen4 x4. Estes estão disponíveis em capacidades de 2 TB ou 4 TB e são todos drives OPAL com criptografia automática.

A HP informa que as peças de reposição permanecerão disponíveis por até cinco anos após o término da produção. No entanto, trata-se fundamentalmente de um sistema do tipo appliance, e não de uma estação de trabalho modular.

Entrada/Saída e Expansão

A parte frontal do dispositivo é minimalista, apresentando apenas um botão liga/desliga e um LED indicador de status. Na parte traseira, o sistema oferece uma ampla gama de opções de conectividade de alto desempenho. A HP fornece energia por meio de um adaptador USB-C de 240 W padrão, recomendado pela NVIDIA, e alerta que adaptadores de terceiros podem causar degradação de desempenho ou instabilidade.

Portas traseiras e conectividade do HP ZGX Nano G1n

Três portas USB 3.2 Type-C oferecem conectividade USB, cada uma operando a 20 Gbps e compatível com o modo alternativo DisplayPort 1.4a. Uma porta HDMI 2.1a dedicada fornece saída de vídeo adicional. Para rede, o sistema inclui um controlador Realtek RTL8127-CG 10GbE e um controlador NVIDIA ConnectX-7, fornecendo duas portas QSFP112 de 200GbE, cada uma com taxa de transferência de 200 Gbps.

A pilha de rede suporta uma ampla gama de recursos corporativos. Estes incluem inicialização PXE, Wake-on-LAN, marcação VLAN (802.1Q), sincronização de tempo (802.1as/1588) e operação full-duplex em todas as velocidades suportadas. Além disso, um módulo Wi-Fi 7 (802.11be) 2x2 com Bluetooth 5.4 fornece conectividade sem fio e suporta MU-MIMO, segurança WPA3 e operação nas bandas de 2.4 GHz, 5 GHz e 6 GHz.

Gráficos e áudio

A GPU NVIDIA Blackwell integrada no Superchip GB10 lida com todas as tarefas gráficas. O sistema suporta saída de até 8K a 60Hz via USB-C DisplayPort 1.4a e 8K a 30Hz via HDMI 2.1a. A HP recomenda o uso de conexões diretas por cabo para saída 8K, pois adaptadores ou docks podem causar instabilidade ou degradar a qualidade do sinal.

O áudio é transmitido via HDMI, sem saídas de áudio analógicas dedicadas. Isso está de acordo com o posicionamento do sistema como um nó de computação, e não como uma estação de trabalho multimídia tradicional.

Testes térmicos

CPU Temperature

Durante os testes térmicos da CPU, o HP ZGX Nano G1n atingiu uma temperatura máxima de 77.3 °C durante os picos de intensidade da carga de trabalho. Isso coloca o HP abaixo dos sistemas mais quentes do grupo de comparação durante as transições de pico, já que outras unidades chegaram a atingir a faixa dos 90 °C. À medida que a carga de trabalho transitava para Equal ISL/OSL e, em seguida, para Decode Heavy, as temperaturas da CPU se estabilizaram em vez de continuarem a subir acentuadamente.

Em condições de uso leve, a CPU registrou uma temperatura mínima de 36.4 °C. Isso significa que o HP possui dissipação de calor eficaz quando o sistema não está sob forte carga computacional. No geral, o ZGX demonstrou comportamento térmico controlado da CPU em picos de temperatura, com desempenho estável sob carga sustentada.

 

Temperatura GPU

As temperaturas da GPU seguiram um padrão semelhante. Durante períodos de aceleração intensa, a GPU atingiu uma temperatura máxima de 69 °C. Isso posiciona a HP entre os sistemas com temperaturas mais baixas em comparação com outros modelos durante condições de pico de uso, com vários outros sistemas (como Dell, ASUS e Founders Edition) apresentando temperaturas consideravelmente mais altas em situações extremas. À medida que a atividade passou para as fases de ISL/OSL igual e decodificação pesada, as temperaturas da GPU se estabilizaram e permaneceram estáveis.

A GPU registrou uma temperatura mínima de 34°C durante as fases mais leves, indicando sólidas capacidades térmicas em modo ocioso.

Temperatura NVMe

Durante a fase Equal, a unidade NVMe atingiu aproximadamente 42 °C, apresentando apenas um aumento gradual em relação à sua temperatura basal. À medida que a carga de trabalho passou para Prefill Heavy, a temperatura de armazenamento aumentou consideravelmente, variando de 42 °C a 47 °C. Na fase Decode Heavy, a unidade operou em sua faixa de temperatura mais alta, de 47 °C a 54 °C, onde atingiu o pico, mas permaneceu notavelmente abaixo da maioria dos outros sistemas Spark.

Temperatura NIC

Durante a fase Equal, a temperatura da NIC variou de 39°C a 52°C, mostrando uma subida constante, indicando um acúmulo térmico moderado à medida que a atividade da rede aumenta no início da execução.

Na fase de Prefill Heavy, a temperatura da placa de rede aumentou, variando de 48 °C a 64 °C, pois essa fase exerce uma pressão muito mais constante sobre o subsistema de rede. Durante a fase de Decode Heavy, a temperatura da placa de rede atingiu seu pico, entre 52 °C e 68 °C. Mesmo assim, o comportamento térmico permaneceu estável ao longo de todo o teste.

Consumo de energia da GPU

Durante a fase de testes de igualdade, o consumo de energia da GPU variou de 2.86 W a pouco mais de 40 W, colocando o HP ZGX Nano G1n em uma posição intermediária.

Na fase de Prefill Heavy, o consumo de energia da GPU começou em aproximadamente 37W, caiu para um mínimo de 35W e atingiu um pico de até 69W, tornando esta a fase de maior consumo de energia do teste.

Durante a decodificação pesada, o consumo de energia da GPU estabilizou-se em uma faixa mais baixa e estável de 35 W a 46 W, indicando que a demanda de energia diminuiu à medida que a carga de trabalho deixou de apresentar um comportamento de pico mais agressivo.

Resumo térmico

Sob carga, o ZGX Nano G1n opera dentro de um envelope térmico rigorosamente controlado. O consumo máximo de energia do sistema é de aproximadamente 228 W e a dissipação de calor é de aproximadamente 780 BTU/h. Em contrapartida, o consumo de energia em modo ocioso permanece baixo, em torno de 36–38 W, o que indica um dimensionamento de energia eficiente quando o sistema não está em uso. A solução de resfriamento por ar forçado mantém a operação estável dentro da faixa especificada pela HP, de 5 °C a 30 °C.

Testes de desempenho de IA do HP ZGX Nano

Para avaliar o HP ZGX Nano com GB10, testamos unidades Spark usando o benchmark vLLM Online Serving, o mecanismo de inferência e serviço de alto desempenho mais amplamente adotado para grandes modelos de linguagem. O benchmark vLLM Online Serving simula cargas de trabalho de produção reais, enviando solicitações simultâneas para um servidor vLLM em execução e medindo métricas importantes, incluindo a taxa de transferência total de tokens (tokens por segundo), o tempo até o primeiro token e o tempo por token de saída, em diferentes condições de carga.

Nossos testes abrangeram uma variedade de modelos, incluindo arquiteturas densas e tipos de dados de microescala, e avaliaram o desempenho em três cenários de carga de trabalho: ISL/OSL igual, Preenchimento pesado e Decodificação pesada. Esses cenários representam padrões de serviço distintos do mundo real, desde cargas de entrada e saída balanceadas até processamento de prompts com uso intensivo de computação e geração de tokens limitada pela largura de banda da memória.

Além do HP ZGX Nano com GB10, também avaliamos outros sistemas de fabricantes originais (OEMs) Dell, ASUSAcerGigabyteIsso nos permitiu situar os resultados da HP dentro do cenário competitivo mais amplo e entender onde ela lidera, acompanha o ritmo da concorrência ou fica para trás em diferentes modelos e cargas de trabalho.

GPT-OSS-120B

Com o GPT-OSS-120B, a impressora HP ZGX Nano G1n apresenta seus melhores resultados no Prefill Heavy, onde a taxa de transferência sobe de 304.5 tok/s no lote 1 para 2773.3 tok/s no lote 64. O Equal ISL/OSL também escala de forma constante, aumentando de 69.6 tok/s para 722.9 tok/s ao longo do teste. O Decode Heavy é muito mais leve em comparação, começando em 183.7 tok/s no lote 1, caindo ligeiramente no lote 2 e se recuperando para 262.9 tok/s no lote 64.

 

GPT-OSS-20B

Com o GPT-OSS-20B, os números mais altos da HP vêm do Prefill Heavy, mas o escalonamento é menos linear do que com os outros modelos. O Prefill começa em 1626.6 tok/s no lote 1, sobe para 1980.3 tok/s no lote 2, cai drasticamente para 1120.3 tok/s no lote 4 e, em seguida, se recupera para 4345.1 tok/s no lote 64. O Equal ISL/OSL escala de forma mais suave de 92.6 tok/s para 1550.6 tok/s, e o Decode Heavy sobe de 94.4 tok/s para 670.4 tok/s.

Qwen3 Coder 30B A3B FP8

Para o codificador Qwen3 30B A3B (FP8), a HP novamente se destaca no Prefill Heavy, com o rendimento aumentando de 432.2 tok/s no tamanho de lote 1 para 2069.4 tok/s no tamanho de lote 64. O Equal ISL/OSL sobe de 104.2 tok/s para 1274.4 tok/s, enquanto o Decode Heavy melhora de 55.9 tok/s para 480.4 tok/s. Este está entre os melhores resultados gerais da HP.

Base Qwen3 Coder 30B A3B

Na impressora Qwen3 Coder 30B A3B (Base), a HP apresenta um crescimento constante em todas as três fases, embora o pico permaneça na fase de Prefill Heavy. Essa fase aumenta de 258.6 tok/s no lote 1 para 1629.4 tok/s no lote 64. O Equal ISL/OSL escala de 60.3 tok/s para 690.3 tok/s, enquanto o Decode Heavy sobe de 33.0 tok/s para 331.8 tok/s.

Lhama 3.1 8B Instruções FP4

Com o Llama-3.1-8B-Instruct (FP4), a HP demonstra um claro aumento na produtividade. A taxa de transferência de ISL/OSL igual aumenta de 76.4 tok/s no lote 1 para 2774.1 tok/s no lote 64, tornando-se a mais eficiente das três fases da HP neste modelo. A fase de pré-carregamento pesado também apresenta um crescimento expressivo, subindo de 316.8 tok/s para 2397.1 tok/s no lote 32 antes de cair para 2270.4 tok/s no lote 64. A fase de decodificação pesada aumenta de 40.7 tok/s para 547.6 tok/s ao longo do processo.

Lhama 3.1 8B Instrução (Base)

No Llama-3.1-8B-Instruct (Base), o HP ZGX Nano G1n apresenta um desempenho consistente em todas as três fases. No modo Equal ISL/OSL, a taxa de transferência aumenta de 28.2 tok/s no lote 1 para 1298.6 tok/s no lote 64. No modo Prefill Heavy, a taxa de transferência aumenta de 123.2 tok/s para 1759.5 tok/s, com ganhos significativos ao longo de toda a varredura, antes de diminuir ligeiramente no limite superior. O modo Decode Heavy apresenta um desempenho muito mais leve em comparação, aumentando de 15.5 tok/s no lote 1 para 366.4 tok/s no lote 64.

Armazenamento direto da GPU

Como funciona o armazenamento direto da GPU

Tradicionalmente, quando uma GPU processa dados de uma unidade NVMe, os dados precisam primeiro passar pela CPU e pela memória do sistema antes de chegar à GPU. Esse processo cria gargalos porque a CPU atua como intermediária, adicionando latência e consumindo recursos do sistema. O GPU Direct Storage elimina essa ineficiência, permitindo que a GPU acesse os dados diretamente do dispositivo de armazenamento através do barramento PCIe. Esse caminho direto reduz a sobrecarga de movimentação de dados, possibilitando transferências mais rápidas e eficientes.

As cargas de trabalho de IA, especialmente aquelas que envolvem aprendizado profundo, são extremamente intensivas em dados. O treinamento de grandes redes neurais requer o processamento de terabytes de dados, e qualquer atraso na transferência de dados leva à subutilização das GPUs e a tempos de treinamento mais longos. Consequentemente, o GPU Direct Storage resolve esse desafio entregando dados à GPU o mais rápido possível, minimizando o tempo ocioso e maximizando a eficiência computacional.

Além disso, o GDS beneficia cargas de trabalho que transmitem grandes conjuntos de dados, como processamento de vídeo, processamento de linguagem natural e inferência em tempo real. Ao reduzir a dependência da CPU, o GDS acelera a movimentação de dados e libera recursos da CPU para outras tarefas, aprimorando ainda mais o desempenho geral do sistema.

Taxa de transferência de leitura GDSIO: 16K

Analisando a taxa de transferência de leitura GDSIO 16K, o HP ZGX Nano G1n começa em 0.70 GiB/s com 1 thread, posicionando-o entre os melhores desempenhos com poucos threads do grupo. A taxa cai para 0.41 GiB/s com 2 threads, subindo novamente para 0.86 GiB/s com 4 threads, apresentando a mesma pequena inconsistência inicial observada em alguns desses sistemas. A partir daí, a escalabilidade se torna muito mais consistente. A taxa de transferência sobe para 1.6 GiB/s com 8 threads e 2.2 GiB/s com 16 threads, continuando a subir para 3.0 GiB/s com 32 threads. Em profundidades de fila maiores, o HP continua a ganhar terreno, atingindo 3.9 GiB/s com 64 threads e um pico de 4.6 GiB/s com 128 threads.

Latência média de leitura GDSIO: 16K

Analisando a latência média de leitura GDSIO (16K), o HP ZGX Nano G1n inicia em aproximadamente 0.02 ms com 1 thread e permanece baixa com 2 threads (0.08 ms) e 4 threads (0.07 ms). A latência aumenta ligeiramente com 8 threads (0.08 ms) e 16 threads (0.11 ms), e então aumenta de forma mais perceptível com 32 threads (0.16 ms) e 64 threads (0.25 ms). Com 128 threads, a latência atinge 0.42 ms, ainda um pouco abaixo dos melhores resultados do grupo, enquanto acompanha a escalabilidade constante da taxa de transferência do sistema ao longo do teste.

Taxa de transferência de gravação GDSIO: 16K

Analisando a taxa de transferência de escrita GDSIO de 16K, o HP ZGX Nano G1n inicia em 0.84 GiB/s com 1 thread, sobe para 1.4 GiB/s com 2 threads e atinge 2.2 GiB/s com 4 threads. O desempenho continua a escalar fortemente com 8 threads (3.0 GiB/s) e atinge 3.3 GiB/s com 16 threads, onde se estabiliza. A partir daí, a taxa de transferência permanece quase constante em 3.3 GiB/s com 32 e 64 threads, depois diminui ligeiramente para 3.2 GiB/s com 128 threads, indicando que a plataforma atinge seu limite de escrita relativamente cedo e mantém esse nível consistentemente durante o restante do teste.

Latência média de escrita GDSIO: 16K

Analisando a latência média de escrita GDSIO (16K), o HP ZGX Nano G1n inicia em aproximadamente 0.02 ms com 1 thread e permanece muito baixa com 2 threads (0.02 ms) e 4 threads (0.03 ms). A latência aumenta ligeiramente com 8 threads (0.04 ms) e 16 threads (0.07 ms), e então apresenta um salto com 32 threads (0.15 ms) e 64 threads (0.30 ms). Com 128 threads, a latência atinge 0.61 ms, ainda bastante controlada no geral, embora a tendência de alta coincida com o ponto em que a taxa de transferência de escrita já se estabilizou em contagens de threads mais altas.

Taxa de transferência de leitura GDSIO: 1M

Analisando a taxa de transferência de leitura GDSIO de 1M, o HP ZGX Nano G1n inicia em 3.2 GiB/s com 1 thread e sobe para 4.1 GiB/s com 2 threads. O desempenho continua a aumentar com 4 threads (5.2 GiB/s) e 8 threads (5.5 GiB/s), após o que a plataforma efetivamente atinge seu limite máximo. A taxa de transferência então se mantém essencialmente estável em 5.5 GiB/s para 16, 32 e 64 threads, antes de diminuir ligeiramente para 5.3 GiB/s com 128 threads, indicando uma forte rampa inicial seguida por um platô muito estável com um alto número de threads.

Latência média de leitura GDSIO: 1M

Analisando a latência média de leitura GDSIO (1M), o HP ZGX Nano G1n inicia em aproximadamente 0.31 ms com 1 thread e permanece relativamente baixa com 2 threads (0.47 ms) e 4 threads (0.76 ms). A latência aumenta com a concorrência, subindo para 1.4 ms com 8 threads, 2.9 ms com 16 threads e 5.9 ms com 32 threads. A tendência continua com 64 threads (12.8 ms) e atinge 27.2 ms com 128 threads, acompanhando as maiores profundidades de fila, mesmo que a taxa de transferência já tenha se estabilizado bem antes no teste.

Taxa de transferência de gravação GDSIO: 1M

Analisando a taxa de transferência de escrita GDSIO de 1M, o HP ZGX Nano G1n inicia em 3.1 GiB/s com 1 thread e sobe para 3.5 GiB/s com 2 threads, mantendo-se nesse nível com 4, 8 e 16 threads. O desempenho cai ligeiramente para 3.3 GiB/s com 32 threads antes de retornar a 3.5 GiB/s com 64 threads. Com 128 threads, a taxa de transferência aumenta para 3.7 GiB/s, indicando um perfil de escrita praticamente estável ao longo do teste, com apenas pequenas variações e um leve aumento no número máximo de threads.

Latência média de escrita GDSIO: 1M

Analisando a latência média de escrita GDSIO (1M), o HP ZGX Nano G1n inicia em aproximadamente 0.31 ms com 1 thread, subindo para 0.57 ms com 2 threads e 1.1 ms com 4 threads. A latência continua a aumentar conforme a concorrência aumenta, atingindo 2.2 ms com 8 threads, 4.4 ms com 16 threads e 9.4 ms com 32 threads. A tendência de alta continua com 64 threads (17.7 ms) e atinge 37.3 ms com 128 threads, refletindo uma pressão crescente na fila, embora a taxa de transferência de escrita em si permaneça relativamente estável durante a maior parte do teste.

Conclusão

O HP ZGX Nano G1n apresenta o perfil de desempenho esperado da plataforma DGX Spark e adiciona escolhas de engenharia que o diferenciam dos outros sistemas Spark disponíveis no mercado. Em nossos testes, as temperaturas da CPU atingiram um pico de 77.3 °C e as da GPU, 69 °C, ambas entre as mais baixas das unidades Spark que avaliamos. O desempenho do vLLM foi mais forte em cargas de trabalho com preenchimento pesado em todos os seis modelos testados, com escalabilidade que se manteve estável mesmo com tamanhos de lote maiores. A taxa de transferência de leitura do GPU Direct Storage atingiu 4.6 GiB/s com blocos de 16 KB e 5.5 GiB/s com blocos de 1 MB, e a taxa de transferência de gravação estabilizou no início, mas se manteve consistentemente nesse nível com o número total de threads.

HP ZGX Nano G1n empilhado

O que diferencia o ZGX Nano G1n dos demais dispositivos Spark é o trabalho que a HP realizou em torno do projeto de referência. O conteúdo de materiais reciclados, a divisão entre os chassis superior e inferior que facilita a manutenção interna e o isolamento acústico que se mantém em 27.6 dBA sob carga refletem escolhas de engenharia deliberadas que vão além dos requisitos da própria plataforma GB10. A pilha de segurança segue o mesmo padrão. O TPM 2.0 no modo FIPS 140-2, o Common Criteria EAL4+ e o armazenamento SED OPAL elevam esta unidade além de um dispositivo para desenvolvedores, aproximando-a de um sistema capaz de obter aprovação em ambientes regulamentados.

Assim como outros modelos Spark, este não é um workstation de uso geral, e a HP não o posiciona como tal. Para desenvolvedores, pequenas equipes e organizações que precisam de computação local de IA com histórico comprovado de sustentabilidade e segurança, o ZGX Nano G1n é uma opção claramente diferenciada dentro da linha Spark. Para empresas onde esses critérios não se aplicam, a plataforma subjacente é a mesma em todos os cinco sistemas de fabricantes que analisamos, e a decisão se resume a ecossistema, suporte e preço.

Página do produto – HP ZGX Nano G1n AI

Envolva-se com a StorageReview

Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed

Conor Houser