存储评论网

HP ZGX Nano G1n AI工作站评测:一款安全、可持续的桌面AI节点

电子消费品  ◇  打标工作站

目前我们对DGX Spark平台已经相当熟悉。我们已经评测过…… 戴尔, 华硕, 宏碁技嘉 接受 NVIDIA 的 GB10 Grace Blackwell 参考设计它们的核心配置都相同:1,000 TOPS 的 FP4 计算能力、128GB 的​​统一 LPDDR5x 内存以及双 200GbE 网络,所有组件都集成在一个 150 毫米的机箱内。惠普 ZGX Nano G1n AI Station 在此基础上进行了升级,但惠普围绕其打造的独特设计使其在 Spark 系列产品中脱颖而出。

HP ZGX Nano G1n 前边框

最显著的区别在于材质和结构。惠普 ZGX Nano 的机箱采用高达 75% 的再生铝和 20% 的再生钢制成,包装材料的再生含量高达 93%。内部布局将机箱分为上下两部分,相比我们测试过的几款 Spark 机型,更换 SSD 和纽扣电池等组件更加便捷。在散热方面,惠普官方数据显示该系统待机噪音为 22 分贝,高负载运行时噪音为 27.6 分贝,对于一款峰值散热量约为 780 BTU/小时的系统来说,这样的静音效果相当出色。

在安全性方面,惠普超越了参考平台。ZGX Nano 配备 TPM 2.0,运行于 FIPS 140-2 认证模式,符合通用准则 EAL4+ 标准,并包含 BIOS 级安全启动和 PXE 控制功能。存储方面,出厂预装了一块自加密的 OPAL NVMe 固态硬盘。综上所述,惠普将这款产品定位为一款不仅适用于开发人员桌面 AI 节点,而且适用于供应链认证、静态数据加密和防篡改等采购要求严格的监管环境的系统。

规格 HP ZGX Nano G1n AI Station
概述
产品名称 HP ZGX Nano G1n AI Station
外形 迷你
运行系统 NVIDIA DGX 操作系统 7/Ubuntu 24.04
注意:本产品不支持微软Windows系统。
硬件
处理器 NVIDIA GB10 Grace Blackwell 超级芯片
Blackwell 架构 GPU
20核Arm CPU(10个Cortex-X925 + 10个Cortex-A725)
Blackwell CUDA 核心
第五代 Tensor Core
第四代 RT 核心
1 个 NVENC
1x NVIDIA
内存 128GB LPDDR5x,统一内存,16通道,板载
内存带宽 273 GB /秒
存储(内部 I/O) 1 个 M.2 PCIe Gen5 x4 接口
可选配置:2TB 或 4TB PCIe Gen4 x4 NVMe(2242 接口,SED OPAL TLC 闪存)
网络与I/O
后部 I/O 端口 1 个 USB-C 电源接口(240W)
3 个 USB-C 20Gbps 接口(支持 DisplayPort 1.4a,总功率 30W)
1个HDMI 2.1a
1 个 10GbE RJ-45 接口
2 个 QSFP 200GbE (ConnectX-7)
网络控制器 Realtek RTL8127-CG 10GbE
NVIDIA ConnectX-7 200GbE
无线网络和蓝牙 AzureWave AW-EM637
Wi-Fi 7 + 蓝牙 5.4
性能
人工智能计算 最高可达 1,000 TOPS(FP4)
型号容量 最多 200B 个参数
体能与力量
外形尺寸(高x宽x深) 2.01英寸(无脚垫)/ 2.1英寸(带脚垫)
5.9“x 5.9”
重量 起重1.25公斤(2.76磅)
电源 240W USB-C 外置适配器,效率 89%,主动式 PFC

建筑与设计

与我们目前评测过的其他系统相比,HP ZGX Nano G1n 采用了与 DGX Spark 截然不同的设计方法(参见我们的评测)。 戴尔/华硕/宏碁/技嘉 (评论)。与常见的将内部组件隐藏在顶盖内的设计不同,惠普将机身分为上下两部分,使内部布局在打开后更容易理解。乍看之下似乎更复杂,但实际上却相当实用,只需拧下几颗螺丝即可轻松接触到纽扣电池和固态硬盘等部件。这种更周全的内部结构也体现在外部设计上,惠普更加注重系统的构造和用料。

尽管如此,惠普还是为其配备了一个时尚的黑色外壳,尺寸仅为 150 毫米见方,并且大量使用回收材料。具体来说,这款产品使用了高达 75% 的再生铝、20% 的再生钢以及大量的消费后再生塑料。就连包装也体现了这一理念。瓦楞纸板的再生材料含量高达 93%,塑料包装的再生材料含量也至少达到 30%。

在散热方面,该系统采用强制风冷。考虑到NVIDIA GB10 Grace Blackwell超级芯片的高密度,这是一个值得注意的工程选择。尽管其体积小巧, 惠普指定了完整的热封装在满负荷运行时,该系统每小时最多可散发约 780 BTU 的热量,具体数值取决于配置。系统峰值功耗约为 228 瓦。此外,惠普宣称该系统噪音水平相对较低,空闲时为 22 分贝,高负载运行时为 27.6 分贝。

HP ZGX Nano G1n 底部

这款设备尺寸为 5.9 x 5.9 x 2.01 英寸(不含底座),属于超紧凑型产品。惠普明确指出该设备不可机架安装,这进一步强化了其作为桌面级 AI 节点而非传统数据中心基础设施的定位。其可维护性也经过精心设计,用户需要一把 1 号十字螺丝刀才能访问内部组件,而且大多数组件(包括内存)都不可由用户自行更换。

HP ZGX Nano G1n 内部风扇部分

ZGX Nano 内部采用了 NVIDIA 的参考电路板设计,许多其他基于 DGX Spark 平台的 OEM 厂商也采用了这种设计。LPDDR5x 内存直接焊接在主板上,运行频率最高可达 8533 MHz。总体而言,该平台优先考虑效率和密度,而非模块化设计。

安全性和可升级性

HP ZGX Nano G1n 的设计本身就非常安全。它集成了一个 TPM 2.0 模块,该模块以 FIPS 140-2 认证模式运行,符合可信计算组织 (TCG) 规范,并通过了通用准则 EAL4+ 认证。BIOS 级别的保护措施包括安全启动控制、基于 PXE 的远程启动功能,以及完全禁用从可移动介质启动的功能。

HP ZGX Nano G1n,底盖已拆卸

从硬件角度来看,惠普明确表示:该系统不可升级。128GB LPDDR5x 统一内存直接焊接在主板上。此外,买家必须在购买时选择存储设备。虽然单个 M.2 插槽在电气上支持 PCIe Gen5 x4,但出厂配置配备的是 PCIe Gen4 x4 NVMe SSD。这些 SSD 容量可选 2TB 或 4TB,并且均为自加密 OPAL 硬盘。

惠普指出,即使停产后,备件仍可供应长达五年。然而,这本质上是一个一体式系统,而非模块化工作站。

输入/输出和扩展

该机正面设计极简,仅配备电源按钮和状态指示灯。背面则提供丰富的接口,支持高性能连接。惠普建议使用NVIDIA推荐的240W USB-C标准电源适配器供电,并提醒用户使用第三方适配器可能会导致性能下降或系统不稳定。

HP ZGX Nano G1n 后置端口和连接性

三个 USB 3.2 Type-C 端口提供 USB 连接,每个端口的传输速度均为 20 Gbps,并支持 DisplayPort 1.4a Alt Mode。一个专用的 HDMI 2.1a 端口提供额外的显示输出。网络方面,该系统配备了 Realtek RTL8127-CG 10GbE 控制器和 NVIDIA ConnectX-7 控制器,提供两个 200GbE QSFP112 端口,每个端口的吞吐量均为 200 Gbps。

该网络协议栈支持多种企业级功能,包括 PXE 启动、网络唤醒 (Wake-on-LAN)、VLAN 标记 (802.1Q)、时间同步 (802.1as/1588) 以及所有支持速率下的全双工操作。此外,配备蓝牙 5.4 的 Wi-Fi 7 (802.11be) 2×2 模块提供无线连接,支持 MU-MIMO、WPA3 安全协议,并可在 2.4GHz、5GHz 和 6GHz 频段上运行。

图形和音频

GB10 Superchip 集成的 NVIDIA Blackwell GPU 负责处理所有图形任务。该系统支持通过 USB-C DisplayPort 1.4a 输出 8K 60Hz 分辨率,以及通过 HDMI 2.1a 输出 8K 30Hz 分辨率。惠普建议使用线缆直接连接进行 8K 输出,因为适配器或扩展坞可能会导致信号不稳定或降低信号质量。

音频通过HDMI传输,没有专用的模拟音频输出。这与该系统作为计算节点而非传统多媒体工作站的定位相符。

热测试

CPU温度

在CPU散热测试中,HP ZGX Nano G1n在负载高峰期最高温度达到77.3°C。与其他对比机型相比,HP ZGX Nano G1n在峰值负载转换时的温度低于其他机型,其他机型的温度均攀升至90°C以上。当负载切换到均衡ISL/OSL负载以及解码密集型负载时,CPU温度趋于稳定,并未继续急剧上升。

在低负载情况下,CPU最低温度为36.4°C。这意味着当系统不处于高计算压力下时,HP处理器具有有效的散热性能。总体而言,ZGX展现了可控的CPU瞬时温度控制和稳定的持续负载性能。

 

GPU温度

GPU 温度变化趋势类似。在高负载加速期间,GPU 最高温度达到 69°C。这使得 HP 在峰值负载下的温度在同类产品中处于较低水平,其他一些系统(例如戴尔、华硕和 Founders Edition)在高负载运行时温度明显更高。随着负载转移到均衡 ISL/OSL 和解码密集型阶段,GPU 温度趋于稳定。

在光照较弱的阶段,GPU 记录到的最低温度为 34°C,表明其具有良好的待机散热能力。

NVMe温度

在均衡测试阶段,NVMe 固态硬盘的温度约为 42°C,仅比其静息基线温度缓慢上升。随着工作负载切换到预填充重负载,存储温度明显升高,范围从 42°C 到 47°C。在解码重负载阶段,固态硬盘的温度达到峰值,在 47°C 到 54°C 之间,但仍明显低于大多数其他 Spark 系统。

NIC 温度

在均衡阶段,NIC 温度范围为 39°C 至 52°C,呈现稳定上升趋势,表明随着网络活动在运行初期加速,温度适度升高。

在预填充重负载测试阶段,网卡温度升高,范围从 48°C 到 64°C,因为该阶段对网络子系统施加了更大的持续压力。在解码重负载测试阶段,网卡温度达到峰值,范围为 52°C 到 68°C。尽管如此,整个测试过程中网卡的温度表现依然稳定。

GPU功耗

在均衡阶段,GPU 功耗范围为 2.86W 至 40W 以上,HP ZGX Nano G1n 处于中等水平。

在 Prefill Heavy 模式下,GPU 功耗从大约 37W 开始,降至最低 35W,并飙升至最高 69W,使其成为运行过程中功耗最高的阶段。

在解码重载期间,GPU 功耗稳定在 35W 至 46W 的较低、更稳定的范围内,这表明随着工作负载从更激进的突发行为转向其他行为,功耗需求有所降低。

热力总结

在负载运行时,ZGX Nano G1n 的温度控制非常出色。系统最大功耗约为 228W,散热量约为 780 BTU/小时。相比之下,待机功耗仅为 36–38W 左右,表明系统在非活动状态下具有高效的功率控制。强制风冷散热方案确保系统温度稳定在惠普规定的 5°C 至 30°C 范围内。

HP ZGX Nano AI 性能测试

为了评估搭载 GB10 的 HP ZGX Nano,我们使用 vLLM Online Serving 基准测试对 Spark 单元进行了测试。vLLM Online Serving 基准测试是目前应用最广泛的大型语言模型高吞吐量推理和服务引擎。该基准测试通过向运行中的 vLLM 服务器发送并发请求来模拟真实生产环境中的工作负载,并测量关键指标,包括总令牌吞吐量(每秒令牌数)、首令牌到达时间和每个输出令牌的生成时间,同时考察不同负载条件下的性能。

我们的测试涵盖了多种模型,包括密集架构和微扩展数据类型,并评估了三种工作负载场景下的性能:均衡 ISL/OSL、预填充密集型和解码密集型。这些场景代表了不同的实际服务模式,从均衡的输入输出负载到计算密集型的提示符处理和内存带宽受限的令牌生成。

除了搭载 GB10 的 HP ZGX Nano 之外,我们还对其他 OEM 系统进行了基准测试。 戴尔, 华硕宏碁和 技嘉这使我们能够将惠普的测试结果置于更广泛的竞争格局中,并了解它在不同的型号和工作负载中处于领先地位、与竞争对手并驾齐驱还是落后。

GPT-OSS-120B

使用 GPT-OSS-120B 时,HP ZGX Nano G1n 在预填充重任务中表现最为出色,吞吐量从第 1 批次的 304.5 tok/s 提升至第 64 批次的 2773.3 tok/s。等效 ISL/OSL 的吞吐量也稳步提升,从 69.6 tok/s 增至 722.9 tok/s。相比之下,解码重任务的性能则要弱得多,第 1 批次的吞吐量为 183.7 tok/s,第 2 批次略有下降,随后在第 64 批次回升至 262.9 tok/s。

 

GPT-OSS-20B

使用 GPT-OSS-20B 时,HP 的最高码率来自 Prefill Heavy,但其性能提升并非线性,与其他模型相比,曲线并不平缓。Prefill 的性能在第一批次时达到 1626.6 tok/s,在第二批次时攀升至 1980.3 tok/s,随后在第四批次时急剧下降至 1120.3 tok/s,最后在第 64 批次时回升至 4345.1 tok/s。Equal ISL/OSL 的性能提升则更为平滑,从 92.6 tok/s 提升至 1550.6 tok/s,而 Decode Heavy 的性能提升则从 94.4 tok/s 提升至 670.4 tok/s。

Qwen3 编码器 30B A3B FP8

对于 Qwen3 Coder 30B A3B (FP8) 测试,HP 在预填充重任务中再次表现出色,吞吐量从批处理大小为 1 时的 432.2 tok/s 提升至批处理大小为 64 时的 2069.4 tok/s。等 ISL/OSL 测试的吞吐量也从 104.2 tok/s 提升至 1274.4 tok/s,而解码重任务的吞吐量则从 55.9 tok/s 提升至 480.4 tok/s。这是 HP 整体表现较为出色的成绩之一。

Qwen3 Coder 30B A3B Base

在 Qwen3 Coder 30B A3B(基础版)上,HP 在所有三个阶段均实现了稳定增长,但最高增速仍集中在预填充重载阶段。该阶段的吞吐量从第一批次的 258.6 tok/s 提升至第 64 批次的 1629.4 tok/s。等 ISL/OSL 阶段的吞吐量从 60.3 tok/s 提升至 690.3 tok/s,而解码重载阶段的吞吐量则从 33.0 tok/s 提升至 331.8 tok/s。

Llama 3.1 8B 指令 FP4

使用 Llama-3.1-8B-Instruct (FP4) 时,HP 的吞吐量明显提升。等 ISL/OSL 的吞吐量从批次 1 的 76.4 tok/s 提升至批次 64 的 2774.1 tok/s,使其成为 HP 在此模型三个阶段中性能最强的阶段。预填充重型阶段的吞吐量也大幅提升,从批次 32 的 316.8 tok/s 提升至 2397.1 tok/s,随后回落至批次 64 的 2270.4 tok/s。解码重型阶段的吞吐量在整个扫描过程中从 40.7 tok/s 提升至 547.6 tok/s。

Llama 3.1 8B 指令(基础版)

在 Llama-3.1-8B-Instruct (Base) 测试中,HP ZGX Nano G1n 在所有三个阶段均表现出良好的性能提升。在 Equal ISL/OSL 模式下,吞吐量从批次 1 的 28.2 tok/s 提升至批次 64 的 1298.6 tok/s。在 Prefill Heavy 模式下,HP 的吞吐量从 123.2 tok/s 提升至 1759.5 tok/s,在整个测试过程中性能提升显著,仅在峰值附近略有下降。相比之下,Decode Heavy 模式的性能提升则要小得多,吞吐量从批次 1 的 15.5 tok/s 提升至批次 64 的 366.4 tok/s。

GPU 直接存储

GPU 直接存储的工作原理

传统上,当GPU处理来自NVMe固态硬盘的数据时,数据必须先经过CPU和系统内存才能到达GPU。由于CPU充当中间人,这个过程会造成性能瓶颈,增加延迟并消耗系统资源。GPU直接存储(GPU Direct Storage)通过允许GPU直接通过PCIe总线访问存储设备中的数据,消除了这种低效。这种直接路径减少了数据传输开销,从而实现了更快、更高效的传输。

人工智能工作负载,尤其是涉及深度学习的工作负载,都是数据密集型的。训练大型神经网络需要处理TB级的数据,任何数据传输延迟都会导致GPU利用率不足,从而延长训练时间。因此,GPU直接存储通过尽可能快地将数据传输到GPU来应对这一挑战,最大限度地减少空闲时间,并最大限度地提高计算效率。

此外,GDS 还有利于处理大型数据集的工作负载,例如视频处理、自然语言处理和实时推理。通过降低对 CPU 的依赖,GDS 可以加快数据传输速度,并将 CPU 资源释放出来用于其他任务,从而进一步提升系统整体性能。

GDSIO 读取吞吐量 16K

从 GDSIO 读取吞吐量 16K 测试来看,HP ZGX Nano G1n 在单线程下初始速度为 0.70GiB/s,在同组产品中低线程性能表现优异。双线程时速度降至 0.41GiB/s,四线程时回升至 0.86GiB/s,与部分同类产品一样,存在早期线程性能不稳定的情况。此后,性能扩展性显著提升。八线程时吞吐量达到 1.6GiB/s,十六线程时达到 2.2GiB/s,三十二线程时继续攀升至 3.0GiB/s。在更高的线程数下,HP 的性能持续提升,六十四线程时达到 3.9GiB/s,十二八线程时达到峰值 4.6GiB/s。

GDSIO 读取平均延迟 16K

从 GDSIO 读取平均延迟 (16K) 来看,HP ZGX Nano G1n 在单线程时延迟约为 0.02 毫秒,在双线程 (0.08 毫秒) 和四线程 (0.07 毫秒) 时也保持较低水平。延迟在八线程 (0.08 毫秒) 和十六线程 (0.11 毫秒) 时略有上升,然后在三十二线程 (0.16 毫秒) 和六十四线程 (0.25 毫秒) 时明显增加。在 128 线程时,延迟达到 0.42 毫秒,虽然略低于同组最高值,但系统在整个测试过程中吞吐量保持稳定增长。

GDSIO 写入吞吐量 16K

从 GDSIO 16K 写入吞吐量测试来看,HP ZGX Nano G1n 在单线程下初始速度为 0.84GiB/s,双线程下提升至 1.4GiB/s,四线程下达到 2.2GiB/s。性能在八线程下继续保持强劲增长(3.0GiB/s),并在十六线程下达到 3.3GiB/s,之后基本趋于稳定。在 32 线程和 64 线程下,吞吐量基本保持在 3.3GiB/s 左右,然后在 128 线程下略微下降至 3.2GiB/s,这表明该平台较早达到写入性能的上限,并在后续测试中保持稳定。

GDSIO 写入平均延迟 16K

从 GDSIO 写入平均延迟 (16K) 来看,HP ZGX Nano G1n 在单线程时延迟约为 0.02 毫秒,在双线程 (0.02 毫秒) 和四线程 (0.03 毫秒) 时仍保持极低的延迟。延迟在八线程 (0.04 毫秒) 和十六线程 (0.07 毫秒) 时略有上升,然后在三十二线程 (0.15 毫秒) 和六十四线程 (0.30 毫秒) 时显著增加。在 128 线程时,延迟达到 0.61 毫秒,总体而言仍然控制得相当好,但其上升趋势与写入吞吐量在高线程数下趋于平缓的点相吻合。

GDSIO 读取吞吐量 1M

从 GDSIO 读取吞吐量(1M)来看,HP ZGX Nano G1n 在单线程时为 3.2GiB/s,双线程时提升至 4.1GiB/s。性能在四线程(5.2GiB/s)和八线程(5.5GiB/s)时继续攀升,之后平台性能基本达到极限。在 16、32 和 64 线程时,吞吐量基本保持在 5.5GiB/s 左右,然后在 128 线程时略微下降至 5.3GiB/s,这表明性能在早期阶段增长强劲,随后在高线程数下保持稳定。

GDSIO 读取平均延迟 1M

从 GDSIO 读取平均延迟(1M)来看,HP ZGX Nano G1n 在单线程时延迟约为 0.31 毫秒,在双线程(0.47 毫秒)和四线程(0.76 毫秒)时也保持相对较低。延迟随着并发数的增加而增加,在 8 线程时上升至 1.4 毫秒,16 线程时上升至 2.9 毫秒,32 线程时上升至 5.9 毫秒。这一趋势在 64 线程时继续(12.8 毫秒),并在 128 线程时达到 27.2 毫秒,即使吞吐量在测试早期就已经趋于平稳,延迟仍然随着队列深度的增加而增加。

GDSIO 写入吞吐量 1M

从 GDSIO 写入吞吐量 1M 测试结果来看,HP ZGX Nano G1n 在 1 线程时为 3.1GiB/s,2 线程时提升至 3.5GiB/s,并在 4、8 和 16 线程时保持在该水平。在 32 线程时性能略微下降至 3.3GiB/s,随后在 64 线程时回升至 3.5GiB/s。在 128 线程时,吞吐量提升至 3.7GiB/s,表明在整个测试范围内写入性能基本保持平稳,仅在最高线程数下略有波动。

GDSIO 写入平均延迟 1M

从 GDSIO 写入平均延迟(1M)来看,HP ZGX Nano G1n 在单线程时约为 0.31 毫秒,双线程时上升至 0.57 毫秒,四线程时上升至 1.1 毫秒。随着并发数的增加,延迟持续攀升,八线程时达到 2.2 毫秒,十六线程时达到 4.4 毫秒,三十二线程时达到 9.4 毫秒。在六十四线程时,延迟继续上升(17.7 毫秒),并在十二八个线程时达到 37.3 毫秒,这反映出队列压力持续增加,尽管在大部分测试期间写入吞吐量基本保持稳定。

结语

HP ZGX Nano G1n 延续了 DGX Spark 平台的预期性能,并在此基础上进行了多项工程优化,使其在众多 Spark 系统中脱颖而出。在我们的测试中,CPU 最高温度为 77.3°C,GPU 最高温度为 69°C,在我们测试过的所有 Spark 设备中,这两个温度都属于较低水平。在我们测试的六款机型中,vLLM 在预填充密集型工作负载下的性能表现最为出色,并且在大批量处理的情况下,性能依然保持稳定。GPU Direct Storage 的读取吞吐量在 16K 块大小下达到 4.6 GiB/s,在 1M 块大小下达到 5.5 GiB/s,写入吞吐量在早期就趋于稳定,但在剩余的线程数下,写入吞吐量始终保持在该水平。

HP ZGX Nano G1n 堆叠式

ZGX Nano G1n 与其他 Spark 机型最大的区别在于惠普在参考设计基础上所做的改进。其采用的再生材料、提升内部维护便利性的上下机箱分离设计,以及负载下噪音仅为 27.6 dBA 的出色声学性能,都体现了惠普在 GB10 平台本身要求之外的精心设计。安全架构也遵循同样的原则。TPM 2.0(FIPS 140-2 模式)、通用准则 EAL4+ 认证以及 SED OPAL 存储,使这款产品超越了开发人员的范畴,成为一款能够通过监管环境采购的系统。

与其他 Spark 系列产品一样,这款产品并非通用工作站,惠普也并未将其定位为通用工作站。对于需要本地 AI 计算能力,且注重可持续性和安全性的开发者、小型团队和组织而言,ZGX Nano G1n 是 Spark 产品线中一个明显不同的选择。而对于那些没有这些需求的用户来说,我们评测过的五款 OEM 系统都基于相同的底层平台,因此最终的选择取决于生态系统、支持和价格。

产品页面 – HP ZGX Nano G1n AI

参与 StorageReview

资讯订阅 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter(现为X) | TikTok | RSS订阅

康纳·豪瑟