存储评论网

HP Z2 Mini G1a 评测:无需独立 GPU 即可运行 GPT-OSS 120B

电子消费品  ◇  打标工作站

HP Z2 Mini G1a 工作站标志着 HP 在高度可定制、紧凑型计算领域迈出了大胆的一步。这款强大的工作站专为 3D 建模、AI 开发和数字内容创作等领域的专业人士设计,兼具便携性与精准性。该工作站的核心是 AMD Ryzen AI Max PRO 系列处理器,可为多任务处理、渲染和本地 LLM 提供加速性能。

HP Z2 Mini G1a 侧面

该系统的核心是 AMD 的 Ryzen AI MAX+ Pro 395,这是一款于 2025 年初发布的尖端处理器。其 CPU 主频高达 5.1 GHz,拥有 16 个核心,可提供强大的计算性能。它还搭配了 AMD Radeon 8060S 集成显卡。此外,与许多 AI 产品一样,内置的神经处理单元 (NPU) 可为要求苛刻的 AI 工作负载提供额外的 50 TOPS 计算能力。Radeon 8060S 集成显卡使其成为 GPU 密集型工作负载的有力竞争者,因为用户可以为其分配高达 96GB 的 VRAM。这使其在领导本地 LLM 推理工作负载以及渲染和内容创作方面具有独特的优势。

HP Z2 Mini G1a AMd Ryzen AI Max Pro

当用户配置 HP Z2 Mini G1a 时,该系统的扩展性与其他系统不同。CPU 和 GPU 可以同时扩展。例如,基础配置包括 AMD Ryzen AI Max Pro 380、Radeon 8040S 显卡和 32GB 共享内存。当您增加内存(例如升级到 128GB)时,CPU 和 GPU 也会随之变化。这一变化会将其升级到 Ryzen AI Max+ Pro 395,配备 Radeon 8060S 显卡和 128GB 共享内存。

本次评测的主机是搭载锐龙 AI Max+ Pro 2 芯片组的 Z1 Mini G395a,配备 16 核 CPU 和 Radeon 8060S 显卡,两者共享 128GB DDR5 内存。虽然我们的主机标价 1 美元,但实际零售价要低得多。定价一直是大家比较关心的问题。 惠普 ZBook Ultra G1a 我们在今年早些时候进行了审查,但值得庆幸的是,定价和性能已经有了大幅改善。 目前,B&H 出售配备 2TB SSD 的顶级 Z1 Mini G2a,售价仅为 3,342.65 美元.

HP ZCentral 远程加速

HP 在其专业工作站产品线中提供的一项更有趣的功能是 HP ZCentral Remote Boost。HP ZCentral Remote Boost 是该公司的远程连接软件(以前称为 HP Remote Graphics Software,简称 RGS)。它专为物理工作站而非虚拟机 (VM) 设计。本质上,Remote Boost 将端点设备连接到办公室或家中的 Z 工作站,允许用户通过端点设备访问系统进行图形密集型工作。

这样,多个用户就可以利用一个工作站,无论它位于何处:数据中心、数据机柜,甚至是办公桌上。如果接收方可以通过网络联系发送方系统,那么即使在存在 VPN 的 WAN 环境中,计算资源也可以完全远程控制。

总体而言,HP Remote Boost 的最终用户体验非常出色。我们建议您阅读白皮书、工作原理:HP ZCentral Remote Boost, 详细检查这项有用的技术,它现在比以往任何时候都更加相关。

HP Z2 Mini G1a 规格

类别 规格
可用的操作系统
  • Windows 11专业版
  • Windows 11 家庭版 – 惠普推荐企业使用 Windows 11 专业版
  • Linux 就绪
  • Ubuntu的LTS 24.04
处理器系列 AMD Ryzen AI Max PRO处理器
可用处理器
  • AMD Ryzen AI Max+ PRO 395(最高 5.1 GHz 加速时钟、64 MB L3 缓存、16 核、32 线程),搭载 AMD Radeon 8060S 显卡和 AMD Ryzen AI
  • AMD Ryzen AI Max PRO 390(最高 5.0 GHz 加速时钟、64 MB L3 缓存、12 核、24 线程),搭载 AMD Radeon 8050S 显卡和 AMD Ryzen AI
  • AMD Ryzen AI Max PRO 385(最高 5.0 GHz 加速时钟、32 MB L3 缓存、8 核、16 线程),搭载 AMD Radeon 8050S 显卡和 AMD Ryzen AI
  • AMD Ryzen AI Max PRO 380(最高 4.9 GHz 加速时钟、16 MB L3 缓存、6 核、12 线程),搭载 AMD Radeon 8040S 显卡和 AMD Ryzen AI
神经处理单元 AMD Ryzen AI(50 TOPS)
产品颜色 乌黑
外形 迷你
最大内存 128 GB LPDDR5X-8533 MT/s ECC,传输速率高达 8000 MT/s
内部存储
  • 512GB 至 4TB HP Z Turbo Drive PCIe NVMe M.2 SSD
  • 512GB 至 4TB HP Z Turbo Drive PCIe NVMe Opal 2 M.2 SSD
  • 256GB 至 1TB PCIe NVMe Value M.2 SSD
  • 512GB 至 2TB PCIe NVMe FIPS 140-2 SED SSD
  • 512GB 至 2TB Citadel PCIe NVMe A-DEV FIPS 140-2
可用的图形
  • AMD Radeon 8060S 显卡
  • AMD Radeon 8050S 显卡
  • AMD Radeon 8040S 显卡
音频 集成单声道扬声器,Realtek ALC3205-VA2-CG,2.0W 内置单声道扬声器
扩展插槽 2 个 M.2 2280 PCIe 4×4;1 个 M.2 2230(用于 WLAN)
端口和连接器
  • 侧: 1 个 USB Type-C 10Gbps(USB 供电、DisplayPort 2.1);1 个耳机/麦克风组合端口;1 个 USB Type-A 10Gbps(1 个充电端口)
  • 背面: 2 个 USB Type-A 10Gbps 端口;1 个 RJ-45 端口;2 个 Thunderbolt 4 端口,带 USB Type-C 40Gbps(USB 供电、DisplayPort 2.1);2 个 USB Type-A 480Mbps 端口;2 个 Mini DisplayPort 2.1 端口
  • 可选端口:
    • Flex IO 顶部 - 双 USB Type-A 5Gbps、双 USB Type-C 10Gbps、1 GbE LAN、2.5 GbE LAN、10GbE LAN、基于 USB 的串行端口、1GbE 光纤 LC NIC。
    • Flex IO 底部 - 1 GbE LAN、2.5 GbE LAN、串行端口、外部电源按钮、远程管理套件。
键盘选项 HP USB 商务超薄智能卡 CCID 键盘;HP 125 黑色有线键盘;HP 320K 有线键盘
鼠标选项 HP 有线台式机 128 激光鼠标;HP 有线 320M 鼠标;HP 125 有线鼠标
传播学 LAN:Realtek RTL8125BPH-CG 2.5 GbE;WLAN:联发科 Wi-Fi 7 MT7925(2×2)和蓝牙 5.4
软件 HP UEFI BIOS 认证 2.7B;HP PC 硬件诊断 Windows;HP 图像助手;HP 可管理性集成套件 10;性能顾问 3.0
安全管理 HP Secure Erase;HP Sure Click;HP BIOSphere Gen6;Sure Recover Gen4;HP Sure Admin;引擎盖传感器可选套件;HP Client Security Manager Gen6;HP Sure Start Gen7;HP Sure Sense Gen2;HP Sure Run Gen5;Microsoft Pluton;HP Wolf Pro 安全版
管理功能 高性能模式、静音模式、机架模式、性能模式
电力 300 W 内置电源适配器,效率高达 92%,主动 PFC
尺寸 3.4 x 6.6 x 7.9 英寸;8.55 x 16.8 x 20 厘米(标准桌面方向)
重量 起始重量为 5.07 磅(2.3 千克);包装起始重量为 9 磅(4.1 千克)
生态标签 IT ECO 宣言;国家环保总局;台湾绿色标志;日本 PC 绿色标签;FEMP;EPEAT Gold with Climate+;韩国 MEPS
能源认证 能源之星认证
可持续影响 提供散装包装;10% ITE 衍生闭环塑料;产品碳足迹;包含至少 65% 的消费后再生塑料;包含至少 20% 的工业后再生钢;支持二维码的产品门户(2025 年 XNUMX 月);新能源消耗仪表板
显示支持 支持四台显示器同时显示。每个 Mini DisplayPort 端口可连接一台显示器;每个 Thunderbolt 端口可连接两台显示器

设计与建造

HP Z2 Mini G1a 的正面设计时尚,布局简洁。前面板采用酷炫的格栅框架,一侧是 HP 徽标,另一侧是电源按钮。格栅设计实用,使空气在机箱内自由流通,不受阻碍。

HP Z2 Mini G1a 正面

Z2 Mini G1a 的一侧还提供了一些端口,包括一个具有 10W 输出的 USB-C 15Gbps 端口,一个具有 10GBps 连接的 USB-A 端口,以及一个耳机/麦克风插孔。

HP Z2 Mini G1a 侧面

该系统背面有各种各样的端口。它包括两个 Mini DP 2.1 端口、两个 USB 2.0 端口、两个 USB 3.0 10 Gb/s 端口、两个 Thunderbolt 4 USB-C 40 Gb/s 端口、一个 2.5 GbE 端口,当然还有电源接口和线缆锁。电源完全集成,这是一个很不错的设计,无需使用巨大的交流电源适配器。惠普还支持一项允许更高程度定制的功能,即两个 Flex IO 插槽,用户可以根据自己的喜好进行更换。顶部插槽提供双端口 USB-A 5Gb/s 组合或带串行端口的 1GbE 网卡选择。底部插槽可通过串行端口配置另一个 1GbE 网卡、一个额外的外部电源按钮以及一个用于带外 (OOB) 管理的惠普远程系统控制器。

HP Z2 Mini G1a 后端口

要深入了解 HP Z2 Mini G1a,可以使用背面的手指闩锁轻松滑下顶盖。

HP Z2 Mini G1a 服务

大型风扇+散热器组合覆盖了主板的大部分空间,为 AMD Ryzen CPU/GPU 组合散热。虽然系统内存是焊接上去的,无法维修,但 Z2 Mini G1a 提供了两个 PCIe Gen4 M.2 插槽。只需拧下连接风扇组件和散热器的两颗小螺丝,然后提起风扇组件即可使用。

HP Z2 Mini G1a 内部

在频繁使用期间,一些风扇噪音变得明显,尽管不像在较大的工作站中听到的那么明显或刺耳。

HP Z2 Mini G1a 固态硬盘

HP Z2 Mini G1a 性能测试

在本次评测中,我们将 HP Z2 Mini G1a 与 HP ZBook Ultra G1a 14 英寸笔记本电脑 我们之前写过。工作站和笔记本电脑都包含相同的组件,这让我们能够看到台式机的外形尺寸与更大的功率范围和更强的散热性能相比如何。

UL Procyon:人工智能计算机视觉

Procyon AI 计算机视觉基准测试详细洞察了 AI 推理引擎在专业级水平上的表现。通过整合来自多家供应商的引擎,该基准测试提供的性能分数能够准确反映设备的性能。该基准测试通过比较不同硬件类型(包括 CPU、GPU 和 NPU)上的 AI 加速性能来评估最先进的神经网络模型,从而帮助用户评估其在各种工作负载规模和条件下的相对效率。

为了反映现实世界的 AI 工作负载,基准测试使用了六种不同的神经网络模型,每种模型的选择都基于其与现代计算机视觉任务的相关性。MobileNet V3 是一款紧凑型、专注于移动设备的模型,专为图像中的主体识别而设计;而 Inception V4 则使用更深层、更复杂的架构来执行相同的任务。

YOLO V3(You Only Look Once)通过实时估算物体概率,专注于物体检测。基于 MobileNet V3 构建的 DeepLab V2 专注于语义图像分割和像素聚类。Real-ESRGAN 是计算要求最高的测试,它将图像分辨率从 250×250 提升到 1,000×1,000。最后,ResNet 50 是一个强大的分类模型,可以更有效地训练深度神经网络。

HP Z2 Mini G1a 在 CPU 测试中略胜 HP ZBook Ultra G1a 14 英寸。工作站总得分 227 分,而笔记本电脑总得分 186 分。工作站的运行速度明显更快,且在各个类别中都保持了相当的水平。REAL-ESRGAN 测试结果最佳,工作站的运行时间为 1,892.10 毫秒,而移动平台的运行时间为 2,138.97 毫秒。尽管两者速度差异明显,但工作站的得分优势明显,最终两款设备都获得了优异的成绩。

在 GPU 测试中,笔记本电脑以 583 分的总成绩胜过工作站的 528 分。Radeon 8060S 集成显卡在两个系统上都表现出了高性能指标。然而,在大多数测试项目中,笔记本电脑的成绩略快一些。唯一的例外是 MobileNet V3,工作站的得分为 0.42 毫秒,而笔记本电脑为 0.46 毫秒。然而,其余测试结果的情况却截然相反。例如,以最大的工作负载 REAL-ESRGAN 为例,工作站的时间为 211.76 毫秒,比笔记本电脑的 11 毫秒慢了大约 200.40 毫秒。

HP Z2 Mini G1a 和 HP ZBook Ultra G1a 14 英寸在 NPU 测试中均表现出色。工作站版总得分 1,761 分,笔记本电脑版总得分 1,773 分,ZBook 移动平台似乎在这方面表现更佳。然而,除了 DeepLab V3 和 REAL-ESRGAN 之外,几乎所有类别的差异都只有百分之一毫秒。两款系统在 AI 推理方面都表现出色,表明它们的性能相当。

UL Procyon:AI 计算机视觉推理(越低越好) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
CPU 时间
AI计算机视觉总体评分(越高越好) 227 186
移动网络 V3 0.75毫秒 1.09毫秒
残差网络 50 5.99毫秒 6.84毫秒
盗梦空间V4 17.12毫秒 19.80毫秒
深实验室V3 21.20毫秒 28.27毫秒
优洛V3 36.58毫秒 41.64毫秒
真爱斯甘 1,892.10毫秒 2,138.97毫秒
GPU时代
AI计算机视觉总体评分(越高越好) 528 583
移动网络 V3 0.42毫秒 0.46毫秒
残差网络 50 3.85毫秒 3.27毫秒
盗梦空间V4 15.15毫秒 11.62毫秒
深实验室V3 10.98毫秒 10.72毫秒
优洛V3 12.64毫秒 10.57毫秒
真爱斯甘 211.76毫秒 200.40毫秒
西工大时报
AI计算机视觉总体评分(越高越好) 1,761 1,773
移动网络 V3 0.27毫秒 0.27毫秒
残差网络 50 0.83毫秒 0.82毫秒
盗梦空间V4 1.72毫秒 1.71毫秒
深实验室V3 4.31毫秒 4.22毫秒
优洛V3 3.17毫秒 3.15毫秒
真爱斯甘 100.05毫秒 100.83毫秒

UL Procyon:AI 文本生成

Procyon AI 文本生成基准 通过提供简洁一致的评估方法,简化了 AI LLM 性能测试。它允许跨多个 LLM 模型进行重复测试,同时最大限度地降低大型模型和可变因素的复杂性。它与 AI 硬件领导者共同开发,优化了本地 AI 加速器的使用,从而实现更可靠、更高效的性能评估。以下测量结果均使用 TensorRT 进行测试。

完成 AI 文本生成测试后,结果显示出一致的趋势:HP Z2 Mini G1a 的性能略优于 HP ZBook Ultra G1a,尽管两者之间的差异并不大。例如,在 Phi 基准测试中,Z2 Mini 的总得分为 965,而 ZBook 为 922。第一个令牌的生成时间几乎相同,Z1.898 Mini 为 2 秒,ZBook 为 1.956 秒。每秒输出令牌数也同样接近,分别为 68.967 个和 64.986 个。这些数据表明,虽然 Z2 Mini 处理任务的速度略快,但两个系统在推理过程中的响应速度相当。

这一趋势在 Mistral 和 Llama3 的测试中延续。Z2 Mini 的得分分别为 850 和 766,而 ZBook 的得分分别为 829 和 756。输出速度和令牌延迟也同样出色,且差距不大。这些一致的结果表明,两款系统的性能水平相当,尤其是在实际条件下运行中型机型时。

Llama2 的测试结果总体上最为接近。Z2 Mini 的得分为 936 分,第一个令牌的响应时间为 3.813 秒,而 ZBook 的得分为 929 分,响应时间为 3.860 秒。两款设备之间细微的差距进一步证明了,在处理现代 AI 工作负载时,两款系统的性能非常接近。

总体而言,Z2 Mini 在每项测试中均略胜一筹,但数据显示,在使用 TensorRT 运行 LLM 时,两款系统的性能几乎不相上下。这些差异在综合基准测试中可能较为明显,但在大多数使用场景下,不太可能造成显著的性能差距。

UL Procyon:AI 文本生成 HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
菲总分 965 922
Phi 输出时间到第一个标记 1.898秒 1.956秒
每秒输出 Phi 令牌数 68.967 个代币/秒 64.986 个代币/秒
Phi 总时长 52.666秒 55.501秒
米斯特拉尔总成绩 850 829
Mistral 输出第一个令牌的时间 2.734秒 2.783秒
每秒 Mistral 输出代币数 43.358 个代币/秒 41.992 个代币/秒
米斯特拉尔总持续时间 81.716秒 84.065秒
Llama3 总体评分 766 756
Llama3 输出第一个标记的时间 2.545秒 2.578秒
Llama3 每秒输出令牌数 36.752 个代币/秒 36.243 个代币/秒
Llama3 总时长 91.987秒 93.200秒
Llama2 总体评分 936 929
Llama2 输出第一个标记的时间 3.813秒 3.860秒
Llama2 每秒输出令牌数 24.685 个代币/秒 24.619 个代币/秒
Llama2 总时长 136.077秒 136.720秒

UL Procyon: 人工智能图像生成

Procyon AI 图像生成基准 提供一致且准确的方法来衡量各种硬件(从低功耗 NPU 到高端 GPU)的 AI 推理性能。它包含三项测试:针对高端 GPU 的 Stable Diffusion XL (FP16)、针对中等性能 GPU 的 Stable Diffusion 1.5 (FP16) 以及针对低功耗设备的 Stable Diffusion 1.5 (INT8)。该基准测试使用针对每个系统的最佳推理引擎,确保结果公平且具有可比性。

为了模拟实际使用情况,基准测试会根据一组标准化的文本提示生成图像,从而在所有设备上创建一致的文本转图像 AI 工作负载。每项测试都提供关键性能指标,包括总得分、总生成时间和图像生成速度,从而实现不同型号和硬件配置之间的简单有效比较。

HP Z2 Mini G1a 和 HP ZBook Ultra G1a 均能运行 Procyon AI 图像生成基准测试中的三项图像生成测试中的两项。具体来说,两款系统均以 FP1.5 精度完成了 Stable Diffusion 16 测试,以及要求更高的 Stable Diffusion XL FP16 测试。两种配置均不支持 INT8 版本的 Stable Diffusion 1.5 测试。

在 Stable Diffusion 1.5 FP16 测试中,Z2 Mini 以 725 的总分、137.815 秒的总生成时间、每幅图像 8.613 秒的生成速度完成了工作负载。ZBook 的成绩与之相当,总分为 648 分,总时间为 154.203 秒,每幅图像 9.638 秒。这些数据表明,尽管两款系统都搭载了相同的 Ryzen AI Max+ PRO 2 处理器和 Radeon 395S GPU,但 Z8060 Mini 在处理效率方面仍保持着一定的领先优势。

在 Stable Diffusion XL FP16 测试中也出现了类似的情况。Z2 Mini 的总得分为 570,基准测试耗时 1,052.468 秒,每张图片的生成速度为 65.779 秒。相比之下,ZBook 的得分为 451,总耗时为 1,329.592 秒,每张图片的生成速度为 83.100 秒。虽然两款系统都能处理这些较大的模型,但 Z2 Mini 始终能更快地完成任务,这反映出在相同的硬件限制下,其性能略有优化。

UL Procyon:AI 图像生成 HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
稳定扩散 1.5 (FP16) – 总体得分 725 648
稳定扩散 1.5 (FP16) – 总时间 137.815秒 154.203秒
稳定扩散 1.5 (FP16) – 图像生成速度 8.613 秒/图像 9.638 秒/图像
稳定扩散 1.5 (INT8) – 总体得分
稳定扩散 1.5 (INT8) – 总时间
稳定扩散 1.5 (INT8) – 图像生成速度
稳定扩散 XL (FP16) – 总体得分 570 451
稳定扩散 XL (FP16) – 总时间 1,052.468秒 1,329.592秒
稳定扩散 XL (FP16) – 图像生成速度 65.779 秒/图像 83.100 秒/图像

规格工作站 4

SPECworkstation 4.0 基准测试是评估工作站性能所有关键方面的综合工具。 它提供了 CPU、图形、加速器和磁盘性能的真实衡量标准,确保专业人员拥有数据来对其硬件投资做出明智的决策。 该基准测试包括一组专门针对 AI 和 ML 工作负载的测试,包括数据科学任务和基于 ONNX 运行时的推理测试,反映了 AI/ML 在工作站环境中日益增长的重要性。 它涵盖七个垂直行业和四个硬件子系统,为当今工作站的性能提供了详细而相关的衡量标准。

测试结果显示,Z2 Mini 在大多数类别中的得分普遍较高,反映出其在持续工作负载下略微的性能优势。在能耗测试中,Z2 Mini 的得分为 2.50,而 ZBook 的得分为 2.20。金融服务领域的差距更大,工作站得分为 2.35,笔记本电脑得分为 1.60。生命科学领域也呈现出类似的趋势,Z2 Mini 得分为 2.60,ZBook 得分为 2.20。媒体和娱乐领域的得分分别为 2.22 和 1.90,而产品设计领域的工作站得分为 2.00,笔记本电脑得分为 1.74。

ZBook 唯一略胜一筹的地方是在生产力和开发方面,其得分为 1.03,而 Z2 Mini 的得分为 1.00。虽然这些差异并不显著,但这说明,即使两款系统共享相同的处理器和 GPU,Z2 Mini 在工作站级应用中的吞吐量可能略胜一筹。

SPECworkstation 4.0.0(越高越好)

HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S)

HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
新能源 2.50 2.20
金融服务 2.35 1.60
生命科学 2.60 2.20
媒体与娱乐 2.22 1.90
产品设计 2.00 1.74
生产力与发展 1.00 1.03

乐士马克

Luxmark 是一款 GPU 基准测试,利用开源光线追踪渲染器 LuxRender 来评估系统处理高精细 3D 场景的性能。该基准测试适用于评估服务器和工作站的图形渲染能力,尤其适用于视觉效果和建筑可视化应用,因为精确的光线模拟对这些应用至关重要。

HP Z2 Mini G1a 和 HP ZBook Ultra G1a 在本次测试中均表现出色,充分体现了锐龙 AI Max+ PRO 395 处理器搭配 Radeon 8060S 显卡的强劲性能。在 Hallbench 场景中,Z2 Mini 的得分为 8,477 分,略高于 ZBook 的 7,833 分。同样,在美食场景中,工作站的得分为 3,943 分,笔记本电脑的得分为 3,915 分。这些结果差异很小,表明这两款系统都非常适合轻度到中度的 3D 渲染工作负载。

值得注意的是,这两款设备都受益于灵活的内存分配,允许在 CPU 和 GPU 任务之间动态共享 RAM。此功能有助于它们高效地处理渲染任务,即使在通常与密集图形性能无关的紧凑外形中也是如此。

Luxmark(越高越好) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
大厅长凳 8,477 7,833
食品 3,943 3,915

7-Zip 压缩

7-Zip 压缩基准测试评估压缩和解压缩任务期间的 CPU 性能,测量 GIPS(每秒千兆指令)和 CPU 使用率。更高的 GIPS 和高效的 CPU 使用率表明性能优越。

从最终的评分来看,惠普 Z2 Mini G1a 和惠普 ZBook Ultra G1a 均表现出色,性能相当。在压缩测试中,Z2 Mini 的最终评分为 139.298 GIPS,略低于 ZBook 的 139.617 GIPS。然而,在解压测试中,Z2 Mini 的最终评分为 163.969 GIPS,高于 ZBook 的 174.046 GIPS。

综合考虑两种工作负载,Z151.634 Mini 的总得分为 2 GIPS,ZBook 的总得分为 156.832 GIPS。这些结果表明,虽然两款系统都能够很好地处理压缩密集型工作流程,但 ZBook 在整体吞吐量方面略有优势,尤其是在解压阶段。

7-Zip 压缩基准(越高越好) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
压缩
当前 CPU 使用率 2,734% 2,868%
电流额定值/使用 5.136 吉普斯 4.883 吉普斯
额定电流 140.405 吉普斯 140.061 吉普斯
产生的 CPU 使用率 2,718% 2,855%
结果评级/使用 5.126 吉普斯 4.890 吉普斯
结果评级 139.298 吉普斯 139.617 吉普斯
解压
当前 CPU 使用率 2,343% 2,904%
电流额定值/使用 6.805 吉普斯 6.029 吉普斯
额定电流 159.451 吉普斯 175.104 吉普斯
产生的 CPU 使用率 2,414% 2,887%
结果评级/使用 6.793 吉普斯 6.028 吉普斯
结果评级 163.969 吉普斯 174.046 吉普斯
总评分
总 CPU 使用率 2,566% 2,871%
总评分/使用情况 5.959 吉普斯 5.459 吉普斯
总评分 151.634 吉普斯 156.832 吉普斯

Blackmagic RAW 速度测试

Blackmagic RAW Speed Test 是一款性能基准测试工具,用于衡量系统使用 Blackmagic RAW 编解码器处理视频播放和编辑的能力。它评估系统解码和播放高分辨率视频文件的性能,并提供基于 CPU 和 GPU 处理的帧速率。

在 8K CPU 测试中,HP Z2 Mini G1a 达到了 124 帧每秒,超过了 HP ZBook Ultra G1a(102 帧每秒)。这表明 ZBook 在基于 CPU 的原始解码任务中略占优势。然而,使用 OpenCL 的 GPU 加速结果却显示出相反的趋势。ZBook 的帧率略高,为 78 帧每秒,而 Z74 Mini 的帧率仅为 2 帧每秒。

Blackmagic RAW 速度测试 HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
8K 中央处理器 FPS 124 FPS 102
8K 开放式 FPS 74 FPS 78

Blackmagic磁盘速度测试

Blackmagic Disk Speed Test 通过测量读写速度来评估存储性能,从而深入了解系统处理数据密集型任务(例如视频编辑和大文件传输)的能力。

HP Z2 Mini G1a 提供两个 PCIe Gen4 插槽,都非常易于访问和升级。SSD 性能可能会略有不同,具体取决于您具体配置的部件。

磁盘速度测试(越高越好) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S)

HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)

了解 4,549.3 MB / s的 4,547.3 MB / s的
填写 5,344 MB / s的 4,264.8 MB / s的

搅拌机基准

Blender 是一款开源 3D 建模应用程序。本次基准测试使用 Blender Benchmark 实用程序运行。分数以每分钟采样数计算,数值越高,性能越好。

HP Z2 Mini G1a 在三个测试场景中的表现均优于 HP ZBook Ultra G1a。在 Monster 项目中,Z2 Mini 的采样率达到了每分钟 224.3 次,而 ZBook 的采样率仅为每分钟 189.29 次。紧随其后的是 Junkshop 场景,采样率分别为每分钟 149.5 次和 129.42 次。最后,在 Classroom 场景中,Z2 Mini 的采样率达到了每分钟 116.3 次,而 ZBook 的采样率仅为每分钟 94.14 次。

Blender 基准 CPU(每分钟样本数,越高越好) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
怪物 224.3 个样本/米 189.29 个样本/米
旧货店 149.5 个样本/米 129.42 个样本/米
课堂 116.3 个样本/米 94.14 个样本/米

当切换到基于 GPU 的渲染模式,使用 Blender 的 OptiX 引擎时,结果显示两款系统的性能表现更加均衡。在怪物场景中,HP ZBook Ultra G1a 的渲染速度为每分钟 661.50 个样本,略高于 Z2 Mini 的每分钟 616.1 个样本。这表明,尽管两款设备都搭载相同的 Radeon 8060S 显卡,但 ZBook 在这一特定场景中仍略微在 GPU 方面占据优势。

然而,在 Junkshop 和 Classroom 测试中,Z2 Mini 重新以微弱优势领先。它分别达到了每分钟 350.6 次和 342.7 次采样,而 ZBook 在相同场景中的得分分别为 341.92 次和 333.26 次。这些差异相对较小,在预期范围内,表明两款系统在 OptiX 下均提供了相当接近的 GPU 渲染性能。

Blender 基准 GPU(每分钟样本数,越高越好) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
怪物 745.55 个样本/米 661.50 个样本/米
旧货店 366.54 个样本/米 341.92 个样本/米
课堂 359.01 个样本/米 333.26 个样本/米

y 粉碎机

y-cruncher 是一款多线程可扩展程序,能够计算圆周率 (Pi) 及其他精确到万亿位的数学常数。自 2009 年推出以来,它已成为超频玩家和硬件爱好者的热门基准测试和压力测试应用程序。

HP Z2 Mini G1a 的各项指标与 HP ZBook Ultra G1a 14 英寸一致。该工作站在所有计算增量中都略占优势,首先是 1 亿位的测试,耗时 12.965 秒。在 2.5 亿和 5 亿的测试中,差距均扩大了几秒。34.533 亿位的测试耗时 2.5 秒,75.021 亿位的测试耗时 5 秒,成绩相当稳定。在 10 亿位的部分,该工作站以 160.252 秒的完成时间领先,比 ZBook 快了 11 秒,这主要是因为笔记本电脑的功耗略有限制。

Y-Cruncher(总计算时间) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
1亿 12.965秒 12.93秒
2.5亿 34.533秒 34.91秒
5亿 75.021秒 78.19秒
10亿 160.252秒 171.72秒

Geekbench 6

Geekbench 6 是一个跨平台基准测试,用于衡量整体系统性能。

HP Z2 Mini G1a 的测试结果并不令人意外。CPU 得分与笔记本电脑几乎相同,单核 2,862 分,多核 12,210 分。出于与之前讨论的类似原因,GPU OpenCL 得分有所上升,达到 91,591 分。这些得分表明,运行 CPU 密集型任务对这款系统来说并非难事。至于 GPU,Radeon 8060S 集成显卡的性能堪比 2019 年左右推出的新显卡,非常适合小型工作站。

Geekbench 6(越高越好) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
CPU单核 2,862 2,825
CPU 多核 17,210 17,562
GPU OpenCL 91,591 85,337

Cinebench R23

Cinebench R23 是广泛认可的基准测试,用于评估 CPU 在 3D 渲染工作负载下的性能。它使用 Cinema 4D 引擎,衡量处理器处理单线程和多线程任务的性能,从而深入了解处理器的整体响应能力和并行处理能力。

在多核测试中,HP Z2 Mini G1a 的得分为 37,156,远超 HP ZBook Ultra G1a(得分 29,112)。这表明 Z2 Mini 更有能力承受更重的多线程渲染工作负载,这可能是因为其机箱散热条件更佳。

在单核性能方面,两款系统的表现几乎相同。Z2 Mini 的得分为 2,020,而 ZBook 的得分紧随其后,为 1,984。这些数据表明,两款设备在轻线程任务(例如视口交互或基本建模操作)中的表现相似。

Cinebench R23(越高越好) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
多核 37,156 29,112
单核 2,020 1,984

Cinebench 2024

Cinebench 2024 在 R23 的基础上,引入了基于 GPU 的渲染测试,同时继续关注 CPU 性能。在本部分中,我们仅考察 CPU 得分,这能让我们深入了解每个系统处理现代 3D 渲染任务的能力。

在多核测试中,惠普 Z2 Mini G1a 得分 1,906,优于惠普 ZBook Ultra G1a 的 1,579。这与 R23 测试中的情况相同,Z2 Mini 展现了更高效的多线程吞吐量,这可能得益于其在高负载下更佳的持续性能。

单核测试结果几乎相同。Z2 Mini 得分 112 分,而 ZBook 得分 111 分,仅落后一分。这表明,在依赖单线程的任务(例如轻量级编辑或实时应用程序交互)中,两者的性能表现相近。

Cinebench 2024(越高越好) HP Z2 Mini G1a(锐龙 AI Max+ PRO 395 | Radeon 8060S) HP ZBook Ultra G1a 14 英寸(锐龙 AI Max+ PRO 395 | Radeon 8060S)
多核 1,906 1,579
单核 112 111

Ollama Gemma3 LLM 表演

为了评估 HP Z2 Mini G1a 在实际工作负载下处理大型语言模型 (LLM) 推理的性能,我们使用了 Ollama 及其专门用于分析本评测性能部分的提示。测试的模型参数数量从 1.5 亿到 70 亿不等,并在适用的情况下使用了 Gemma3 变体。此类工作负载对 GPU 和 CPU 资源都提出了压力,尤其是在长提示序列下,对内存容量、推理吞吐量和计算稳定性提出了挑战。

规模较小的模型(例如 Ollama 1.5B 和 7B)执行速度很快,分别在 4.76 秒和 36.65 秒内完成。两者的快速评估都非常高效,716.99B 模型的令牌处理速度为每秒 1.5 个令牌,799.29B 模型的令牌处理速度为每秒 7 个令牌。然而,随着模型规模的增加,输出评估速度会下降。在 1.5B 模型中,输出令牌的生成速度为每秒 112.18 个令牌,而 7B 模型的完成速度为每秒 36.86 个令牌。

正如预期,性能会随着模型规模的增加而下降。14B 模型耗时近 65 秒,生成速度降至每秒 18.90 个令牌。32B 模型的速度下降更为显著,总共耗时 94.29 秒,生成速度为每秒 9.38 个令牌。计算要求最高的测试是 70B 模型,耗时 164.73 秒,生成速度仅为每秒 4.24 个令牌。

虽然由于键值缓存优化,初始提示评估在所有规模下都保持高效,但随着模型规模和内存需求的增加,总生成时间和令牌输出率会可预测地下降。HP Z2 Mini G1a 演示了它可以扩展到 70B 层级,但对于长提示或复杂提示,超过 14B 后,用户应该会发现响应速度明显下降。

奥拉马 1.5B 总时长(秒) 负载持续时间(毫秒) 提示评估计数(令牌) 提示评估持续时间(毫秒) 即时评估率 评估计数(令牌) 评估时长(秒) 评估率
HP Z2 Mini g1a 4.76小号 17.21毫秒 22  30.68毫秒 716.99 tk/秒 528 4.71小号 112.18 tk/秒
奥拉马 7B
HP Z2 Mini g1a 36.65小号 18.21毫秒 22 27.52毫秒 799.29 tk/秒 1349 36.06小号 36.86 tk/秒
奥拉马 14B
HP Z2 Mini g1a 64.97小号 18.66毫秒 22 28.41毫秒 774.37 tk/秒 1227 64.92小号 18.90 tk/秒
奥拉马 32B
HP Z2 Mini g1a 94.29小号 73.83毫秒 22 69.27毫秒 317.61 tk/秒 883 94.14小号 9.38 tk/秒
奥拉马 70B
HP Z2 Mini g1a 164.73小号 21.97毫秒 22 38.90毫秒 565.52 tk/秒 699 164.67小号 4.24 tk/秒

支持 OpenAI 的新 GPT-OSS 120B 模型

几天前,OpenAI 发布了其长期以来的首批开源 LLM 版本:GPT-OSS 120B 和 20B 模型。GPT-OSS 120B 代表了一项突破,它是首批使用 MXFP4 量化原生训练的模型之一。据 OpenAI 介绍,这些模型在训练后会进行 MoE 权重量化,将其转换为 MXFP4 格式,从而将每个参数的权重减少到仅 4.25 位。由于 MoE 权重占总参数数量的 90% 以上,这种激进的量化使 120B 模型能够安装在单个 80GB 的 H100 GPU 上,或者在我们的情况下,安装在拥有 395GB 共享内存的 Ryzen AI Max+ PRO 96 上。这种与行业趋势的契合尤为重要,因为低精度混合专家模型正日益普及,这使得计算能力较低的设备仍然能够在推理中提供出色的性能。

这种原生 MXFP4 训练也带来了一个关键优势。当进一步量化为 Int4 以部署到 AI Max+ PRO 395 上时,与从 BF16 量化到 Int4 时通常出现的显著损失相比,质量下降微乎其微。因此,GPT-OSS 120B 是您可以在 AI Max+ PRO 395 上运行的性能最佳的模型之一,可提供接近完整的质量。

通过利用这种低精度架构趋势,Z2 Mini G1a 将传统上需要成本三倍的企业级硬件(例如配备 6000GB VRAM 的 NVIDIA RTX 96 Pro)转变为可用于大规模 LLM 实验的可访问工作站解决方案。

如 LM Studio 所示,系统检测到配备 8060GB VRAM 的 Radeon 96S GPU,并确认其兼容模型执行。该配置还支持将 KV 缓存卸载到 GPU 内存,从而进一步提升长提示或扩展对话的推理效率。启用 OpenAI 的严格模型护栏后,即使在 LLM 工作负载繁重的情况下,系统也能保持过载保护。

我们安装的运行时扩展包包括 ROCm llama.cpp (Windows)、Vulkan llama.cpp (Windows)、CPU llama.cpp (Windows) 和 Harmony 框架。CUDA 也已列出,但无法使用,因为它需要 NVIDIA GPU,而系统配备了 AMD Radeon 8060S。

本次运行中,下图展示了之前提到的 OpenAI GPT OSS 120B 模型及其格式、架构和大小。该模型采用 GGUF 格式,总大小为 63.39 GB,并配置为完全 GPU 卸载。

在使用方面,HP Z2 Mini G1a 使用 120B 参数模型时表现出色,保持了接近 40 个令牌/秒的速率。我们与 LLM 进行了多次详细的沟通。反馈的质量比使用较小模型要好得多,而许多系统由于 VRAM 的限制,只能使用较小的模型。

查看 LLM 运行时的系统统计数据,我们发现 GPU 消耗的功率略低于 100W,并且 GPU 和 CPU 的温度保持在 51-54°C 之间。

结语

HP Z2 Mini G1a 是我们今年测试过的最令人惊喜的系统之一。理论上,它看起来像一台集成显卡的紧凑型台式机。但在实际使用中,这款小型工作站的性能始终远超预期,尤其是在处理 AI 工作负载时。它的市场价约为 3,300 美元,足以与更大、更昂贵的系统(包括配备高端独立显卡的系统)相媲美。

该系统还让我们有机会重新审视 HP ZBook Ultra G1a 14 英寸笔记本电脑 我们在今年早些时候评测过这款笔记本电脑。当时,我们对其高昂的价格和低迷的性能感到失望,尤其是在 AI 任务方面。尽管使用了类似的 AMD 硬件,但这款笔记本电脑的推理性能却很差,我们强调其 AI 性能远低于市场宣传。最终,我们对此印象不深。

几个月的时间和一次重要的软件更新就能带来巨大的改变。得益于 AMD 对驱动程序和运行时支持的持续改进,Ryzen AI Max+ Pro 395 现在的性能表现正如我们所期望的那样。凭借 128GB 共享内存和高达 96GB 的 VRAM,Z2 Mini G1a 可以轻松运行像 OpenAI 的 GPT-OSS 120B 这样的大规模本地模型。这种能力过去需要一台配备 RTX 10,000 或类似 GPU 的 6000 美元工作站才能实现。现在,它只需花费一小部分成本就能装进一个紧凑的机箱里。

HP Z2 Mini G1a 正面

惠普值得称赞的不仅仅是其丰富的配置选择。Z2 Mini G1a 经过精心设计,拥有强大的散热性能、出色的端口灵活性,以及 Flex IO 和 HP ZCentral Remote Boost 等可选功能,这些功能在专业环境中具有显著的价值。

这款系统彻底颠覆了人们对小型工作站性能的期待。它集令人印象深刻的本地AI性能、智能设计以及令人难以置信的绝佳价格于一身。正因如此,HP Z2 Mini G1a 荣获我们的“编辑推荐奖”。它就是这么优秀。

产品页

参与 StorageReview

资讯订阅 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter(现为X) | TikTok | RSS订阅

凯文·奥布莱恩

在 StorageReview 实验室内部评估产品并与行业领导者合作开发新的测试环境。 在家里,我养家糊口。