首页 企业版 灵活性和效率:MiTAC TYAN HG68-B8016 多节点服务器

灵活性和效率:MiTAC TYAN HG68-B8016 多节点服务器

by 布赖恩·比勒

MiTAC TYAN HG68-B8016 是一个高度灵活的平台,非常适合提供定制服务器配置的云提供商。

MiTAC TYAN HG68-B8016 是一款多功能 6U 五节点服务器平台,专为服务提供商而设计。它支持 AMD EPYC 4004 系列处理器,提供专门打造的性能、能效和成本效益的结合。每个节点可容纳高达 192GB 的 DDR5 内存、双 M.2 SSD 插槽,并包括 PCIe Gen5 和 Gen4 扩展以实现可扩展性。

MiTAC 服务器的模块化设计使云提供商能够高效地为其客户分配专用资源。每个节点独立运行,允许提供商提供根据特定客户需求量身定制的配置——从计算密集型应用程序到存储密集型工作负载。这种隔离意味着更容易管理,因为可以定制、维护或重新启动单个节点,而不会对相邻系统造成中断风险。简化的设计还有助于控制平台成本。

MiTAC TYAN HG68-B8016 后部

技术规格

HG68-B8016 专为容纳单个 AMD AM5 处理器而设计,支持高达 192GB 的 UDIMM/DDR5 ECC UDIMM 或非 ECC 4800 内存。此配置提供广泛的功能以及卓越的性能。

外形 6U机架式
存储柜(每个刀片) 连接器 (M.2) – (2) 2280(通过 PCIe.4 接口)
处理器(每个刀片) 数量/插槽类型: (1) AMD 插槽 AM5
支持的 CPU 系列:(1) AMD EPYC 4004 处理器
内存(每个刀片) 支持的 DIMM:数量 (4) 个 DIMM 插槽
DIMM 类型/速度:DDR5 ECC UDIMM 和非 ECC 4800
容量:高达 192GB UDIMM
扩展槽(每个刀片) (1) PCIe Gen.4 x4 插槽 / (1) PCIe Gen.4 x8 插槽(带 x4 链路)/ (1) PCIe Gen.5 x16 插槽
网络端口(每个刀片) (2) 个千兆以太网端口
I/O 端口(每个刀片) USB:(4)个 USB3.2 Gen.1 端口
VGA: (2) 显示端口 / (1) D-Sub 15 针端口
RJ-45:(2)个 GbE 端口
音频:(1)线路输入/线路输出/MIC

AMD EPYC 4004 系列处理器提供出色的性能和能效,使云提供商能够处理更多并发用户和复杂的工作负载。HG192-B5 支持每个节点高达 68GB 的 DDR8016 内存,可提供快速的数据访问和处理能力。该平台灵活的存储和扩展选项允许定制以满足特定的应用需求,并确保为各种云服务提供最佳性能。

MiTAC TYAN HG68-B8016 设计和构建

TYAN HG68-B8016 是一款 6U 机架式机箱,尺寸为 26.85 英寸 x 17.60 英寸 x 10.44 英寸(682 毫米 x 447 毫米 x 265.3 毫米),可轻松集成到标准服务器机架中。其坚固的结构确保了耐用性,同时优化了气流,这对于维持数据中心的稳定运行至关重要。6U 外形尺寸可实现高密度配置。

神达TYAN HG68-B8016-08前面板

每个节点的前面板均配备两个 RJ45 千兆 LAN 端口(LAN1 和 LAN2),支持 1 Gbps 速度。这些端口提供灵活的设置,允许冗余以确保持续的网络可用性或管理和数据的流量分离。此外,连接到基板管理控制器 (BMC) 的 D-Sub VGA 端口允许管理员远程访问系统的界面。

其他连接选项包括四个 USB 3.2 Gen 1 Type-A 端口,方便连接外围设备和外部存储设备,以及两个直接连接到 CPU 的 DisplayPort 1.2 输出,用于高分辨率视频输出。前面板还具有用于模拟输入/输出的音频插孔,这对于需要声音的监控任务非常有用。对于远程管理,IPMI LAN 端口通过智能平台管理接口提供专用访问,无需实际在场即可实现完整的系统监控和控制。最后,ID 按钮可让管理员快速识别大型服务器机架中的节点。

后面板让用户可以访问一系列 PCIe 插槽,并允许他们安装额外的组件,如网卡、GPU 或存储接口。这允许根据系统需要执行的操作进行大量自定义。两个冗余电源单元(PSU0 和 PSU1)也位于背面,这意味着即使一个发生故障,另一个也可以保持系统不间断运行,从而最大限度地减少停机时间。

在引擎盖下,MiTAC S8016 服务器主板构成了节点的核心。两个 80x38mm 风扇负责冷却,并确保 CPU 和内存模块之间的气流一致,以防止过热。配电和背板负责管理和稳定所有组件的电力输送。

MiTAC-TYAN-HG68-B8016-08内部

RAM DIMM 整齐地排列在 AMD CPU 插槽旁边,便于使用,并能实现最佳气流。它们就位于 CPU 插槽旁边,由安装在散热器上的专用风扇冷却,确保处理器保持最佳温度。

系统电源由 GPU 卡插槽旁边的 1+1 冗余 80 Plus 钛金级 PSU(位于后角)供电。这使得系统能够执行渲染、AI 处理或科学计算等计算密集型任务。

MiTAC TYAN HG68-B8016 显卡

总体而言,TYAN HG68-B8016 的制造质量非常适合其预期用途。机箱设计精良,一切都经久耐用,适合在云环境中长期使用。另一件引人注目的事情是服务器节点可冷通道维护,这意味着所有维护都可以从前端完成。

神达 TYAN HG68-B8016 性能

为了测试 MiTAC TYAN HG68-B8016 系统的功能,我们使用了以下基本规格:

  • 主机板: 泰安 S8016AGM2NR
  • 运行系统:Windows 10 64位
  • : Predator SSD GM7 M.2 1TB
  • 分辨率:1024 x 768 px

我们使用两款 4000 系列 AMD EPYC 处理器(EPYC 4564P 和 EPYC 4364P 型号)搭配各种 RAM 配置,测试了所有五个 MiTAC 服务器节点。每个节点都通过 BMC 和 RDP 接口进行远程访问。此设置允许通过 BMC 进行高效的硬件级管理,而 RDP 则支持每种配置的基准操作和性能数据收集。

规格 AMD EPYC 4564P AMD EPYC 4364P
核心/线程 16核/ 32线程 8核/ 16线程
基地时钟 4.5 GHz 4.5 GHz
最大升压时钟 高达5.7 GHz 高达5.4 GHz
L3缓存 64 MB 32 MB
TDP(热设计功率) 170W 105W

神通泰安 HG68-B8016 AMD 霄龙 4564P

我们的性能结果将使我们能够检查每个 CPU 在相同条件下的性能,并关注 CPU 在各种实际场景中对性能的影响,从 AI 推理任务到视频渲染和数据压缩。我们还将 NVIDIA A6000 GPU 整合到一个节点中,以显示特定工作负载下的图形性能。

搅拌机优化

首先是 Blender 基准测试,它使用开源 3D 建模和渲染应用程序来评估性能。基准测试测量每分钟处理的样本数量,分数越高表示性能越好。样本数量以每分钟为单位,分数越高越好。

在 Blender 结果中,我们测试的两类 CPU 的性能有明显区别。配备 AMD EPYC 4564P 的节点(节点 1-3)在所有测试场景和基准测试版本中始终显示更高的每分钟采样率。例如,在 Blender OptiX 4.0 的“怪物”场景中,这些节点每分钟可实现约 230 个样本。相比之下,配备 AMD EPYC 4364P 的节点(节点 4-5)在同一测试中每分钟可记录约 120 个样本。

分类 节点 1(AMD EPYC 4564P、32GB RAM、5200MHz) 节点 2(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 2(NVIDIA A6000 GPU、32GB RAM、4800MHz) 节点 3(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 4(AMD EPYC 4364P、32GB RAM、4800MHz) 节点 5(AMD EPYC 4364P、64GB RAM、4000MHz)
Blender OptiX 4.2
怪物 223.567 221.099 2381.519 221.513 115.871 115.472
旧货店 158.780 158.608 1461.651 158.816 81.232 81.585
课堂 111.575 110.718 1315.029 110.622 57.971 58.181

Blackmagic RAW 速度测试

我们还开始运行 Blackmagic 的 RAW 速度测试,该测试评估高分辨率视频播放中的 CPU 性能(对于 8K 视频处理等媒体密集型应用程序而言,这是一个关键指标)。在此测试中,AMD EPYC 4564P 节点(1-3)表现出色,在 91K CPU 测试中始终提供约 92-8 FPS。相比之下,AMD EPYC 4364P 节点(4-5)达到 57-58 FPS,性能明显下降。

对于提供高分辨率视频播放或云游戏服务的云提供商来说,这一差异凸显了 4564P 更有效地管理苛刻的视频工作负载的能力,确保在 8K 等更高分辨率下更流畅地播放。4364P 虽然仍然功能强大,但更适合视频播放性能不太重要或分辨率较低的场景,因此对于较轻的工作负载来说,它是一种更具成本效益的选择。

Blackmagic RAW 速度测试(越高越好) 节点 1(AMD EPYC 4564P、32GB RAM、5200MHz) 节点 2(AMD EPYC 4564P、NVIDIA A6000 32GB RAM、4800MHz) 节点 3(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 4(AMD EPYC 4364P、32GB RAM、4800MHz) 节点 5(AMD EPYC 4364P、64GB RAM、4000MHz)
8K 中央处理器 FPS 92 FPS 91 FPS 92 57帧/秒 58帧/秒
8K 图形处理器  无 169  无

7-Zip 压缩

7-Zip 基准测试衡量 CPU 处理数据压缩和解压缩任务的能力,这对于必须高效压缩和传输大量数据的云环境至关重要。此基准测试受益于更高的核心数量和更好的内存管理,使其成为比较不同 CPU 处理能力的宝贵测试。

结果显示,EPYC 4564P 节点 (1-3) 的表现明显优于 EPYC 4364P 节点 (4-5)。例如,节点 1 的总压缩率为 134.461 GIPS,而节点 4 则为 86.640 GIPS。同样,在解压缩方面,EPYC 4564P 以 218.800 GIPS 保持领先,而 EPYC 123.568P 为 4364 GIPS。这一巨大差距凸显出 4564P 处理器更适合需要快速数据压缩和解压缩的工作负载,例如云存储或备份解决方案。虽然 4364P 仍然表现不错,但它更适合峰值性能不那么重要的低强度工作负载。

7-Zip 压缩基准(越高越好) 节点 1(4564P、32GB RAM、5200MHz) 节点 2(4564P、32GB RAM、4800MHz) 节点 3(4564P、32GB RAM、4800MHz) 节点 4(4364P、32GB RAM、4800MHz) 节点 5(4364P、64GB RAM、4000MHz)
压缩
当前 CPU 使用率 2584% 2569% 2583% 1287% 1285%
电流额定值/使用 5.203 吉普斯 5.135 吉普斯 5.062 吉普斯 6.730 吉普斯 6.608 吉普斯
额定电流 134.461 吉普斯 131.947 吉普斯 130.764 吉普斯 86.640 吉普斯 87.502 吉普斯
产生的 CPU 使用率 2579% 2573% 2581% 1299% 1298%
结果评级/使用 5.167 吉普斯 5.066 吉普斯 5.041 吉普斯 6.656 吉普斯 6.743 吉普斯
结果评级 133.242 吉普斯 130.375 吉普斯 130.086 吉普斯 86.460 吉普斯 87.495 吉普斯
解压
当前 CPU 使用率 3020% 3008% 3043% 1596% 1587%
电流额定值/使用 7.245 吉普斯 7.156 吉普斯 7.167 吉普斯 7.741 吉普斯 7.761 吉普斯
额定电流 218.800 吉普斯 218.237 吉普斯 218.102 吉普斯 123.568 吉普斯 123.167 吉普斯
产生的 CPU 使用率 3055% 3040% 3056% 1581% 1582%
结果评级/使用 7.249 吉普斯 7.122 吉普斯 7.178 吉普斯 7.717 吉普斯 7.714 吉普斯
结果评级 221.470 吉普斯 216.479 吉普斯 219.328 吉普斯 122.025 吉普斯 122.058 吉普斯
总评分
总 CPU 使用率 2817% 2806% 2818% 1440% 1440%
总评分/使用情况 6.208 吉普斯 6.094 吉普斯 6.109 吉普斯 7.186 吉普斯 7.229 吉普斯
总评分 177.356 吉普斯 173.427 吉普斯 174.707 吉普斯 104.243 吉普斯 104.777 吉普斯

UL Procyon 人工智能推理

UL Procyon AI 推理基准 评估 CPU 处理 AI 模型推理的速度,这对于机器学习、实时数据分析和 AI 驱动服务等任务至关重要。推理时间越短,性能越好,这意味着处理器可以在更短的时间内处理更多与 AI 相关的功能。

在这里,AMD EPYC 4564P(节点 1-3)再次提供了比 EPYC 4364P(节点 4-5)更快的推理时间,尤其是在 YOLO V3 等模型中,其中节点 1 记录为 61.66 毫秒,而节点 4 为 107.12 毫秒。这一趋势也适用于其他模型,例如 ResNet 50 和 Inception V4,表明 EPYC 4564P 能够更有效地处理复杂的 AI 任务。这使其成为专注于 AI 工作负载的云提供商的理想选择,其中更快的模型推理可以改进实时分析、推荐和决策系统。EPYC 4364P 在其入门级产品中仍然提供了可观的性能,但更适合较轻的 AI 任务或优先考虑节省成本而不是速度的场景。

UL Procyon 平均推理时间(越低越好) 节点 1(AMD EPYC 4564P、32GB RAM、5200MHz) 节点 2(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 3(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 4(AMD EPYC 4364P、32GB RAM、4800MHz) 节点 5(AMD EPYC 4364P、64GB RAM、4000MHz)
移动网络 V3 1.20ms 1.18ms 1.18ms 0.95ms 0.91ms
残差网络 50 8.57ms 8.62ms 8.72ms 13.34ms 13.14ms
盗梦空间V4 26.55ms 26.51ms 26.94 40.46ms 39.37ms
深实验室V3 28.97ms 28.88ms 29.25ms 39.35ms 38.55ms
优洛V3 61.66ms 61.11ms 62.28ms 107.12ms 104.87ms
真实ESRGAN 3,217.42ms 3,240.89ms 3,244.35ms 4,846.26ms 4,751.87ms
总体得分 146 147  145 106 109

y 粉碎机

y-cruncher 基准测试 CPU 计算大量圆周率数字的效率,这是对多核、多线程处理能力的一个很好的压力测试。这使得它特别适合测量科学和云计算环境中常见的计算工作量,在这些环境中,处理大型数据集或复杂计算至关重要。自 2009 年推出以来,它已成为超频者和硬件爱好者的热门基准测试应用程序。

在此基准测试中,AMD EPYC 4564P 节点 (1-3) 的计算时间明显快于 EPYC 4364P 节点 (4-5)。例如,计算 1 亿位数字时,节点 1 需要 18.7 秒,而节点 4 则需要 24.95 秒。随着数字数量的增加,这种性能差距会越来越大,EPYC 4364P 计算 5 亿位数字所需的时间会更长。这凸显了 EPYC 4564P 在高需求、计算密集型任务方面的卓越效率,使其成为科学模拟、数据分析等工作负载或任何需要强大并行处理能力的应用程序的理想选择。与此同时,EPYC 4364P 虽然速度较慢,但​​在计算密集度较低的任务方面仍表现良好,为中等工作负载提供了更具成本效益的解决方案。

y 粉碎机
(总计算时间以秒为单位;越低越好)
节点 1(AMD EPYC 4564P、32GB RAM、5200MHz) 节点 2(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 3(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 4(AMD EPYC 4364P、32GB RAM、4800MHz) 节点 5(AMD EPYC 4364P、64GB RAM、4000MHz)
1亿位数字 18.703秒 19.202秒 19.223秒 24.951秒 24.849秒
2.5亿位数字 50.263秒 51.681秒 51.826秒 70.750秒 70.320秒
5亿位数字 109.403秒 112.434秒 112.805秒 156.884秒 155.585秒
10亿位数字 339.228秒

Geekbench 6

Geekbench 6 基准测试衡量不同平台上的整体系统性能,重点是 CPU 性能。基准测试为单核和多核性能提供单独的分数,全面了解处理器在不同工作负载下的性能。您可以在 Geekbench浏览器.

在单核测试中,AMD EPYC 4564P(节点 1-3)略胜于 EPYC 4364P(节点 4-5)。例如,节点 1 得分 3,041,而节点 4 得分 2,978。这种相对较近的差距表明,对于依赖单核性能的任务,例如较轻的工作负载或不充分利用多线程的特定应用程序,这两个 CPU 的性能都足够好。

然而,在多核测试中,差距明显扩大。EPYC 4564P 得分为 17,888(节点 1),而 EPYC 4364P(节点 4)得分为 14,495。这凸显了 EPYC 4564P 卓越的多核效率,使其更适合要求更高的云工作负载。

Geekbench 6(越高越好) 节点 1(AMD EPYC 4564P、32GB RAM、5200MHz) 节点 2(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 3(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 4(AMD EPYC 4364P、32GB RAM、4800MHz) 节点 5(AMD EPYC 4364P、64GB RAM、4000MHz)
CPU单核 3,041 3,029 3,019 2,978 2,977
CPU 多核 17,888 17,442 17,469 14,495 14,429

Maxon Cinebench 结果

  • Cinebench R23: 与其前代产品 R20 相比,它具有更长的测试时间来评估热节流,并包括多核和单核分数,以进行全面的 CPU 性能评估。
  • Cinebench 2024(R24): 最新版本具有苛刻的渲染任务,并针对现代 CPU 和扩展负载进行了优化,可提供多核和单核性能结果。

在 Cinebench R23 中,EPYC 4564P(节点 1)的多核性能达到 33,896 分,而 EPYC 4364P(节点 4)落后 18,329 分。这一巨大差异表明 EPYC 4564P 型号在处理需要多核性能的工作负载(例如 3D 渲染或高端视频处理)时效率更高。

同样,单核得分显示 EPYC 4564P 领先(尽管差距较小),节点 1 得分为 1,993 分,而节点 4 得分为 1,970 分。这表明两个 CPU 在单线程应用程序或任务方面的表现相似;然而,EPYC 4564P 仍然具有优势。

Cinebench 2024 的结果也呈现出类似的趋势,因为 EPYC 4564P 在多核任务中表现出色,但保持了更接近的单核性能。EPYC 4564P 更适合在媒体和内容密集型环境中执行复杂的渲染任务。

基准 CPU测试 节点 1(AMD EPYC 4564P、32GB RAM、5200MHz) 节点 2(AMD EPYC 4564P、NVIDIA A6000、32GB RAM、4800MHz) 节点 3(AMD EPYC 4564P、32GB RAM、4800MHz) 节点 4(AMD EPYC 4364P、32GB RAM、4800MHz) 节点 5(AMD EPYC 4364P、64GB RAM、4000MHz)
Cinebench R23 多核 33,896 分 33,569 分 33,555 分 18,329 分 18,528点
Cinebench R23 单核 1,993 分 1,990 分 1,996 分 1,970 分 1,975点
Cinebench 2024 多核 1,889 分 1,849 分 1,847 分 1,035 分 1,059 分
Cinebench 2024 单核 119 分 118 分 118 分 117 分 117 分
Cinebench 2024 GPU 17,382点

视频游戏托管

虽然该服务器平台的许多应用可能都是面向业务的,但我们不能忽视这样一个事实:MiTAC TYAN HG68-B8016 的架构使其成为视频游戏托管的绝佳选择。为了进行测试,我们将其中一个节点配置为我们的 Discord 社区的 Rust 服务器。

在运行像《存储评论官方月刊》这样的专用 Rust 服务器时,高单线程性能对于保持稳定的游戏玩法和低延迟至关重要。与许多多人在线游戏一样,Rust 严重依赖服务器端计算来跟踪玩家的动作、互动和游戏世界物理。必须快速处理这些计算,以确保玩家和服务器之间的顺畅同步。

虽然 Rust 使用多个 CPU 核心,但游戏中许多最重要的流程(例如处理玩家输入、战斗交互和实体物理)仍然严重依赖单线程性能。实际上,即使使用现代多核 CPU,单个核心的速度在服务器端性能中也起着重要作用,尤其是在管理大量玩家或复杂的游戏内活动时。

我们运行了 Storage Review Rust 服务器的整个清除周期,持续了一个月。在 Rust 中,清除周期是指服务器地图和玩家进度的完全重置,通常是为了刷新游戏世界并为所有玩家提供一个新的开始。

对于我们的设置,我们选择了 AMD EPYC 4564P,这是一款基本时钟频率为 16 GHz 的 4.5 核处理器。这一选择使我们能够始终实现较高的服务器端 FPS(大约 200-250),即使在玩家活动高峰期也能确保游戏响应迅速。在 Rust 中管理大型地图和大量玩家互动时,高单线程性能的重要性变得尤为明显,因为处理速度的任何下降都可能导致不同步、延迟或其他游戏问题,从而对玩家体验产生负面影响。

结语

MiTAC TYAN HG68-B8016 是一款高度灵活的平台,非常适合提供定制服务器配置的云提供商。其独立的节点架构允许五个节点中的每一个都根据客户要求进行定制,从而确保最大的灵活性。

MiTAC TYAN HG68-B8016 前机架

AMD EPYC 4004 CPU 提供出色的性能和能效,为提供商提供经济高效的解决方案,以平衡计算能力和运营费用。我们的测试显示,所有五个节点均具有一致的强劲性能,展示了该平台的可靠性和处理苛刻工作负载的能力,而不会受到影响。对于可以从 GPU 中受益的工作负载,这款 MiTAC 平台也涵盖了这些用例;我们在一个节点上测试了 A6000,结果非常出色。临时 Rust 服务器测试还验证了该平台处理我们向服务器提出的任何任务的能力。

根据我们的测试,这种灵活性、性能和效率的组合使 HG68-B8016 成为寻求满足不同客户需求的服务提供商的有力选择。

产品页

参与 StorageReview

电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅