NVIDIA RTX 4090 与 RTX 6000 Ada 对决——我们比较了两款截然不同但性能强大的戴尔系统,以了解这些 GPU 的表现如何。
为了探索不同的桌面架构如何处理 AI 工作负载,我们向戴尔提出了一个直接的要求:为我们提供其游戏和工作站系列中最强大的系统。目标是什么?确定针对消费者性能优化的顶级游戏台式机与为专业级任务设计的高端工作站在运行 AI 工作负载时有何不同——每台工作站都配备了同类最佳的 NVIDIA GPU。
戴尔交付了 Alienware的极光R16,代表了他们在 PC 游戏领域的巅峰。该系统是游戏和高性能消费应用的强大引擎,配备 NVIDIA RTX 4090 GPU、24GB GDDR6X 内存、Intel Core i9-14900KF 处理器和紧凑型设计。Aurora R16 的制造价格相对实惠,这不禁让人思考:专为游戏打造的系统是否也能应对 AI?
戴尔发送 精密5860 代表工作站系列,该系统专为重型专业用途而设计,包括我们预期的 AI 用例。这款工作站配备了 NVIDIA RTX 6000 Ada GPU,具有 48GB GDDR6 内存、Intel Xeon W7-2595X 处理器和 128GB ECC DDR5 内存,旨在处理复杂的计算密集型任务。然而,它的价格比 Aurora R4 高出约 16 倍,我们不得不问:它的专用硬件是否能证明 AI 工作负载的成本是合理的?
本文对这两个系统进行了比较,以揭示工作站的额外 GPU 内存、ECC RAM 和 CPU 性能对 AI 任务的影响有多大,以及游戏台式机是否可以为注重预算的 AI 爱好者提供可行的替代方案。
Dell Precision 5860 和 Alienware Aurora R16 规格
在这项任务中,我们并没有妄想认识到 Precision 5860 具有巨大的性能优势,它拥有两倍的 GDDR 内存、更多的 DRAM 插槽、更强大的 CPU……等等。我们的配置在测试时的价格约为 12 美元,而 Alienware 的配置则为 3 美元。在我们探索系统时,请记住这一点,并记住本文的目标是看看 Alienware 及其中的 RTX 4090 是否以及在哪些方面可以跟上更强大的 RTX 6000 Ada。
戴尔 Precision 5860 规格
处理器选项 | Intel Xeon “Sapphire Rapids” w3 至 w7,最高 26 颜色 |
运行系统 |
|
内存选项 | 高达 2TB DDR5-4800 ECC(8 个 DIMM 插槽) |
存储选项 |
|
图像 |
|
端口 | 接待:
背面:
|
光盘驱动器 | 可选薄型 DVD 刻录机 |
老虎机 |
|
尺寸 | 我们:
|
电源选项 |
|
保修政策 |
|
Dell Alienware Aurora R16 规格
元件 | |
---|---|
处理器 | Intel® Core™ i7-i9 14700-14900KF,20-24 核,5.4 至 6.0 GHz P 核热速度) |
运行系统 | Windows 11 家庭版或专业版,英语 |
图像 | NVIDIA® GeForce RTX™ 4060-4090,8-24 GB GDDR6X |
内存 | 16 – 64 GB DDR5,5200 – 5600 MT/s(2 个 DIMM 插槽) |
1-4 TB PCIe Gen 4 NVMe SSD | |
可编程电源 | 500W 或 1000W 白金级 PSU 选项 |
散热器 | 240mm 液冷 CPU |
端口(正面) |
|
端口(后部) |
|
音频 | Realtek 高性能音频芯片 (ALC1220) |
尺寸 |
|
Wi-Fi | 英特尔® Killer™ Wi-Fi 6E AX1675、2×2、802.11ax、MU-MIMO、蓝牙® 无线网卡 |
保修政策 | 远程诊断后提供 1 年基本现场服务(仅提供硬件支持) |
Dell Precision 5860 和 Dell Alienware Aurora R16 的构建和设计
Dell Precision 5860 工作站
从构建和设计开始,我们重新审视了 戴尔Precision 5860,之前评测过的一款工作站。前面板采用可持续的再生塑料和钢材混合物制成,保持了设备时尚一致的美感,同时提供了各种连接选项。以下是您将在前面找到的连接选项:
- 有两个 USB-A(5Gbps)和两个 USB-C(10Gbps)端口,其中一个带有 PowerShare,可在关机时为设备充电。
- 全尺寸 SD 卡读卡器和通用音频插孔。
- 超薄光驱和用于热插拔 NVMe 或 SATA 驱动器的可锁定柔性托架等可选功能增强了其专业级的多功能性。
- 电源按钮
现在,来看看设备的后部。高效的冷却和电源对于这种级别的系统至关重要。后面板具有宽阔的气流格栅,并提供 750W 或 1,350W 的电源选项,确保为高性能组件提供可靠的支持。在后面,您会发现连接选项:
- 1GbE 和 10GbE 以太网。
- 三个 USB-A(5Gbps)端口和三个 USB-C(10Gbps)端口。
- 音频线路输出,可选择通过 PCIe 扩展添加端口。
在设备内部,您会发现 Precision 5860 提供了出色的可维护性和定制选项,例如:
-
- 一个 Gen5 PCIe x16 插槽,最多支持双 NVIDIA RTX 6000 Ada GPU。
- 全高 Gen4 PCIe x16 插槽。
- (2)全高 Gen4 PCIe x8 插槽开放式。
- 全高 Gen4 PCIe x8 插槽(x4 电气),开放式。
- (2)M.2 2230/2280 PCIe NVMe Gen4 SSD 插槽。
- (2)用于 2.5/3.5 英寸 HDD/SSD 的 SATA 插槽。
- FCLGA4677 插槽采用带有 11 根热管的先进塔式散热器进行冷却,确保持续工作负载期间的热效率。
- 8 个 DDR5 内存插槽,支持 RDIMM 和 ECC。
Precision 5860 将企业级组件与出色的可扩展性相结合,具有 8 个 RAM 插槽和多种存储选项,包括 3.5 英寸和 2.5 英寸 HDD、SSD 和 NVMe 驱动器。它还支持多种 GPU,包括双 NVIDIA RTX 6000 Ada GPU,使其能够高度适应苛刻的工作负载。虽然系统的 PSU 和主板不可升级,但其强大的连接性、先进的冷却和对 ECC 内存的支持确保它仍然是企业环境中需要顶级性能和灵活性的用户的可靠、长期解决方案。
戴尔Alienware Aurora R16
现在,让我们来看看 Storagereview 的第二台新机——戴尔 Alienware R16。从外观上看,R16 保持了精致的设计,虽然不像典型的 Alienware 外观那样大胆,但仍保留了标志性的美感。它采用透明的有机玻璃侧面板,便于查看内部组件,并为 GPU 的下半部分提供通风。机箱尺寸如下:
- 高度:16.46毫米(418.00英寸)
- 宽度:7.75毫米(197.00英寸)
- 深度:18.05毫米(458.40英寸)
- 重量:33.89磅(15.37公斤)
将焦点转移到 R16 的前面板,它提供了可靠的连接端口选择,包括:
- 电源键(外星人头)
- 用于音频的全球耳机端口。
- 两个用于外围设备的 USB 3.2 Gen 1 (5Gbps) 端口。
- USB 3.2 Gen 1 (5Gbps) PowerShare 端口,允许在关机时充电。
- USB 3.2 Gen 2 Type-C(10Gbps)PowerShare 端口,可快速传输数据和充电。
RGB 照明区域照亮了后风扇、机箱侧面和 Alienware 徽标,进一步增强了其时尚的美感,为系统增添了个性化色彩。这些照明效果可通过 Alienware 控制中心轻松定制和管理,让用户可以个性化照明以匹配他们的风格或增强他们的游戏设置。
侧面板由透明有机玻璃制成,展示了系统的内部结构,包括:
- 240 毫米一体式液冷系统可确保英特尔处理器高效的热量管理。
- 后风扇、侧面板和 Alienware 标志上的 RGB 照明区域。
R16 的后面板具有一系列端口,确保游戏和高性能工作流程的多功能性:
- 音频端口:一个后置 L/R 环绕端口、一个光纤 S/PDIF、一个侧面 L/R 环绕端口、一个音频输入/麦克风、一个线路输出端口、一个同轴 S/PDIF、一个中置/低音炮 LFE 和一个线路输入。
- USB 端口:一个 USB 3.2 Gen 2 Type-C® (10Gbps)、一个 USB 3.2 Gen 2×2 Type-C (20Gbps)、两个带智能电源技术的 USB 2.0 Type-A、两个 USB 2.0 Type-A 和两个 USB 3.2 Gen 1 Type-A (5Gbps)。
- 网络:一个 RJ45 以太网端口(1GbE)和一个双自互补天线 (SCA) 端口,用于增强 Wi-Fi。
- 安全性:Kensington 安全电缆和挂锁插槽。
在内部,R16 提供以下配置:
- 英特尔酷睿 i7-14700F 至英特尔酷睿 i9-14900KF 处理器,提供多达 20-24 个内核和 68MB 缓存。
- NVIDIA GeForce RTX 4060 至 RTX 4090 显卡,配备高达 8-24GB 的 GDDR6X 内存,可确保要求苛刻的游戏和应用程序获得顶级图形性能。
- 1-4 TB PCIe NVMe SSD 可实现闪电般的快速存储和最短的加载时间。
- 500-1000W 白金级电源,与主板一样,不可升级,使其成为系统内的固定组件。
- 一体式 240 毫米液体冷却系统可确保在激烈的会议期间实现最佳的热管理。
- 两个 DDR5 RAM 插槽,最低配置为 16GB,可升级容量高达 64GB,频率为 5200-5600 MHz。
R16 结合了高端组件和可定制性能,非常适合家庭游戏和高水平创意工作。虽然系统的 PSU、主板和 RAM 不可升级,两个 RAM 插槽最多支持 64GB,但其性能使其成为寻求长期高性能解决方案的用户的理想选择。
Dell Precision 5860 Tower 和 Dell Alienware Aurora R16 基准测试
在我们查看基准测试之前,以下是我们测试的每个单元的配置。
规格 | 戴尔 Precision 5860 塔式 | 戴尔Alienware Aurora R16 |
---|---|---|
中央处理器 | 英特尔至强 w7-2595X(26 核 52 线程) | 英特尔 i9-14900KF(8P + 16E 核心 32 线程) |
CPU时钟速度 | 2.8 GHz(基本)4.8 GHz(加速) | 2.8 GHz(基本)4.8 GHz(加速) |
中央处理器热设计设计 | 250W(最小)300W(最大) | 125W(最小)253W(最大) |
内存 | 128GB DDR5(8x 16GB DDR5 Sk Hynix) | 32GB DDR5(2 个 16GB DDR5 金士顿 Fury Beast) |
RAM 时钟速度 | 5600 MHz | 5600 MHz |
GPU | NVIDIA RTX 6000 ADA | NVIDIA RTX 4090 |
GPU 内存大小 | 48 GB GDDR6 | 24 GB GDDR6X |
GPU内存带宽 | 960.0 GB /秒 | 1.01 TB / s |
GPU基本时钟 | 915 MHz | 2235 MHz |
GPU升压时钟 | 2505 MHz | 2520 MHz |
显卡热设计功耗 | 300W 瓦 | 450W 瓦 |
建议的电源 | 700W 瓦 | 850W 瓦 |
GPU 内存时钟 | 2500 MHz(有效20 Gbps) | 1313 MHz(有效21 Gbps) |
GPU 插槽宽度 | 双槽 | 三槽 |
GPU 长度 | 267毫米(10.5英寸) | 304毫米(12英寸) |
显卡宽度 | 112毫米(4.4英寸) | 137毫米(5.4英寸) |
主板芯片组 | W790 | Z690 |
运行系统 | Microsoft Windows 11 Pro | 微软 Windows 11 家庭版 |
2 个 SAMSUNG PM9A1 1TB M.2 SSD,RAID0 | 3 个 SAMSUNG PM9F1 1TB M.2 SSD(两个为 RAID0) |
Blender OptiX 4.0 / 4.1
混合器 是一款开源 3D 建模应用程序。此基准测试使用 Blender Benchmark 实用程序运行。分数以每分钟样本数计算,分数越高越好。
从数据来看,戴尔 Precision 在 CPU 性能方面表现出色。它在渲染怪物和垃圾店场景等任务上始终胜过戴尔 Alienware,使其更适合复杂的 CPU 密集型工作流程。Alienware 在 GPU 性能方面略胜一筹,在所有以 GPU 为中心的任务(例如教室和垃圾店场景)中提供更快的渲染时间。两款系统都能高效处理 GPU 任务,但对于优先考虑 GPU 渲染速度的用户来说,Alienware 更胜一筹。
搅拌机4.2.0 | 戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 Ada) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
中央处理器 | ||
怪物 | 270.71 | 211.69 |
旧货店 | 178.14 | 143.21 |
课堂 | 130.32 | 无 |
GPU | ||
怪物 | 5528.98 | 5593.47 |
旧货店 | 2576.73 | 2709.25 |
课堂 | 2661.92 | 2766.24 |
Geekbench 6
Geekbench 6 是衡量整体系统性能的跨平台基准测试。Geekbench 浏览器可让您将任何系统与其进行比较。
在 Geekbench 6 基准测试中,戴尔 Alienware 在单核 CPU 性能方面占据主导地位,得分为 3,061,而戴尔 Precision 为 2,112,这使其更适合依赖单个进程速度的任务。Alienware 在多核性能方面也占有明显优势,得分为 19,969,而 Precision 为 15,738,在需要多线程的任务(如渲染或模拟)中表现出色。在 GPU 性能方面,Alienware 再次领先,得分为 324,190,而 Precision 为 272,472,这使其更适合要求苛刻的图形任务。虽然 Precision 仍然表现良好,但 Alienware 的整体性能和速度使其成为需要快速、高性能计算来处理各种工作负载的用户的更好选择。
Geekbench 6 (越高越好) |
戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 ADA) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
CPU单核 | 2112 | 3061 |
CPU 多核 | 15,738 | 19,969 |
GPU | 272,472 | 324,190 |
Cinebench R23
这款 Cinebench R23 基准测试工具通过使用 Cinema 3D 引擎渲染复杂的 4D 场景来评估系统的 CPU 性能。它测量单核和多核性能,全面了解 CPU 处理 3D 渲染任务的能力。
Cinebench R23 结果显示,Dell Precision 在多核工作负载下的表现明显快于 Dell Alienware,使其能够更好地处理利用多个 CPU 核心的任务。然而,Alienware 在单核性能方面表现出明显优势,执行依赖单个核心速度的任务的速度比 Precision 快得多。多核扩展方面的差距进一步凸显了 Precision 在并行处理效率方面的主导地位,而 Alienware 则优先考虑原始单线程速度。
Cinebench R23(越高越好) | 戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 ADA) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
CPU 多核 | 41,255点 | 32,256点 |
CPU单核 | 1,375点 | 2,247点 |
MP比率 | 30.00点¯x | 14.35点¯x |
Cinebench 2024
Cinebench 2024 通过添加 GPU 性能评估来扩展 R23 的基准测试功能。它继续测试 CPU 性能,但也包括衡量 GPU 处理渲染任务能力的测试。
在 Cinebench 2024 测试结果中,戴尔 Precision 在多核 CPU 性能方面超越了戴尔 Alienware,在利用所有可用内核的工作负载中展现了强大的功能。但是,Alienware 提供了更快的单核性能,这使得它对于依赖单线程处理的任务明显更快。在 GPU 性能方面,Alienware 略胜一筹,完成渲染任务的速度略快于 Precision。多核比率进一步强调了 Precision 在跨内核扩展方面的效率,而 Alienware 更注重提供更高的单核速度和 GPU 渲染能力。
Cinebench R24(越高越好) | 戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 ADA) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
CPU多核 | 2,184点 | 1,922点 |
CPU 单核 | 82点 | 132点 |
GPU | 30,626点 | 33,149点 |
MP比率 | 26.72点¯x | 14.51点¯x |
y 粉碎机
y 粉碎机 是一款流行的基准测试和压力测试应用程序,于 2009 年推出。此测试是多线程且可扩展的,可计算 Pi 和其他高达万亿位的常数。在此测试中,速度越快越好。
Dell Precision 5860 Tower 在 y-cruncher 基准测试中的表现优于 Dell Alienware Aurora R16,因为它拥有专为专业计算密集型任务而设计的卓越硬件。主要区别在于:
- 处理器架构:Precision 配备 Intel Xeon w7-2595X,这是一款不带 P 核和 E 核的工作站级 CPU,专注于为计算任务提供一致的高性能多线程。相比之下,Alienware 的 Intel i9-14900KF 采用混合架构,P 核用于提高性能,E 核用于提高效率,在 y-cruncher 等高度并行的工作负载中可能无法很好地扩展。
- 核心数和 RAM:Precision 的 Xeon 处理器拥有更多内核 (26) 和线程 (52),使其更适合处理跨多个线程的大规模计算。此外,Precision 拥有 8 个 DIMM 插槽,RAM 为 128GB,比 Alienware 的 32GB 大得多,这对于在 y-cruncher 等基准测试中管理大型数据集至关重要。
总体而言,Precision 结合了具有更多内核和更高 RAM 容量的工作站级 CPU,使其能够更有效地处理 y-cruncher 的多线程需求,从而在所有测试中始终保持更快的性能。
y-cruncher (0.8.5.9)(越低越好) | 戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 ADA) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
1亿 | 12.463秒 | 20.470秒 |
2.5亿 | 38.014秒 | 58.020秒 |
5亿 | 84.884秒 | 131.515秒 |
10亿 | 189.168秒 | 无 |
25亿 | 566.895秒 | 无 |
Blackmagic磁盘速度测试
这款 Blackmagic磁盘速度测试 通过测量读写速度来评估存储性能,提供对系统处理视频编辑和大文件传输等数据密集型任务的能力的深入了解。
配备 NVME PM5860F9 Samsung 1 的 Dell Precision 10 Tower 在 Blackmagic Disk Speed Test 中写入速度达到 4943.5 MB/s,读取速度达到 4903.2 MB/s。这表明磁盘性能全面而高效,在写入密集型和读取密集型任务中均表现出色。
另一方面,配备 NVMe PM16A9 Samsung SSD 的戴尔 Alienware Aurora R1 的写入速度达到 3812.5 MB/s,读取速度达到 4839.8 MB/s。虽然写入性能落后,但其读取速度仍可与 Precision 5860 Tower 相媲美。
总体而言,Precision 5860 Tower 的写入速度更快,非常适合需要快速写入数据的任务。Alienware Aurora R16 的写入性能虽然稍弱,但读取速度仍然很快。两款系统的性能都很好,但 Precision 5860 更适合需要高速写入操作的混合工作负载。
Blackmagic RAW 速度测试
这款 Blackmagic RAW 速度测试 是一款性能基准测试工具,旨在衡量系统使用 Blackmagic RAW 编解码器处理视频播放和编辑的能力。它评估系统解码和播放高分辨率视频文件的能力,为基于 CPU 和 GPU 的处理提供帧速率。
在 Blackmagic 原始速度测试中,戴尔 Precision 5860 Tower 在 CPU 和 CUDA 测试中的表现优于 Alienware Aurora R16。Precision 5860 在 146K CPU 测试中达到 8 FPS,在 199K CUDA 测试中达到 8 FPS,而 Alienware Aurora 在 108K CPU 上达到 8 FPS,在 143K CUDA 上达到 8 FPS。Precision 5860 Tower 提供更快的原始性能,尤其是在 GPU 加速任务中。
7-ZIP
这款 7-Zip 压缩基准 评估压缩和解压缩任务期间的 CPU 性能,测量 GIPS(每秒千兆指令)和 CPU 使用率。更高的 GIPS 和高效的 CPU 使用率表明性能优越。
压缩性能
- Dell Precision 5860 Tower 的性能显著提高,总压缩率为 195.277 GIPS,CPU 利用率为 4448%,保持率为 4.374 GIPS。
- Dell Alienware Aurora R16 的压缩率为 133.024 GIPS,使用 1198% 的 CPU 和 11.129 GIPS 的单位使用率。虽然其单位使用率较高,但其整体吞吐量落后于 Precision。
减压性能
- Dell Precision 5860 Tower 在减压方面表现出色,总体评级达到 234.059 GIPS,CPU 使用率为 5029%,每使用率为 4.655 GIPS。
- 尽管性能强劲,戴尔 Alienware Aurora R16 仍略有不足,其解压等级为 193.905 GIPS,CPU 使用率为 3050%,每使用率为 6.359 GIPS。
总体结果
- Dell Precision 5860 Tower 的基准测试评分为 214.316 GIPS,总 CPU 使用率为 4739%,胜过 Alienware,凸显了其在压缩和解压缩任务中的优势。
- Dell Alienware Aurora R16 获得了可观的 163.464 GIPS 总体评级,总体 CPU 使用率为 2124%,但无法与 Precision 的更高效率和吞吐量相媲美。
7-Zip 压缩 | 戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 ADA) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
压缩 | ||
当前 CPU 使用率 | 4452% | 1147% |
电流额定值/使用 | 4.386 吉普斯 | 11.519 吉普斯 |
额定电流 | 195.277 吉普斯 | 132.11 吉普斯 |
产生的 CPU 使用率 | 4448% | 1198% |
结果评级/使用 | 4.374 吉普斯 | 11.129 吉普斯 |
结果评级 | 194.573 吉普斯 | 133.024 吉普斯 |
解压 | ||
当前 CPU 使用率 | 4946% | 3079% |
电流额定值/使用 | 4.658 吉普斯 | 6.153 吉普斯 |
额定电流 | 230.385 吉普斯 | 189.482 吉普斯 |
产生的 CPU 使用率 | 5029% | 3050% |
结果评级/使用 | 4.655 吉普斯 | 6.359 吉普斯 |
结果评级 | 234.059 吉普斯 | 193.905 吉普斯 |
总评分 | ||
总 CPU 使用率 | 4739% | 2124% |
总评分/使用情况 | 4.514 吉普斯 | 8.744 吉普斯 |
总评分 | 214.316 吉普斯 | 163.464 吉普斯 |
辛烷值台
接下来我们看看 辛烷值台,OctaneRender 的基准测试实用程序,OctaneRender 是另一个与 V-Ray 类似且支持 RTX 的 3D 渲染器。
在 OctaneBench 测试结果中,戴尔 Alienware 在大多数测试中的表现都优于戴尔 Precision,在各种渲染任务中的得分更高。例如,Alienware 在内部路径追踪中的得分为 172.21,而 Precision 的得分为 153.13。Alienware 在直接照明和信息通道等其他类别中也处于领先地位,显示出其整体 GPU 性能更强。虽然 Precision 在某些领域(例如 ATV 路径追踪)不相上下,但 Alienware 始终处于领先地位,使其成为依赖 GPU 能力的渲染任务的更快选择。
OctaneBench(分数,越高越好) | 戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 ADA) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
室内情况 | 44.33 | 46.55 |
直接照明 | 123.05 | 135.00 |
路径追踪 | 153.13 | 172.21 |
主意 | 26.24 | 27.57 |
直接照明 | 97.72 | 106.92 |
路径追踪 | 118.20 | 130.70 |
全地形越野车 | 66.03 | 70.77 |
直接照明 | 124.53 | 143.15 |
路径追踪 | 157.93 | 182.26 |
盒子 | 36.17 | 38.29 |
直接照明 | 117.88 | 129.86 |
路径追踪 | 130.71 | 145.51 |
SPECviewperf 2020年
我们的下一个测试是 SPECviewperf 2020年这是在 OpenGL 和 Direct X 应用程序编程接口下测量专业应用程序图形性能的全球标准。视图集(或基准)表示实际应用程序中的图形内容和行为,而无需安装应用程序本身。去年年底,该基准的最新版本进行了重大更新,包括从最新版本的 3ds Max、Catia、Maya 和 Solidworks 应用程序的轨迹中获取的新视图集。此外,他们在所有视图集中添加了对 2K 和 4K 分辨率显示器的支持。
在 SPECviewperf2020 Viewsets 基准测试中,戴尔 Alienware 在大多数测试类别中的表现通常优于戴尔 Precision,表明其在处理复杂的 3D 渲染任务方面具有出色的能力。例如,在 Maya-06 中,Alienware 得分为 576.9,而 Precision 得分为 486.41,表明其在图形密集型应用程序中的性能更佳。然而,Precision 在 3dsmax-07 和 Creo-03 等领域的表现优于 Alienware,表明其在特定 3D 建模软件方面的优势。Alienware 在各种渲染任务中提供了更一致的性能优势。
SPECviewperf 2020 视图集(越高越好) | 戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 ADA) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
3dsmax-07 | 213.87 | 225.11 |
卡地亚-06 | 116.78 | 94.32 |
Creo-03 | 149.36 | 143.75 |
能量-03 | 83.84 | 66.18 |
玛雅06 | 486.41 | 576.9 |
医疗-03 | 127.86 | 37.6 |
SNX-04 | 898.04 | 46.47 |
Solidworks-05 | 291.59 | 263.42 |
规格工作站 3
SPEC工作站3 专门用于测试工作站性能所有关键方面的基准测试。它使用超过 30 个工作负载来测试 CPU、图形、I/O 和内存带宽。工作负载分为更广泛的类别,例如媒体和娱乐、金融服务、产品开发、能源、生命科学和一般运营。我们将列出每个大类结果,而不是单个工作负载。结果是每个类别中所有单个工作负载的平均值。
Dell Precision 在多个类别中的表现均优于 Dell Alienware,尤其是在生命科学领域,其得分为 8.38,而 Alienware 的得分为 5.18。Precision 在媒体和娱乐、产品开发和金融服务方面也处于领先地位。然而,Alienware 在 GPU 计算方面确实领先,得分为 11.24,略高于 Precision 的 10.51。Precision 在更多样化的工作负载方面表现出色,而 Alienware 在以 GPU 为中心的任务方面表现出色。
SPECworkstation 3(越高越好) | 戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 ADA) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
媒体和娱乐 | 6.2 | 5.87 |
产品开发 | 6.18 | 5.42 |
生命科学 | 8.38 | 5.18 |
金融服务 | 7.63 | 6.51 |
新能源 | 无 | 6.51 |
常规操作 | 3.01 | 3.2 |
GPU计算 | 10.51 | 11.24 |
乐士马克
我们使用的另一个 3D 基准是 勒克斯马克,一个 OpenCL GPU 基准测试实用程序。
大厅长凳:评估 GPU 处理复杂 3D 场景和动态照明的能力的测试。
食品:一种更复杂的测试,使用强光和阴影处理详细的 3D 对象和纹理。
在 LuxMark 基准测试中,戴尔 Alienware 在两个测试类别中的表现都优于戴尔 Precision。在 Hallbench 测试中,Alienware 得分为 38,998,超过 Precision 的 31,654。食品测试也呈现出同样的趋势,Alienware 得分为 16,825,而 Precision 得分为 14,487。总体而言,Alienware 的 GPU 性能更强,尤其是在渲染任务中。
LuxMark(越高越好) | 戴尔 Precision 5860 塔式机(英特尔至强 w7-2595X、128GB、NVIDIA RTX 6000 ADA) | 戴尔 Alienware Aurora R16(英特尔 i9-14900KF、32GB、NVIDIA GeForce RTX 4090) |
---|---|---|
大厅长凳 | 31,654 | 38,998 |
食品 | 14,487 | 16,825 |
UL Procyon 人工智能推理
UL Procyon AI 推理旨在衡量工作站在专业应用中的性能。需要注意的是,这个测试并没有利用多CPU能力。具体来说,该工具对工作站处理人工智能驱动的任务和工作流程的能力进行了基准测试,提供了对其处理复杂人工智能算法和应用程序的效率和速度的详细评估。
在 UL Procyon 平均推理时间基准测试中,戴尔 Alienware Aurora R16 在各种机器学习模型中的表现始终优于戴尔 Precision 5860 Tower。使用 TensorRT 时,Alienware 在 MobileNet V3(0.45 毫秒)和 ResNet 50(1.02 毫秒)等模型中表现出色,推理时间最快。Precision 5860 的结果较慢,尤其是在 Real-ESRGAN 等模型中,Alienware 的完成速度明显更快。总体而言,Alienware 在 AI 和深度学习任务中表现出色,尤其是在 GPU 加速推理方面。
UL Procyon 平均推理时间(毫秒,越低越好) | 移动网络 V3 | 残差网络 50 | 盗梦空间V4 | 深实验室V3 | 优洛V3 | 真实ESRGAN | 总体得分 |
---|---|---|---|---|---|---|---|
Dell Precision 5860 Tower(Windows ML – 英特尔) | 1.28 | 7.36 | 22.51 | 28.18 | 37.77 | 1,699.41 | 185 |
戴尔 Precision 5860 塔式机 (Windows ML – Nvidia) | 0.57 | 0.96 | 2.22 | 38.08 | 7.27 | 79.07 | 915 |
戴尔 Precision 5860 塔式机 (Tensor RT) | 0.44 | 1.06 | 3.05 | 2.52 | 2.86 | 88.59 | 1,603 |
戴尔 Alienware Aurora R16(Windows ML – 英特尔) | 0.98 | 7.94 | 23.20 | 26.95 | 54.68 | 2,518.94 | 168 |
戴尔 Alienware Aurora R16(Windows ML – Nvidia) | 0.43 | 0.91 | 2.19 | 31.23 | 4.34 | 56.24 | 1,155 |
戴尔 Alienware Aurora R16 (Tensor RT) | 0.45 | 1.02 | 2.97 | 3.12 | 3.21 | 59.95 | 1,637 |
黄玉视频 AI
我们在测试过程中添加了一项新工作负载,重点关注运行以下平台的平台的性能: 黄玉视频 AI 增强扫描的影片。我们有一些之前出土的 1947 年美国公开赛的镜头。虽然官方的历史镜头都是黑白的,但在扫描一些家庭电影时,我们发现了许多球员全天练习和射击的镜头,包括 Lew Worsham 的制胜推杆。原始镜头是 8 毫米胶片,平均帧率为 16FPS,是手动拍摄的。这段镜头是由 Kevin 的祖母录制的,为在圣路易斯举行的这场锦标赛提供了独特的视角。
我们选择处理的文件时长 8 分钟,大小为 14.6GB。我们将文件导入 Topaz Video AI,选择通用视频增强算法 Proteus,并将帧率提高到 23.97FPS。然后对作业进行批处理,处理时间就是最终得分。
Alienware R4090 内的 NVIDIA RTX 16 以大约 7FPS 的速度处理视频,总处理时间为 27 分 58 秒。Precision 6000 内的 RTX 5860 Ada 跟不上,平均处理速度约为 5FPS,总时间为 41 分 12 秒。
Topaz Video AI 套件还具有板载基准测试,用于测量系统在不同视频增强算法中的性能。我们用它来比较 NVIDIA RTX 6000 Ada 和 RTX 4090。
从 NVIDIA RTX 4090 开始,经测试,Proteus 配置在 40.89X 时的处理率为 1FPS,18.60X 时的处理率为 2FPS,5.38X 时的处理率为 4FPS,视频源为 1080P。
相比之下,RTX 6000 Ada 在 42.86X 时以较高的 1FPS 速率开始,但在 15.61X 时逐渐下降到 2FPS,在 3.81X 时逐渐下降到 4FPS。
为 AI 选择合适的 GPU:NVIDIA RTX 4090 与 RTX 6000 Ada
正如我们在许多基准测试中看到的那样,面向消费者的 NVIDIA RTX 4090 和面向企业的 RTX 6000 Ada 之间的根本区别在于它们的功率预算和时钟速度。RTX 4090 在超频前以更高的时钟速度运行,功率预算高达 600W,这使其在单线程工作负载方面异常强大。这种激进的功率配置使其能够比工作站同类产品更快地处理特定工作负载。
然而,RTX 6000 Ada 的 48GB VRAM(是 4090 的两倍)为特定工作流程提供了显著的优势。这种更大的内存容量可以运行更大的 AI 模型。虽然你可以从存储中按顺序加载更大的模型,但更大的 VRAM 仍然允许更高的吞吐量(tok/s)和使用 vLLM 或 Nvidia 的 NIM 微服务进行有效批处理。
GPU 性能的一个被忽视的方面是不同的工作负载如何利用并行处理能力。视频处理是一个很好的例子,说明为什么更多的 VRAM 并不总是意味着更好的性能。许多视频处理任务本质上是连续的,帧之间的依赖关系限制了并行执行。在我们的 Topaz 测试中,这种限制变得明显,因为 RTX 4090 的更高时钟速度导致完成任务比 RTX 10 Ada 快 6000 分钟,尽管 VRAM 较少。
这种行为是由视频处理管道的性质决定的。虽然某些操作(如调色)可以有效地并行化,但其他操作(如时间降噪或帧插值)由于帧与帧之间的依赖关系而需要顺序处理。这些依赖关系造成了瓶颈,即额外的 VRAM 无法弥补原始处理速度。
我们可以看到游戏工作负载也出现了类似的下降。高分辨率游戏通常会消耗更多 VRAM,从而允许加载更重要的资源。不过,大多数游戏不会消耗 24 上的全部 4090GB VRAM。
RTX 6000 Ada 凭借其 vGPU 功能在企业环境中脱颖而出。NVIDIA 官方支持该卡上的虚拟 GPU 功能,允许组织将 48GB VRAM 划分到多个虚拟机中。此功能对于提供基于云的 CAD 和 3D 渲染服务的工程公司和 SaaS 提供商尤其有价值。RTX 4090 虽然功能强大,但缺乏对此类虚拟化的官方支持,限制了其在企业部署中的灵活性。
这些 GPU 的物理实现方式在部署选项方面存在显著差异。RTX 4090 的高功耗需要大量冷却解决方案,通常需要 3-3.5 个带有前置风扇的插槽空间。这种设计使得在标准工作站或服务器配置中实施起来具有挑战性。
相比之下,RTX 6000 Ada 的 300W 功率范围允许采用更传统的 2 槽鼓风机设计,使其成为工作站或服务器部署的理想选择。惠普和 Peuget Systems 等一些供应商提供官方支持的 4-GPU 配置,并且这些卡可以轻松集成到标准的 10-GPU 服务器机箱中。这种标准化对于可靠性和支持至关重要的企业环境至关重要。
从规模上看,A6000 在几个关键领域表现出明显的优势:功率密度、热管理、可靠性和供应商支持。这些因素在数据中心环境中变得越来越重要,因为数据中心环境中的稳定性和可预测性比原始性能指标更重要。官方支持渠道和企业级功能使 A6000 成为需要专业级可靠性和支持合同的组织的更合适选择。
这些 GPU 之间的选择最终取决于具体用例和操作要求。虽然 RTX 4090 在特定工作负载的原始性能方面表现出色,但 A6000 的企业功能和部署灵活性使其成为需要稳定性、虚拟化和官方支持渠道的专业环境的首选。
结语
比较戴尔 Alienware Aurora R16 和 Precision 5860 时,很明显,这些系统之间的选择取决于您的特定 AI 工作负载和预算。Alienware Aurora R16 配备 NVIDIA RTX 4090 GPU 和消费级组件,可为 GPU 密集型任务提供出色的原始性能。其经济实惠和令人印象深刻的单线程性能使其成为小规模 AI 项目、视频处理和 GPU 密集型应用程序的可行选择,在这些应用程序中高时钟速度和带宽至关重要。
然而,戴尔 Precision 5860 展示了为什么工作站级系统的价格更高。凭借 NVIDIA RTX 6000 Ada 的 48GB GDDR6 内存、更多 CPU 内核以及支持高达 2TB 的 ECC RAM,Precision 在需要大规模并行处理、稳定性和长期可靠性的场景中表现出色。它特别适合运行大型 AI 模型、处理大量数据集或部署虚拟 GPU 工作负载的企业。对于想要在 Precision 台式机中使用英特尔 14900K 的客户, 3680 支持该 CPU,并扩展可能受益于该 CPU 的工作负载的单核性能。除了性能之外,Dell Precision 系列还具有许多优势,包括经过认证的驱动程序。
对于精打细算的爱好者或尝试 AI 的组织,搭配 NVIDIA RTX 16 的 Alienware Aurora R4090 提供了一个易于入门且性能不打折扣的产品。然而,配备一个或两个 NVIDIA RTX 5860 Ada GPU 的 Dell Precision 6000 提供了所需的稳健性、可扩展性和企业级支持,可有效处理数据密集型环境中专业人士或企业最苛刻的 AI 工作流程。
最终,正确的选择取决于您的工作量、对妥协的容忍度和预算。戴尔在这两个方面都提供了令人信服的解决方案,证明无论您需要的是消费者级性能还是专业级可靠性,都有适合您的 AI 需求的系统。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅