主页 电子消费品客户端配件 NVIDIA RTX A4000 评测

NVIDIA RTX A4000 评测

by 莱尔·史密斯
系统背面的 NVIDIA RTX A4000

NVIDIA RTX A4000 是该公司最新桌面专业 GPU 系列的一部分,适用于需要高性能实时光线追踪、AI 加速计算和高性能图形的桌面工作站。 利用第二代 RTX 架构,NVIDIA 声称 A4000 是市场上面向专业人士的最强大的单槽 GPU。

NVIDIA RTX A4000 是该公司最新桌面专业 GPU 系列的一部分,适用于需要高性能实时光线追踪、AI 加速计算和高性能图形的桌面工作站。 利用第二代 RTX 架构,NVIDIA 声称 A4000 是市场上面向专业人士的最强大的单槽 GPU。

系统中的 NVIDIA RTX A4000

A4000 位于 RTX A5000 的正后方, RTX-A6000 在 NVIDIA 的新系列专业 RTX 卡中,具有 48 个 RT 核心(2nd gen)、192 个第三代 Tensor 核心和 6,144 个 CUDA 核心以及 16 GB 显存。 虽然 NVIDIA 放弃了 Quadro 名称以区分其专业产品线,但 RTX A4000 仍具有与 Quadro 产品线相同的专业功能、硬件和软件认证以及经过认证的驱动程序。

NVIDIA RTX A4000风扇视图

对于连接性,4.4 英寸高 x 9.5 英寸长的 A4000 具有四个 DisplayPort 1.4a 端口和常用的 1 个 6 针 PCIe 电源端口。 通风沿着每个 DisplayPort 的顶部和卡的正面运行,而较小的风扇位于另一侧。

NVIDIA RTX A4000 端口

NVIDIA RTX A4000 与 Quadro RTX 4000

NVIDIA 认为 RTX A4000 是 四核RTX 4000,一张老化的卡,在本次审查时已经使用了几年。 在我们 2019 年的评测中,RTX 4000 作为一款入门级显卡展示了一些令人印象深刻的性能,使其成为该公司令人印象深刻的产品组合的重要补充,同时发布时的价格仅为 900 美元左右。 也就是说,随着 NVIDIA 最近在其 GPU 架构方面取得的进步,我们总是很高兴看到他们为工作站级卡存储的内容。

NVIDIA RTX A4000 电源端口

您马上就会看到 A4000 将 Quadro 卡的 GPU 内存增加了一倍,达到 16GB,同时几乎将 CUDA 核心数量增加了三倍。 再加上内存带宽 (448GB/s) 的轻微增加,新的 A4000 看起来已经好得多了。 这些规格使其更符合 NVIDIA 的高性能桌面消费卡 RTX 3070。

NVIDIA安培

正如我们在我们的 RTX A6000 评测,公司下一代专业显卡最重要的升级是 NVIDIA安培. 这就是性能真正飞跃的地方。 这种新架构的亮点在于利用三星的 8 纳米 NVIDIA 定制工艺和 28 亿个晶体管。 它还具有改进的流式多处理器和第二代光线追踪核心(提高光线追踪硬件加速)和第三代张量核心,后者提高了 AI 推理性能和 DLSS,从而在更高分辨率下获得更好的性能。

与上一代模型相比,Ampere 架构还将 CUDA 内核增加了两倍的单精度浮点数。 这意味着在 3D 模型开发和计算机辅助工程桌面模拟等任务方面的性能显着提高。

NVIDIA RTX A3 提供 4000 年保修,根据品牌的不同,售价约为 2,000 美元。

NVIDIA RTX A4000 规格

显存 16 GB GDDR6
记忆体介面 256 bit
记忆体频宽 448 GB /秒
纠错码 (ECC) Yes
基于 NVIDIA Ampere 架构的 CUDA 内核 6,144
NVIDIA 第三代 Tensor Cores 192
NVIDIA 第二代 RT Cores 48
单精度性能 19.2 TFLOPS3
RT 核心性能 37.4 万亿次浮点运算3
张量性能 153.4 万亿次浮点运算4
系统介面 PCI Express 4.0x16
能量消耗 总板功率:140 W
散热解决方案 现有的
外形尺寸 4.4” 高 x 9.5” 长,

单槽

显示连接器 4 个显示端口 1.4a
最大同时显示 4x 4096 x 2160 @ 120 赫兹,

4x 5120 x 2880 @ 60 赫兹,

2x 7680 x 4320 @ 60 赫兹

电源连接器 1 个 6 针 PCIe
编码/解码引擎 1x 编码,1x 解码(+AV1 解码)
VR就绪 Yes
图形 API DirectX 12.075,着色器模型 5.175,

OpenGL 4.686,凡尔康 1.26

计算 API CUDA、DirectCompute、OpenCL™

英伟达 RTX A4000 性能

为了衡量其性能,我们对 RTX A4000 进行了一系列资源密集型测试,并将其与更高级别的 RTX A6000 进行了比较,以向您展示第二代 RTX 架构频谱两端的差异。 我们将 A4000 和 A6000 安装在一个 联想ThinkStation P620惠普 ZCentral 4R 供测试用。

惠普 ZCentral 4R:

  • Intel Xeon 2295(3.0 GHz 基本频率,采用 Intel vPro 技术最高可达 4.6 GHz)
  • 64GB DDR4-2933 ECC 内存
  • 1TB M.2 SSD

联想 ThinkStation P620:

  • AMD Ryzen Threadripper Pro 3995WX 处理器(2.70 GHz,最高 4.20 GHz Max Boost,64 核,128 线程,32 MB 缓存)
  • DDR64 RAM的4GB
  • 1TB PM981 固态硬盘

SPECviewperf 2020年

首先是 SPECviewperf 2020 基准测试,这是衡量在 OpenGL 和 Direct X 应用程序编程接口下运行的专业应用程序图形性能的全球标准。 视图集(或基准)表示来自实际应用程序的图形内容和行为,而无需自己安装应用程序。 这些视图集包括 3D Max、CATIA、Creo、Energy、Maya、Medical、Siemens NX 和 Solidworks。

视图集 NVIDIA公司
RTX 4000 联想 ThinkStation P620
英伟达 RTX A4000
惠普 ZCentral 4R
英伟达 RTX A6000 联想ThinkStation P620 NVIDIA RTX
A6000
惠普 ZCentral 4R
3dsmax-07 90.29 90.8 131.96 127.89
卡地亚-06 67.54 58.75 90.99 75.32
Creo-03 103.84 90.65 125.88 99.54
能量-03 21.97 22.16 42.22 38.83
玛雅06 224.81 215.15 314.82 273.01
医疗-03 22.55 21.53 34.87 30.58
SNX-04 322.7 328.37 450.72 422.01
SW-05 107.06 108.76 161.4 152.19

对于此基准测试,由于采用了新的 Ampere 架构,RTX A4000 在 Lenovo 和 HP 系统中均表现出出色的性能(结果非常相似)。 您会在我们的其他基准测试中注意到相同的趋势。

尽管高端型号 (A6000) 的性能差异有时很明显,但 A4000 仍然可以为最密集的用例提供充足的性能。

接下来,我们运行了 SPECworkstation3,这是一项专门用于测试工作站性能所有关键方面的基准测试; 它使用 30 多个工作负载来测试 CPU、图形、I/O 和内存带宽。 工作负载属于更广泛的类别,例如媒体和娱乐、金融服务、产品开发、能源、生命科学和一般运营。 我们将列出每个类别的大类结果,而不是单独的工作负载。 结果是每个类别中所有单个工作负载的平均值。

SPEC工作站3

产品类别 NVIDIA RTX A4000 联想 ThinkStation P620 NVIDIA RTX
A4000
惠普 ZCentral 4R
NVIDIA RTX A6000 联想 ThinkStation P620 NVIDIA RTX A6000 HP ZCentral 4R
5.87 3.37 6.04 3.49
产品开发 5.01 3.35 5.49 3.63
生命科学 3.99 3.51 4.61 3.76
新能源 4.68 2.58 5.58 2.79
FSI 9.46 3.96 9.49 3.38
通用操作 2.2 1.59 2.14 1.63
GPU计算 5.25 5.19 7.44 7.22

总体而言,我们看到将 A4000 安装在 P620 内部时的性能更令人印象深刻,有时甚至可以提供与 A6000 相似甚至更好的结果(特别是一般运营和金融服务类别)。 当安装在 HP ZCentral 工作站内时,A4000 显示的数字明显较低,但 GPU 计算类别除外。

环境系统研究所 (Esri)

接下来是环境系统研究所 (Esri) 基准。 Esri 是地理信息系统 (GIS) 软件的供应商,而他们的性能团队设计了他们的 PerfTool 插件脚本来自动启动 ArcGIS Pro。

此应用程序使用“ZoomToBookmarks”功能浏览各种预定义的书签,并创建一个日志文件,其中包含预测用户体验所需的所有关键数据点。 该脚本自动循环书签三次以说明缓存(内存和磁盘缓存)。 换句话说,该基准模拟了人们可能会通过 Esri 的 ArcGIS Pro 软件看到的大量图形使用。

测试由三个主要数据集组成。 两个是宾夕法尼亚州费城和魁北克省蒙特利尔的 3-D 城市景观。 这些城市视图包含覆盖在地形模型和覆盖航拍图像上的带纹理的 3-D 多面体建筑物。 第三个数据集是波特兰或地区的二维地图视图。 此数据包含有关道路、土地利用地块、公园和学校、河流、湖泊和山丘阴影地形的详细信息。

首先是蒙特利尔。 在这里,RTX A4000 在 P471.31 中达到了 194.66 的平均 FPS 和 620 的最低 FPS。 HP ZCentral 4R 配置显示平均 FPS 为 349.32,最低 FPS 为 167.86。

ESRI ArcGIS Pro 2.3 蒙特利尔
平均 FPS
NVIDIA RTX A4000(ThinkStation P620) 471.31
NVIDIA RTX A4000(HP ZCentral 4R) 349.32
英伟达 RTX A6000 614.03
最低帧率
NVIDIA RTX A4000(ThinkStation P620) 194.66
NVIDIA RTX A4000(HP ZCentral 4R) 167.86
英伟达 RTX A6000 238.18

接下来是费城。 在这里,RTX A4000 的平均 FPS 为 323.15,P164.68 的最低 FPS 为 620。 HP ZCentral 4R 配置显示平均和最低 FPS 分别为 363.24 和 202.02。

ESRI ArcGIS Pro 2.3 费城
平均 FPS
NVIDIA RTX A4000(ThinkStation P620) 323.15
NVIDIA RTX A4000(HP ZCentral 4R) 363.24
英伟达 RTX A6000 542.70
最低帧率
NVIDIA RTX A4000(ThinkStation P620) 164.68
NVIDIA RTX A4000(HP ZCentral 4R) 202.02
英伟达 RTX A6000 237.54

我们的最后一个模型是波特兰,其中 RTX A4000 的平均 FPS 为 2,305.81,P790.43 内的最低 FPS 为 620。 HP ZCentral 4R 配置显示平均和最低 FPS 分别为 1,694.04 和 637.65。

ESRI ArcGIS Pro 2.3 波特兰
平均 FPS
NVIDIA RTX A4000(ThinkStation P620) 2,305.81
NVIDIA RTX A4000(HP ZCentral 4R) 1,694.04
英伟达 RTX A6000 2,756.82
最低帧率
NVIDIA RTX A4000(ThinkStation P620) 790.43
NVIDIA RTX A4000(HP ZCentral 4R) 637.65
英伟达 RTX A6000 906.17

混合器

接下来是无处不在的 Blender,这是一款开源 3D 建模应用程序。 该基准测试是使用 Blender Benchmark 实用程序运行的。 NVIDIA OptiX 是选择的渲染方法,而不是 CUDA,因为 A4000(如更高端的 A6000)可以使用 RTX。 在这个以秒为单位的基准测试中,越低越好。

虽然 A6000 安装在 P620 和 HP ZCentral 4R 中时速度几乎是原来的两倍,但这是意料之中的,A4000 仍然显示出同类产品的下一代结果。

勒克斯马克

LuxMark 是开源 3D 渲染引擎 LuxRender 维护人员的 OpenCL 跨平台基准测试工具。 该工具着眼于 3D 建模、照明和视频工作领域的 GPU 性能。 对于这次审查,我们使用了最新版本 v4alpha0。 在 LuxMark 中,分数越高越好。

在联想 P620 内部,RTX A4000 在食物渲染类别中得分为 4,627,而 Hallbench 得分为 12,314。 这些落后于大多数测试驱动器,但同样,结果仍然不错,因为其他测试的 GPU 配备了更高性能的组件。

在 HP ZCentral 4R 中,RTX A4000 在食品和 Hallbench 类别中的得分分别为 12,117 和 4,540。

辛烷值台

最后,我们看看 OctaneBench。 这是 OctaneRender 和另一个支持 RTX 的 3D 渲染器(类似于 V-Ray)的基准测试实用程序。

RTX A4000总分:392.47
联想ThinkStation P620
 现场 核心 毫秒/秒 长宽比  重量  评分
内部(由 Julia Lynen 设计) 资讯频道 239.64 4.651 10 11.63
内部(由 Julia Lynen 设计) 直接照明 71.47 4.015 40 40.15
内部(由 Julia Lynen 设计) 路径追踪 35.13 4.113 50 51.41
想法(胡里奥·卡耶塔诺) 资讯频道 247.17 2.874 10 7.19
想法(胡里奥·卡耶塔诺) 直接照明 66.43 3.156 40 31.56
想法(胡里奥·卡耶塔诺) 路径追踪 60.06 3.099 50 38.74
亚视(于尔根·阿列克谢耶夫) 资讯频道 223.54 7.121 10 17.80
亚视(于尔根·阿列克谢耶夫) 直接照明 67.25 4.421 40 44.21
亚视(于尔根·阿列克谢耶夫) 路径追踪 57.24 4.430 50 55.38
盒子(Enrico Cerica 设计) 资讯频道 259.13 3.941 10 9.85
盒子(Enrico Cerica 设计) 直接照明 55.13 3.983 40 39.83
盒子(Enrico Cerica 设计) 路径追踪 48.12 3.578 50 44.72

 

RTX A4000总分:391.72
惠普 ZCentral 4R
现场  核心 毫秒/秒 长宽比  重量  评分
内部(由 Julia Lynen 设计) 资讯频道 238.19 4.623 10 11.56
内部(由 Julia Lynen 设计) 直接照明 71.49 4.017 40 40.17
内部(由 Julia Lynen 设计) 路径追踪 35.14 4.114 50 51.43
想法(胡里奥·卡耶塔诺) 资讯频道 244.42 2.842 10 7.11
想法(胡里奥·卡耶塔诺) 直接照明 66.26 3.148 40 31.48
想法(胡里奥·卡耶塔诺) 路径追踪 59.98 3.095 50 38.68
亚视(于尔根·阿列克谢耶夫) 资讯频道 222.32 7.083 10 17.71
亚视(于尔根·阿列克谢耶夫) 直接照明 67.12 4.413 40 44.13
亚视(于尔根·阿列克谢耶夫) 路径追踪 57.19 4.426 50 55.33
盒子(Enrico Cerica 设计) 资讯频道 257.61 3.918 10 9.80
盒子(Enrico Cerica 设计) 直接照明 54.97 3.971 40 39.71
盒子(Enrico Cerica 设计) 路径追踪 48.02 3.570 50 44.63

在这里,我们看到在 HP 和 Lenovo 工作站内填充时的总分分别为 392.47 和 391.72。 这大约是 A8000 能力的一半; 然而,对于入门级卡来说,这是一个令人印象深刻的结果,并且肯定比其前身有了跨越式发展。

与更高端的消费级显卡相比,OctaneBench 官方网站为强大的 RTX 3070 和 3060 TI 以及 RTX 3080(笔记本电脑型号)分别打出了 400 分和 376 分,而 四核RTX 4000 在他们的图表中仅显示 228。

结论

RTX A4000 是 NVIDIA 基于第二代 RTX 架构的专业 GPU 产品组合的最新中端版本。 虽然 A6000 是性能卓越且价格昂贵的显卡,但新的 A4000 是该系列中最实惠的显卡,具有 6,144 个 CUDA 处理内核、48 个下一代 RT 内核、HDCP 2.2 支持和 PCI Express 4.0 x16 接口。 它还可以连接到最多四个 4096 x 2160 分辨率为 120Hz 的显示器。 该卡适用于需求适中且预算较少的专业人士,但它仍然可以处理各种资源密集型专业工作负载。

英伟达 rtx a4000

NVIDIA表示这本质上是Quadro RTX 4000的替代品; 但这肯定是一种轻描淡写的说法,因为新的 A4000 在各个方面都将它从水中吹了出来。 性能更符合广受欢迎且功能强大的 RTX 3070 的台式机版本。也就是说,新的 NVIDIA 卡将 RTX 4000 的 GPU 内存大小增加了一倍,达到 16GB GDDR6,这使其性能更高在处理复杂的 3D 数据集时。

正如我们之前提到的,这种显着的性能提升主要归功于 NVIDIA Ampere,这是一种使用三星 8 纳米 NVIDIA 定制工艺的下一代架构。 它还通过改进的流式多处理器、第二代光线追踪核心和相当好的光线追踪硬件加速来突出显示。

系统背面的 NVIDIA RTX A4000

此外,Ampere 使用第三代 Tensor Core 提高 AI 推理性能,而 DLSS 在更高分辨率下显着提高性能。 Ampere 还有很多,但所有这一切仅仅意味着 RTX A3(与 A4000 一样)是 GPU 技术的巨大飞跃,与上一代相比,即使是像这样的入门卡也能显示出巨大的性能提升。 通过此版本,NVIDIA 为那些买不起高端工作站 GPU 的人提供了使用这一令人印象深刻的架构的机会。

那么,RTX A4000 适合谁? 使用高级专业应用程序且不需要高端工作站 GPU 的工程师和建筑师肯定会发现 A4000 是他们工作负载的理想选择。 那些需要工作站发挥最佳性能(启动预算要大得多)的人可能会选择 NVIDIA 的旗舰产品 RTX-A6000 和介于两者之间的 A5000。

NVIDIA RTX A4000 产品页面

参与 StorageReview

订阅电子邮件 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS订阅