NVIDIA GeForce RTX 5070 Founders Edition 评测:我们测试了其 Blackwell 架构、DLSS 4、AI 性能和游戏基准。
NVIDIA GeForce RTX 5070 Founders Edition 加入了新的 50 系列产品线,在高端 5080 之后推出,并以中端产品的形式展示了 NVIDIA 的 Blackwell 架构。虽然人们对它的能效、AI 马力和光线追踪改进有很多猜测,但我们将在实际测试中亲自发现。在通过各种基准测试(从 AI 文本生成到高级 3D 渲染)后,我们可以准确地告诉你它在 NVIDIA 的下一代产品名单中的位置。
游戏玩家和硬件爱好者都迫切希望看到 RTX 5070 最终能否提供中端显卡一直承诺的强大性价比。过去几年,多代 RTX 都受到供应限制、价格虚高和代际飞跃不尽如人意的困扰,消费者渴望更有意义的改进。
从纸面上看,RTX 5070 有望比 RTX 4070 有大幅提升,宣称拥有 DLSS 4 的多帧生成、更高的内存带宽和额外的原始计算能力——所有这些都是为了实现更流畅的游戏和更快的生产力。那么,让我们来看看它的功能、规格和细节,然后深入了解这些进步与上一代相比的真正对比,看看炒作与实际性能提升有何不同。
NVIDIA GeForce RTX 5070 Founders Edition 架构
RTX 5 利用 PCIe Gen5070 接口,拥有 6,144 个 CUDA 核心,基本频率为 2.16 GHz,最高可达 2.51 GHz。这可实现 31 TFLOPS 的 FP32 计算性能,与 4070 的 29 TFLOPS 相比有明显提升。第四代光线追踪核心可提供 4 TFLOPS 的 RT 能力,提供更好的实时反射、全局照明和路径追踪支持。第五代 Tensor 核心可实现 94 AI TOPS,显著改善 AI 增强升级、帧生成和计算工作负载。
与 RTX 4070 FE 相比,NVIDIA 表示,在使用支持多帧生成的 DLSS 5070 时,1.9 FE 的 3D 渲染性能提高了 4 倍,光栅化性能提高了 20%。对于仍在使用 RTX 3070 的用户来说,差异更加显著:使用 DLSS 3 时性能提高了 4 倍以上,传统光栅性能提高了 65%。
最显著的硬件改进之一是升级至 GDDR7 内存。RTX 5070 保留了 12GB VRAM,但在 6 位总线上从 GDDR7X 升级至 GDDR192,内存带宽增加至 675 GB/s — 比 33 的 4070 GB/s 提升了 504%。这意味着纹理加载速度更快、4K 性能更好,并且创意应用程序中对大型数据集的处理能力也得到了提升。
DLSS 4 和 AI 驱动的功能
DLSS 4 支持是 RTX 50 系列的最大亮点之一。它引入了多帧生成,这是一种新的 AI 技术,可为每个渲染帧创建多个帧,从而显著提高受支持游戏中的 FPS。DLSS 4 增强了光线重建和超分辨率,提高了图像清晰度和稳定性。
在发布时,已有超过 75 款游戏支持 DLSS 4,包括 Avowed 和 Kingdom Come Deliverance II 等较新的游戏以及广受欢迎的 Red Dead Redemption II 和 Microsoft Flight Simulator 等较旧的版本。得益于新的 RT 核心和 AI 辅助降噪技术,利用光线追踪和路径追踪的游戏可能会获得明显的提升。
对于竞技游戏玩家,NVIDIA Reflex 2 带来了 Frame Warp,这是一种通过根据实时鼠标输入动态调整帧时间来减少系统延迟的新方法。这可能会让《守望先锋》、《使命召唤》多人游戏、《漫威的对手》等快节奏射击游戏和其他电子竞技游戏受益。
内容创作和专业工作负载的增强功能
除了游戏之外,RTX 5070 还非常适合创作者。一项重大升级是专用的硬件加速 4:2:2 视频编码,这使得专业级视频的导出速度比 RTX 6 快 4070 倍。NVIDIA Studio 驱动程序在视频编辑、3D 渲染和直播方面提供了优化的性能,并将 AI 驱动的工具集成到 130 多个创意应用程序中。
对于基于 AI 的工作流程,得益于 FP5070 加速和最新的 Blackwell 张量核心,4070 的 GenAI 性能是 RTX 4 的三倍。虽然它的性能肯定不如 50 系列的高端型号,但它仍然是机器学习、AI 驱动的图像处理和计算摄影的强大选择——帮助用户更快地训练模型、使用 AI 增强图像并突破创意自动化的极限。
NVIDIA GeForce RTX 5070 Founders Edition 效率与散热
尽管 RTX 250 的 TGP 增加了 4070W(高于 200 的 5070W),但考虑到性能的显著提升,其效率仍然令人惊讶。NVIDIA 很好地平衡了功耗和计算输出,确保用户获得显著的性能提升,而不会导致能耗大幅增加。虽然更高的 TGP 可能会让人感到惊讶,但效率和冷却方面的改进使其成为那些需要持续功率而又不浪费过多能源的用户的明智之举。
此外,NVIDIA RTX 5070 Founders Edition 还配备了优化的双风扇设置,可有效管理气流和散热。借助更大的散热器和改进的蒸汽室,NVIDIA 显然优先考虑了热稳定性。这意味着用户可以推动 5070 进行长时间的 AI 训练运行、高分辨率渲染或其他密集型工作负载,而不必担心由于热节流导致性能下降。
对于那些需要可靠性能而又不必担心过热的人来说,5070 的设计感觉像是一次精心设计的升级,而不是简单的强力动力提升。
显示与连接
正如预期的那样,RTX 5070 专为高刷新率游戏和专业显示器设置而打造。它通过三个 DisplayPort 4b 端口和一个 HDMI 480b 端口支持 8Hz 的 120K 和 2.1Hz 的 2.1K。这使其成为具有极高刷新率的电子竞技显示器、高端 4K 游戏显示器以及视频制作、8D 渲染和 HDR 内容创作中的专业 3K 显示器的绝佳选择。
不过,值得注意的是,HDMI 论坛在 CES 2.2 上宣布了 HDMI 2025,它将带宽大幅提升至 96Gbps,可实现 10K 分辨率和高达 240Hz 的刷新率。如果您希望未来也能获得这种级别的性能,您可能需要等待下一代 RTX 卡才能充分利用它。
现在,让我们检查一下性能结果,看看 RTX 5070 提供了什么。对于 RTX 4070 用户(甚至是那些仍在使用 30 或 20 系列 GPU 的用户)来说,最大的问题是它在 AI 驱动图形、光线追踪和内存速度方面的改进是否值得升级。
NVIDIA GeForce RTX 5070 Founders Edition 规格
GPU 比较 | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 华硕 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
GPU名称 | AD104 | GB205 | GB203 | GB203 |
卓越 | 阿达洛夫莱斯 | 布莱克威尔2.0 | 布莱克威尔2.0 | 布莱克威尔2.0 |
工艺尺寸 | 5纳米 | 5纳米 | 5纳米 | 5纳米 |
晶体管 | 35,800万 | 31,000千万 | 45,600千万 | 45,600千万 |
密度 | 121.8米 / 平方毫米 | 117.9米 / 平方毫米 | 120.6米 / 平方毫米 | 120.6米 / 平方毫米 |
模具尺寸 | 294mm² | 263mm² | 378mm² | 378mm² |
槽宽 | 双槽 | 双槽 | 2.5插槽 | 双槽 |
尺寸 | 240毫米x 110毫米x 40毫米 | 242 mm x 112 mm | 304 x 126 x 50毫米 | 304毫米x 137毫米x 48毫米 |
TDP | 200W 瓦 | 250W 瓦 | 300W 瓦 | 360W 瓦 |
视频连接 | 1 个 HDMI 2.1、3 个 DisplayPort 1.4a | 1 个 HDMI 2.1b、3 个 DisplayPort 2.1a | 1 个 HDMI 2.1b、3 个 DisplayPort 2.1b | 1 个 HDMI 2.1b、3 个 DisplayPort 2.1b |
电源连接器 | 1x 16针 | 1x 16针 | 1x 16针 | 1x 16针 |
总线接口 | PCIe 4.0 x16 | PCIe 5.0 x16 | PCIe 5.0 x16 | PCIe 5.0 x16 |
基地时钟 | 1920 MHz | 2165 MHz | 2300 MHz | 2295 MHz |
提升时钟 | 2475 MHz | 2510 MHz | 超频模式:2482MHz 默认模式:2452MHz(加速时钟) |
2617 MHz |
记忆时钟 | 1313 MHz(有效21 Gbps) | 2209 MHz(有效28 Gbps) | 1750 MHz(28有效)Gbps |
2366 MHz(有效30 Gbps) |
内存大小 | 12 GB | 12 GB | 16 GB | 16 GB |
内存类型 | GDDR6X | GDDR7 | GDDR7 | GDDR7 |
Magistrala pamięci | 192 bit | 192 bit | 256 bit | 256 bit |
内存带宽 | 504.2 GB /秒 | 672.2 GB /秒 | 896.0 GB /秒 | 960.0 GB /秒 |
CUDA核心 | 5888 | 6,144 | 8960 | 10,752 |
TMU | 184 | 192 | 280 | 336 |
个ROPs | 64 | 64 | 128 | 128 |
SM 计数 | 46 | 48 | 70 | 84 |
张量核心 | 184 | 192 | 280 | 336 |
RT核心 | 46 | 48 | 70 | 84 |
L1缓存 | 128 KB(每个 SM) | 128 KB(每个 SM) | 128 KB(每个 SM) | 128 KB(每个 SM) |
L2缓存 | 36 MB | 40 MB | 64 MB | 64 MB |
像素率 | 158.4 GPixel / s | 160.6 GPixel / s | 313.9 GP 像素/秒 | 335.0 GPixel / s |
纹理速率 | 455.4 格塞尔/秒 | 481.9 格塞尔/秒 | 686.6 格塞尔/秒 | 879.3 格塞尔/秒 |
FP16(一半) | 29.15 万亿次浮点运算 (1:1) | 30.84 万亿次浮点运算 (1:1) | 43.94 万亿次浮点运算 (1:1) | 56.28 万亿次浮点运算 (1:1) |
FP32(浮点数) | 29.15 TFLOPS | 30.84 TFLOPS | 43.94 TFLOPS | 56.28 TFLOPS |
FP64 (双精度) | 455.4 GFLOPS(1:64) | 481.9 GFLOPS(1:64) | 686.6 GFLOPS(1:64) | 879.3 GFLOPS(1:64) |
发行价格(美元) | $599 | $549 | $749 | $999 |
StorageReview AMD Threadripper 测试平台
以下是我们将用于 RTX 5070 FE 测试的测试平台:
- 主板: 华硕 Pro WS TRX50-SAGE WIFI
- CPU: AMD Ryzen Threadripper 7980X 64 核
- RAM: 128GB DDR5 4800MT/s
- 存储: 2TB 三星 980 Pro
- OS: Windows 11 Pro for Workstations
- 司机: NVIDIA 571.86 GameReady 驱动程序
AMD Ryzen Threadripper 7980X 是我们测试系统的核心,拥有 64 个核心和广泛的多线程功能。这确保了 CPU 限制不会干扰以 GPU 为中心的基准测试,特别是在 AI 处理、光线追踪和高分辨率渲染方面,这些方面的工作负载大量转移到 GPU。
我们将 7980X 与 ASUS Pro WS TRX50-SAGE WIFI 主板搭配使用,以提供充足的 PCIe 带宽,确保 GPU 能够充分发挥其潜力而不会出现瓶颈。我们的系统还包括 128GB 的 DDR5 内存,速度为 4800MT/s,在处理大型数据集时提供足够的空间以实现流畅运行。虽然三星 980 Pro 是一款稍旧的 Gen4 SSD,但它仍然提供快速的读写速度,将加载时间保持在最低限度,并防止数据密集型任务(如 AI 模型推理或纹理流)受到存储性能的阻碍。
此设置应该使我们能够隔离并准确测量 GeForce RTX 5070 的实际性能,所以让我们立即开始吧。
我们将 RTX 5070 FE 与以下 GPU 进行比较:
- NVIDIA RTX 5080 (16GB GDDR7)
- 华硕 Prime NVIDIA RTX 5070 Ti (16GB GDDR7)
- NVIDIA RTX 4070(12GB GDDR6X)
UL Procyon:AI 文本生成
我们首先要进行的测试是 Procyon AI 文本生成基准。该基准测试通过提供紧凑一致的评估方法简化了 AI LLM 性能测试,允许在多个 LLM 模型上进行重复测试,同时最大限度地降低大模型尺寸和可变因素的复杂性。该基准测试由 AI 硬件领导者共同开发,优化了本地 AI 加速器的使用,以实现更可靠、更高效的性能评估。下面测量的结果是使用 TensorRT 测试的。
在这里,RTX 5070 Founders Edition 在每项测试中都比上一代 4070 有所改进。无论是总体得分、第一个令牌的输出时间还是每秒令牌数,5070 FE 都显示出性能飞跃——通常在 10-15% 左右。这种提升意味着更快的 AI 输出、更短的等待时间和更流畅的模型推理。例如,在 Phi 基准测试中,4070 的得分从 3,191 增加到 3,453 FE 的 5070,每秒令牌数从 141.575 上升到 150.435。虽然不是惊天动地的,但这种差异足以看到合成工作负载和实际使用情况的明显改善。
与功能更强大的 5070 Ti 相比,5070 FE 预计会落后约 15-25%,具体取决于具体测试。例如,在相同的 Phi 基准测试中,Ti 版本的总得分达到 4,179,与 FE 的 3,453 相比有显著提升。这种性能差距在 Mistral 和 Llama 系列测试中保持一致,表明 Ti 为需要更大 AI 吞吐量的用户提供了更大的优势。与此同时,旗舰产品 5080 位居排行榜榜首,比 5070 Ti 领先 5-10%。它的优势最明显体现在令牌生成速度和第一个令牌的时间上,在大量工作负载中,缩短几分之一秒的时间可能会产生很大的影响。
虽然 5070 FE 在 AI 推理任务方面表现不俗,但想要更快生成时间或处理海量数据集的高级用户可能会发现 5070 Ti 或 5080 更能满足他们在这一性能方面的需求。
UL Procyon:AI 文本生成 | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 华硕 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
菲总分 | 3,191 | 3,453 | 4,179 | 4,400 |
Phi 输出时间到第一个标记 | 0.356小号 | 0.323小号 | 0.290小号 | 0.277小号 |
每秒输出 Phi 令牌数 | 141.575 个代币/秒 | 150.435 个代币/秒 | 192.487 个代币/秒 | 209.459 个代币/秒 |
Phi 总时长 | 21.743小号 | 20.302小号 | 15.771小号 | 14.908小号 |
米斯特拉尔总成绩 | 2,987 | 3,562 | 4,412 | 4,635 |
Mistral 输出第一个令牌的时间 | 0.508小号 | 0.433小号 | 0.374小号 | 0.347小号 |
每秒 Mistral 输出代币数 | 99.590 个代币/秒 | 120.507 个代币/秒 | 160.167 个代币/秒 | 163.598 个代币/秒 |
米斯特拉尔总持续时间 | 30.651小号 | 25.496小号 | 19.480小号 | 18.933小号 |
Llama3 总体评分 | 2,810 | 3,125 | 4,187 | 4,424 |
Llama3 输出第一个标记的时间 | 0.423小号 | 0.379小号 | 0.306小号 | 0.283小号 |
Llama3 每秒输出令牌数 | 82.130 个代币/秒 | 100.388 个代币/秒 | 131.853 个代币/秒 | 136.177 个代币/秒 |
Llama3 总时长 | 36.147小号 | 29.720小号 | 22.786小号 | 21.985小号 |
Llama2 总体评分 | 2,658 | 3,125 | 4,284 | 4,790 |
Llama2 输出第一个标记的时间 | 0.947小号 | 0.785小号 | 0.560小号 | 0.493小号 |
Llama2 每秒输出令牌数 | 49.487 个代币/秒 | 56.647 个代币/秒 | 75.905 个代币/秒 | 83.653 个代币/秒 |
Llama2 总时长 | 61.300小号 | 53.234小号 | 39.545小号 | 35.703小号 |
UL Procyon: 人工智能图像生成
- Procyon AI 图像生成基准 持续准确地测量各种硬件(从低功耗 NPU 到高端 GPU)的 AI 推理性能。它包括三项测试:针对高端 GPU 的稳定扩散 XL (FP16)、针对中等功率 GPU 的稳定扩散 1.5 (FP16) 和针对低功耗设备的稳定扩散 1.5 (INT8)。基准测试使用每个系统的最佳推理引擎,确保结果公平且具有可比性。
RTX 5070 FE 在每项图像生成测试中都比 4070 有所进步,最明显的是在稳定扩散 1.5 (FP16) 中,它的总分从 2,400 的 4070 跃升至 2,937 FE 的 5070。这一差距意味着在 FP16 和 INT8 基准测试中,图像生成速度更快,推理时间更短,这使得 5070 FE 成为专注于 AI 驱动图形工作负载的用户的有力竞争者。与 5070 Ti 和 5080 相比,5070 FE 在大多数测试中落后约 20-25%,这或许可以证明 Ti 的价格更高,适合对 AI 图像生成需求极其苛刻的用户。与此同时,5080 更进一步,比 Ti 又高出 15-20%。
从实际角度来看,RTX 5070 FE 明显优于 4070,这意味着推理时间明显更快,内容创建工作流程更流畅。但是,如果您经常处理复杂或大规模的图像生成任务,那么 20 Ti 提供的额外 25-5070% 性能提升(或 15 提供的额外 20-5080% 性能提升)可能值得投资。
UL Procyon:AI 图像生成(总分:越高越好) | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 华硕 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
稳定扩散 1.5 (FP16) — 总体得分 | 2,400 | 2,937 | 3,755 | 4,650 |
稳定扩散 1.5 (FP16) — 总时间 | 41.661小号 | 34.038小号 | 26.625小号 | 21.503小号 |
稳定扩散 1.5 (FP16) — 图像生成速度 | 2.604 秒/图像 | 2.127 秒/图像 | 1.664 秒/图像 | 1.344 秒/图像 |
稳定扩散 1.5 (INT8) — 总体得分 | 31,048 | 36,320 | 46,744 | 55,683 |
稳定扩散 1.5 (INT8) — 总时间 | 8.052小号 | 6.883小号 | 5.348小号 | 4.490小号 |
稳定扩散 1.5 (INT8) — 图像生成速度 | 1.006 秒/图像 | 0.860 秒/图像 | 0.669 秒/图像 | 0.561 秒/图像 |
稳定扩散 XL (FP16) — 总体得分 | 1,940 | 2,473 | 3,352 | 4,257 |
稳定扩散 XL (FP16) — 总时间 | 309.269s | 242.606s | 178.946小号 | 140.928s |
稳定扩散 XL (FP16) — 图像生成速度 | 19.329 秒/图像 | 15.163 秒/图像 | 11.184 秒/图像 | 8.808 秒/图像 |
乐士马克
Luxmark 是一个 GPU 基准测试,它使用开源光线追踪渲染器 LuxRender 来评估系统在处理高度详细的 3D 场景方面的性能。该基准测试适用于评估服务器和工作站的图形渲染能力,特别是对于视觉效果和建筑可视化应用程序,其中准确的光模拟至关重要。
在衡量高级光线追踪性能的 Luxmark 中,RTX 5070 FE 在食物场景测试中比 20 提升了约 4070%(7,535 vs. 9,061),在大厅场景中提升了约 10%(20,003 vs. 22,062)。与 5070 Ti 相比,它在食物场景中落后约 33%(9,061 vs. 12,073),在大厅场景中落后 30%(22,062 vs. 28,635)——对于处理大型 3D 渲染或 VFX 项目的用户来说,这一明显差距可能证明 Ti 的价格更高是合理的。 5080 进一步扩大了利润空间,在食品领域比 5070 FE 高出 50% 以上(9,061 比 13,637),在大厅领域比 40 FE 高出约 22,062%(30,815 比 XNUMX)。
Luxmark(越高越好) | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 华硕 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
食物评分 | 7,535 | 9,061 | 12,073 | 13,637 |
霍尔斯 | 20,003 | 22,062 | 28,635 | 30,815 |
在相关工作流程中(例如建筑可视化或视觉效果制作),5070 FE 仍然比 4070 有了显著的提升。
Geekbench 6
Geekbench 6 是衡量整体系统性能的跨平台基准测试。Geekbench 浏览器可让您将任何系统与其进行比较。
在下面的结果表中,RTX 5070 FE 得分为 188,892 分,比 4070 的 174,725 分有了相当大的提升。Geekbench 8 的 GPU OpenCL 得分从 6 增加到 174,725,增长 188,892% 乍一看可能并不大。然而,对于那些处理资源密集型任务(如高分辨率视频编辑、复杂的 3D 渲染或机器学习推理)的人来说,它仍然可以提供适度的提升。虽然它不会对更简单的工作流程产生重大影响,但如果你经常将 GPU 推到极限,额外的空间可能会更加明显。
Geekbench(越高越好) | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 华硕 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
GPU OpenCL 分数 | 174,725 | 188,892 | 246,875 | 265,397 |
与 50 系列的高端型号相比,差距预计会扩大。5070 Ti 得分为 246,875 分,性能提升约 30%。在排行榜上,5080 的得分甚至进一步提升至 265,397 分,吸引了工作站专业人士和狂热爱好者。不过,对于那些希望在更繁重的 GPU 任务中获得明显升级而又不必冒险进入更昂贵领域的用户来说,5070 FE 是一个不错的选择。
的V-Ray
- 的V-Ray 基准测试使用先进的 V-Ray 6 引擎测量 CPU、NVIDIA GPU 或两者的渲染性能。它使用快速测试和简单的评分系统让用户评估和比较其系统的渲染能力。对于寻求高效性能见解的专业人士来说,它是一款必不可少的工具。
在这里,RTX 5070 FE 的得分为 6,553,比 RTX 47 的 4,469 大幅提升了 4070%。这一提升可能会转化为渲染密集型工作负载(例如光线追踪场景、建筑可视化或高端 CGI)的更流畅体验。对于从 5070 升级到 4070 的专业人士或爱好者来说,渲染时间可能会明显减少,具体取决于他们系统的其他设置。
V-Ray(越高越好) | NVIDIA RTX 4070 | NVIDIA RTX 5070 | 华硕 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 |
虚拟路径 | 4,469 | 6,553 | 8,018 | 9,311 |
将 RTX 5070 与高端型号进行比较,5070 Ti 的 vpath 得分为 8,018,比 5070 FE 高出约 22%。5080 再次进一步提升至 9,311,性能比 42 FE 高出 5070%。虽然 Ti 和 5080 更适合重度渲染工作负载,但 5070 FE 仍然比上一代有了显著的提升,使其成为一个强大的中端选择。
3D马克
3DMark Port Royal、Speed Way 和 Steel Nomad 是 GPU 基准测试,用于测试不同场景下的性能。Port Royal 专注于光线追踪,Speed Way 评估赛车模拟中的性能,Steel Nomad 则以高强度、逼真的图形来挑战 GPU。它们评估 GPU 在渲染、照明和动态场景中的能力。
3DMark 测试(分数越高越好) | NVIDIA GeForce RTX 4070 | NVIDIA RTX 5070 | 华硕 PRIME NVIDIA RTX 5070 Ti |
皇家港口 | 11,074 | 14,026 | 19,290 |
速度方式 | 4,477 | 5,869 | 7,709 |
钢铁游牧者 | 3,748 | 5,019 | 6,458 |
NVIDIA RTX 5070 在 31DMark 基准测试中比 RTX 4070 性能高出 3%,在同等价位中实现了大幅价值提升。ASUS PRIME RTX 5070 Ti 性能更进一步,平均比 RTX 41 高出 4070%。
NVIDIA GeForce RTX 5070 Founders 电源效率结果
我们一直使用 Procyon AI Image 测试作为基准,以测量所有新 50 系列 NVIDIA GPU 的功耗。运行 Stable Diffusion XL FP16 测试时,我们查看生成倒数第二张图像的间隔。我们测量从该间隔开始到结束的时间、峰值功耗、平均高功耗以及测试完成后的空闲功耗。我们的测试表明,在持续工作负载下,平均功耗为 2W,峰值达到 409W,空闲功耗为 429W。NVIDIA GeForce RTX 184 的标称功率为 5070W,功耗约为 250W,峰值为 225W。该卡完成了我们 245 秒的测试周期,总能耗为 19.2Wh。这比 2.46Ti 有明显的上升,是 GeForce RTX 5070 测量值的两倍多。
稳定扩散 XL FP16 图像功率使用情况(越低越好) | NVIDIA RTX 5070 | 华硕 Prime NVIDIA RTX 5070 Ti | NVIDIA RTX 5080 | NVIDIA RTX 5090 |
耗电量 | 2.46Wh | 1.66Wh | 1.39Wh | 1.16Wh |
测试时间 | 19.2小号 | 11.1小号 | 8.7小号 | 5.1小号 |
结语
NVIDIA RTX 5070 FE 的价格达到了至关重要的 549 美元,兼具性能和下一代功能,但价格却不算高。对于使用 30 系列或 20 系列 GPU 的用户来说,这款显卡代表了明显的升级 — 更高的帧速率、更高的内存带宽以及 DLSS 4 的多帧生成等 AI 功能,有助于带来更流畅、响应更快的体验。如果您使用的是 40 系列 GPU,5070 仍可提供有意义的改进,尤其是在渲染和 AI 工作负载方面。
在我们的测试中,RTX 5070 在 AI 驱动的应用程序中始终比 4070 表现好 10-15%,在渲染和计算密集型任务中甚至有更大的飞跃。例如,V-Ray 的性能提升了 40% 以上,大大缩短了复杂光线追踪场景的渲染时间。这些收益凸显了 NVIDIA 的 Blackwell 进步,包括增强的张量和 RT 核心以及切换到 GDDR7 内存,这可以更好地处理高分辨率纹理和要求苛刻的创意工作负载。虽然 12GB 的 VRAM 有点不尽如人意,但对于许多游戏和 AI 任务来说已经足够了,尤其是较小的本地模型。
最终,RTX 5070 FE 感觉像是一个平衡的选择,它使下一代功能以合理的价格变得可用。NVIDIA 为那些需要更多功能的用户提供了 5070 Ti 和 5080 的空间,但对于大多数用户来说,5070 在成本和性能之间取得了出色的平衡。然而,真正的考验是可用性。如果 NVIDIA 保持库存水平稳定,这最终可能会成为一款兼具性能和可用性的中端显卡,而不会出现前几代产品的供应问题。
参与 StorageReview
电子报 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS订阅