在 COMPUTEX 2025 展会上短暂亮相后,AMD 的 Radeon RX 9060 XT 现已正式发布,目标客户是那些希望以更实惠的价格获得强劲 1080p 和 1440p 性能的游戏玩家。我们之前评测过 RX 9070 和 RX 9070 XT,在中端市场表现不俗。现在,RX 9060 XT 的入门价格进一步降低,379GB 型号售价 16 美元,299GB 版本售价 8 美元。AMD 的定价使其低于 NVIDIA 的 GeForce RTX 5060 Ti,因此对于注重预算的买家来说,这款显卡更具性价比。
AMD 为我们提供了 RX 9060 XT 进行测试,我们特别评测了技嘉 Radeon RX 9060 XT GAMING OC 16G 版本。这款原厂超频型号配备三风扇散热器、金属背板(以增强刚性),以及兼顾散热效率和静音运行的设计。随着 AMD RDNA 4 架构的全部功能详尽介绍,我们可以评估这款显卡在实际游戏、光线追踪和 AI 增强工作负载下的表现,并看看它与更高级别的同类产品相比如何。
AMD Radeon RX 9060 XT 架构
RX 9060 XT 基于 AMD 的 RDNA 4 架构打造,相较前几代产品,该架构实现了显著提升,专注于提升效率、增强每瓦性能,并扩展了计算、光线追踪、AI 和媒体等功能。该架构的核心是重新设计的计算单元,得益于改进的内存子系统和更优化的 GPU 数据路径。与 RDNA 3 相比,RDNA 4 计算单元的单计算单元性能提升高达 40%,使 RX 9060 XT 能够达到 3GHz 以上的睿频加速,同时保持极具竞争力的功耗水平。这些改进对于在不增加平台要求的情况下将高端功能引入主流市场至关重要。
光线追踪性能也得到了显著提升。RX 9060 XT 搭载 AMD 第三代 RT 加速器,其中包含第二个光线相交引擎,可将光线盒和光线三角形运算的吞吐量翻倍。全新专用光线变换硬件进一步提升性能,尤其是在深度遍历边界体积层次结构时。此外,定向边界盒 (Oriented Bounding Boxes) 的引入通过降低 BVH 复杂度和内存开销,改进了几何图形的处理方式。这些改进使得实时光线追踪即使在这个价位也能在更广泛的游戏中更加可行。
AI加速是RDNA 4最重要的飞跃之一。RX 9060 XT搭载AMD第二代AI加速器,通过扩展数学流水线和支持FP8等现代数据类型,实现了比以往设计更快的吞吐量。这些单元支持结构化稀疏性等推理技术,从而能够在游戏、内容创作和升级应用中更高效地执行AI工作负载。在实际应用中,这些改进使FidelityFX Super Resolution 4 (FSR4)能够在支持的游戏中提供超越原生分辨率的图像质量,同时通过先进的帧生成技术提升性能。FSR4基于FSR 3.1构建,具有针对RDNA 4硬件优化的机器学习核心。此外,AMD使其与现有游戏引擎向后兼容,从而更容易被采用。
RX 9060 XT 还受益于更新的媒体和显示引擎。AMD 的 Radiance 显示引擎支持 DisplayPort 2.1a,从而解锁更高的刷新率,并让显卡能够适应下一代显示器。AV1 编码和解码支持也得到了改进,从而实现更流畅的视频播放、更低比特率的流媒体传输和更清晰的录制。此次升级使 RX 9060 XT 不仅成为游戏的得力助手,也成为内容创作和直播工作流程的理想之选。
| 规格概述 | AMD Radeon RX 9060 XT |
|---|---|
| 家庭 | Radeon RX |
| 系列 | Radeon RX 9000系列 |
| 板子类型 | 桌面 |
| 操作系统支持 | Windows 10/11(64 位)、Linux x86 64 位 |
| 附加电源连接器 | 1个8针 |
| 计算单位 | 32 |
| 流处理器 | 2048 |
| 射线加速器 | 32 |
| 人工智能加速器 | 64 |
| 提升频率 | 高达3130 MHz |
| 游戏频率 | 2530 MHz |
| 个ROPs | 64 |
| 纹理单元 | 128 |
| 晶体管计数 | 29.7亿 |
| 典型电路板功耗 | 160W |
| 最低 PSU 建议 | 450W |
| 内存大小 | 16 GB GDDR6 或 8 GB GDDR6 |
| 存储器接口 | 128 bit |
| 内存带宽 | 高达 320 GB/秒 |
| 记忆体速度 | 高达20 Gbps |
| 无限缓存 | 32 MB |
| 峰值 FP16 计算 | 51.3 TFLOPs |
| 峰值 FP32 计算 | 25.6 TFLOPs |
| INT4 峰值性能 | 821个TOP |
| INT8 峰值性能 | 410个TOP |
| 峰值像素填充率 | 高达 200.3 GP/s |
| 显示端口™ | 2.1a |
| HDMI™ | 2.1b |
| AV1 编码/解码 | 是 |
| H265 编码/解码 | 是 |
| 价格美元 | 379GB 16 美元 | 299GB 8 美元 |
构建和设计 AMD Gigabyte Radeon RX 9060 XT GAMING OC 16G
AMD 技嘉 Radeon RX 9060 XT 是一款双插槽显卡,搭载技嘉的 WINDFORCE 散热系统,该系统采用三个设计独特的 HAWK 风扇。这些风扇采用技嘉的叶片设计,可增强气流并保持高效散热,同时保持低噪音运行。该显卡配备 16GB GDDR6 显存,128 位显存,可为游戏和创意任务提供稳定的性能。测试中,这款显卡的风扇噪音几乎为零,在空载状态下,风扇甚至完全停止运转。
显卡的底面乍一看并没有什么特别之处,但却展现了技嘉对散热方案的用心。它采用了一块大型铜底板和复合铜热管,有效地将热量从关键组件上导走。为了确保最佳的热传递效果,技嘉在 GPU 和散热接口之间涂抹了服务器级导热凝胶,从而增强了整体散热效果。
显卡顶部有一个 8 针电源接口,为其 160W TDP 供电。为了增加美感,技嘉在技嘉徽标上添加了 RGB 灯光,而 Radeon 品牌标识则保持非发光状态。
在显卡的 PCIe 接口上,有一个坚固的金属双槽支架,用于容纳显示输出接口。它包含两个 DisplayPort 2.1a 端口和一个 HDMI 2.1b 端口,支持高达 7680 x 4320 的分辨率。此配置支持高分辨率显示器或多显示器配置。
技嘉在显卡背面配备了一块黑色铝制背板,不仅增强了结构强度,还有助于散热。显卡尾部附近的开孔设计可以改善散热器的气流。背板上还印有精致的技嘉和 Radeon 品牌标识,整体外观简洁精致。
标杆: 技嘉 Radeon RX 9060 XT GAMING OC 16G
为了测试技嘉新款 Radeon RX 9060 XT 显卡,我们采用了高性能 AMD Threadripper 平台,该平台配备 64 核 CPU 和定制水冷系统。这种配置确保 GPU 能够满负荷运行,不会出现 CPU 瓶颈。为了进行比较,我们在此配置下测试了技嘉 Radeon RX 9060 XT,同时测试的还有 AMD 华硕 Prime Radeon RX 9070 和 RX 9070 XT,以及 PNY NVIDIA GeForce RTX 5060 Ti。, NVIDIA Founders Edition RTX 4070,以及 华硕 Prime NVIDIA RTX 5070 Ti.
以下是完整的系统配置。
StorageReview AMD Threadripper 测试平台
- 主板: 华硕 Pro WS TRX50-SAGE WIFI
- CPU: AMD Ryzen Threadripper 7980X 64 核
- RAM: 128GB DDR5 4800MT/s
- 存储: 2TB 三星 980 Pro
- OS: Windows 11 Pro for Workstations
- 司机: AMD 肾上腺素 25.3.1
UL Procyon:AI 文本生成
此 Procyon AI 文本生成基准 通过提供紧凑一致的评估方法,简化了 AI LLM 性能测试。它允许在多个 LLM 模型上进行重复测试,同时最大限度地降低大模型大小和可变因素的复杂性。它与 AI 硬件领导者共同开发,优化了本地 AI 加速器的使用,以实现更可靠、更高效的性能评估。下面测量的结果是使用 TensorRT 在 NVIDIA 模型上测试的,使用 ONNX 在 AMD 模型上测试的。
在 Procyon AI 文本生成基准测试中,AMD Radeon RX 9060 XT 在所有测试的 LLM 中始终垫底。它在 Phi 中的得分为 1,281,在 Mistral 中的得分为 1,274,在 Llama1,150 中的得分为 3,在 Llama1,252 中的得分为 2。这些结果远低于 RX 9070 XT 的得分(范围从 2,070 到 2,298),甚至远远落后于 NVIDIA 的中高端显卡,其中 RTX 5070 Ti 在 Mistral 中的峰值为 4,412,在 Llama4,284 中的峰值为 2。 RX 9060 XT 的每秒令牌数 (tokens/s) 也最慢,在 Phi 中仅为 94.453 个令牌/秒,在 Mistral 中为 65.115 个令牌/秒,在 Llama53.167 中为 3 个令牌/秒,在 Llama34.654 中为 2 个令牌/秒。其首个令牌生成时间 (time-to-first-token) 值也是所有测试中最长的。总体而言,RX 9060 XT 在文本生成任务中表现落后,其入门级推理性能明显低于 AMD 高端型号以及所有测试过的 NVIDIA GPU。
| UL Procyon:AI 文本生成 | AMD Radeon RX 9060 XT | 的AMD Radeon RX 9070 | AMD Radeon RX 9070 XT | NVIDIA GeForce RTX 5060 Ti | NVIDIA GeForce RTX 5070FE | 华硕 PRIME NVIDIA GeForce RTX 5070 Ti |
| 菲总分 | 1,281 | 1,933 | 2,080 | 2,870 | 3,453 | 4,179 |
| Phi 输出时间到第一个标记 | 1.473小号 | 0.954小号 | 0.855小号 | 0.375小号 | 0.323小号 | 0.290小号 |
| 每秒输出 Phi 令牌数 | 94.453 个代币/秒 | 139.187 个代币/秒 | 144.471 个代币/秒 | 120.773 个代币/秒 | 150.435 个代币/秒 | 192.487 个代币/秒 |
| Phi 总时长 | 39.365小号 | 26.989小号 | 25.587小号 | 25.216小号 | 20.302小号 | 15.771小号 |
| 米斯特拉尔总成绩 | 1,274 | 2,040 | 2,231 | 2,807 | 3,562 | 4,412 |
| Mistral 输出第一个令牌的时间 | 1.827小号 | 1.109小号 | 0.946小号 | 0.526小号 | 0.433小号 | 0.374小号 |
| 每秒 Mistral 输出代币数 | 65.115 个代币/秒 | 101.300 个代币/秒 | 103.348 个代币/秒 | 91.057 个代币/秒 | 120.507 个代币/秒 | 160.167 个代币/秒 |
| 米斯特拉尔总持续时间 | 54.516小号 | 34.960小号 | 33.350小号 | 33.377小号 | 25.496小号 | 19.480小号 |
| Llama3 总体评分 | 1,150 | 1,904 | 2,070 | 2,599 | 3,125 | 4,187 |
| Llama3 输出第一个标记的时间 | 1.632小号 | 0.981小号 | 0.845小号 | 0.449小号 | 0.379小号 | 0.306小号 |
| Llama3 每秒输出令牌数 | 53.167 个代币/秒 | 87.594 个代币/秒 | 89.102 个代币/秒 | 74.709 个代币/秒 | 100.388 个代币/秒 | 131.583 个代币/秒 |
| Llama3 总时长 | 62.563小号 | 38.273小号 | 36.742小号 | 39.489小号 | 29.720小号 | 22.786小号 |
| Llama2 总体评分 | 1,252 | 2,047 | 2,298 | 2,576 | 3,125 | 4,284 |
| Llama2 输出第一个标记的时间 | 2.992小号 | 1.926小号 | 1.565小号 | 0.844小号 | 0.785小号 | 0.560小号 |
| Llama2 每秒输出令牌数 | 34.654 个代币/秒 | 59.673 个代币/秒 | 61.127 个代币/秒 | 41.386 个代币/秒 | 56.647 个代币/秒 | 75.905 个代币/秒 |
| Llama2 总时长 | 99.027小号 | 59.100小号 | 55.520小号 | 71.302小号 | 53.234小号 | 39.545小号 |
UL Procyon: 人工智能图像生成
此 Procyon AI 图像生成基准 持续准确地测量各种硬件(从低功耗 NPU 到高端 GPU)的 AI 推理性能。它包括三项测试:针对高端 GPU 的稳定扩散 XL (FP16)、针对中等功率 GPU 的稳定扩散 1.5 (FP16) 和针对低功耗设备的稳定扩散 1.5 (INT8)。基准测试使用每个系统的最佳推理引擎,确保结果公平且具有可比性。
在稳定扩散 1.5 (FP16) 测试中,AMD Radeon RX 9060 XT 得分 1,436,是所有测试显卡中得分最低的。RTX 5060 Ti 得分 2,110,RX 9070 得分 2,280,RX 9070 XT 得分 2,598,均超过了它。RTX 5070 FE 得分 2,937,而华硕 PRIME RTX 5070 Ti 以 3,755 的成绩领先。在稳定扩散 XL (FP16) 测试中也出现了类似的趋势,RX 9060 XT 得分仅为 1,124。相比之下,RTX 5060 Ti 得分为 1,940,最高分再次来自 RTX 5070 Ti,得分为 3,352。本次测试中的 RX 9060 XT 和其他 AMD 型号不支持 INT8 推理,因此在该类别中没有得分,而 NVIDIA 显卡则在本次测试中表现出色。总体而言,RX 9060 XT 在 AI 推理工作负载方面落后于其他产品线,其性能低于 AMD 的高端型号以及所有测试过的 NVIDIA GPU。
| UL Procyon:AI 图像生成(总分:越高越好) | 的AMD Radeon RX 9070 | NVIDIA GeForce RTX 5060 Ti | 的AMD Radeon RX 9070 | AMD Radeon RX 9070 XT | NVIDIA GeForce RTX 5070FE | 华硕 PRIME NVIDIA GeForce RTX 5070 Ti |
| 稳定扩散 1.5 (FP16) — 总体得分 | 1,436 | 2,110 | 2,280 | 2,598 | 2,937 | 3,755 |
| 稳定扩散 1.5 (FP16) — 总时间 | 69.633小号 | 47.590小号 | 43.858小号 | 38.481小号 | 34.038小号 | 26.625小号 |
| 稳定扩散 1.5 (FP16) — 图像生成速度 | 4.352 秒/图像 | 2.974 秒/图像 | 2.741 秒/图像 | 2.405 秒/图像 | 2.127 秒/图像 | 1.664 秒/图像 |
| 稳定扩散 1.5 (INT8) — 总体得分 | 无 | 27,705 | 无 | 无 | 36,320 | 46,744 |
| 稳定扩散 1.5 (INT8) — 总时间 | 无 | 9.024小号 | 无 | 无 | 6.883小号 | 5.348小号 |
| 稳定扩散 1.5 (INT8) — 图像生成速度 | 无 | 1.128 秒/图像 | 无 | 无 | 0.860 秒/图像 | 0.669 秒/图像 |
| 稳定扩散 XL (FP16) — 总体得分 | 1,124 | 1,940 | 1,805 | 2,010 | 2,473 | 3,352 |
| 稳定扩散 XL (FP16) — 总时间 | 533.736小号 | 326.550小号 | 332.400小号 | 298.499小号 | 242.606小号 | 178.946小号 |
| 稳定扩散 XL (FP16) — 图像生成速度 | 33.359 秒/图像 | 20.409 秒/图像 | 20.775 秒/图像 | 18.656 秒/图像 | 15.163 秒/图像 | 11.184 秒/图像 |
乐士马克
Luxmark 是一款 GPU 基准测试,利用开源光线追踪渲染器 LuxRender 来评估系统处理高精细 3D 场景的性能。该基准测试尤其适用于评估服务器和工作站的图形渲染能力,尤其是在视觉效果和建筑可视化应用中,精确的光线模拟至关重要。
在Luxmark测试中,AMD Radeon RX 9060 XT在食物场景中的得分为4,220,在大厅场景中的得分为8,007。这些结果使其低于NVIDIA GeForce RTX 5060 Ti,后者在相同测试中的得分分别为6,590和15,348。AMD的RX 9070和9070 XT表现出渐进式的提升,在食物场景中的得分分别为8,233和8,610,在大厅场景中的得分分别为16,566和16,758。NVIDIA的RTX 5070 FE进一步扩大了领先优势,分别以9,061和22,062的成绩领先,而华硕PRIME RTX 5070 Ti则以12,073和28,635的成绩在两项测试中均占据主导地位。这使得 RX 9060 XT 在光线追踪渲染任务中的表现处于中低端,明显落后于 AMD 的高端显卡和 NVIDIA 的 5070 级 GPU,尤其是在像 Hall 这样更复杂的场景中。
| Luxmark(越高越好) | AMD Radeon RX 9060 XT | NVIDIA GeForce RTX 5060 Ti | 的AMD Radeon RX 9070 | AMD Radeon RX 9070 XT | NVIDIA GeForce RTX 5070FE | 华硕 PRIME NVIDIA GeForce RTX 5070 Ti |
| 食物评分 | 4,220 | 6,590 | 8,233 | 8,610 | 9,061 | 12,073 |
| 霍尔斯 | 8,007 | 15,348 | 16,566 | 16,758 | 22,062 | 28,635 |
Geekbench 6
Geekbench 6 是衡量整体系统性能的跨平台基准测试。Geekbench 浏览器可让您将任何系统与其进行比较。
在 Geekbench 6 中,AMD Radeon RX 9060 XT 的 OpenCL 得分为 102,750,在受测 GPU 中处于较低水平。它的表现不如 AMD 自己的 RX 9070 和 RX 9070 XT,后者得分分别为 138,463 和 188,892。NVIDIA 的 RTX 5060 Ti 的成绩更高,为 150,743,而 RTX 5070 FE 的表现更强,为 173,255。华硕 PRIME RTX 5070 Ti 获得了最高分,达到了 246,875。这些结果表明,虽然 RX 9060 XT 足以胜任通用 GPU 计算任务,但在原始 OpenCL 性能方面,它明显落后于 NVIDIA 的中端显卡和 AMD 的高端产品。
| Geekbench(越高越好) | AMD Radeon RX 9060 XT | 的AMD Radeon RX 9070 | NVIDIA GeForce RTX 5060 Ti | NVIDIA GeForce RTX 5070FE | AMD Radeon RX 9070 XT | 华硕 PRIME NVIDIA GeForce RTX 5070 Ti |
| GPU OpenCL 分数 | 102,750 | 138,463 | 150,743 | 173,255 | 188,892 | 246,875 |
3D马克
3DMark Port Royal、Speed Way 和 Steel Nomad 是 GPU 基准测试,用于测试不同场景下的性能。Port Royal 专注于光线追踪,Speed Way 评估赛车模拟的性能,而 Steel Nomad 则以高强度、逼真的图形挑战 GPU。它们评估 GPU 在渲染、光照和动态场景方面的能力。
在 3DMark Port Royal 测试中,AMD Radeon RX 9060 XT 得分 9,751,低于 RTX 5060 Ti 的 10,432,并显著落后于 RTX 5070 FE 的 14,026。RX 9070 和 RX 9070 XT 的成绩更胜一筹,分别为 15,760 和 17,989,而华硕 PRIME RTX 5070 Ti 则以 19,290 的成绩领先。在 Speed Way 测试中,RX 9060 XT 得分为 3,004,落后于所有其他测试显卡。RTX 5060 Ti 得分为 4,184,RX 9070 得分为 5,791,RX 9070 XT 得分则高达 6,237。 RTX 5070 FE 得分为 5,869,RTX 5070 Ti 再次以 7,709 的成绩位居榜首。在“钢铁游牧”系列测试中,RX 9060 XT 得分为 3,767,略高于 RTX 5060 Ti 的 3,611,但远远落后于 RTX 5070 FE 的 5,019。AMD 的 RX 9070 和 RX 9070 XT 得分分别为 5,992 和 6,977,而 5070 Ti 得分为 6,458。这些结果始终表明 RX 9060 XT 落后于 AMD 的高端产品和 NVIDIA 的中高端产品。
| 3D Mark(越高越好) | AMD Radeon RX 9060 XT | NVIDIA GeForce RTX 5060 Ti | NVIDIA GeForce RTX 5070FE | 的AMD Radeon RX 9070 | AMD Radeon RX 9070 XT | 华硕 PRIME NVIDIA GeForce RTX 5070 Ti |
| 皇家港口 | 9,751 | 10,432 | 14,026 | 15,760 | 17,989 | 19,290 |
| 速度方式 | 3,004 | 4,184 | 5,869 | 5,791 | 6,237 | 7,709 |
| 钢铁游牧者 | 3,767 | 3,611 | 5,019 | 5,992 | 6,977 | 6,458 |
功耗:技嘉 Radeon RX 9060 XT
功耗是任何高端或低端计算平台的重要组成部分。每一代新 GPU 在负载下都会消耗更多电量,这意味着需要更大的电源和充足的冷却气流。然而,功耗与性能还有另一个方面:更快的 GPU 可能会达到更高的峰值,但每个工作负载的持续时间会减少。
我们测试了技嘉 AMD Radeon RX 9060 XT 的功耗,其 TDP 额定值为 160W。在 Procyon AI 图像生成测试中,功耗从空闲时的 148W 上升到负载下的 610W,系统功耗增加了 462W。负载下的平均功耗约为 439W。系统总负载明显高于同期的入门级 NVIDIA 型号。
倒数第二张图像仅用了 33 秒就生成,在此期间系统消耗了 4 Wh 的电量。
| 电源测试 结语 |
AMD 的Radeon RX 9060 XT | AMD 的Radeon RX 9070 XT | PNY NVIDIA GeForce RTX 5060钛 | NVIDIA公司 的GeForce RTX 5070 FE | 华硕 Prime NVIDIA 的GeForce RTX 5070 Ti |
| 耗电量 | 4瓦 | 3.41Wh | 2.13瓦 | 2.46Wh | 1.66Wh |
| 测试时间 | 33秒 | 17.4小号 | 20.2小号 | 19.2小号 | 11.1小号 |
结语
技嘉 AMD Radeon RX 9060 XT 显卡拥有强劲的 1080p 和 1440p 游戏性能,价格在同类产品中也属佼佼者。技嘉 GAMING OC 16G 型号则配备了高效的散热系统和精良的做工,与显卡注重散热和声学性能的理念相得益彰。对于希望在不增加预算的情况下以高画质畅玩现代游戏的玩家来说,这款显卡是一个实用且性能强劲的选择。
然而,在 AI 和计算工作负载方面,AMD Radeon RX 9060 XT 似乎存在局限性。虽然它能够处理较轻的推理任务和小规模加速,但在更苛刻的场景下却难以跟上,正如文本生成或密集图像生成的测试所表明的那样。对于偶尔需要 AI 的用户来说,它并不适合;他们应该考虑升级到更高级别的产品以获得更强大的性能。
然而,对于那些注重价格、效率和现代显示支持的游戏至上用户来说,AMD Radeon RX 9060 XT 满足了他们的要求,其 16GB 版本售价低于 400 美元,为 379 美元,而 8GB 版本仅售 299 美元。它将 RDNA 4 的架构改进带给了主流玩家,并为入门级玩家提供了性能与成本之间的完美平衡。




Amazon