一段时间以来,Oracle 云基础设施 (OCI) 一直在提供创新的云解决方案。 回到2018年,我们 检查了他们的裸机实例,由于 NVMe 存储和网络基础设施超越了大多数其他云,速度非常快。 OCI 继续突破界限 高性能计算实例 利用最新的第三代英特尔至强 CPU 和 OCI 最快的网络。 不过这一次,甲骨文做了一些不同的事情。 OCI Ampere A3 计算实例采用完全不同的方法和消息——每核心小时一美分。
一段时间以来,Oracle 云基础设施 (OCI) 一直在提供创新的云解决方案。 回到2018年,我们 检查了他们的裸机实例,由于 NVMe 存储和网络基础设施超越了大多数其他云,速度非常快。 OCI 继续突破界限 高性能计算实例 利用最新的第三代英特尔至强 CPU 和 OCI 最快的网络。 不过这一次,甲骨文做了一些不同的事情。 OCI Ampere A3 计算实例采用完全不同的方法和消息——每核心小时一美分。
为什么要在 OCI 云中使用 Arm?
Ampere于2017年推出,专门开发基于Arm架构的数据中心处理器。 虽然基于 Arm 的 CPU 已出现在数十亿台设备中,例如传感器、手机和其他小型计算机,但超大规模数据中心一直在关注这一点。 云提供商对 Arm 产生了浓厚的兴趣,因为 CPU 为他们提供了线性扩展、巨大的核心密度和更低的成本。 甲骨文为 Arm 奠定了基础 这里。. 事实上,甲骨文就是这么潜入的,他们 向Ampere投资40万美元 早在2019。
对 Ampere 的投资和对 Arm 的信任直接导致 OCI 提供 Ampere A1 计算平台。 借助基于 Ampere Altra CPU 的 Ampere A1 Compute,客户可以在云中运行云原生甚至通用工作负载,并具有积极的成本指标。 上述每核心小时 XNUMX 美分的成本是 Oracle 拥护的,是所有主要云提供商中每核心成本最低的。 除了一分钱的标题定价之外,甲骨文确实提供了 全面的成本估算工具 帮助组织做出相应的计划。
除了定价之外,还有许多其他原因(例如部署灵活性)让 OCI Ampere A1 Compute 形状令人兴奋。 OCI 提供 A1 形状作为裸机和 VM。 VM 提供的大小从每个 CPU 1 到 80 个内核和每个内核 1 到 64GB 的内存。 作为裸机,这些形状提供多达 160 个内核和 1TB 内存。
在性能方面,所有内核都能够始终以 3Ghz 运行。 每个内核都有自己的 64KB L1 I-cache、64KB L1 D-cache 和 1MB L2 D-cache。 最终,这有助于核心提供可预测的性能。 结合低成本,用户最终可以获得一些非常引人注目的性能结果。
OCI 安培 A1 计算 – 性能成本比
甲骨文发布了一些有趣的关于 A1 性能的博客。 第一个是 两种配置的 NGINX,一个作为反向代理服务器,另一个作为 API 网关服务器。 甲骨文将 A1 与 Intel.VM.Optimized01 的每核每小时 3 美元与 Intel.VM.Optimized054 的每核每小时 4 美元进行了比较,而 AMD.VM.E025 则以每核每小时 68 美元的价格平分差额。 当然,Ampere 在这些结果中表现出色,与 Intel Optimized1 产品相比,Ampere A3 的每美元性能高出 XNUMX%。
在第二篇博客中,Oracle 重点介绍了 x264 视频编码性能 在 Ampere.VM.A1、AMD.VM.E4(AMD EPYC Gen3)和 Intel.VM.Optimized3(英特尔第三代至强)之间。 定价与上面的 NGINX 示例相同。 结果在语气上也大致相同。 在这种情况下,A3 比 Intel 形状的性能/价格优势下降了惊人的 1%。
我们不会花很多时间来挖掘 Oracle 结果,博客为感兴趣的人提供了很好的细节。 有趣的是,当我们被授予不受限制地访问这些 A1 形状时,我们自己的 Blaise Robitaille 做的第一件事就是立即将 15GB H264 转码为 X265。 更多关于下面的练习。
OCI 安培 A1 计算 – 设置
公平地说——我们创造了一个公平的竞争环境,并在所有 8 个平台上创建了一个具有 32GB RAM 的 3 核实例; AMD、英特尔和安培。 这些配置的不同之处在于成本。
Ampere – VM.Standard.A1.Flex 8 核,8 个 vCPU
英特尔 – VM.Optimized3.Flex 8 核,16 个 vCPU
AMD – VM.Standard.E3.Flex 8 核心,16 vCPU
需要注意的是,我们的 AMD 数据是在测试时可用的 E3 形状上,现在有 E4 选项。
OCI 安培 A1 计算 – 性能结果
我们设置了一个 Ubuntu 20.04 实例,并使用 handbrake 在所有三个平台上将 264GB 的 H15.3 电影转换为 1.9GB 的 X265 文件。 需要注意的是,我们的 AMD 数据是在测试时可用的 E3 形状上,现在有 E4 选项。
在较高的层面上,考虑到专门用于测试的场景和硬件,测试结果符合我们的预期。
成果
- Ampere VM 8 Core – 以 2.11 FPS 的速度执行
- 英特尔 VM 8 核(16 线程)——以 20.44 FPS 的速度运行
- AMD VM 8 核心(16 线程)以 17.37 FPS 的速度执行
就完成时间而言,以下是每个形状在几秒钟内对 163,262 帧进行编码的方式。
我们还运行了另一个编码作业,只是为了看看是否可以缩小整体性能差距。 我们还运行了 x264 编码测试。 这相当于一个 500 帧的 2160p 测试文件(在树中)。
Intel 图形得分为 17.41 FPS,而 Ampere 得分为 3.98 FPS。 差距仍然很大,但 A1 形状确实缩小了差距,性能或多或少翻了一番,而英特尔则放弃了一点。
总结思考
OCI Ampere A1 形状非常引人注目。 很容易锁定价格并被成本所吸引。 但是,如果没有一定程度的性能,成本可能毫无意义。 我们着手看看是否可以通过直接跳到相当残酷的编码工作负载来打破模型。
最终我们可能对 A1 形状有点苛刻,这种特殊的工作负载并不温和。 英特尔和 AMD 的形状很容易掌握指挥权,但这种性能是有代价的。 AMD 型号的价格是 A4 的两倍,而 Intel 型号的价格大约是 A1 的 XNUMX 倍。
另一个值得考虑的定价点。 对于那些想玩 Ampere A1 的人来说,Oracle 让这一切变得简单。 他们提供 Oracle 云免费套餐,其中包括一项永远免费的服务,其中包括最多 4 个 A1 Compute 实例(四个 Ampere A1 内核和 24 GB 内存),以及其他服务。 因此,在我们的定价示例中,假设使用免费套餐,我们的 A1 成本实际上是 0.052 美元。
虽然我们的数据很有趣,但大多数组织都希望根据自己的工作负载自行检查 A1。 一些工作负载将真正与 ARM 提供的功能相协调,使用 A1 而不是其他形状可能具有成本效益。 如果您不想将 A1 用于“生产性用例”,您可以随时运行 免费的 Minecraft 服务器 代替。
Ampere 实例可能并不适用于所有工作负载,这显然不是 Oracle 的断言。 但显而易见的是,OCI 再次成为独特云服务的先锋,为他们的客户提供了很多选择。 A1 形状具有很大的潜力,同时提供了一种非常便宜(或免费)的方式来测试 Oracle 的云。
参与 StorageReview
电子报 | YouTube | LinkedIn | Instagram | Twitter | Facebook | TikTok | RSS订阅