ホーム Enterprise AMD EPYC 9754S レビュー – 非常に特殊なスキルを備えた CPU

AMD EPYC 9754S レビュー – 非常に特殊なスキルを備えた CPU

by ジョーダン・ラナス

AMD EPYC 9754S は、SMT が無効になっている HPC ワークロード向けに設計されており、デフォルトの TDP 128 W で 128 コアと 360 スレッドを提供します。

昨年、AMD は第 4 世代 EPYC でサーバー CPU ラインを拡張しました。 128 コア、256 スレッドの EPYC 9754 が最高の料金を獲得しましたが、SKU マトリックスではそのすぐ下に AMD EPYC 9754S があります。 9754 つのチップの違いは単純ですが、劇的です。 9754S では、同時マルチスレッド (SMT) が無効になっています。これは、128S が 9754 と同じ 128 コアを提供することを意味しますが、SMT を無効にすると 256 スレッドと比較して、わずか XNUMX スレッドになります。この変更は、すでに SMT を無効にしているお客様に嬉しい割引をもたらします。

AMD EPYC 9754S

モデル コア 最大スレッド数 デフォルトのTDP ベース周波数(GHz) ブースト周波数(GHz) L3キャッシュ(MB)
9754 128 256 360W 2.25 3.10 256
9754S 128 128 360W 2.25 3.10 256
9734 112 224 320W 2.2 3.0 256

AMD SMT とは何ですか? 9754S が存在する理由は何ですか?

SMT を使用すると、単一の EPYC CPU コアが 2 つのスレッドを同時に処理できるため、プロセッサのリソースをより効率的に使用できます。一方のスレッドがメモリからデータがロードされるのを待っているとき、またはアイドル状態のときに、もう一方のスレッドが命令を実行している可能性があります。これは、コアがアイドル状態で過ごす時間が減り、パフォーマンスが向上する可能性があることを意味します。これは、仮想化やレンダリングなどのユースケースに特に当てはまります。

SMT を無効にすると、メーカーはこれらのチップを下位層の製品として販売できるようになり、特定のパフォーマンスと安定性の基準を確実に満たすことができます。 SMT が無効になっている CPU は、ビニング プロセス、市場セグメンテーション戦略、特定のパフォーマンスや効率のニーズに応えたいという要望の影響を受ける可能性があり、メーカーが製品計画やポジショニングにおいて微妙なアプローチをとっていることがわかります。

とはいえ、すべてのワークロードが SMT の恩恵を受けるわけではなく、多くの場合、AMD サーバーでは BIOS で SMT が無効になっている可能性があります。これは効果的な調整ですが、別の重要な点が生じます。 SMT を無効にした 9754S チップは、9754 よりも若干安価です。いずれの場合でも、シングルスレッド アプリケーション、計算ワークロード、および CPU 遅延が非常に重要なユースケースでは、SMT を無効にすることでメリットが得られます。

AMD EPYC 9754S と EPYC 9754 のパフォーマンス

定期テストのうち 2024 つ、y-cruncher と Cinebench 9754 を実行して、SMT の有無でどのようなパフォーマンスの違いが得られるかを確認したいと考えています。 SMT をまったく使用しない 9754S にどのような利点があるかを確認するために、SMT をオンまたはオフにして 9754 を実行しながら、9754S と XNUMX を相互に実行しました。

テストプラットフォームと仕様:

Cinebench 2024

まずは、非 S モデルで SMT が有効になっている Cinebench 2024 です。ここでは、実行ごとの変動の差の範囲内にあることがわかります。

Cinebench 2024 CPU 2x EPYC 9754S 2x EPYC 9754
 CPUマルチコア 2,682 2,587
 CPUシングルコア 68 69
MP比 39.19x 37.64x

特に y-cruncher が選択されたのは、プログラムのアーキテクチャが総合的なシステム テストとして位置付けられているためです。システム メモリに収まる程度の大規模な Pi 計算を実行することで、SMT が CPU とメモリに制約されたワークロードに悪影響を与える可能性があるという長年の直感を証明することを目的としました。それが何を意味するのかを説明する前に、まず結果を見てみましょう。

y-クランチャー 0.8.3

y-cruncher 0.8.3 合計計算時間 (秒)
(低いほど良い)
2x EPYC 9754S 2x EPYC 9754 (SMT オフ) 2x EPYC 9754 (SMT オン) 9754 SMT オフのパフォーマンス向上
1億 13.481 13.546 14.139 視聴者の38%が
2.5億 23.818 24.144 28.111 視聴者の38%が
5億 40.760 40.797 49.271 視聴者の38%が
10億 77.409 77.959 95.420 視聴者の38%が
25億 203.303 202.124 233.629 視聴者の38%が
50億 475.557 476.949 520.349 視聴者の38%が
100億 1,248.458 1,251.36 1,242.419 -0.49%

y-クランチャー 0.8.4

y-cruncher 0.8.4 合計計算時間 (秒)
(低いほど良い)
2x EPYC 9754S 2x EPYC 9754 (SMT オフ) 2x EPYC 9754 (SMT オン) 9754 SMT オフのパフォーマンス向上
1億 13.480 13.56 14.573 視聴者の38%が
2.5億 23.680 23.501 28.649 視聴者の38%が
5億 40.819 40.547 50.082 視聴者の38%が
10億 78.523 77.466 93.842 視聴者の38%が
25億 206.399 206.078 236.070 視聴者の38%が
50億 483.797 482.79 521.867 視聴者の38%が
100億 1,269.484 1,266.83 1,253.446 -1.28%

結果分析

AMD SMT の複雑さを掘り下げると、システム パフォーマンスへの影響について技術コミュニティ内で説得力のある対話が行われます。 SMT は本質的に、パフォーマンスの向上を追求する人にとって簡単な選択肢であるように見えます。理論的には、SMT を有効にすることで理想的なスケーリングが実現できるのであれば、それを有益なアーキテクチャ上の選択肢として採用しないのはなぜでしょうか。

AMD ベルガモ CPU

SMT の効率とコア アーキテクチャの関係は、白黒はっきり付けられるものではありません。精彩のない SMT スケーリングは、必ずしも実装の欠陥を示しているわけではありません。実際、これは、SMT が目立った違いを生む余地をほとんど残さない堅牢なコア設計を示唆している可能性があります。この矛盾は、業界における重要な洞察を強調しています。プロセッサ メーカーは、SMT または同様のテクノロジで画一的な利点を主張することはできません。彼らは、SMT は特定の使用例では追加のパフォーマンスを絞り出すことができますが、他のシナリオでは欠点がないわけではないことを認めています。

ハイパフォーマンス コンピューティングとスーパーコンピューティング タスクのレンズを通して、SMT の限界がより明らかになります。コアあたりのスレッド数を 2 倍にするというアイデアは有望に聞こえるかもしれませんが、現実にはコアが 2 倍になるわけではありません。極端な場合には、スレッドがキャッシュ リソースを獲得するために競合するため、パフォーマンスの低下につながる可能性があります。それにもかかわらず、大部分のマルチスレッド アプリケーション、特にキャッシュ競合がないアプリケーションでは、SMT はパフォーマンスを向上させ、主にその可能性を最大限に活用できるタスクで威力を発揮します。

閉じた思考

AMD SMT は、企業内で一般的なさまざまなワークロードに非常に役立ちます。ただし、すべてのワークロードが SMT を必要としたり、SMT から恩恵を受けるわけではありません。私たちのテストを通じて、AMD が製造におけるばらつきをどのように利用して、独自の価値提案を持つ堅実な製品を提供できるかを示しました。 SMT を使用しないピュアコアを必要とする特定の種類のワークロード向けのプラットフォームを設計している組織は、工場出荷時に SMT が永久に無効になっている AMD EPYC 9754S を購入することで、費用を少し節約できます。

AMD製品ページ

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード