AMD Zen 5 アーキテクチャは革新的なモジュール設計を採用しており、AMD はデスクトップ、サーバー、クライアント、組み込み向けの CPU を作成できます。
AMD の 2024 Tech Day では、最新の進歩の詳細が明らかにされ、特に最新の Zen 5 CPU と XDNA AI 中心のアーキテクチャを中心に、幅広い分野が取り上げられました。このイベントでは、AI の効率、電力パフォーマンス、複数のアプリケーション間のシームレスな統合に革命を起こすという AMD のビジョンが強調され、高性能コンピューティング分野における同社のリーダーシップが再確認されました。
Microsoft との戦略的コラボレーションにより、AMD は AI PC エクスペリエンスにおけるリーダーシップを確立し、幅広いアプリケーションにわたって前例のない効率、パフォーマンス、統合を実現しました。最大 5 コア、192 スレッドの第 384 世代 EPYC CPU は、電力効率と AI アクセラレーションの大幅な向上を約束します。AMD によると、高度な分岐予測、デュアル デコード パイプ、新しい数学アクセラレーション ユニットにより、Zen 5 はシングルコア AES-XTS パフォーマンスが前世代より 35% 向上し、機械学習タスクが 32% 高速化します。AMD が処理能力と効率の限界を押し広げ続ける中、Zen 5 アーキテクチャはデータ センターとサーバー市場に革命を起こす準備ができています。
AMD Zen 5 アーキテクチャは革新的なモジュール設計を採用しており、AMD はデスクトップ、サーバー、クライアント、組み込みアプリケーション向けにカスタマイズされた製品を作成できます。4nm および 3nm プロセス テクノロジーを組み込むことで、Zen5 ベースの製品はさまざまな使用ケースで最適なパフォーマンスと電力効率を実現できます。
AMD Zen 5
AMD の 2024 Tech Day でのプレゼンテーションで、マーク ペーパーマスターは Zen 5 アーキテクチャの大幅な進歩、特に第 5 世代 EPYC CPU に焦点を当てて発表しました。2024 年後半にリリースされる EPYC ラインは、比類のないパフォーマンスと効率性を実現し、サーバーおよびデータ センター市場における密度とパフォーマンスの指標を極限まで押し上げることが期待されています。
第 5 世代 EPYC CPU では、コア数とスレッド機能が大幅に増加しています。これらの機能強化には、TSMC との継続的なパートナーシップと最適化されたメタル スタックによって可能になった電力効率の改善も含まれます。後者は、熱性能と電気性能を大幅に向上させました。このアーキテクチャは、新しい数学アクセラレーション ユニットを導入することで高度な AI アクセラレーションを活用し、Zen 35 と比較して、シングルコア AES-XTS パフォーマンスが最大 32%、シングルコア マシン ラーニング タスクが最大 4% 向上することを約束します。
Zen 5 のアーキテクチャの進歩は包括的です。命令フェッチとデコード ステージは、高度な分岐予測とデュアル デコード パイプによって強化され、レイテンシが短縮され、精度が向上しました。整数実行ユニットは、8 ワイドのディスパッチ/リタイア機能と、より統合された ALU スケジューラによって大幅にアップグレードされ、すべてより大きな実行ウィンドウ内で実行されます。ロード/ストアの進歩には、L48 キャッシュと浮動小数点ユニットの両方の最大帯域幅が 12 倍になった 1KB 1 ウェイ LXNUMX データ キャッシュが含まれており、これはデータ量の多い操作に不可欠です。
Zen 5 アーキテクチャでは、データ帯域幅も大幅に改善されています。48KB 12 ウェイ L1 データ キャッシュによるロード/ストアの進化により、データ集約型操作に不可欠な L1 キャッシュと浮動小数点ユニットへの最大帯域幅が 512 倍になります。AVX-512 と完全な XNUMX ビット データ パスにより、実行中の浮動小数点命令を大量に処理できるアーキテクチャにより、AI およびベクター ワークロードで大幅なパフォーマンス向上が保証されます。
浮動小数点およびベクトル演算ユニットの実行も大幅に改善されました。AVX-512 は、完全な 512 ビット データ パスと 4 つのパイプライン (浮動小数点加算演算に 256 サイクルのレイテンシを提供) を備え、同時浮動小数点命令を管理する機能を大幅に強化します。これは特にベクトルおよび AI ワークロードにメリットをもたらし、機械学習やデータ集約型タスクのパフォーマンスを大幅に向上させます。これは、AMD が 512 ビット パスを「ダブル ポンプ」して XNUMX ビットのパフォーマンスを実現した Zen XNUMX とは対照的です。
Zen 5 は、デスクトップおよびモバイル プロセッサの IPC を前世代の Zen 16 と比較して平均 4% 向上させます。これは、ディスパッチ ユニットと実行ユニットの拡大、データ帯域幅の増加、プリフェッチ アルゴリズムの強化など、アーキテクチャの改良によって実現されています。IPC の向上は、ゲームからコンテンツ作成、機械学習まで、さまざまなアプリケーションで実際のパフォーマンスの向上につながります。
GPU の面では、AMD は RDNA 3 アーキテクチャを最適化して電力パフォーマンス効率を高め続けています。AMD は、以前の Ryzen CPU よりもワットあたりのパフォーマンスが最大 32% 高いと主張しています。これは、メモリ管理の改善、一般的なゲーム テクスチャ操作の XNUMX 倍の速度、および電力管理機能の強化によって実現されています。
AMD の Zen 5 アーキテクチャは、特に EPYC ラインにとって Zen アーキテクチャの印象的な進化であり、デスクトップやモバイルからサーバーやデータ センター市場まで、全般的にパフォーマンス基準の向上を約束します。コア数、スレッド、電力効率、一部のチップの AI アクセラレーションが大幅に改善された第 5 世代 EPYC CPU は、現代のデータ中心のワークロードの高まる需要に対応できるようになっています。
XDNA
人工知能グループの上級副社長である Vamsi Boppana 氏は、AMD の新しい AI 中心のアーキテクチャの変革の可能性について説明しました。AI ワークロードの急激な成長と特殊化には革新的なコンピューティング アーキテクチャが必要であり、AMD はこれに応えるために XDNA 2 アーキテクチャを導入しました。
このイノベーションの中心にあるのは、通信、5G 展開、防衛レーダー信号処理、3D 視点の放送リアルタイム AI 処理、医療画像処理など、多様な AI および DSP アプリケーションで実績のある AMD XDNA アーキテクチャです。このアーキテクチャは、従来の固定コンピューティングとキャッシュベースのメモリ階層から、より柔軟で適応性の高いモデルに移行しています。この空間再構成可能性とタイル化されたデータフロー アーキテクチャにより、効率的なマルチタスクと保証されたリアルタイム パフォーマンスが可能になります。
プレゼンテーションでは、AI ワークロードに高い効率とパフォーマンスを提供するように設計された、統合 NPU を備えた AMD の x86 プロセッサが強調されました。第 3 世代 AMD Ryzen AI プロセッサは、NPU 機能の大幅な進歩を誇り、最大 50 TOPS (12 秒あたり兆回の演算) を達成し、最大 16 個の CPU コアと 100 個の GPU コンピューティング ユニットを組み込んでいます。これらのプロセッサは、Adobe、Black Magic、Topaz Labs などのプラットフォームで XNUMX を超える AI 駆動型エクスペリエンスを実現するように設定されており、次世代 AI PC エクスペリエンスの中心となります。
XDNA 2 アーキテクチャ内の AI エンジンには、INT8 や Block FP16 などの多様なデータ タイプに対する強化されたサポートが含まれており、さまざまな AI アプリケーションで高いパフォーマンスと精度を保証します。適応型 AI アーキテクチャにより、AMD の製品ポートフォリオ全体でスケーラブルな統合が可能になり、空間再構成とタイル化されたデータフロー アーキテクチャを通じて効率的なマルチタスクと保証されたリアルタイム パフォーマンスが提供されます。
特に、ブロック FP16 は、精度をほとんど損なうことなく FP32 モデルを簡単に置き換えることができるため、画像生成、言語モデル、リアルタイムのオーディオおよびビデオ処理などのタスクに非常に効率的です。
際立った機能の 1 つは、実行時に XDNA ファブリックを構成できることです。これにより、データパスと NPU のセグメンテーションを柔軟に行えるようになり、サイズの異なる複数のモデルを同時に実行できます。また、Copilot+ などの AI を活用したエクスペリエンスを柔軟に提供して、生産性の向上と没入型コラボレーションを実現します。AMD の CPU、GPU、NPU コンポーネント全体に統合された AI ソフトウェア スタックを統合することで、幅広いモデルのサポートと最適化されたパフォーマンスが可能になり、開発者は何千もの AI モデルを迅速かつ効果的に展開しやすくなります。
AMD XDNA 2 アーキテクチャは、AI テクノロジーの大きな飛躍を示しています。最大 XNUMX つの同時空間ストリームにより、電力効率が前世代の XNUMX 倍になります。これにより、AMD のソリューションは強力かつ高効率になり、PC やその他のアプリケーションにおける AI アプリケーションの新時代への道が開かれます。
第 3 世代 AMD Ryzen AI プロセッサは、新しい Trusted IO 機能の導入により、セキュリティも強化されています。このセキュリティ強化は、機密データを保護し、AI 駆動型アプリケーションで信頼性の高いパフォーマンスを確保するために不可欠であり、安全で効率的な AI ソリューションに対する AMD の取り組みを強化します。
AMD Zen 5 と XDNA 2 の仕様
Zen5アーキテクチャ | |
機能 | 詳細 |
プロセス技術 | 4nmと3nm |
コアカウント | 最大192コア |
スレッドカウント | 最大 384 スレッド |
キャッシュ | 48KB 12ウェイL1データキャッシュ |
帯域幅 | L1キャッシュと浮動小数点ユニットへの最大帯域幅をXNUMX倍に |
整数実行 | 8 ワイド ディスパッチ/リタイア、6 ALU、3 乗算 |
浮動小数点実行 | フル 512 ビット データ パス、512 つのパイプラインを備えた AVX-6 |
AIアクセラレーション | 新しい数学加速ユニット |
IPC の向上 | Zen 16と比較して平均4%のIPC向上 |
パフォーマンスの向上 | シングルコア AES-XTS が 35% 向上、機械学習タスクが 32% 向上 |
電力効率 | 強化された金属スタックによりワット当たりのパフォーマンスを最適化 |
製品の用途 | デスクトップ、モバイル、サーバー、データセンター |
XDNA 2 アーキテクチャ | |
AIエンジンタイル | 最大32 |
AIパフォーマンス | 最大50TOPS |
コアカウント | 最大12 CPUコア |
GPU計算ユニット | 最大16 |
サポートされているデータ型 | INT8、ブロック FP16 |
効率化 | 前世代に比べて電力効率が2倍 |
同時ストリーム | 最大8 |
セキュリティ | 新しい信頼できるIO機能 |
ソフトウェアスタック | CPU、GPU、NPU にわたる統合 AI ソフトウェア スタック |
リアルタイムパフォーマンス | 空間アーキテクチャによるリアルタイムパフォーマンスの保証 |
アプリケーション | ゲーム、エンターテインメント、パーソナルAIアシスタンス、コンテンツ作成、エンタープライズ生産性 |
Curve Shaper を使用した Zen 5 デスクトップのオーバークロック
AMD の Curve Optimizer は、Ryzen 7000 シリーズの特徴的な機能で、PMFW/PBO に対応した動的電圧スケーリングまたはアンダーボルティングを有効にできます。この強力なツールは、調整可能な「Curve Optimizer」ステップを通じて電圧曲線を動的にシフトし、周波数スペクトル全体にわたって可変電圧を提供し、高周波数ではより多くの電圧を割り当てます。ユーザーはこの最適化をコアごと、CCD ごと、または CPU ごとに適用できるため、CPU のパフォーマンスと効率を細かく制御できます。
AMD は、Curve Optimizer を基盤として、Curve Shaper を導入しました。これは、ユーザーが基礎となる電圧曲線を再形成して、低電圧化の可能性を最大化できるようにする高度な拡張機能です。Curve Shaper は、前身と同じステップを使用します。それでも、15 の異なる周波数温度帯域 (XNUMX つの温度帯域と XNUMX つの周波数帯域) からステップを選択的に追加または削除する柔軟性がユーザーに与えられます。この微調整機能により、ユーザーは安定した帯域の電圧をさらに下げながら、不安定性が見られる領域に電圧を追加できます。再形成された曲線はすべてのコアに均一に適用され、Curve Optimizer を使用してさらに調整できます。
閉じた思考
AMD Tech Day 2024 は、製品を支えるエンジニアたちと深く掘り下げる貴重な機会となった素晴らしいイベントでした。XDNA 2 アーキテクチャと Zen 5 CPU による AMD の最新の進歩は、AI と高性能コンピューティング革命をリードするという同社の取り組みを強調しています。コア数、スレッド、電力効率、AI アクセラレーションの画期的な改善により、AMD は業界標準を再定義し、現代のデータ中心のワークロードの高まる需要に対応し、デスクトップ、モバイル、サーバー、データセンター アプリケーション全体で広範なパフォーマンスを確保します。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード