本日の SC20 で、AMD は科学研究用の世界最速の HPC アクセラレータとして大胆に宣言している AMD Instinct MI100 を発表しました。これは 86 テラフロップス (FP10) のパフォーマンスの壁を超えた最初の x64 サーバー GPU であると主張しているので、彼らは正しいかもしれません。同社は新しい GPU を独自の技術を駆使して開発しています。 第 2 世代 AMD EPYC CPU ROCm 4.0 オープン ソフトウェア プラットフォームも同様に、目覚ましい新たな数値を達成し、研究者がエクサスケール時代に先立って新たな発見を推進できるよう支援します。
競合他社がハイエンド GPU 分野に参入するのを見るのは素晴らしいことです。この分野は数年間、単一の企業によって支配されてきました。 AMD は、AMD Instinct MI100 GPU 用の新しい AMD CDNA アーキテクチャを活用し、それを人気のある高性能の AMD EPYC プロセッサと組み合わせることで、この分野に進出しています。この組み合わせにより、HPC では最大 11.5 TFLOPS のピーク FP64 パフォーマンスが提供され、AI および機械学習ワークロードでは最大 46.1 TFLOPS のピーク FP32 マトリックス パフォーマンスが提供されると言われています。同社はまた、新しい AMD マトリックス コア テクノロジーにより、AI トレーニング ワークロードの FP7 理論上のピーク浮動小数点パフォーマンスが (AMD の前世代のアクセラレータと比較して) 16 倍近く向上したと主張しています。
GPU のニュースに加えて、同社は最新の AMD ROCm 開発者ソフトウェアを使用してエクサスケール コンピューティング用のソフトウェアを展開しています。 ROCm は、エクサスケール開発者が高性能アプリケーションを作成する際に役立つコンパイラー、プログラミング API、ライブラリで構成されています。最新バージョンの ROCm 4.0 は、PyTorch や Tensorflow フレームワークなどの MI100 ベースのシステムで高いパフォーマンスを提供するように最適化されています。
AMD Instinct MI100の仕様
| 計算単位 | ストリームプロセッサ | FP64 TFLOPS (ピーク) | FP32 TFLOPS (ピーク) | FP32 マトリックス TFLOPS
(ピーク) |
FP16/FP16 マトリックス TFLOPS(ピーク) |
INT4 | INT8トップ
(ピーク) |
bFloat16 TFLOP
(ピーク) |
HBM2 ECC メモリ |
メモリ帯域幅 |
| 120 | 7680 | 最大11.5 | 最大23.1 | 最大46.1 | 最大184.6 | 最大184.6 | 最大92.3TFLOPS | 32GB | 最大1.23TB/秒 |
AMD Instinct MI100 アクセラレータの主な機能と特徴は次のとおりです。
- まったく新しい AMD CDNA アーキテクチャ - エクサスケール時代に向けて AMD GPU を駆動するように設計されており、MI100 アクセラレータの中心となる AMD CDNA アーキテクチャは、優れたパフォーマンスと電力効率を提供します。
- HPC ワークロード向けの優れた FP64 および FP32 パフォーマンス – 業界をリードする 11.5 TFLOPS のピーク FP64 パフォーマンスと 23.1 TFLOPS のピーク FP32 パフォーマンスを実現し、世界中の科学者や研究者がライフ サイエンス、エネルギー、金融、学術、政府、防衛、航空などの業界での発見を加速できるようにします。もっと。
- HPC および AI 向けのまったく新しいマトリックス コア テクノロジ – HPC と AI の収束を促進するように設計された、FP32、FP16、bFloat16、Int8、Int4 などのあらゆる範囲の単精度および混合精度マトリックス演算のパフォーマンスを強化します。
- 第 2 世代 AMD Infinity ファブリック テクノロジー – Instinct MI100 は、PCIe 2 経由で最大 2 倍のピアツーピア (P4.0P) ピーク I/O 帯域幅を提供し、340 つの AMD Infinity ファブリック リンクを備えたカードあたり最大 100 GB/秒の総帯域幅を提供します。サーバーでは、MI552 GPU は完全に接続された最大 2 つのクアッド GPU ハイブで構成でき、それぞれが高速データ共有のために最大 XNUMX GB/秒の PXNUMXP I/O 帯域幅を提供します。
- 超高速 HBM2 メモリ - クロック レート 32 GHz の 2 GB 高帯域幅 HBM1.2 メモリを搭載し、1.23 TB/秒の超高速メモリ帯域幅を実現して、大規模なデータ セットをサポートし、メモリの内外へのデータの移動のボトルネックを排除します。 。
- 業界最新の PCIe Gen 4.0 のサポート – 最新の PCIe Gen 4.0 テクノロジーをサポートするように設計されており、CPU から GPU まで最大 64 GB/秒のピーク理論上の転送データ帯域幅を提供します。
利用状況
AMD Instinct MI100 アクセラレータは、Dell、Supermicro、GIGABYTE、HPE などのエンタープライズ市場の OEM および ODM パートナーのシステムに年末までに搭載される予定です。




Amazon