ホーム EnterpriseAI Googleの1MWラック納入計画と冷却計画の内幕

Googleの1MWラック納入計画と冷却計画の内幕

by ハロルド・フリッツ

Google は、400MW ラックと増大する熱負荷に対応するための、+/-1 VDC 電源と液体冷却を備えた新しい AI データセンター インフラストラクチャの概要を説明します。

2025 OCP EMEAサミットGoogleは、現代のデータセンターを支える物理インフラに関する重要な発表を行いました。そのメッセージは明確でした。AIワークロードの規模が拡大するにつれ、電力、冷却、機械システムの能力も向上する必要がある、ということです。

AIの飽くなき電力需要はもはや理論上の話ではありません。Googleは、2030年までに機械学習の導入にはITラック500台あたりXNUMXkW以上の電力が必要になると予測しています。この急増は、ラックの高密度化への飽くなき追求によって推進されており、あらゆるラックに密集した「xPU」(GPU、TPU、CPU)が詰め込まれています。こうした要件を満たすには、電力供給の根本的な転換が求められています。つまり、電源コンポーネントとバッテリーバックアップをラックの外部に配置した、高電圧DCソリューションです。そして、この転換に伴い、新たな業界用語が生まれています。

電力供給

Googleの最初の主要発表は、データセンターの電力供給における48年間の進歩を振り返るものでした。12年前、GoogleはITラックの10VDCへの移行を推進し、従来の100VDC規格と比較して電力供給効率を劇的に向上させました。業界はこれに対応し、ラック電力を48kWから400kWへと拡張しました。100VDC(直流電圧)から新しい±1VDCへの移行により、ITラックはXNUMXkWからXNUMXMWまで拡張可能になりました。

この ディアブロ山プロジェクトMeta、Microsoft、そしてOCPコミュニティの共同プロジェクトである「400VDC」は、電気・機械インターフェースの標準化を目指しています。この電圧選択は恣意的なものではなく、電気自動車向けに構築された堅牢なサプライチェーンを活用することで、スケールメリット、製造の合理化、そして品質向上を実現します。

+/-400 VDC 電力供給: AC-DC サイドカー電源ラック

最初の具体的な成果は、AC-DCサイドカー電源ラックです。これは、電源コンポーネントをITラックから分離するものです。このアーキテクチャにより、エンドツーエンドの効率が約3%向上し、ラック全体をコンピューティングハードウェアに解放します。今後、Googleとそのパートナーは、データセンター全体にわたる高電圧DC直接配電を検討しており、これにより、さらなる高密度化と効率化が期待されます。

熱の課題

チップの消費電力が100WのCPUから1,000Wを超えるアクセラレータまで急増するにつれ、熱管理は極めて重要になっています。業界はイノベーションの波でこれに応えてきましたが、課題は明確です。チップの高密度化は、冷却需要の増加を意味します。

液冷は、大規模環境で唯一実行可能なソリューションとして浮上しました。水の熱特性は他に類を見ないほど優れており、単位体積あたり空気の約4,000倍の熱を運ぶことができ、熱伝導率は30倍も高くなります。Googleはすでにギガワット規模で液冷システムを導入しており、過去2,000年間で99.999台以上のTPUポッドを3%という驚異的な稼働率でサポートしています。液冷サーバーは、かさばるヒートシンクをコールドプレートに置き換えることで、空冷サーバーの約半分の容積しか占めません。これにより、Googleは液冷式TPU v2スーパーコンピューターのチップ密度を空冷式TPU vXNUMX世代と比較してXNUMX倍に、規模をXNUMX倍に拡大することができました。

Google AI データセンター インフラストラクチャ

プロジェクト・デシューツCDU:第4世代が配備中、第5世代が構想中

TPU v3からTPU v5へ、そして今 アイアンウッドGoogleのアプローチは、インロー冷却液分配ユニット(CDU)の採用へと進化しました。これらのCDUは、ラック内の液体ループを施設内のループから分離し、制御された高性能な冷却環境を実現します。GoogleのCDUアーキテクチャであるProject Deschutesは、冗長化されたポンプと熱交換器を備え、99.999年から2020%の可用性を実現しています。

StorageReviewは液体冷却の進化を最初から追跡しており、次のようなイノベーターを取り上げています。 CoolIT, 潜水艦、 ジェットクール, DUGノマド.

業界での導入を加速

今年後半にはGoogleが貢献する予定 プロジェクト・デシューツCDU OCPにシステムの詳細、仕様、ベストプラクティスを共有し、液冷システムの大規模導入を加速します。この貢献には、冷却性能、製造品質、信頼性、導入速度、保守性、運用上のベストプラクティスを向上させるための設計ガイダンス、そしてエコシステム・サプライチェーンの進化に関する洞察が含まれます。

AIハードウェアの急速なイノベーションにより、データセンターは次なる変化の波への備えが求められています。Mt. Diablo仕様の推進によって業界が±400VDCへと移行したことは、大きな前進です。Googleは、コミュニティに対し、Project DeschutesのCDU設計を採用し、液冷に関する深い専門知識を活用して、将来のAIインフラストラクチャのニーズに対応するよう強く求めています。

StorageReview と連携する

ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード