Google は、400MW ラックと増大する熱負荷に対応するための、+/-1 VDC 電源と液体冷却を備えた新しい AI データセンター インフラストラクチャの概要を説明します。
に 2025 OCP EMEAサミットGoogleは、現代のデータセンターを支える物理インフラに関する重要な発表を行いました。そのメッセージは明確でした。AIワークロードの規模が拡大するにつれ、電力、冷却、機械システムの能力も向上する必要がある、ということです。
AIの飽くなき電力需要はもはや理論上の話ではありません。Googleは、2030年までに機械学習の導入にはITラック500台あたりXNUMXkW以上の電力が必要になると予測しています。この急増は、ラックの高密度化への飽くなき追求によって推進されており、あらゆるラックに密集した「xPU」(GPU、TPU、CPU)が詰め込まれています。こうした要件を満たすには、電力供給の根本的な転換が求められています。つまり、電源コンポーネントとバッテリーバックアップをラックの外部に配置した、高電圧DCソリューションです。そして、この転換に伴い、新たな業界用語が生まれています。
電力供給
Googleの最初の主要発表は、データセンターの電力供給における48年間の進歩を振り返るものでした。12年前、GoogleはITラックの10VDCへの移行を推進し、従来の100VDC規格と比較して電力供給効率を劇的に向上させました。業界はこれに対応し、ラック電力を48kWから400kWへと拡張しました。100VDC(直流電圧)から新しい±1VDCへの移行により、ITラックはXNUMXkWからXNUMXMWまで拡張可能になりました。
この ディアブロ山プロジェクトMeta、Microsoft、そしてOCPコミュニティの共同プロジェクトである「400VDC」は、電気・機械インターフェースの標準化を目指しています。この電圧選択は恣意的なものではなく、電気自動車向けに構築された堅牢なサプライチェーンを活用することで、スケールメリット、製造の合理化、そして品質向上を実現します。
+/-400 VDC 電力供給: AC-DC サイドカー電源ラック
最初の具体的な成果は、AC-DCサイドカー電源ラックです。これは、電源コンポーネントをITラックから分離するものです。このアーキテクチャにより、エンドツーエンドの効率が約3%向上し、ラック全体をコンピューティングハードウェアに解放します。今後、Googleとそのパートナーは、データセンター全体にわたる高電圧DC直接配電を検討しており、これにより、さらなる高密度化と効率化が期待されます。
熱の課題
チップの消費電力が100WのCPUから1,000Wを超えるアクセラレータまで急増するにつれ、熱管理は極めて重要になっています。業界はイノベーションの波でこれに応えてきましたが、課題は明確です。チップの高密度化は、冷却需要の増加を意味します。
液冷は、大規模環境で唯一実行可能なソリューションとして浮上しました。水の熱特性は他に類を見ないほど優れており、単位体積あたり空気の約4,000倍の熱を運ぶことができ、熱伝導率は30倍も高くなります。Googleはすでにギガワット規模で液冷システムを導入しており、過去2,000年間で99.999台以上のTPUポッドを3%という驚異的な稼働率でサポートしています。液冷サーバーは、かさばるヒートシンクをコールドプレートに置き換えることで、空冷サーバーの約半分の容積しか占めません。これにより、Googleは液冷式TPU v2スーパーコンピューターのチップ密度を空冷式TPU vXNUMX世代と比較してXNUMX倍に、規模をXNUMX倍に拡大することができました。
プロジェクト・デシューツCDU:第4世代が配備中、第5世代が構想中
TPU v3からTPU v5へ、そして今 アイアンウッドGoogleのアプローチは、インロー冷却液分配ユニット(CDU)の採用へと進化しました。これらのCDUは、ラック内の液体ループを施設内のループから分離し、制御された高性能な冷却環境を実現します。GoogleのCDUアーキテクチャであるProject Deschutesは、冗長化されたポンプと熱交換器を備え、99.999年から2020%の可用性を実現しています。
StorageReviewは液体冷却の進化を最初から追跡しており、次のようなイノベーターを取り上げています。 CoolIT, 潜水艦、 ジェットクール, DUGノマド.
業界での導入を加速
今年後半にはGoogleが貢献する予定 プロジェクト・デシューツCDU OCPにシステムの詳細、仕様、ベストプラクティスを共有し、液冷システムの大規模導入を加速します。この貢献には、冷却性能、製造品質、信頼性、導入速度、保守性、運用上のベストプラクティスを向上させるための設計ガイダンス、そしてエコシステム・サプライチェーンの進化に関する洞察が含まれます。
AIハードウェアの急速なイノベーションにより、データセンターは次なる変化の波への備えが求められています。Mt. Diablo仕様の推進によって業界が±400VDCへと移行したことは、大きな前進です。Googleは、コミュニティに対し、Project DeschutesのCDU設計を採用し、液冷に関する深い専門知識を活用して、将来のAIインフラストラクチャのニーズに対応するよう強く求めています。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード