Chilldyne ポッドキャスト – 高性能サーバーの漏れ防止設計と効率性に重点を置いたデータセンター向け液体冷却ソリューション。
ブライアンがポッドキャストで医師と対談する機会はめったにありません。しかし、今日は Chilldyne の CEO であるスティーブ・ハリントン博士が参加しています。私たちは液体冷却技術に強い関心を持っており、次々に新しい技術が登場しています。しかし、私たちは Chilldyne に特別な思い入れを持っています。
スティーブ・ハリントン博士の経歴。彼は Chilldyne の CTO であり、Flometrics の創設者です。彼は流体力学と熱力学の専門家であり発明家であり、ポンプ、バルブ、ノズル、流量計、航空機冷却システム、ロケット燃料ポンプ、ロケット試験台、タービン流量測定システム、医療用人工呼吸器、空気/酸素ミキサー、呼吸加湿器、CPAP マシン、スパイロメーター、熱交換器、掃除機、酸素濃縮器、オートバイのフェアリング、輸液ポンプ、電子機器冷却システム、ウェーブマシン、データ取得システムなどを設計しています。しかし、それだけではありません。彼の専門知識は、電子機器、プログラミング、光学、原子物理学、生物学、生理学にまで及びます。
スティーブは、流体力学と熱力学の分野で 29 年以上の経験があります。航空宇宙、半導体、医療機器、レース、電子冷却などの業界でコンサルタントを務めてきました。25 件を超える特許を保有し、NASA、DARPA、SOCOM、USACE のプロジェクトを完了しています。
暇な時は、カリフォルニア大学サンディエゴ校の非常勤講師として、学生に液体ロケットの計測、組み立て、飛行を教える航空宇宙工学上級設計クラスを教えています。また、サーファー、パイロット、スキューバダイバー、ボートや車の整備士、電気技師、配管工でもあります。
液体冷却については学ぶべきことがたくさんありますが、このポッドキャストは世界中の IT およびデータ センターの専門家が抱いている疑問のいくつかに答えるのに役立つと考えています。
これで、このポッドキャストを全部聞きたくなるはずです。ただし、時間がない場合は、必要に応じて飛ばして聞けるように、ポッドキャストを 5 分間のセグメントに分割しました。
00:00 – 05:30 はじめに
「ホットな」新技術:液体冷却
ブライアンは、液体冷却がデータ センターで「ホット」な技術であるというダジャレで話を開始します。液体冷却は一周して戻ってきました。CMOS の出現により一度は放棄されましたが、現代のプロセッサが発する強烈な熱のために、現在では復活しています。
スーパーコンピュータからジェットエンジンまで
Steve は、1980 年代のスーパーコンピューターの冷却から始まった液体冷却への道のりについて、個人的な歴史を語ります。興味深い事実: ロケット エンジンとレーザー システムの冷却に関する彼の専門知識は、現代のデータ センターの液体冷却にうまく応用されています。
液体冷却はなぜ廃止されたのか?
CMOS テクノロジによって電力の問題が解決されたと考えられていたため、液体冷却は休止状態になりました。しかし、驚いたことに、電力需要が猛烈な勢いで復活しています。
航空宇宙からデータセンターまで
航空宇宙産業では、液体冷却は単なる冷却ではなく、長期にわたる信頼性が重要です。飛行機、ロケット、レーザーを考えてみましょう。一方、データ センターでは稼働時間と寿命が求められ、スティーブが航空宇宙産業から転職する際には、独特の課題が加わります。
ARPA-E グラントと 2 キロワット チップ
スティーブの先見の明には、ARPA-E と提携して 2 キロワット チップ用のコールド プレートを開発することが含まれていました。この先見の明は実を結び、より多くのデータ センターがこれらの高出力チップを使用したプロジェクトに入札するようになりました。
05:30 – 10:24 CFOを安心させる
液体冷却: CFO にとっての悪夢?
液体冷却システムのテストには数百万ドルの費用がかかることがあります。CFO にそのような「実験」を承認してもらうのは、財務スプレッドシートにうまく収まらないため、容易なことではありません。2 万ドルの試乗を購入するようなものです。楽しそうに聞こえますが、リスクはあります。
秘密の共有: メタパラドックス
Meta やその他の大手企業は、液体冷却の秘密を自社のアルゴリズムよりも厳重に守る傾向があります。共有は思いやりですが、競争が絡むとそうはいきません。
Chilldyneの漏れ防止負圧システム
Chilldyne の秘密は、基本的に漏れのない負圧システムです。漏れが発生した場合、冷却剤が漏れる代わりに空気が入り込み、チップが湿った状態になるのを防ぎます。
漏水の対処: 慌てないとき
漏れがあっても、チルダインのシステムは稼働し続けます。
液体冷却データ: 欠けている章
液体冷却が摩耗に与える影響に関する業界全体のデータは乏しいです。液体冷却は、オープンな議論というよりは、謎めいた「ビール会議」のトピックのように感じられるかもしれません。
10:24 – 14:55 水から細菌を排除する
データセンター冷却剤の生物多様性
水道水に含まれる地元の細菌が液体冷却システムに悪影響を及ぼす可能性があることをご存知ですか? 地域によって微生物は異なり、データセンターの冷却システムに大損害を与え、プレートの詰まりや GPU の過熱を引き起こす可能性があります。
冷却剤化学入門
Chilldyne には、冷却剤の品質を監視するための化学実験室が組み込まれています。滅菌水の夢は忘れてください。これは生物学とテクノロジーの戦いです。
冷却剤添加剤:予算のジレンマ
緊急メンテナンスが必要でない限り、冷却剤の化学薬品を安く購入しないでください。
PG 25: ゲーマーの友、データセンターの敵
PG 25 は凍結せず、バクテリアの増殖を防ぐので、ゲーマーに最適です。ただし、シール部分を攻撃し、時間が経つと漏れが発生するため、データセンターでの長期使用には適していません。
データセンターのメンテナンスにおける化学の役割
データ センターでは、液体冷却が「設定して忘れる」ソリューションではないことを忘れがちです。定期的な監視とメンテナンスが必要です。
14:55 – 20:16 低毒性添加物の必要性
涼しさを保つ添加物
Chilldyne は、抗菌性および防錆性の化学物質を少量配合した、毒性の低い添加剤を使用しています。
PG 25 にはノーと言う(時々)
PG 25 は、液体冷却装置を出荷するゲーマーにとっては「凍結しない」救世主ですが、データセンターにとってはそうではありません。
施設用水は始まりに過ぎない
CDU (冷却分配ユニット) を設置する場合、Chilldyne は蒸留水または逆浸透ろ過水から始めます。
コールドプレートクリーンアップクルー
ある顧客は推奨された添加剤の使用を拒否したため、GPU が詰まって熱くなりました。Chilldyne は化学洗浄で対応しましたが、コールド プレートが詰まりすぎると、ゲームオーバーになり、交換が必要になることもあります。
液体冷却は「設定して忘れる」ものではない
電子機器は何年もスムーズに動作しますが、液体冷却はどうでしょうか? それはまた別の話です。
20:16 – 26:03 冷却にはやはり水が一番
水: 冷却液のMVP
なぜ古き良き水にこだわるのでしょうか? 水は安価で、無毒であり、特に単相システムでは優れた性能を発揮します。
浸漬冷却:スローバーナー
エンジニアリングオイルを使用した浸漬冷却は、特にエッジゾーンや中程度の電力のサーバーではある程度の可能性がありますが、今日の 2 キロワットのモンスターには効率が足りません。
パイプが異常に大きくなると
冷却システムの規模が拡大するにつれて、物流上の悪夢に注意してください。
電気の限界:本当のボトルネック
液体冷却システムは拡張可能ですが、チップが処理できる電流量には限界があります。
チラーを忘れないでください
冷却塔は多くの場所で理想的ですが、水不足のためチラーが必要な地域もあります。冷却塔をお勧めします。
26:03 – 29:44 それは漏れですか?
リークでは分からない
サーバー コンポーネントとは異なり、液体冷却システムはまだ漏れに関する事前警告を出すほどスマートではありません。
正圧の問題
特殊なテープで漏れを検出する正圧システムは反応型で、何か問題が発生するとサーバーをシャットダウンします。一方、Chilldyne のような負圧システムは、軽微な漏れがあってもサーバーを稼働させ続け、コストのかかるダウンタイムを回避します。
互換性の混乱
複数のベンダーから部品を購入する場合の問題は、互換性の問題です。
配管工はITスキルではない
データ センターのオペレーターは、ネットワーク、サイバー セキュリティ、電力管理のスキルを持っていますが、配管工や化学者ではありません。そこで、専門のベンダーの出番です。
スイッチオーバーバルブ:フェイルセーフ
Chilldyne は、冷却システムの冗長性を確保するためにスイッチオーバー バルブを使用しています。これらのバルブは飛行機の安全装置のように機能し、1 つのシステムに障害が発生した場合、サーバーが気付かないうちにもう 1 つのシステムが作動します。
29:44 – 35:22 液体冷却が本当に必要なのか確認する
規模が重要: 100kW の閾値
Steve は、100kW を超える計算能力を扱っていない限り、液体冷却は面倒な作業に値しないと示唆しています。
フォーチュン500以上の企業
大企業はすでにその状況にありますが、中堅企業でさえもその熱を感じ始めています。GPU を満載したサーバーの電力消費を考えると、多くの組織にとって液体冷却がすぐに必要になるでしょう。
ラックスケールCDUは
Chilldyne は 50 ~ 100kW のラック スケール CDU を設計していますが、まだ購入者はいません。
4インチパイプの問題
液体冷却システムは、配管が扱いにくくなる前に、約 1 ~ 2MW で最大になります。システムを扱いやすくしておくことが重要です。
電気と冷却の限界
冷却能力よりも電気的な制限の方が問題になる段階に近づいています。
35:22 – 40:16 ここは暑いですか?
熱処理の難問
ギアを冷却するだけでは不十分で、大量の熱に対処する必要があります。
チップ温度タンゴ
冷却効率とチップのパフォーマンスにはバランスがあります。次世代チップは低温で 20% 高速に動作する可能性があるため、必要に応じて低温にできるシステムを設計してください。
データセンターの計算は難しくなりつつある
冷却塔の効率、GPU のパフォーマンス、ファンの速度など、さまざまな要素を考慮します。今日の冷却ソリューションの背後にある計算は、最適化にとって非常に重要です。
HVAC と IT: 奇妙な組み合わせ
HVAC エンジニアと IT チームは以前は別々に活動していましたが、液体冷却によって両者が結びついています。
IT 担当者に最新情報を伝える
ハードウェア プロバイダーと冷却の専門家との連携を促進して、ソリューションが圧力によって溶解しないようにします。
40:16 – 43:35 まとめ
今すぐ液体冷却を始めましょう
スティーブは、小さく始めることを推奨していますが、今すぐ始めましょう。システムを入手して実行し、深みにはまってしまう前にそこから学んでください。
自信過剰の危険性
企業の中には、小規模なシステムをテストすることなく、大規模な液体冷却データセンターを計画しているところもあります。
リードタイム:それは現実です
液体冷却システムのリードタイムは 16 ~ 52 週間です。早めに注文したほうがよいでしょう。
新しいラックの仕様に関する混乱
NVIDIA の新しい MVL ラックは間もなく登場しますが、具体的な水温や化学的なガイドラインはまだ不明です。
ホームラボの精神: 練習を積む
スティーブは、企業に「ホームラボ」アプローチ、つまり小さく始めて、いろいろ試して、学ぶことを推奨しています。
StorageReview と連携する
ニュースレター | YouTube |ポッドキャスト iTunes/Spotifyは | Instagram | Twitter | TikTok | RSSフィード