Google은 400MW 랙과 증가하는 열 부하를 처리할 수 있는 +/-1 VDC 전력과 액체 냉각 시스템을 갖춘 새로운 AI 데이터 센터 인프라를 개략적으로 설명합니다.
에서 2025 OCP EMEA 서밋Google은 최신 데이터 센터를 지원하는 물리적 인프라에 대한 중요한 발표를 진행했습니다. 메시지는 명확했습니다. AI 워크로드가 확장됨에 따라 전력, 냉각 및 기계 시스템의 성능 또한 향상되어야 한다는 것입니다.
AI의 끝없는 전력 수요는 더 이상 이론적인 차원이 아닙니다. 구글은 2030년까지 머신러닝 구축에 IT 랙당 500kW 이상의 전력이 필요할 것으로 전망합니다. 이러한 급증은 랙 밀도 향상에 대한 끊임없는 요구에서 비롯되는데, 랙의 모든 밀리미터는 긴밀하게 상호 연결된 "xPU"(GPU, TPU, CPU)로 채워져 있습니다. 이러한 요구 사항을 충족하기 위해서는 전력 분배 방식에 근본적인 변화가 필요합니다. 바로 고전압 DC 솔루션, 전력 부품 및 배터리 백업을 랙 외부로 이전하는 것입니다. 이러한 변화와 함께 새로운 업계 유행어가 생겨났습니다.
전력 공급
구글의 첫 번째 주요 발표는 지난 48년간의 데이터 센터 전력 공급 발전 과정을 재점검하는 것이었습니다. 12년 전, 구글은 IT 랙 내 10VDC 전환을 적극적으로 추진하여 기존 100VDC 표준 대비 전력 분배 효율을 획기적으로 향상시켰습니다. 업계는 랙 전력을 48kW에서 400kW로 확장하는 방식으로 대응했습니다. 100V 직류(VDC)에서 새로운 ±1VDC로의 전환을 통해 IT 랙의 전력 용량을 XNUMXkW에서 XNUMXMW까지 확장할 수 있게 되었습니다.
The 디아블로 산 프로젝트Meta, Microsoft, 그리고 OCP 커뮤니티의 협력으로 탄생한 이 프로젝트는 400VDC에서 전기 및 기계 인터페이스를 표준화하는 것을 목표로 합니다. 이러한 전압 선택은 임의적인 것이 아니라, 전기 자동차를 위해 구축된 견고한 공급망을 활용하여 규모의 경제, 제조 간소화, 그리고 품질 향상을 실현합니다.
+/-400 VDC 전력 공급: AC-DC 사이드카 전원 랙
첫 번째 가시적인 결과는 전원 구성 요소를 IT 랙에서 분리하는 AC-DC 사이드카 전원 랙입니다. 이 아키텍처는 엔드투엔드 효율을 약 3% 향상시키고 랙 전체를 컴퓨팅 하드웨어에 할당할 수 있도록 합니다. 앞으로 Google과 파트너사들은 데이터센터 전체에 고전압 DC 직접 분배를 도입하여 더욱 높은 밀도와 효율성을 제공할 수 있도록 노력하고 있습니다.
열 도전
칩의 전력 소비량이 100W CPU에서 1,000W를 넘는 가속기로 급증함에 따라 열 관리는 필수적인 요소가 되었습니다. 업계는 혁신의 물결로 대응해 왔지만, 과제는 명확합니다. 칩 밀도가 높아질수록 냉각 요구량도 증가하기 때문입니다.
액체 냉각은 대규모 솔루션으로 유일하게 실현 가능한 솔루션으로 부상했습니다. 물의 열적 특성은 타의 추종을 불허합니다. 단위 부피당 공기보다 약 4,000배 더 많은 열을 전달할 수 있으며, 열전도도는 30배 더 높습니다. Google은 이미 기가와트 규모의 액체 냉각 기술을 도입하여 지난 2,000년 동안 99.999개 이상의 TPU 포드를 지원하며 3%의 놀라운 가동 시간을 달성했습니다. 액체 냉각 서버는 공랭식 서버보다 부피가 약 절반밖에 차지하지 않아 부피가 큰 히트싱크를 냉각판으로 대체했습니다. 이를 통해 Google은 공랭식 TPU v2 세대 대비 액체 냉각 TPU vXNUMX 슈퍼컴퓨터의 칩 밀도를 두 배로 높이고 규모를 네 배로 확장할 수 있었습니다.
프로젝트 데슈츠 CDU: 4세대 배치, 5세대 개념
TPU v3에서 TPU v5로, 그리고 지금 아이언 우드Google의 접근 방식은 인로우(in-row) 냉각수 분배 장치(CDU)를 사용하는 방식으로 발전했습니다. 이 CDU는 랙 액체 루프를 시설 루프로부터 분리하여 제어된 고성능 냉각 환경을 제공합니다. Google의 CDU 아키텍처인 프로젝트 데슈츠(Project Deschutes)는 이중 펌프와 열교환기를 특징으로 하며, 99.999년 이후 2020%의 가용성을 달성했습니다.
StorageReview는 액체 냉각의 진화를 처음부터 추적하여 다음과 같은 혁신자들을 다루었습니다. 진정해, 잠수함, 제트쿨및 DUG 노마드.
산업 채택 가속화
올해 말에 Google이 기여할 것입니다. 프로젝트 데슈츠 CDU OCP에 시스템 세부 정보, 사양 및 모범 사례를 공유하여 대규모 액체 냉각 시스템 도입을 가속화합니다. 이 자료에는 향상된 냉각 성능 설계, 제조 품질, 신뢰성, 구축 속도, 서비스 가능성, 운영 모범 사례, 그리고 생태계 공급망 발전에 대한 통찰력에 대한 지침이 포함됩니다.
AI 하드웨어 혁신의 빠른 속도는 데이터 센터가 차세대 변화에 대비할 것을 요구합니다. 마운트 디아블로 사양을 통해 촉진된 ±400VDC로의 업계 전환은 중요한 진전입니다. 구글은 미래 AI 인프라의 요구를 충족하기 위해 데슈츠 프로젝트의 CDU 설계를 채택하고 수냉 분야에 대한 구글의 심층적인 전문 지식을 활용할 것을 업계에 촉구합니다.
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드