O Google descreve uma nova infraestrutura de data center de IA com energia de +/-400 VCC e resfriamento líquido para lidar com racks de 1 MW e cargas térmicas crescentes.
No Cúpula OCP EMEA 2025O Google fez anúncios cruciais sobre a infraestrutura física que dá suporte aos data centers modernos. A mensagem era clara: à medida que as cargas de trabalho de IA aumentam, o mesmo deve ocorrer com as capacidades dos sistemas de energia, refrigeração e mecânicos.
O apetite insaciável da IA por energia não é mais uma teoria. O Google projeta que, até 2030, as implantações de aprendizado de máquina demandarão mais de 500 kW por rack de TI. Esse aumento é impulsionado pela busca incessante por densidades de rack mais altas, onde cada milímetro é preenchido com "xPUs" (GPUs, TPUs, CPUs) firmemente interconectadas. Uma mudança fundamental na distribuição de energia é necessária para atender a esses requisitos: soluções de CC de alta tensão, com componentes de energia e bateria de reserva movidos para fora do rack. E com essa mudança, surge um novo termo da moda no setor.
Entrega de potência
O primeiro grande anúncio do Google revisitou uma década de progresso no fornecimento de energia para data centers. Dez anos atrás, o Google defendeu a mudança para 48 VCC em racks de TI, melhorando drasticamente a eficiência da distribuição de energia em relação ao antigo padrão de 12 VCC. A indústria respondeu aumentando a potência dos racks de 10 kW para 100 kW. A transição de 48 VCC para o novo +/-400 VCC permite que os racks de TI aumentem a potência de 100 quilowatts para 1 megawatt.
A Projeto Monte Diablo, uma colaboração entre a Meta, a Microsoft e a comunidade OCP, visa padronizar interfaces elétricas e mecânicas a 400 VCC. Essa seleção de tensão não é arbitrária; ela aproveita a robusta cadeia de suprimentos desenvolvida para veículos elétricos, gerando economias de escala, simplificação da fabricação e melhoria da qualidade.
Fornecimento de energia de +/-400 VCC: rack de energia lateral CA para CC
O primeiro resultado tangível é um rack de energia sidecar CA-CC, que desacopla os componentes de energia do rack de TI. Essa arquitetura proporciona um aumento de aproximadamente 3% na eficiência de ponta a ponta e libera todo o rack para hardware de computação. Visando o futuro, o Google e seus parceiros estão explorando a distribuição direta de CC de alta tensão por todo o data center, prometendo densidade e eficiência ainda maiores.
O Desafio Térmico
Com o aumento do consumo de energia dos chips — de CPUs de 100 W para aceleradores que ultrapassam 1,000 W — o gerenciamento térmico tornou-se essencial. A indústria respondeu com uma onda de inovação, mas o desafio é claro: maiores densidades de chips significam maiores demandas de resfriamento.
O resfriamento líquido surgiu como a única solução viável em escala. As propriedades térmicas da água são incomparáveis: ela pode transportar cerca de 4,000 vezes mais calor por unidade de volume do que o ar, e sua condutividade térmica é 30 vezes maior. O Google já implementou o resfriamento líquido em escala de gigawatts, suportando mais de 2,000 TPU Pods com um tempo de atividade impressionante de 99.999% nos últimos sete anos. Servidores refrigerados a líquido ocupam cerca de metade do volume de seus equivalentes refrigerados a ar, substituindo dissipadores de calor volumosos por placas frias. Isso permitiu ao Google dobrar a densidade de chips e quadruplicar a escala de seus supercomputadores TPU v3 refrigerados a líquido em comparação com a geração TPU v2 refrigerada a ar.
Projeto Deschutes CDU: 4ª geração em implantação, 5ª geração em conceito
Do TPU v3 ao TPU v5 e agora IronwoodA abordagem do Google evoluiu para o uso de unidades de distribuição de refrigerante (CDUs) em fileira. Essas CDUs isolam o circuito de líquido do rack do circuito da instalação, proporcionando um ambiente de resfriamento controlado e de alto desempenho. O Projeto Deschutes, a arquitetura de CDU do Google, conta com bombas e trocadores de calor redundantes, alcançando 99.999% de disponibilidade desde 2020.
O StorageReview acompanhou a evolução do resfriamento líquido desde o início, cobrindo inovadores como Acalme-se, Submerso, JetCool e DUG Nomad.
Acelerando a adoção pela indústria
Ainda este ano, o Google contribuirá Projeto Deschutes CDU para o OCP, compartilhando detalhes do sistema, especificações e melhores práticas para acelerar a adoção do resfriamento líquido em escala. A contribuição incluirá orientações sobre projeto para melhor desempenho de resfriamento, qualidade de fabricação, confiabilidade, velocidade de implantação, facilidade de manutenção, melhores práticas operacionais e insights sobre os avanços da cadeia de suprimentos do ecossistema.
O ritmo acelerado da inovação em hardware de IA exige que os data centers se preparem para a próxima onda de mudanças. A mudança da indústria em direção a +/-400 VDC, impulsionada pela especificação Mt. Diablo, representa um avanço significativo. O Google incentiva a comunidade a adotar o projeto de CDU do Projeto Deschutes e a aproveitar sua profunda experiência em refrigeração líquida para atender às demandas da infraestrutura de IA do futuro.
Envolva-se com a StorageReview
Newsletter | YouTube | Podcast iTunes/Spotify | Instagram | Twitter | TikTok | RSS feed