AMD EPYC가 탑재된 Supermicro 서버에 적용된 ZutaCore의 2단계 냉각은 향상된 냉각 성능, 효율성 및 획기적인 성능을 제공합니다.
고성능 서버를 위한 고급 냉각 기술에 대한 지속적인 평가의 일환으로, 우리는 듀얼 AMD EPYC Bergamo CPU가 장착된 Supermicro 서버에서 ZutaCore® 2상 직접 칩(DTC) 냉각 솔루션을 테스트했습니다. 이 테스트는 영국 버크셔주 레딩에 있는 Centersquare 데이터 센터에서 통합자 Boston Limited와 협력하여 진행되었습니다.
효율적인 냉각 솔루션의 필요성
CPU의 코어 수와 전력 소비가 계속 증가함에 따라 기존의 공랭 솔루션은 최첨단 프로세서의 열 수요에 발맞추기 위해 고군분투하고 있습니다. 이는 특히 고밀도 컴퓨팅 노드에서 두드러지는데, 공랭 방식은 AMD의 128코어 EPYC Bergamo와 같은 고성능 멀티코어 CPU에서 발생하는 상당한 열을 효과적으로 관리하지 못합니다.
이러한 강력한 프로세서가 상당한 열 출력을 생성함에 따라 공기 냉각의 한계가 더욱 두드러집니다. 가장 진보된 방열판조차도 소음을 추가하거나 과도한 전력을 소모하지 않고 최적의 열 성능을 유지하는 데 어려움을 겪습니다.
이 프로젝트는 듀얼 소켓 Supermicro 섀시를 기존 공랭에서 ZutaCore의 2상 DTC 솔루션으로 업그레이드하는 데 중점을 두고 있습니다. 우리는 전환 전 시스템을 테스트하고, 상당한 냉각 효율 한계를 관찰했으며, DTC 설치 후 서버를 벤치마킹했습니다.
하드웨어 설정
테스트 시스템은 각각 1개의 코어를 자랑하는 듀얼 AMD EPYC Bergamo CPU가 장착된 128U Supermicro 섀시를 특징으로 합니다. 후드 아래에 256개의 코어와 768GB의 RAM을 갖춘 이 서버는 특히 AI 및 데이터 집약적 환경에서 밀도 있는 워크로드를 처리하도록 설계되었습니다. 그러나 대형 기존 공랭식 히트싱크를 사용하더라도 시스템은 스트레스 테스트 중에 온도를 제어하는 데 어려움을 겪었고, 그 결과 열 조절이 발생했습니다.
우리는 냉각을 개선하고 성능을 향상시키기 위해 ZutaCore의 2상 액체 냉각 시스템을 선택했습니다. 이 혁신적인 시스템은 CPU에 직접 부착된 냉각판 내에서 액체에서 증기로 전환되는 열 전달 유체를 활용합니다. 이 상 변화는 유체 증발의 잠열이 CPU 코어에서 열을 더 효과적으로 끌어내는 데 도움이 되므로 기존의 액체 또는 공기 냉각기보다 훨씬 더 높은 열 효율을 제공합니다.
변환 과정
서버 준비
변환 과정은 스톡 에어쿨링 구성 요소를 분해하는 것으로 시작되었습니다. 기존의 방열판을 제거하면 Bergamo CPU의 작고 밀도가 높은 히트 스프레더가 드러났는데, 이는 전력 소모가 많은 칩의 열 부하를 관리하기에는 분명히 크기가 작았습니다. 초기 테스트 중에 CPU가 고온에 도달하고 스트레스 상황에서 지속적인 성능을 발휘하는 데 어려움을 겪는 것을 발견했습니다.
ZutaCore 냉각판 설치
다음 단계는 2상 냉각 시스템의 핵심인 ZutaCore의 맞춤형 냉각판을 도입하는 것이었습니다. 이 냉각판에는 내부 증발기가 장착되어 있어 열 전달 유체가 열을 흡수하고 시스템을 통과할 때 증발할 수 있습니다. 증발된 유체는 응축기로 돌아가 냉각되고 시스템에 다시 도입되어 사이클을 계속합니다.
이 시스템의 더욱 매혹적인 특징 중 하나는 기계적 자체 조절입니다. 각 증발기의 플로트 메커니즘은 CPU의 열 부하에 따라 열 전달 유체 흐름을 조정합니다. 이와 같은 폐쇄 루프 시스템은 각 CPU가 수동 개입 없이 필요한 양의 유체를 받도록 보장합니다.
냉각판은 CPU에 조심스럽게 장착되어 일관된 압력과 최적의 열 접촉을 보장했습니다. 열 전달 유체를 운반하는 튜빙은 냉각판에 연결되었고, 전체 설치를 진행하기 전에 누출이 없는지 확인하기 위해 일련의 압력 테스트를 실행했습니다.
서버의 전원 및 열 관리 시스템과의 통합
다음 과제는 냉각 시스템을 더 광범위한 데이터 센터 인프라에 통합하는 것이었습니다. ZutaCore의 DTC 시스템은 서버의 기존 열 관리 시스템과 통합되며 ZutaCore의 냉각 관리 소프트웨어를 통해 향상된 제어를 제공합니다. 이 소프트웨어는 냉매 압력, 시스템의 다양한 지점에서의 온도, CPU 접합부 온도와 같은 주요 지표를 실시간으로 모니터링할 수 있습니다.
이 소프트웨어는 서버의 IPMI(Intelligent Platform Management Interface)에 연결되어 냉각 매개변수를 원활하게 모니터링하고 제어할 수 있습니다. 팬 속도, 증기 온도, 펌프 듀티 사이클을 포함한 제공된 세부 정보에 특히 감명을 받았습니다. 냉각 프로세스에 대한 이러한 세부적인 가시성을 통해 작업 부하에 맞게 시스템 성능을 미세 조정할 수 있습니다.
빠른 분리 피팅을 이용해 시스템을 방열 장치에 연결하고, 포함된 서비스 키트를 사용해 루프에서 대기 가스를 빠르게 제거한 후, 시스템에 전원을 켤 준비가 되었습니다.
실적 하이라이트
변환 전 결과
위에서 언급했듯이, ZutaCore의 256단계 시스템으로 전환하기 전에 우리는 스톡 에어 쿨링으로 일련의 벤치마크를 실행했습니다. 85개 코어에 모두 스트레스를 주도록 설계된 워크로드를 사용하여 시스템은 빠르게 열 한계에 도달하여 CPU가 안전한 작동 온도 내에 머물기 위해 성능을 조절했습니다. 지속적으로 무거운 부하가 걸리면서 CPU 온도는 XNUMX°C에 가까워졌고 클록 속도가 눈에 띄게 떨어졌습니다.
변환 후 결과
DTC 솔루션을 설치한 후, 우리는 벤치마크를 다시 실행했고, 그 결과는 극적이었습니다. 풀 로드 상태에서 CPU 온도는 상당히 떨어졌고, 피크 온도는 65°C 미만으로 유지되었습니다. 더 중요한 것은, 열 조절이 제거되었다는 것입니다. XNUMX단계 시스템은 테스트 내내 Bergamo CPU를 더 높은 지속 클록 속도로 작동시켰습니다.
놀랍지 않게도, 시스템의 전력 소비는 감소했습니다. 팬이 더 이상 고온을 보상하기 위해 최대 RPM까지 회전할 필요가 없었기 때문입니다. 소음이 많은 데이터 센터 환경에서도 더 조용한 작동이 즉시 눈에 띄었습니다.
이 연습은 ZutaCore 솔루션에 대한 실무 경험을 위한 것이었기 때문에 모든 측정은 정성적이었습니다. 촬영 및 집필 당시 ZutaCore 냉각 Bergamo 시스템은 y-cruncher BBP 범주에서 몇 가지 세계 기록을 달성했으며 HWBot.org에서 검증되었다는 점에 주목할 가치가 있습니다.
전력 및 냉각 효율성
ZutaCore 시스템의 두드러진 장점 중 하나는 에너지 절감 가능성입니다. 공기 냉각에 대한 의존도가 낮아져 고 RPM 팬과 에어컨에 대한 필요성이 낮아져 실제 에너지 비용 절감으로 이어집니다. 또한 이 시스템을 사용하면 과열 위험 없이 더 높은 주변 온도에서 서버를 작동할 수 있습니다. 이 기능은 시설의 온도를 높여 PUE(전력 사용 효율성)를 최적화하려는 데이터 센터에 매우 중요합니다.
데이터 센터에 대한 장기적 의미
ZutaCore의 2단계 냉각 솔루션은 높은 열 부하를 효과적으로 관리하고 데이터 센터에 장기적인 이점을 제공합니다. 향상된 에너지 효율성과 낮은 냉각 비용은 고밀도 컴퓨팅 환경에 필수적일 수 있습니다.
AMD의 EPYC, NVIDIA의 H100과 같은 차세대 프로세서와 GPU를 채택한 데이터 센터의 경우, ZutaCore 냉각 솔루션은 기존 인프라를 크게 변경하지 않고도 증가하는 열 출력을 관리할 수 있는 확장 가능한 옵션을 제공합니다.
또한, 2상 냉각 방식은 상당히 환경 친화적입니다. ZutaCore의 열전달 유체는 무독성이며 GWP(지구 온난화 잠재력)가 낮습니다. 유전체 유체를 사용하면 누출이 발생하더라도 전기 단락이나 장비 손상의 위험이 없습니다.
결론
Supermicro 듀얼 AMD EPYC Bergamo 서버를 ZutaCore의 2상 직접 칩 냉각 솔루션으로 전환한 결과 열 성능, 소음 감소 및 에너지 효율성이 확연히 향상되었습니다. 데이터 센터가 계속 확장되고 서버 성능의 한계를 뛰어넘으면서 ZutaCore와 같은 고급 냉각 기술은 현대 컴퓨팅 환경의 증가하는 열 수요를 관리하기 위한 유망한 진로를 제공합니다.
고밀도 작업 부하를 운영하고 하드웨어를 한계까지 끌어올리는 경우 ZutaCore와 같은 고급 냉각 솔루션에 투자하면 장기적으로 성능을 향상하고 운영 비용을 절감할 수 있습니다.
큰 소리 치다. 보스턴 리미티드 하드웨어를 공급해 주신 Centersquare와 데이터 센터를 제공해 주신 Centersquare에 감사드립니다!
StorageReview에 참여
뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드