홈페이지 Enterprise 중요한 DDR4 LRDIMM 서버 메모리 검토

중요한 DDR4 LRDIMM 서버 메모리 검토

by 아담 암스트롱

모든 스토리지 기술과 새로운 CPU가 점점 더 높은 성능을 주도하는 가운데 한동안 성능을 제공해온 퍼즐의 한 조각은 메모리(DRAM/RAM)입니다. 일반적으로 더 많은 성능이 필요한 경우 더 많은 RAM을 추가하면 됩니다. 이것은 빨리 비싸질 수 있습니다. Crucial은 비용에 대해 많은 것을 할 수 없지만(구성 부품은 비싸지만 가격이 서서히 약해지고 있기 때문에) 고성능 및 고용량 RAM 모듈을 출시했습니다. 이것이 회사가 DDR4 LRDIMM 서버 메모리 모듈로 수행한 작업입니다.


모든 스토리지 기술과 새로운 CPU가 점점 더 높은 성능을 주도하는 가운데 한동안 성능을 제공해온 퍼즐의 한 조각은 메모리(DRAM/RAM)입니다. 일반적으로 더 많은 성능이 필요한 경우 더 많은 RAM을 추가하면 됩니다. 이것은 빨리 비싸질 수 있습니다. Crucial은 비용에 대해 많은 것을 할 수 없지만(구성 부품은 비싸지만 가격이 서서히 약해지고 있기 때문에) 고성능 및 고용량 RAM 모듈을 출시했습니다. 이것이 회사가 DDR4 LRDIMM 서버 메모리 모듈로 수행한 작업입니다.

Crucial의 DDR4 LRDIMM 서버 메모리 모듈은 두 가지 측면에서 가상화, 클라우드 컴퓨팅 및 고성능 컴퓨팅(HPC)과 같은 애플리케이션을 지원할 수 있습니다. 하나는 더 높은 밀도를 통해 서버에서 더 많은 DRAM을 허용할 수 있으며 모듈은 최대 128GB입니다. CPU당 12개의 메모리 슬롯이 있는 서버의 경우 잠재적으로 CPU당 최대 1.5TB의 RAM을 가져올 수 있습니다. DRAM의 속도는 최대 2,666MT/s(낮은 용량은 2,400MT/s)입니다. RAM은 또한 1.2V의 전력 소비를 가져옵니다. 이 모든 것은 약속된 성능을 제공하는 데 도움이 될 뿐만 아니라 밀도를 통해 사용량을 통합하고 종료를 방지할 수 있으므로 비용을 절감할 수 있습니다.

Crucial LRDIMM 서버 메모리 사양 

부품 번호 모듈 유형 밀도 속도 계급 전압 구성 요소 구성 CAS 대기 시간
CT32G4LFD424A LRDIMM 288핀 32GB 2400MT / s 이중의 1.2V 2Gx4 CL17
CT32G4LFD4266 LRDIMM 288핀 32GB 2666MT / s 이중의 1.2V 2Gx4 CL19
CT64G4LFQ4266 LRDIMM 288핀 64GB 2666MT / s 쿼드 1.2V 4Gx4 CL19
CT128G4ZFE426S LRDIMM 288핀 128GB 2666MT / s 쿼드 1.2V 8Gx4 CL19

고객 사례

위에서 언급한 바와 같이 밀도가 높고 성능이 뛰어난 DRAM이 이상적이거나 경우에 따라 필요한 여러 사용 사례가 있습니다. 밀도 측면에서 생각하면 많을수록 좋다는 쉬운 답이 떠오릅니다. 그러나 이것은 빠르게 비용이 많이 들 수 있습니다. NVRAM은 DRAM과 NVMe SSD와 같은 고성능 스토리지 기술 사이에 있는 가교 기술입니다. NVRAM은 DIMM 슬롯을 활용하여 서버에서 사용할 수 있는 저밀도 DRAM에 사용할 수 있는 슬롯의 양을 제한합니다. Crucial의 더 높은 32GB, 64GB 또는 128GB 모듈을 사용하면 사용자가 RAM 공간을 희생하지 않고도 NVRAM을 활용할 수 있습니다.

밀도는 또한 사용 사례를 기반으로 DRAM 계획을 허용할 수 있습니다. VDI는 새로운 GPU가 그래픽 디자인 관점에서 점점 더 많은 작업을 수행할 수 있게 해주는 흥미로운 예입니다. 예를 들어 VDI는 각 VM에 충분한 RAM이 할당되지 않은 경우 성능이 크게 저하될 수 있습니다. 여기서 문제는 대부분의 응용 프로그램이 시간이 지남에 따라 더 많은 RAM을 필요로 한다는 것입니다. 따라서 관리자는 처음에 VM에 필요한 RAM의 양을 결정해야 할 뿐만 아니라 시간이 지남에 따라 얼마나 많이 사용할지도 알아야 합니다. 더 높은 성능과 더 높은 밀도의 DRAM을 사용하면 관리자는 RAM 할당에 대해 조금 더 많은 여유를 갖게 됩니다. 물론 VDI가 간단한 것(콜 센터 또는 간단한 데이터 입력)용으로 설정되어 있다면 RAM은 전반적인 문제가 아닙니다. 

가상화는 위와 동일한 보트에 적합합니다. VM의 RAM이 부족할 뿐만 아니라 물리적 서버당 VM이 많을수록 더 많은 RAM이 필요합니다. 더 많은(또는 필요한) 메모리 VM은 더 나은 QoS를 갖게 됩니다. 여기에는 빅 데이터 및 분석, 데이터베이스, 콘텐츠 호스팅, 이메일, 웹 호스팅, 파일 공유 및 콘텐츠 생성과 같은 가상화된 서버 애플리케이션이 포함됩니다. 가상화에 더 많은 메모리가 존재한다는 것은 예측할 수 없는 워크로드가 발생할 때 더 잘 처리할 수 있음을 의미합니다. 이것은 더 빠른 속도의 워크로드가 동일한 서버에서 작동할 수 있도록 하는 로컬 및 공유 모두에서 더 빠른 플래시 제품에 의해 주도되는 추세입니다. StorageReview는 당사에서 이러한 시나리오를 테스트하기 위한 요점을 제시합니다. 서버 리뷰, 스토리지 및 CPU 리소스에 적절하게 부하를 주기 위해 지정된 서버에 4개 또는 8개의 MySQL VM을 배치합니다. 각 데이터베이스 VM에 60GB의 DRAM이 할당되므로 메모리 요구 사항이 빠르게 합산됩니다.

더 많은 RAM이 응용 프로그램에 도움이 되는 경우를 제외하고 CPU 자체를 고려해야 합니다. AMD와 Intel CPU 모두 점점 더 많은 코어를 추가하고 있으며 이제 AMD EPYC에서 최대 32개입니다. 이러한 모든 코어를 갖는다는 것은 실행할 수 있는 애플리케이션이 점점 더 많아지고 더 높은 밀도로 충족되어야 하는 RAM에 대한 요구가 점점 더 높아진다는 것을 의미합니다. 위에서 언급한 바와 같이 12개의 메모리 슬롯이 있는 마더보드는 이러한 새로운 높은 코어 수 CPU를 위해 최대 1.5TB의 DRAM을 지원할 수 있습니다.  

퍼포먼스

RAM은 일반적인 테스트 공세에 비해 벤치마크하기가 약간 까다롭습니다. 그러나 기존 장비를 활용하여 더 많은 RAM을 추가하면 실행할 수 있는 워크로드의 양과 서버의 잠재력을 최대한 발휘하는 측면에서 시스템에 어떤 이점이 있는지 보여줄 수 있습니다. 이를 시연하기 위해 우리는 850GB RAM이 장착된 Lenovo SR512을 로드하고 지정된 플랫폼에서 여러 인스턴스를 확장할 때 RAM에 의존하는 Sysbench 워크로드를 실행했습니다. Sysbench 워크로드는 MySQL 전용 24GB로 프로비저닝되고 나머지는 시스템 리소스로 사용됩니다. 고객이 증가하는 컴퓨팅 리소스를 최대한 활용하는 방법과 유사하게 모든 VM에 대해 서버에 충분한 RAM이 설치되어 있는지 확인해야 합니다.

트랜잭션 테스트에서 8개의 NVMe 드라이브가 있는 21,632VM이 16 TPS에 도달한 반면 25,427VM은 XNUMX TPS에 도달할 수 있었습니다. 모든 워크로드가 컴퓨팅 리소스 자체를 완전히 포화시킬 수는 없지만 워크로드를 완전히 확장하지 않고도 테이블에 여전히 성능이 남아 있음을 보여줍니다. 

Sysbench 평균 대기 시간으로 이동하면 8VM은 11.96ms에 불과했고 16VM은 20.26ms에 불과했습니다.

결론

Crucial LRDIMM 서버 메모리 모듈은 서버에 더 많은 RAM 밀도와 성능을 제공합니다. 이 모듈은 최대 128GB의 밀도로 실행되므로 12개의 메모리 슬롯 서버에서 사용자는 CPU당 최대 1.5TB의 RAM을 사용할 수 있습니다. 새로운 모듈은 또한 최대 2,666MT/s의 속도로 실행됩니다. 즉, HPC, 가상화 및 클라우드 컴퓨팅과 같은 애플리케이션은 필요에 따라 더 빠르고 충분한 RAM을 확보할 수 있습니다. 대체로 이것은 비용 절감과 성능 향상으로 이어져 보다 효과적인 최종 사용자 경험을 제공할 수 있습니다. 

밀도가 높은 고성능 DRAM은 다양한 사용 사례에서 많은 개선을 가져올 수 있습니다. 이를 통해 조직은 DRAM 공간을 너무 많이 포기하지 않고도 NVRAM을 활용할 수 있습니다. VDI 및 가상화의 경우 추가된 RAM은 VDI 설정에 대한 RAM 할당 문제를 해결하고 RAM이 부족한 VM에 충분한 메모리를 제공할 수 있습니다. 그리고 CPU에서 코어 수가 계속 증가함에 따라 더 많은 애플리케이션이 실행되고 있으며 원하는 성능을 달성하려면 더 많은 RAM이 필요합니다.

성능을 위해 남은 CPU 리소스를 더 잘 활용하기 위해 스토리지가 많은 워크로드를 확장할 수 있는 이점을 살펴보았습니다. 우리는 트랜잭션 성능이 21,632VM에서 8 TPS에 도달하는 것을 보았습니다. 이는 그 자체로는 훌륭하지만 서버의 컴퓨팅 리소스를 완전히 포화시키지는 않습니다. 총 16개의 VM이 있는 더 많은 Sysbench VM을 서버로 이동하면 총 성능이 25,427 TPS로 증가했습니다. 많은 서버가 스토리지 및 컴퓨팅 기능을 지속적으로 확장함에 따라 보유한 리소스를 최대한 활용하려면 DRAM 밀도를 높여야 할 수 있습니다. 이 작업에는 Crucial LRDIMM이 완벽하게 적합하며 결과적으로 우리 연구실에서 많이 활용됩니다.

결정적인 기억

이 검토에 대해 토론

StorageReview 뉴스레터 신청