홈페이지 Enterprise 고밀도 스토리지로 보다 반응성이 뛰어난 콘텐츠 전송 네트워크 구현

고밀도 스토리지로 보다 반응성이 뛰어난 콘텐츠 전송 네트워크 구현

by 브라이언 빌러

CDN(콘텐츠 전송 네트워크)에 대해 생각할 때 Netflix, Hulu 등과 같이 우리가 알고 있는 대형 브랜드로 바로 이동하는 것은 쉽습니다. 좋아하는 프로그램의 최신 에피소드가 휴대폰이나 거실 TV에 배포되는 것을 생각하는 것은 직관적입니다. 물론 그보다 훨씬 더 복잡하며 고용량 스토리지는 고객 경험에서 중요한 역할을 합니다.

CDN(콘텐츠 전송 네트워크)에 대해 생각할 때 Netflix, Hulu 등과 같이 우리가 알고 있는 대형 브랜드로 바로 이동하는 것은 쉽습니다. 좋아하는 프로그램의 최신 에피소드가 휴대폰이나 거실 TV에 배포되는 것을 생각하는 것은 직관적입니다. 물론 그보다 훨씬 더 복잡하며 고용량 스토리지는 고객 경험에서 중요한 역할을 합니다.

전화할 때 Hulu의 슬로더하우스, 스트리밍 장치는 먼저 집에 가까운 에지 CDN에 도달합니다. CDN 노드가 보유할 수 있는 데이터가 많을수록 서비스가 요청된 콘텐츠를 검색하기 위해 더 멀리 있는 노드로 반송되는 대신 빠른 시작을 제공할 가능성이 높아집니다. 비디오 스트리밍에 필요한 홉을 줄이는 이점은 분명하지만 CDN은 그 이상을 수행합니다.

CDN은 Tesla와 같은 자동차의 OTA(over-the-air) 업데이트나 영화 스트림을 인터넷에서 상업용 항공기 내부로 이동하는 등의 다른 사용 사례를 가능하게 합니다. 전달되는 파일 유형에 관계없이 한 가지는 분명합니다. 엣지에 더 많이 저장할 수 있을수록 CDN의 응답성이 높아질 수 있습니다. 이 모든 일을 가능하게 하는 기본 인프라입니다.

보고서에서 늘 그렇듯이 우리는 CDN이 작동하는 방식과 아키텍처에 대한 압력이 가장 많이 발견되는 위치에 대해 추측하고 싶지 않았습니다. 우리는 전문가에게 갔다. 이 경우에는 바니시 소프트웨어, 콘텐츠 전달 소프트웨어 분야의 탁월한 리더 중 하나입니다.

우리는 Varnish와 파트너십을 맺고 Varnish의 콘텐츠 전달 소프트웨어, Supermicro의 CDN 전용 서버, 30.72TB Solidigm P5316 SSD로 인한 대규모 스토리지 공간 및 고속 200GbE 상호 연결을 갖춘 완벽한 엣지 CDN 노드를 실험실에서 구성했습니다. NVIDIA는 엣지 CDN 노드의 스트레스 요인과 특히 스토리지가 결과에 미치는 영향을 더 잘 처리합니다.

바니시 소프트웨어는 누구입니까?

Varnish는 쉽게 디지털 상호 작용 속도를 높이고 대규모 트래픽 로드를 처리하며 웹 인프라를 보호할 수 있는 콘텐츠 전달 소프트웨어를 제공합니다. Varnish는 조직이 콘텐츠 제공을 클라이언트에 최대한 가깝게 이동하여 인프라에 대한 투자 수익을 최대화하는 동시에 최고의 경험을 보장하도록 돕습니다.

이 기반은 오리진과 클라이언트 사이에 있는 풍부하고 강력한 기능을 갖춘 오픈 소스 HTTP 캐시와 역방향 프록시인 Varnish Cache를 기반으로 합니다. 기본 하드웨어에서 최대 성능과 효율성을 추출하도록 최적화되었습니다. Varnish Cache는 시스템 수준 대기열, 저장 및 검색을 간소화하여 콘텐츠 전달 및 에지 전달 워크로드를 벤치마킹하는 데 이상적인 방법입니다.

Varnish는 거의 모든 작업에서 실행될 수 있지만 고객 경험을 향상시키기 위해 몇 가지 주요 영역에서 엣지 노드에 더 많은 성능을 제공하면 이점이 있습니다. 클라이언트 장치에서 데이터 센터로 돌아갈 때마다 대기 시간이 발생하므로 에지 노드가 더 많은 것을 제공할수록 좋습니다. 이를 위해 우리는 최고의 엣지 CDN 노드를 구축하고 Varnish의 엄격한 노드 검증 도구를 사용하여 테스트했습니다.

Varnish CDN이 그렇게 빠른 이유는 무엇입니까?

CDN에는 특히 에지에서 빠른 네트워크 이상의 것이 필요합니다. 모든 요청이 새로 고침을 위해 호스트 사이트로 돌아가야 한다면 비효율적이고 속도가 느릴 것입니다. 최적의 솔루션은 고객과 가까운 곳에서 데이터를 처리하고 저장하는 스토리지 시스템이 될 것입니다. 시스템에는 대용량 스토리지 기능과 캐시에서 정보를 빠르게 가져와 지연 없이 전달할 수 있는 고성능 서버가 필요합니다.

Varnish Software는 고성능 서버와 고밀도 스토리지 시스템을 갖춘 거의 모든 환경에 맞게 매우 큰 데이터 세트를 지원하는 솔루션을 구현했습니다. 대용량 스토리지 엔진을 만나보세요.

Varnish Software의 MSE(Massive Storage Engine)는 최적화된 디스크 및 메모리 캐시 엔진입니다. MSE는 비디오 및 미디어 배포, CDN 및 대용량 캐시 사용 사례를 지원하는 100TB 이상의 데이터 세트에 대한 고성능 캐싱 및 지속성을 지원합니다. MSE는 대규모 데이터 세트의 고성능 제공이 중요한 기업에 완벽하게 적합합니다.

고성능 MSE를 사용하면 다시 시작하고 업그레이드할 때에도 캐시가 그대로 유지되므로 많은 비용과 시간이 소요되는 캐시 리필을 방지할 수 있습니다. 이는 빠른 검색을 제공하고 다시 시작한 후 네트워크 정체를 방지하는 데 도움이 됩니다.

MSE 솔루션은 빠르고 확장 가능한 콘텐츠 전달을 위해 거의 무제한 크기의 개체를 캐시에 저장하고 제공할 수 있습니다. MSE는 LRU(최근 사용 횟수) 캐시 제거 정책에 따라 조각화가 적은 콘텐츠를 제공하도록 최적화되어 뛰어난 성능과 동시성을 제공합니다. 캐시 크기가 50GB보다 크거나 메모리가 제한된 고객의 경우 Varnish는 MSE 사용을 권장합니다.

최신 세대의 MSE(MSE 4)는 디스크의 정상적인 오류를 허용하여 디스크 오류가 감지된 후 영구 캐시 공간이 자동으로 작업을 재개할 수 있도록 합니다.

Edge CDN 노드 하드웨어 구성

테스트 시나리오에서는 Edge CDN 노드 역할을 하는 단일 서버와 단일 클라이언트를 활용했습니다. 우리의 CDN 노드는 슈퍼마이크로 SYS-111E-WR 서버 단일 Intel Xeon Gold 6414U CPU를 사용합니다. 이 CPU는 32개의 코어를 제공하며 기본 주파수는 2GHz입니다.

우리는 이 CPU를 256GB DDR5 메모리 및 5316개의 Solidigm P30.72 XNUMXTB QLC SSD와 결합했습니다. 이 디자인의 목표는 더 비싼 SSD나 활용도가 낮은 CPU 리소스를 추가하지 않고도 성능 측면에서 린 배포 모델이 무엇을 제공할 수 있는지 보여주기 위한 것입니다.

클라이언트 측에서는 Intel Xeon Platinum 8450H CPU와 함께 실험실에서 사용 가능한 듀얼 프로세서 플랫폼을 사용했는데, 이는 과도하지만 병목 현상이 네트워킹이나 CDN 노드인지 확인하기 위한 충분한 리소스가 있었습니다.

우리 시스템은 OS로 Ubuntu 22.04로 구성되었으며 각각 NVIDIA 200Gb NIC가 장착되었습니다. 200Gb 이더넷 패브릭은 이 테스트 시나리오에 충분한 대역폭을 제공했습니다.

Edge CDN 노드 성능

테스트 실행에서는 우리가 구축한 엣지 노드에서 Varnish Software의 전반적인 성능을 살펴보았습니다. 특히 평가되는 중요한 지표에는 TTLB(마지막 바이트까지의 시간), 요청/초, 전송/초(바이트), 총 요청, 오류, CPU 사용량, 메모리 사용량, 처리량 및 굿풋(goodput)이 포함됩니다. 명확하게 말하면 처리량은 Varnish에서 전송되는 모든 것이며 굿풋은 재전송이나 오버헤드 데이터를 무시하고 클라이언트가 실제로 보는 것입니다.

테스트는 다음을 사용하여 완료되었습니다. WRK 로드 생성 도구로서 100개의 TCP 연결을 사용하여 비디오 백엔드에서 다양한 크기의 파일 청크를 가져옵니다. 이 테스트는 배포된 비디오 전달 환경에서 흔히 볼 수 있는 현상을 시뮬레이션하기 위해 90% ~ 95%의 캐시 적중률을 갖도록 설계되었습니다. 다양한 워크로드를 시뮬레이션하기 위해 우리는 작은 파일과 큰 파일의 성능에 중점을 두었습니다. 여기서 작은 파일은 API 호출을 시뮬레이션하고 큰 파일은 라이브 또는 주문형 비디오(VOD) 시나리오에서 다양한 비디오 품질을 나타낼 수 있습니다.

작은 개체 테스트의 경우 100KB와 500KB, 큰 개체의 경우 1,000, 10,000, 16,000 및 50,000KB의 파일 크기를 테스트했습니다. 우리는 다양한 파일 크기를 살펴봄으로써 다양한 CDN 사용 사례를 포착하고자 했습니다. 대용량이지만 소규모 API 호출을 수행하는 조직의 경우 100KB가 대부분의 경우보다 클 수 있습니다. VOD의 경우 10MB 개체는 짧은 비디오 클립, 16MB는 HD 비디오, 50MB는 더 높은 품질의 비디오를 나타낼 수 있습니다. 이러한 파일 크기는 ISO 이미지, 소프트웨어 업데이트, 설치 패키지 배포 및 제공에도 적용될 수 있습니다.

로드 테스트 도구 WRK는 TTLB(마지막 바이트까지의 시간)를 반환하므로 대기 시간 측정항목은 전체 비디오 청크에 대한 전체 로드 시간을 표시합니다. 또한 TTFB(Time to First Byte)는 첫 번째 서버 응답 시간으로, 일반적으로 밀리초 단위로 측정되며 다양한 파일 크기에 대해 일정합니다.

우리는 4.4ms에서 최대 995.2ms의 TTLB를 관찰했습니다. 100KB라는 가장 작은 비디오 청크의 경우 평균 전체 응답은 4.4ms에 불과했습니다. 최대 크기인 50MB의 경우 평균 1초 이내에 전체 로드가 완료되었습니다.

주목할만한 다른 측정항목은 오류 횟수입니다. 언급된 유일한 오류는 일부 잔여 시간 초과 오류였습니다. 이는 가장 큰 크기의 물체에 대해 예상됩니다. CPU 및 메모리 사용량은 테스트 전반에 걸쳐 전체 용량의 50%~60%로 양호하게 유지되었습니다. 가장 높은 CPU 사용량은 100KB 테스트에서 58.8%, 50MB 테스트에서는 58%로 나타났습니다. 이는 작은 파일에 대한 요청 수와 큰 파일 크기로 인해 발생했습니다.

더 큰 크기의 비디오에 대한 평균 처리량은 170.5Gbps 이상이었고, 더 작은 크기의 비디오에 대한 평균 처리량은 164Gbps 이상이었습니다.

하나의 WRK 클라이언트를 로딩 생성기로 사용하여 더 큰 크기의 Goodput 평균은 158.8+ Gbps이고 더 작은 크기의 경우 149.1+ Gbps였습니다. Varnish에서 내부적으로 실행한 몇 가지 다른 실험에서 관찰된 것처럼 WRK 클라이언트를 확장하면 더 높은 처리량을 달성할 수 있을 것으로 예상되지만 이는 이 백서의 범위를 벗어납니다.

원시 성능 지표도 중요하지만 Edge CDN 시스템의 또 다른 고려 사항은 전력 소비입니다. 이것이 우리가 이 프로젝트를 위해 선택한 플랫폼이 작동하는 곳입니다. 단일 소켓 슈퍼마이크로 SYS-111E-WR 서버 듀얼 프로세서로 전력을 너무 많이 소모하지 않으면서 NIC용 PCIe 슬롯이 많은 고밀도 NVMe 스토리지 플랫폼을 제공합니다.

부하가 적용된 서버에서 소비되는 전력을 측정하기 위해 Quarch 주 전력 분석 모듈을 활용했습니다. 이를 통해 125us의 응답 시간으로 서버에서 끌어오는 전력을 정확하게 볼 수 있습니다. 여기서는 각 테스트 그룹을 동일한 시간 동안 실행하고 워크로드 시작부터 끝까지 평균 전력을 측정했습니다.

우리는 총 시스템 RMS 전력 대 테스트 파일 크기, 와트당 초당 요청이라는 두 가지 전력 지표에 중점을 두었습니다. 첫 번째 가정은 전송 속도가 높을수록 전력 사용량이 증가한다는 것이었지만 실제로는 그렇지 않았습니다. 전송 크기가 작을수록 전력 소비가 증가하는 것을 확인했으며 전송 크기가 증가함에 따라 전력 소비가 약간 감소했습니다. 이는 더 작은 전송 크기로 인해 더 많은 I/O 프로세스가 발생하고 더 적은 I/O 프로세스로 더 큰 전송 크기로 귀결됩니다.

총 시스템 전력을 살펴보면, 전송 크기가 1M일 때 시스템 전력 레벨이 473.9W로 측정되었으며, 전송 크기가 426.5M일 때 50W로 감소했습니다. 이를 와트당 초당 요청으로 분류하면 1M 전송 크기는 46.9로 측정되었으며 1.09M 전송 크기의 경우 50로 감소했습니다.

성능과 비용의 균형

우리의 Varnish CDN 노드는 탁월한 성능과 밀도를 제공하기 위해 만들어졌습니다. 1U 서버 랙 밀도뿐만 아니라 Solidigm SSD가 제공하는 용량 밀도도 마찬가지입니다. 현재 우리는 30.72TB P5316 드라이브만 "사용"하고 있지만 61.44TB P5336 장치를 사용하면 훨씬 더 많은 이점을 얻을 수 있습니다. 더 좋은 점은 CDN 워크로드의 읽기 작업이 매우 많기 때문에 이러한 QLC 기반 SSD가 작업에 적합하다는 것입니다. 재미있는 점은, Varnish로 성능 수치를 검토할 때 엔지니어가 노드 성능이 너무 인상적이어서 Gen5 SSD를 사용하고 있다고 생각했다는 것입니다.

서버 밀도는 중요한 요소 중 하나이지만 비용 최적화된 CDN 노드는 다른 것입니다. 여기서 사용한 단일 프로세서 Supermicro 서버는 Varnish에 풍부한 하드웨어 성능과 확장 옵션을 제공하는 한편, 600개의 NVMe 베이를 통해 Solidigm의 ​​SSD 용량 리더십을 사용하여 XNUMXTB 이상의 스토리지를 축적할 수 있습니다. 달러당 상대적 성능, 그리고 데이터에 대해 좀 더 자세히 알아보고 싶다면 와트당 성능 측정항목은 논쟁의 여지가 없습니다.

CDN은 때로는 예측 가능하지만 때로는 예측 가능하지 않은 요청을 통해 즉시 데이터를 전달해야 하는 불가피한 작업을 수행합니다. 미세하게 조정된 서버 하드웨어는 점점 더 엣지로 밀려나고 있는 이러한 CDN 노드의 성능에 있어 모든 차이를 만듭니다. Solidigm의 ​​대규모 기업용 SSD를 사용하면 이러한 노드는 캐시 적중률을 획기적으로 향상시켜 궁극적으로 우수한 고객 경험을 제공할 수 있습니다.

바니시 소프트웨어

솔리드다임 스토리지

이 보고서는 Solidigm이 후원합니다. 이 보고서에 표현된 모든 견해와 의견은 고려 중인 제품에 대한 우리의 공정한 견해를 기반으로 합니다.

StorageReview에 참여

뉴스레터 | 유튜브 | 팟캐스트 iTunes/스포티 파이 | 인스타그램 | 트위터 | 틱톡 서비스 | RSS 피드