홈페이지 Enterprise 플래시 종단 간 검토가 포함된 Datrium DVX

플래시 종단 간 검토가 포함된 Datrium DVX

by StorageReview 엔터프라이즈 랩

Datrium은 차세대 통합 인프라라고 부르는 "개방형 융합"을 제공합니다. 엔터프라이즈 IT 분야의 벤더 수만큼 컨버전스에 대한 리프가 많을 수 있으며 Datrium은 인프라의 모습에 대한 비전을 홍보하는 데 부끄러워하지 않습니다. Datrium의 관점에서는 컴퓨팅, 기본 스토리지, 보조 스토리지 및 클라우드가 각 스토리지 클래스에 대한 사일로 없이 확장 가능하고 관리하기 쉬운 매우 탄력적인 구성으로 결합되는 것을 봅니다. 또한 대부분의 데이터 호출이 온보드 플래시 캐시로 컴퓨팅 노드에 도달하기 때문에 Datrium은 거의 모든 경우에 데이터 노드로 이동하지 않고도 엄청난 성능을 제공할 수 있습니다. 이는 최대 200K 읽기 및 쓰기 대역폭과 16M IOPS 32K 임의 읽기에서 18GB/s 및 4GB/s로 변환됩니다.


Datrium은 차세대 통합 인프라라고 부르는 "개방형 융합"을 제공합니다. 엔터프라이즈 IT 분야의 벤더 수만큼 컨버전스에 대한 리프가 많을 수 있으며 Datrium은 인프라의 모습에 대한 비전을 홍보하는 데 부끄러워하지 않습니다. Datrium의 관점에서는 컴퓨팅, 기본 스토리지, 보조 스토리지 및 클라우드가 각 스토리지 클래스에 대한 사일로 없이 확장 가능하고 관리하기 쉬운 매우 탄력적인 구성으로 결합되는 것을 봅니다. 또한 대부분의 데이터 호출이 온보드 플래시 캐시로 컴퓨팅 노드에 도달하기 때문에 Datrium은 거의 모든 경우에 데이터 노드로 이동하지 않고도 엄청난 성능을 제공할 수 있습니다. 이는 최대 200K 읽기 및 쓰기 대역폭과 16M IOPS 32K 임의 읽기에서 18GB/s 및 4GB/s로 변환됩니다.

기본적으로 Datrium은 DVX 시스템을 구성하는 컴퓨팅 노드와 스토리지 노드로 구성됩니다. 컴퓨팅 노드는 Datrium에서 제공하거나 고객이 자체 기존 서버 인프라를 활용할 수 있습니다. 컴퓨팅 노드는 IO 처리를 처리하여 캐시를 플래시에 로컬로 유지합니다. 플래시는 저렴한 고용량 SATA 드라이브에서 고성능 NVMe에 이르기까지 거의 모든 것이 될 수 있습니다. 플래시에 대한 결정은 전적으로 워크로드에 따라 달라지며 고객의 요구 사항을 충족하도록 조정할 수 있습니다. 영구 데이터는 데이터 노드에 상주하기 때문에 컴퓨팅 노드는 상태 비저장이며 데이터 손실이나 손상 위험 없이 오프라인 상태가 되어 n-1 가용성을 유지할 수 있습니다. Datrium은 vSphere 5.5-6.5, Red Hat 7.3, CentOS 7 1611 및 베어메탈 Docker 1.2를 비롯한 다양한 환경을 지원합니다.

데이터 노드는 데이터의 영구 복사본을 유지하며 디스크 또는 플래시 구성에서 사용할 수 있습니다. Datrium DVX 내에서 데이터는 항상 압축되고 전역적으로 중복 제거되며 이중 내결함성으로 삭제 코딩됩니다. Datrium은 또한 DVX 내에서 암호화, 스냅샷 및 복제를 제공합니다. 데이터 노드는 모든 처리를 컴퓨팅 노드에 의존하여 스토리지 시스템이 이중 핫스왑 가능 컨트롤러를 통해 IO를 제공할 수 있도록 합니다. 데이터 노드에는 빠른 쓰기를 위한 미러링된 배터리 지원 NVRAM과 로드 밸런싱 및 경로 장애 복구 기능이 있는 고속 이더넷 네트워킹이 포함됩니다. Datrium의 최신 노드에는 플래시 종단 간 DVX가 포함되어 있습니다. 이는 올플래시 DVX 데이터 노드와 함께 컴퓨팅 노드에 플래시가 있음을 의미합니다. F12X2 데이터 노드에는 16TB의 사용 가능한 스토리지(12×1.92TB SSD)가 있으며 최대 32-96TB의 유효 용량과 2-6배의 데이터 감소 및 25GbE 네트워킹을 지원합니다. 최신 컴퓨팅 노드인 CN2100은 새로운 Skylake CPU, NVMe 지원 및 최대 25GbE 네트워킹을 추가합니다.

이 리뷰는 32개의 Dell PowerEdge C6320 컴퓨팅 노드와 10개의 Datrium DVX 올플래시 데이터 노드로 구성된 Datrium 테스트 환경에 원격으로 액세스할 수 있다는 점에서 다소 독특합니다.

  • 32 x Dell PowerEdge C6320 서버
    • VMware ESXi 6.0 Update3 설치됨
    • 듀얼 제온 CPU E5-2697 v4 CPU
    • 128GB 메모리
    • 4 x 1.92TB Samsung PM863a SSD를 데이터 캐시로 사용
    • 2 x 10Gb/s NIC(관리/데이터)
  • 네트워킹 구성
    • 코어 스위치의 F10X12 데이터 노드 2개
    • 32개의 TOR 스위치에 있는 8개의 컴퓨팅 노드
    • 각 TOR 스위치에는 코어 스위치에 대한 160Gbps 업링크가 있습니다.

DVX는 브라우저를 통해 또는 VMware vCenter 플러그인으로 HTML5 기반 사용자 인터페이스로 관리됩니다. DVX UI의 전체 전제는 단순성에 의존하므로 기존 방식으로 스토리지를 관리할 필요가 없습니다. 스토리지 프로비저닝부터 복제 관리까지 모든 것이 동일한 UI에서 이루어집니다.

사용자는 클러스터 VM IOPS, 처리량, 네트워크 전송 속도, 호스트 플래시 적중률과 함께 Datrium 평균 읽기/쓰기 대기 시간에 관한 성능 정보를 한 눈에 확인할 수 있습니다. Datrium DVX 플랫폼의 계층 구조를 고려할 때 호스트와 기본 데이터 노드 간의 성능 수준을 확인하면 전체 성능을 측정하는 데 도움이 됩니다. 성능 지표 외에도 스냅샷 공간과 함께 총 데이터 공간을 보여주는 총 가용 용량과 현재 데이터 감소 지표가 제공됩니다.

위의 스크린샷에서 주목해야 할 한 가지 흥미로운 항목은 네트워크 트래픽입니다(하나는 4K 임의 쓰기 활동을 보여주고 다른 하나는 읽기 활동을 보여줍니다). Datrium DVX는 읽기 활동에 호스트 측 플래시를 활용하고 쓰기 활동을 데이터 노드에 커밋하므로 네트워크 속도로 표시되는 것을 볼 수 있습니다. 4K 무작위 테스트에서 네트워크 활동은 7.3GB/s로 측정된 반면 내부 호스트 플래시에서 데이터를 가져온 읽기 테스트에서는 네트워크 트래픽이 존재하지 않았습니다.

성능 벤치 마크

이러한 대규모 클러스터의 성능을 측정하기 위해 수백 개의 vdbench VM에서 성능 데이터를 집계할 수 있는 기능과 배포 용이성 때문에 VMware의 HCIBench를 선택했습니다. 대규모 클러스터의 경우 이 도구를 사용하여 엔터프라이즈 스토리지를 측정하는 데 일반적으로 사용되는 워크로드를 빠르게 늘릴 수 있을 뿐만 아니라 사용자 정의 반복 패턴이 있는 데이터로 작업할 수 있습니다. 데이터 절감 서비스를 제공하는 플랫폼의 경우 사용자에게 실제 상황에 가까운 성능을 보여줄 수 있는 기회를 제공합니다. 이 경우 각 워크로드에 대해 2:1 압축 설정을 사용했습니다. 모든 벤치마크, 압축, 중복 제거 및 인라인 삭제 코딩이 실행 중이라는 점에 유의해야 합니다. 즉, 모든 벤치마크는 완전한 실제 작동 조건에서 수행되었습니다.

HCIbench 4K에서는 완전 랜덤 4K 워크로드 프로필을 사용하여 최대 랜덤 처리량을 살펴봅니다. Datrium DVX는 9.5725GB/s 읽기 및 2.524GB/s 쓰기를 달성할 수 있었습니다.

다음으로 동일한 4K 프로필에서 피크 I/O를 살펴봅니다. 여기서 Datrium DVX는 2.45만 IOPS 읽기 및 646,162 IOPS 쓰기로 또 다른 인상적인 성능을 보여주었습니다.

다음 메트릭은 완전히 임의적인 4K 워크로드 프로필의 평균 대기 시간을 살펴봅니다. 1.05밀리초 미만의 대기 시간은 아니지만 DVX는 여전히 매우 인상적인 3.96ms 읽기 및 XNUMXms 쓰기를 달성할 수 있었습니다.

다음 테스트는 8% 읽기 및 70% 쓰기 활동이 혼합된 더 큰 30K 임의 데이터 프로필을 살펴봅니다. 여기서 DVX의 처리량은 9,229.5GB/s였습니다. 최대 I/O를 살펴보면 DVX는 1.18만 IOPS 이상을 달성할 수 있었습니다. 8K 70/30 대기 시간은 2.17ms에 불과했습니다.

마지막 워크로드는 32K 순차 읽기 및 쓰기 프로필로 구성된 피크 대역폭 포커스로 전환됩니다. 여기에서 DVX는 엄청난 42.16GB/s 읽기 및 13.26GB/s 쓰기를 달성할 수 있었습니다.

동일한 워크로드에 대한 최대 I/O를 살펴보면 DVX는 1.349만424,282 IOPS 읽기 및 XNUMX IOPS 쓰기로 인상적인 수치를 계속해서 보여줍니다.

DVX는 32K 테스트에서 모든 높은 수치를 기록했으며 1.9ms 읽기 및 6.02ms 쓰기의 상당히 낮은 대기 시간으로 모든 것을 마무리했습니다.

컨버지드 플랫폼이기 때문에 스토리지 오버헤드의 일부가 워크로드 자체를 운영하는 데 활용되는 동일한 시스템에서 나오기 때문에 CPU 사용률은 고려해야 할 중요한 요소입니다. 각 워크로드 동안 플랫폼을 모니터링하는 동안 우리는 vdbench를 활용하는 HCIbench 작업자를 포함하여 스토리지 VM 자체의 오버헤드와 결합된 클러스터 전체에 퍼져 있는 전체 클러스터 성능(방정식의 양쪽)을 살펴보았습니다.

대량의 순차 쓰기 작업(대부분의 작업이 플래시 노드로 직접 오프로드됨) 동안 사용된 전체 시스템 리소스의 40% 미만을 확인했습니다. 4K 임의 읽기 워크로드와 같이 읽기 활동이 많은 동안에는 이 메트릭이 60%를 조금 넘는 수준으로 증가했습니다. 따라서 워크로드를 처리하는 시스템과 워크로드를 소비하는 VM이 ​​모두 있는 경우에도 CPU 리소스의 60%가 다른 애플리케이션 및 워크로드에 남아 있었고 최악의 경우 40%로 떨어졌습니다. 따라서 전체 인라인 데이터 서비스가 진행되는 최악의 시나리오에서 인세인 모드를 실행(40% 최대 호스트 사용률 대 일반적으로 20%)할 때 Datrium 플랫폼에는 여전히 많은 시스템 리소스가 남아 있었습니다.

결론

Datrium DVX 제품군은 최신 스토리지 및 컴퓨팅 리소스를 지원하도록 업데이트되었습니다. 이 경우 영구 스토리지를 위한 올플래시 데이터 노드와 함께 컴퓨팅 노드의 플래시 캐시를 포함하는 엔드 투 엔드 플래시 구성을 살펴보았습니다. Datrium의 "개방형 컨버전스" 플랫폼에는 더 성숙한 제품에서 일반적으로 볼 수 있는 데이터 서비스도 포함됩니다. Datrium DVX를 사용하면 데이터가 항상 압축되고 전역적으로 중복 제거되며 이중 내결함성으로 삭제 코딩됩니다. 고객은 Datrium의 컴퓨팅 노드를 사용하도록 선택할 수 있지만 이 검토의 경우와 마찬가지로 필수 사항은 아닙니다(테스트에서는 32개의 Dell PowerEdge 노드를 활용했습니다). 이러한 컴퓨팅 노드는 최대 20%의 최소 오버헤드로 IO 처리 및 캐시를 처리합니다. 그러나 더 많은 스토리지 성능이 필요한 인스턴스의 경우 DVX는 DVX가 컴퓨팅 리소스의 최대 40%를 활용할 수 있는 Insane 모드로 전환될 수 있습니다.

성능 측면에서 우리는 Datrium DVX가 대규모 환경에서 실제로 수행할 수 있는 작업을 가장 잘 반영하는 HCIbench 벤치마크를 선택했습니다. 방망이에서 바로 올 플래시 DVX는 매우 인상적인 수치를 기록했습니다. 4K 벤치마크에서 DVX는 9.57GB/s 및 2.45만 IOPS 읽기 및 2.52GB/s 및 646K IOPS 쓰기 이상의 처리량을 기록했습니다. DVX는 1.05ms 읽기 및 3.96ms 쓰기의 낮은 대기 시간으로 이러한 수치를 기록했습니다. 8K 70% 읽기 30% 쓰기로 전환한 DVX는 모두 9.2ms의 대기 시간으로 1.18GB/s 이상의 처리량, 2.17만 IOPS 이상의 처리량으로 다시 한 번 깊은 인상을 받았습니다. 32K 순차 테스트에서 DVX는 42.16ms의 대기 시간으로 놀라운 1.349GB/s 읽기 및 1.9만XNUMX 이상의 IOPS를 기록했습니다.

분명히 Datrium의 컨버전스 스핀은 고유한 것입니다. 로컬화된 플래시가 있는 컴퓨팅 노드에서 "남은" CPU를 활용하는 것은 모든 TCO 이점을 위해 영구 스토리지용 플래시를 계속 유지할 수 있는 동시에 상당한 의미가 있습니다. 이 작업을 수행하는 핵심 동인은 DVX 시스템이 제공하는 스토리지 효율성이며, 이는 데이터 노드에서 플래시를 최대한 활용하는 데 중요합니다. 훨씬 더 높은 성능이 필요한 사람들을 위해 컴퓨팅 노드에 NVMe 스토리지를 추가하는 것은 충분히 쉽습니다. 비록 우리가 더 낮은 비용의 옵션으로 매우 잘한 것은 분명합니다. 그러나 어떤 성능도 복원력 없이는 큰 의미가 없습니다. DVX를 사용하면 컴퓨팅 노드는 상태 비저장이며 N-1 서버 장애 허용 모델을 지원합니다. 즉, 테스트 구성에서 31개 서버 중 32개를 잃을 수 있으며 모든 데이터는 계속 사용할 수 있습니다. 모든 서버가 손실되더라도 DVX는 신뢰할 수 있는 데이터 사본이 컴퓨팅 노드가 아닌 데이터 노드에 저장되고 보호되기 때문에 데이터를 손실하지 않습니다.

궁극적으로 현재 엔터프라이즈 IT에서 컨버지드 인프라만큼 흥미로운 것은 없습니다. 이러한 비전을 실행하는 방법에는 여러 가지가 있지만 Datrium은 뛰어난 성능 프로필과 쌍을 이루는 심층 데이터 관리 서비스를 포함하는 DVX에 대한 피치를 모았습니다. 그러나 컨버전스 공간에서 성능과 기능 모두를 실행한 사람은 거의 없었기 때문에 Datrium의 DVX는 군중에서 뚜렷하게 눈에 띄는 잘 무장된 제품이 되었습니다.

데이트리움 사이트

이 리뷰에 대해 토론하기

StorageReview 뉴스레터 신청