홈페이지 Enterprise Memblaze PBlaze5 910 U.2 NVMe SSD 검토

Memblaze PBlaze5 910 U.2 NVMe SSD 검토

by 아담 암스트롱

베이징에서 열린 Step Ahead 행사에서 Memblaze는 새로운 500 NVME 드라이브 시리즈와 900 라인을 910 및 916으로 확장했습니다. 이 리뷰에서는 910 시리즈를 살펴보겠습니다. 새로운 910 드라이브는 두 가지 폼 팩터로 제공되며 64레이어 3D NAND를 활용하여 최대 16TB의 용량을 제공할 수 있습니다. 이렇게 밀도가 높아지면 데이터 센터에서 랙이 더 밀집되거나 통합될 수 있습니다.


베이징에서 열린 Step Ahead 행사에서 Memblaze는 새로운 500 NVME 드라이브 시리즈와 900 라인을 910 및 916으로 확장했습니다. 이 리뷰에서는 910 시리즈를 살펴보겠습니다. 새로운 910 드라이브는 두 가지 폼 팩터로 제공되며 64레이어 3D NAND를 활용하여 최대 16TB의 용량을 제공할 수 있습니다. 이렇게 밀도가 높아지면 데이터 센터에서 랙이 더 밀집되거나 통합될 수 있습니다.

64레이어를 활용하여 더 높은 용량을 달성하는 것 외에도 Memblaze PBlaze5 910은 이전 모델보다 더 높은 성능을 요구합니다. 이 회사는 드라이브가 최대 3.5GB/s의 순차 읽기와 최대 835K IOPS의 처리량을 달성할 수 있으며 동시에 밀리초 미만의 대기 시간을 가질 수 있다고 말합니다. 드라이브는 또한 고가용성 기능이 내장되어 있으며 이중 포트이므로 단일 실패 경로가 제거됩니다. 910은 1DWPD의 내구성과 XNUMX만 시간의 MTBF를 제공합니다. 이상적인 사용 사례에는 데이터베이스, 검색, 인덱싱, CDN, 클라우드 및 하이퍼스케일, SDS, 딥 러닝 및 빅 데이터 분석, ERP, SAP HANA, BOSS, 뱅킹, 과세, 고주파 거래 및 온라인 결제가 포함됩니다.

이 리뷰에서는 PBlaze3.84 2의 U.5인 910TB를 살펴볼 것입니다.

Memblaze PBlaze5 910 NVMe SSD 사양

폼 팩터 U.2
생산 능력 3.84TB 7.68TB 15.36TB
낸드 3D eTLC
인터페이스 PCIe 3.0 x 4
프로토콜 NVMe 1.2a
퍼포먼스
순차 읽기(128KB) 3.5GB / s 3.5GB / s 3.3GB / s
순차 쓰기(128KB) 3.1GB / s 3.5GB / s 3.3GB / s
지속적인 임의 읽기(4KB) 835K IOPS 830K IOPS 826K IOPS
지속적인 임의 쓰기(4KB) 99K IOPS 135K IOPS 150K IOPS
레이턴시 R/W 87 / 12μs
DWPD 1
우버 <10^-17
MTBF 2 백만 시간
전력 소비  7 ~ 25W

퍼포먼스

테스트베드

당사의 엔터프라이즈 SSD 검토는 애플리케이션 테스트를 위해 Lenovo ThinkSystem SR850을 활용하고 델 파워에지 R740xd 합성 벤치마크용. ThinkSystem SR850은 고성능 로컬 스토리지에 스트레스를 주는 데 필요한 것보다 훨씬 더 많은 CPU 성능을 제공하는 잘 갖춰진 쿼드 CPU 플랫폼입니다. 많은 CPU 리소스가 필요하지 않은 합성 테스트는 보다 전통적인 듀얼 프로세서 서버를 사용합니다. 두 경우 모두 스토리지 공급업체의 최대 드라이브 사양과 일치하는 최상의 조명에서 로컬 스토리지를 보여주기 위한 것입니다.

레노버 씽크시스템 SR850

  • 4 x Intel Platinum 8160 CPU(2.1GHz x 24코어)
  • 16 x 32GB DDR4-2666Mhz ECC DRAM
  • RAID 2-930i 8Gb/s RAID 카드 12개
  • NVMe 베이 8개
  • VM웨어 ESXI 6.5

델 파워에지 R740xd

  • Intel Gold 2 CPU 6130개(2.1GHz x 16코어)
  • 16GB DDR16-4MHz ECC DRAM 2666개
  • 1x PERC 730 2GB 12Gb/s RAID 카드
  • 애드인 NVMe 어댑터
  • 우분투-16.04.3-데스크탑-amd64

테스트 배경 및 유사 항목

The StorageReview 엔터프라이즈 테스트 랩 관리자가 실제 배포에서 경험하는 것과 유사한 환경에서 엔터프라이즈 스토리지 장치의 벤치마크를 수행하기 위한 유연한 아키텍처를 제공합니다. Enterprise Test Lab은 다양한 서버, 네트워킹, 전력 조절 및 기타 네트워크 인프라를 통합하여 직원이 실제 조건을 설정하여 검토 중에 성능을 정확하게 측정할 수 있도록 합니다.

랩 환경 및 프로토콜에 대한 이러한 세부 정보를 검토에 통합하여 IT 전문가와 스토리지 구입 책임자가 다음 결과를 달성한 조건을 이해할 수 있도록 합니다. 우리의 리뷰는 우리가 테스트하는 장비 제조업체에서 비용을 지불하거나 감독하지 않습니다. 에 대한 추가 세부 정보 StorageReview 엔터프라이즈 테스트 랩 그리고 네트워킹 기능 개요 해당 페이지에서 사용할 수 있습니다.

이 리뷰에 대한 비교:

애플리케이션 워크로드 분석

엔터프라이즈 스토리지 장치의 성능 특성을 이해하려면 라이브 프로덕션 환경에서 발견되는 인프라 및 애플리케이션 워크로드를 모델링하는 것이 필수적입니다. 따라서 Memblaze PBlaze5 910에 대한 벤치마크는 SysBench를 통한 MySQL OLTP 성능 그리고 마이크로소프트 SQL 서버 OLTP 성능 시뮬레이션된 TCP-C 워크로드를 사용합니다. 애플리케이션 워크로드의 경우 각 드라이브는 2-4개의 동일하게 구성된 VM을 실행합니다.

SQL 서버 성능

각 SQL Server VM은 100개의 vDisk(부팅용 500GB 볼륨, 데이터베이스 및 로그 파일용 16GB 볼륨)로 구성됩니다. 시스템 리소스 관점에서 각 VM을 vCPU 64개, DRAM XNUMXGB로 구성하고 LSI Logic SAS SCSI 컨트롤러를 활용했습니다. Sysbench 워크로드는 이전에 스토리지 I/O 및 용량 모두에서 플랫폼을 포화 상태로 테스트했지만 SQL 테스트는 대기 시간 성능을 찾고 있습니다.

이 테스트는 Windows Server 2014 R2012 게스트 VM에서 실행되는 SQL Server 2를 사용하며 Quest의 Benchmark Factory for Databases에서 스트레스를 받습니다. StorageReview의 Microsoft SQL Server OLTP 테스트 프로토콜 복잡한 애플리케이션 환경에서 발견되는 활동을 시뮬레이트하는 온라인 트랜잭션 처리 벤치마크인 TPC-C(Transaction Processing Performance Council의 벤치마크 C) 최신 초안을 사용합니다. TPC-C 벤치마크는 합성 성능 벤치마크보다 데이터베이스 환경에서 스토리지 인프라의 성능 강점과 병목 현상을 측정하는 데 더 가깝습니다. 이 검토를 위한 SQL Server VM의 각 인스턴스는 333GB(1,500개 규모) SQL Server 데이터베이스를 사용하고 15,000명의 가상 사용자 로드에서 트랜잭션 성능과 대기 시간을 측정합니다.

SQL Server 테스트 구성(VM당)

  • 윈도우 서버 2012 R2
  • 스토리지 공간: 600GB 할당, 500GB 사용
  • SQL 서버 2014
    • 데이터베이스 크기: 1,500 규모
    • 가상 클라이언트 로드: 15,000
    • RAM 버퍼: 48GB
  • 시험 시간: 3시간
    • 2.5시간 전처리
    • 30분 샘플 기간

SQL Server 트랜잭션 벤치마크에서 Memblaze PBlaze5 910 U.2는 12,546.5 TPS로 다른 PBlaze 드라이브 XNUMX개보다 낮은 XNUMX위를 기록했습니다. 

놀랍게도 910의 대기 시간도 38.8ms로 ​​가장 높았습니다. 

시스벤치 성능

다음 애플리케이션 벤치마크는 Percona MySQL OLTP 데이터베이스 SysBench를 통해 측정. 이 테스트는 평균 TPS(Transactions Per Second), 평균 대기 시간 및 평균 99번째 백분위수 대기 시간도 측정합니다.

각각의 시스벤치 VM은 92개의 vDisk로 구성됩니다. 하나는 부팅용(~447GB), 하나는 사전 구축된 데이터베이스(~270GB), 세 번째는 테스트 중인 데이터베이스용(16GB)입니다. 시스템 리소스 관점에서 각 VM을 vCPU 60개, DRAM XNUMXGB로 구성하고 LSI Logic SAS SCSI 컨트롤러를 활용했습니다.

Sysbench 테스트 구성(VM당)

  • 센트OS 6.3 64비트
  • 페르코나 XtraDB 5.5.30-rel30.1
    • 데이터베이스 테이블: 100
    • 데이터베이스 크기: 10,000,000
    • 데이터베이스 스레드: 32
    • RAM 버퍼: 24GB
  • 시험 시간: 3시간
    • 2시간 동안 32개 스레드 사전 조정
    • 1시간 32 스레드

Sysbench 트랜잭션 벤치마크에서 U.2 910은 테스트 팩 중간에 6,664.6 TPS를 더 잘 기록했습니다. 

Sysbench 평균 대기 시간에서 U.2 910은 다시 19.2ms의 대기 시간으로 팩 중간에 있음을 발견했습니다. 

최악의 시나리오 대기 시간 벤치마크에서는 U.2 910이 37.8ms로 ​​다시 중간에 도달했습니다.

SideFX의 후디니

Houdini 테스트는 CGI 렌더링과 관련하여 스토리지 성능을 평가하도록 특별히 설계되었습니다. 이 애플리케이션의 테스트 베드는 코어의 변형입니다. 델 파워에지 R740xd 이중 Intel 6130 CPU 및 64GB DRAM과 함께 연구실에서 사용하는 서버 유형입니다. 이 경우 베어 메탈을 실행하는 Ubuntu Desktop(ubuntu-16.04.3-desktop-amd64)을 설치했습니다. 벤치마크의 출력은 완료하는 데 몇 초 만에 측정되며 적을수록 좋습니다.

Maelstrom 데모는 스왑 파일을 확장 메모리의 한 형태로 효과적으로 사용하는 기능을 보여줌으로써 스토리지의 성능 기능을 강조하는 렌더링 파이프라인의 섹션을 나타냅니다. 테스트는 기본 스토리지 구성 요소에 대한 대기 시간 영향의 벽 시간 효과를 격리하기 위해 결과 데이터를 작성하거나 포인트를 처리하지 않습니다. 테스트 자체는 XNUMX단계로 구성되며 그 중 XNUMX개는 벤치마크의 일부로 실행되며 다음과 같습니다.

  1. 디스크에서 압축된 포인트를 로드합니다. 이것은 디스크에서 읽을 시간입니다. 이는 단일 스레드이므로 전체 처리량이 제한될 수 있습니다.
  2. 처리할 수 있도록 포인트를 단일 플랫 배열로 압축 해제합니다. 포인트가 다른 포인트에 종속되지 않는 경우 작업 세트가 코어에 유지되도록 조정할 수 있습니다. 이 단계는 다중 스레드입니다.
  3. (실행 안 함) 포인트를 처리합니다.
  4. 디스크에 다시 저장하기에 적합한 버킷 블록으로 다시 압축합니다. 이 단계는 다중 스레드입니다.
  5. (실행 안 함) 버킷 블록을 다시 디스크에 씁니다.

Houdini 테스트에서 910 U.2는 중간에서 하단까지 배치되었지만 3,093.8초의 점수로 다른 Memblaze 제품과 나란히 놓였습니다.

VDBench 워크로드 분석

스토리지 장치를 벤치마킹할 때 애플리케이션 테스트가 가장 좋고 합성 테스트가 두 번째입니다. 실제 워크로드를 완벽하게 표현하는 것은 아니지만 합성 테스트는 경쟁 솔루션 간의 비교를 쉽게 할 수 있는 반복성 요소를 사용하여 스토리지 장치의 기준선을 만드는 데 도움이 됩니다. 이러한 워크로드는 "포 코너" 테스트, 일반적인 데이터베이스 전송 크기 테스트에서 다양한 VDI 환경의 추적 캡처에 이르기까지 다양한 테스트 프로필을 제공합니다. 이러한 모든 테스트는 스크립팅 엔진과 함께 공통 vdBench 워크로드 생성기를 활용하여 대규모 컴퓨팅 테스트 클러스터에서 결과를 자동화하고 캡처합니다. 이를 통해 플래시 어레이 및 개별 저장 장치를 포함한 광범위한 저장 장치에서 동일한 작업 부하를 반복할 수 있습니다. 이러한 벤치마크에 대한 테스트 프로세스는 전체 드라이브 표면을 데이터로 채운 다음 드라이브 용량의 25%에 해당하는 드라이브 섹션을 분할하여 드라이브가 애플리케이션 작업 부하에 어떻게 반응하는지 시뮬레이션합니다. 이것은 드라이브의 100%를 사용하고 정상 상태로 만드는 전체 엔트로피 테스트와 다릅니다. 결과적으로 이 수치는 더 높은 지속 쓰기 속도를 반영합니다.

프로필 :

  • 4K 임의 읽기: 100% 읽기, 128 스레드, 0-120% iorate
  • 4K 임의 쓰기: 100% 쓰기, 64 스레드, 0-120% iorate
  • 64K 순차 읽기: 100% 읽기, 16 스레드, 0-120% iorate
  • 64K 순차 쓰기: 100% 쓰기, 8개 스레드, 0-120% 속도
  • 합성 데이터베이스: SQL 및 Oracle
  • VDI 전체 클론 및 연결된 클론 추적

첫 번째 VDBench 워크로드 분석인 Random 4K 읽기에서 Memblaze PBlaze5 910 U.2는 드라이브를 대략 중간에 배치하여 최고 1 IOPS와 665,679μs의 대기 시간으로 전체적으로 191.3ms 미만을 유지할 수 있었습니다. 

4K 임의 쓰기는 전체에서 다시 밀리초 미만의 대기 시간을 보였습니다. 910 U.2는 296,639 IOPS의 최고 성능과 429.6μs의 대기 시간으로 XNUMX위를 차지했습니다.

순차 워크로드로 전환한 910 U.2는 다시 한 번 64K 순차 읽기에서 38,472 IOPS 또는 2.4GB/s의 최대 점수와 415.3μs의 대기 시간으로 XNUMX위를 기록했습니다.

910위에서 꼴찌를 유지한 2 U.18는 1.1K 순차 쓰기에서 약 870μs의 대기 시간에서 약 64K IOPS 또는 XNUMXGB/s로 정점을 찍었습니다. 

SQL 워크로드로 이동하면 910 U.2는 243,228 IOPS로 정점을 찍고 대기 시간은 130.4μs에 불과해 드라이브가 전체적으로 XNUMX위를 차지했습니다.

SQL 90-10에서는 910이 232,061 IOPS의 최고 점수와 136.5μs의 대기 시간으로 XNUMX위를 유지했습니다.

여전히 910위인 2 U.220,195는 SQL 144.6-80 벤치마크에서 20μs의 대기 시간과 함께 XNUMX IOPS로 정점을 찍었습니다.

Oracle 워크로드에서 910 U.2는 212,052 IOPS의 최고 점수와 168.5μs의 대기 시간으로 계속해서 XNUMX위를 유지했습니다.

Oracle 90-10의 경우 910 U.2는 최고 180,723 IOPS와 121.1μs의 대기 시간으로 XNUMX위를 차지했습니다.

Oracle 80-20에서 910은 900 IOPS의 최고 성능과 177,143μs의 대기 시간으로 123.5과 거의 공동 XNUMX위를 차지했습니다.

다음으로 VDI 클론 테스트인 Full and Linked로 이동합니다. VDI 전체 복제 부팅의 경우 910 U.2는 176,239 IOPS의 최고 성능과 197.9μs의 대기 시간으로 XNUMX위에 올랐습니다.

VDI FC 초기 로그인에서는 910 U.2가 66,925위를 차지했지만 최고 성능이 445.1 IOPS이고 대기 시간이 XNUMXμs로 상위 XNUMX개 드라이브보다 훨씬 뒤처졌습니다.

VDI FC Monday Login에서 910 U.2는 67,309 IOPS와 235.7μs의 대기 시간으로 XNUMX위를 차지했습니다.

LC(Linked Clone)로 전환하면 먼저 부팅 테스트를 살펴봅니다. 여기에서 910 U.2는 83,210 IOPS와 191.2μs의 대기 시간으로 XNUMX위를 차지했습니다.

VDI LC 초기 로그인은 910 U.2가 40,035 IOPS와 197.4μs의 대기 시간으로 XNUMX위를 유지했습니다.

마지막으로 VDI LC 월요일 로그인은 910 IOPS에서 2 U.45,349 피크를 기록했고 대기 시간은 349μs로 다시 XNUMX위를 차지했습니다.

결론

Memblaze PBlaze5 910은 64단 3D NAND를 활용하는 회사의 새로운 NVMe 데이터 센터 드라이브입니다. 이 드라이브는 두 가지 폼 팩터(이 리뷰의 경우 U.2)와 3.84TB, 7.68TB 및 15.36TB의 용량으로 제공됩니다. Memblaze는 최대 3.5GB/s 읽기, 3.5GB/s 쓰기 성능, 최대 835K IOPS 읽기 및 150K IOPS 쓰기 처리량을 주장합니다. 이 드라이브는 다양한 사용 사례에 대한 기준을 충족하고 AES 256 데이터 암호화와 같은 보안 옵션과 함께 제공되며 최대 8TB/s의 TRIM 기능을 지원합니다. 

애플리케이션 워크로드 분석 성능을 살펴보면 910 U.2는 SQL Server 벤치마크에서 12,546.5 TPS와 평균 대기 시간 38.8ms로 ​​최하위를 차지했습니다. Sysbench에서 드라이브는 6,664.6 TPS, 평균 대기 시간 19.2ms, 최악의 시나리오 대기 시간 37.8ms로 ​​팩 중간에 약간 더 나은 착륙을 수행했습니다. Houdini by SideFX 벤치마크에서 910 U.2는 3,093.8초의 점수를 기록하여 필드 하단에 있었지만 다른 Memblaze 제품과 일치했습니다. 

VDBench의 경우 Memblaze PBlaze5 910 U.2는 모든 테스트에서 밀리초 미만의 대기 시간을 보였습니다. 드라이브는 모든 테스트에서 팩의 중간에서 중간 아래로 떨어지는 경향이 있었습니다. 주요 결과에는 666K 읽기에서 4K IOPS, 297K 쓰기에서 4K IOPS, 2.4K 읽기에서 64GB/s, 1.1K 쓰기에서 64GB/s가 포함됩니다. SQL 결과는 177K IOPS에서 212K IOPS 사이에서 실행되는 Oracle 테스트에서 약 XNUMX만 IOPS를 기록했습니다. 

전반적으로 좋은 성능을 보였지만 이전 세대 PBlaze5 900에 비해 성능이 떨어지기 시작했습니다.

멤블레이즈 PBlaze5 910

이 리뷰에 대해 토론하기

StorageReview 뉴스레터 신청