首頁 企業 DapuStor H3201 E1.S 固態硬盤評測

DapuStor H3201 E1.S 固態硬盤評測

by 萊爾·史密斯

Dapustor Haishen3 H3200 是一款高能效 NVMe SSD,適用於各種不同的應用。 今天,我們將看看 H1 系列(特別標記為 H3200)的標尺 (E3201.S) 迭代,它具有兩種容量,包括 112 層鎧俠 3D 企業 NAND 和 Marvell 控制器。 我們之前回顧了 大普存儲H3200—U.2 外形型號。 雖然 U.2 外形更適合數據中心、視頻監控和邊緣計算等大量使用,但 E1.S 版本的設計主要是為了在性能和密度方面為超級縮放器提供一些靈活性,所有這些都在一個很小的(即,僅比 M.2 驅動器大一點)外形尺寸。

Dapustor Haishen3 H3200 是一款高能效 NVMe SSD,適用於各種不同的應用。 今天,我們將看看 H1 系列(特別標記為 H3200)的標尺 (E3201.S) 迭代,它具有兩種容量,包括 112 層鎧俠 3D 企業 NAND 和 Marvell 控制器。 我們之前回顧了 大普存儲H3200—U.2 外形型號。 雖然 U.2 外形更適合數據中心、視頻監控和邊緣計算等大量使用,但 E1.S 版本的設計主要是為了在性能和密度方面為超級縮放器提供一些靈活性,所有這些都在一個微小的(即,僅比 M.2 驅動器大一點)外形尺寸。

大普存儲H3201

大普存儲H3201

就其物理足跡而言,E1.S 的好處是巨大的。 使用 H2 的 U.3200 版本,您實際上只能在 10U 服務器機箱內安裝其中的 12-1 個(無需使用中板或其他耗時的方法)。 借助 H3200 E1.S,您可以在同一個 24U 系統中安裝 1 個前置驅動器,所有驅動器均支持熱插拔,具有企業級功能。 這對於 OEM 和超大規模來說都非常重要。 因此,E1.S 模型將允許組織創建密度顯著增加的 1U 服務器。

大普存儲H3201控制器

DapuStor H3201 以安全功能為亮點,例如固件和硬件路徑上的端到端數據保護,包括 DDR ECC、LDPC、掉電保護。 性能方面,3.84TB DapuStor H3201 的順序讀取速度高達 3,400MB/s,寫入速度高達 2,500MB/s,而隨機 4k 性能預計高達 720,000 IOPS 讀取和 105,000 IOPS 寫入。

為確保可靠性,H3201 的耐用等級為 1 DWPD。 DapuStor 提供了另一個 E1.S 型號,容量為 3.2TB,稱為“H3101”。 此版本是更高耐用性的型號,提供更好的隨機寫入性能 (220K IOPS) 和更長的使用壽命,每天 3 次驅動器寫入。

DapuStor H3200 系列的所有型號均享有 5 年保修。

DapuStor H3201 E1.S規格

型號。 大鋪H3201​​XNUMX
容量(TB1) 3.84TB
大綱 E1.S
接口協議 PCle3.0×4 NVMe 1.3,雙口
閃光燈類型 KIOXIA 3D NAND,112層,2平面企業級TLC
讀取帶寬 (128KB) MB/s 3,400MB /秒
寫入帶寬 (128KB) MB/s 2,500MB /秒
隨機讀取 (4KB) KIOPS 720,000 IOPS
隨機寫入 (4KB) KIOPS 105,000 IOPS
電源消耗功率 典型值 8.0W / 最大值 10.5W
4K 隨機延遲(典型值)R/R < 85微秒
4K 順序延遲(典型值)R/W μs < 15微秒
壽命 1 DWPD
不可糾正的誤碼率 (UBER) 每 1^10 位讀取 17 個扇區
平均無故障時間(MTBF) 2萬小時
商品保修條款 5年

DapuStor H3201 E1.S性能

試驗台

我們的 PCIe Gen4 Enterprise SSD 評測利用了 聯想 ThinkSystem SR635 用於應用程序測試和綜合基準。 ThinkSystem SR635 是一個裝備精良的單 CPU AMD 平台,提供的 CPU 能力遠遠超過強調高性能本地存儲所需的能力。 它也是我們實驗室中唯一具有 PCIe Gen4 U.2 托架的平台(也是目前市場上為數不多的平台之一)。 綜合測試不需要大量 CPU 資源,但仍利用相同的 Lenovo 平台。 在這兩種情況下,目的都是以盡可能符合存儲供應商最大驅動器規格的最佳方式展示本地存儲。

PCIe Gen4綜合及應用平台(Lenovo ThinkSystem SR635)

  • 1 個 AMD 7742(2.25GHz x 64 核)
  • 8 x 64GB DDR4-3200MHz ECC DRAM(1 x 64GB 用於 Houdini)
  • CentOS的7.7 1908
  • Ubuntu 20.10-桌面
  • ESXi 6.7u3

測試背景和比較

 StorageReview 企業測試實驗室 提供了一個靈活的架構,用於在與管理員在實際部署中遇到的環境相當的環境中對企業存儲設備進行基準測試。 企業測試實驗室結合了各種服務器、網絡、電源調節和其他網絡基礎設施,使我們的員工能夠建立真實世界的條件,以便在我們的審查期間準確地衡量性能。

我們將這些關於實驗室環境和協議的詳細信息納入審查,以便 IT 專業人員和負責存儲采購的人員能夠了解我們取得以下成果的條件。 我們的評論都不是由我們正在測試的設備製造商支付或監督的。 有關的其他詳細信息 StorageReview 企業測試實驗室 以及其網絡功能的概述可在這些相應頁面上找到。

應用程序工作負載分析

為了了解企業存儲設備的性能特徵,必須對實時生產環境中的基礎架構和應用程序工作負載進行建模。 因此,我們對 DapuStor H3200 的基準測試是 通過 SysBench 的 MySQL OLTP 性能   Microsoft SQL Server OLTP 性能 具有模擬的 TCP-C 工作負載。 對於我們的應用程序工作負載,每個驅動器將運行 2-4 個配置相同的虛擬機。

SQL Server 性能

每個 SQL Server VM 都配置有兩個虛擬磁盤:100GB 卷用於啟動,500GB 卷用於數據庫和日誌文件。 從系統資源的角度來看,我們為每個 VM 配置了 16 個 vCPU、64GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。 雖然我們之前測試的 Sysbench 工作負載在存儲 I/O 和容量方面使平台飽和,但 SQL 測試正在尋找延遲性能。

此測試使用在 Windows Server 2014 R2012 來賓虛擬機上運行的 SQL Server 2,並由 Quest 的數據庫基準工廠進行壓力測試。 存儲評論的 Microsoft SQL Server OLTP 測試協議 採用事務處理性能委員會基準 C (TPC-C) 的當前草案,這是一種在線事務處理基準,可模擬複雜應用程序環境中的活動。 TPC-C 基準比綜合性能基準更接近於衡量數據庫環境中存儲基礎設施的性能優勢和瓶頸。 我們用於本次審核的 SQL Server VM 的每個實例都使用 333GB(1,500 規模)的 SQL Server 數據庫,並測量 15,000 個虛擬用戶負載下的事務性能和延遲。

SQL Server 測試配置(每個虛擬機)

  • 在Windows Server 2012 R2
  • 存儲空間:分配 600GB,使用 500GB
  • SQL Server 2014的
    • 數據庫大小:1,500 規模
    • 虛擬客戶端負載:15,000
    • 內存緩衝區:48GB
  • 測試時長:3 小時
    • 2.5 小時預處理
    • 30分鐘採樣期

對於我們的 SQL Server 事務基準測試,DapuStor H3201 E1.S 在 12,650 個虛擬機上的平均得分為 4 TPS,這是一個不錯的分數。 U.2 版本的平均 TPS 為 12,646。

在平均延遲方面,DapuStor H3200 顯示了另一個可靠的結果,為 2.5 毫秒,而 U.2 版本顯示了明顯更高的平均延遲,為 126.5 毫秒。

系統性能

下一個應用程序基準包括 Percona MySQL OLTP 數據庫 通過 SysBench 測量。 該測試測量平均 TPS(每秒事務數)、平均延遲和平均 99% 延遲。

每 系統平台 VM 配置了三個虛擬磁盤:一個用於引導 (~92GB),一個用於預建數據庫 (~447GB),第三個用於測試中的數據庫 (270GB)。 從系統資源的角度來看,我們為每個虛擬機配置了 16 個 vCPU、60GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。

Sysbench 測試配置(每個虛擬機)

  • 中央操作系統 6.3 64 位
  • Percona XtraDB 5.5.30-rel30.1
    • 數據庫表:100
    • 數據庫大小:10,000,000
    • 數據庫線程:32
    • 內存緩衝區:24GB
  • 測試時長:3 小時
    • 2 小時預處理 32 個線程
    • 1 小時 32 個線程

查看我們的 Sysbench 事務基準測試,DapuStor H3200 E1.S 的總得分為 8,646,遠高於 H3200 U.2 型號的平均 TPS 7,879。

E1.S H3200 繼續保持良好的性能,Sysbench 平均延遲為 14.8 毫秒。 H3200 U.2 型號再次落後,平均為 23.3 毫秒。

對於我們最壞情況下的延遲(第 99 個百分位數),H3200 的延遲令人印象深刻,為 27.61 毫秒,而 H3200 U.2 版本為 31.18 毫秒。

VDBench 工作負載分析

在對存儲設備進行基準測試時,應用程序測試是最好的,綜合測試排在第二位。 雖然不能完美代表實際工作負載,但綜合測試確實有助於為具有可重複性因素的存儲設備建立基線,從而可以輕鬆地在競爭解決方案之間進行同類比較。 這些工作負載提供了一系列不同的測試配置文件,從“四個角”測試、常見的數據庫傳輸大小測試到來自不同 VDI 環境的跟踪捕獲。 所有這些測試都利用通用的 vdBench 工作負載生成器,以及一個腳本引擎來自動化和捕獲大型計算測試集群的結果。 這使我們能夠在各種存儲設備上重複相同的工作負載,包括閃存陣列和單個存儲設備。 我們針對這些基準測試的測試過程用數據填充整個驅動器表面,然後將驅動器部分分區為驅動器容量的 25%,以模擬驅動器如何響應應用程序工作負載。 這與使用 100% 的驅動器並使它們進入穩定狀態的全熵測試不同。 因此,這些數字將反映更高的持續寫入速度。

簡介:

  • 4K 隨機讀取:100% 讀取,128 個線程,0-120% 重複率
  • 4K 隨機寫入:100% 寫入,64 線程,0-120% iorate
  • 64K 順序讀取:100% 讀取,16 線程,0-120% 迭代
  • 64K 順序寫入:100% 寫入,8 個線程,0-120% 迭代
  • 綜合數據庫:SQL 和 Oracle
  • VDI 完整克隆和鏈接克隆跟踪

比較:

我們的第一個 VDBench 工作負載分析是隨機 4K 讀取。 在這裡,H3201 E1.S 在 719,236 µs 時的峰值得分為 709.2 IOPS。 相比之下,H3200 U.2 版本的峰值為 788,774 IOPS,延遲低得多,為 161µs。

對於 4K 隨機寫入,H3201 E1.S 在 312,913µs 時達到 1,623.4 IOPS,而 H3200 U.2 模型在 274,362µs 的延遲時達到 463 IOPS。

切換到 64k 順序工作負載時,H3201 表現出色,峰值性能為 50,344 IOPS(或 3.15GB/s),延遲為 1,269.6µs,而 H3200 U.2 型號的峰值為 52,860 IOPS(或 3.3GB/s) ) 延遲為 301.8µs。

在 64k 寫入中,DapuStor H3201 ES.1 型號的峰值為 20,251 IOPS(或 1.27GB/s); 然而,它在測試結束時的延遲受到重大打擊,達到 3,147.5µs。 H3200 U.2 版本達到 22,654 IOPS(或 1.42GB/s)和 699.3ms。

我們的下一組測試是我們的 SQL 工作負載:SQL、SQL 90-10 和 SQL 80-20。 從 SQL 開始,正如預期的那樣,DapuStor H3200 U.2 模型顯示出明顯更好的結果,其峰值為 281,512 IOPS,延遲僅為 113.2µs。 H3201 E1.S 型號的峰值為 219,870 IOPS,延遲為 144.1µs。

在 SQL 90-10 中,H3201 E1.S 在 200,283µs 時顯示出 158.3 IOPS 的峰值,而 H3200 U.2 型號則顯示 259,351 IOPS 和 118.3µs。

對於 SQL 80-20,H3201 E1.S 在 182,944µs 時達到 173.2 的峰值,而 H3200 U.2 模型顯示 247,053 IOPS,延遲為 129µs。

接下來是我們的 Oracle 工作負載:Oracle、Oracle 90-10 和 Oracle 80-20。 從 Oracle 開始,DapuStor H3201 E1.S 的峰值為 174,220 IOPS,延遲為 204.1µs。 H3200 U.2 模型以 263,217µs 的延遲達到 132.8 IOPS。

看看 Oracle 90-10,DapuStor H3201 E1.S 型號的峰值為 164,870 IOPS,延遲為 131µs,而 H3200 U.2 型號在 218,213µs 時達到 100.4 IOPS。

對於 Oracle 80-20,H3201 E1.S 在 155,614µs 時達到 139.7 的峰值,而 H3200 U.2 型號在 212,157µs 的延遲時達到 103.1 IOPS 的峰值。

接下來,我們切換到我們的 VDI 克隆測試,完整和鏈接。 對於 VDI 完整克隆 (FC) 啟動,DapuStor H3201 E1.S 在 135,628µs 時的峰值為 255 IOPS,而 H3200 U.2 型號在 191,069µs 的延遲時達到 179.1 IOPS。

VDI FC 初始登錄看到 DapuStor H3201 E1.S 在 68,248µs 時達到 439.1 IOPS 的峰值,而 H3200 U.2 型號達到 115,354 IOPS,延遲為 259.2µs。

對於 VDI FC Monday Login,H3201 在 53,529µs 時達到 293.9 IOPS 的峰值,而 H3200 U.2 模型在 87,136µs 的延遲時達到 182.6 IOPS。

對於 VDI 鏈接克隆 (LC) 啟動,H3201 E1.S 在 69,288µs 時達到 229.7 IOPS 的峰值,而 H3200 U.2 驅動器能夠達到 95,726 IOPS,延遲為 166.5µs。

VDI LC Initial Login 在 17,926µs 時的峰值得分為 443.1 IOPS,而 H3200 U.2 型號的峰值得分為 50,750 IOPS,延遲為 154.9µs。

最後,在 VDI LC Monday Login 中,DapuStor H3201 E1.S 在接近 20K IOPS 時表現出非常不穩定的性能,尖峰最終達到最大值略低於 40K 並接近 400µs 標記。 H3200 U.2 型號表現出非常穩定的性能,在 66,846µs 時達到 236.9 IOPS 的峰值。

結論

DapuStor H3201 是一款 Gen3 NVMe SSD 解決方案,具有 KIOXIA 的 112 層 3D NAND 和 Marvell 控制器。 它只有一個容量 (1TB) 的 E3.84.S 外形,使其成為目前主要用於超大規模環境的驅動器。 那些尋求更高耐用性的人可以選擇 H3201 型號,該型號具有改進的寫入性能和更高的 DWPD 等級。

大普存儲H3201背面

在我們的測試中,我們將該驅動器與 DapuStor Haishen3200 系列的 U.2 版本 H3 進行了比較。 對於應用程序工作負載分析,DapuStor H3201 為我們提供了一些非常可靠的結果,在 12,646 個虛擬機上達到 4 TPS,平均延遲為 2.5 毫秒。 對於 Sysbench,該驅動器達到了 8,646 TPS,平均延遲為 14.8 毫秒,最壞情況下的延遲為 27.61 毫秒,所有這些都是上層性能。

在我們的 VDbench 測試中,與 U.2 模型相比,性能有所下降。 亮點包括:719,236K 讀取 4 IOPS,312,913K 寫入 4 IOPS,3.15K 讀取 64GB/s,1.27K 寫入 64GB/s。 在 SQL 工作負載中,它達到 219,870 IOPS,而 SQL 200,283-90 達到 10 IOPS,SQL 182,944-80 達到 20 IOPS。 對於我們的 Oracle 工作負載,它的峰值為 174,220 IOPS,Oracle 164,870-90 中為 10 IOPS,Oracle 155,614-80 中為 20 IOPS。 在我們的 VDI 完整克隆測試中,H3200 達到 135,628(啟動)、68,248 IOPS(初始登錄)、53,529 IOPS(星期一登錄),而鏈接克隆發布 69,288 IOPS(啟動)、17,926 IOPS(初始登錄)和一個非常不穩定的峰值約 40K IOPS(星期一登錄)。

儘管目前標尺的應用用例相當有限(例如,超大規模),尤其是對於這些沒有熱同步的瘦身驅動器, E1.S 服務器 正處於成為主流的風口浪尖。 這將顯著增加企業服務器的可用驅動器插槽數量,進而產生新的標準、高密度 IOPS 驅動的服務器和存儲系統,並且非常注重可維護性。 DapuStor H3201 使用較舊的 Gen3 接口,但性能很有前途,這應該是 DapuStor 進入 Gen4 和 Gen5 E1.S SSD 的良好平台。

大普存儲

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS訂閱