首頁 企業 Intel Optane SSD DC P4800X 評測

Intel Optane SSD DC P4800X 評測

by 布賴恩·比勒

英特爾傲騰 SSD DC P4800X 系列 於 2017 年 XNUMX 月推出 承諾將名為 3D XPoint(英特爾品牌為 Optane)的新型存儲級內存 (SCM) 媒體推向市場。 P4800X 作為傳統的 2.5 英寸 NVMe 驅動器 (U.2) 和 PCIe 附加卡推出。 初始容量從 375GB 開始,計劃到 1.5 年底達到 2017TB。容量目標沒有實現,但英特爾確實推出了 750 月的 XNUMXGB Optane 型號. 無論容量如何,P4800X 都有一項工作,那就是為數據中心中對延遲敏感的應用程序提供盡可能高速的存儲。


英特爾傲騰 SSD DC P4800X 系列 於 2017 年 XNUMX 月推出 承諾將名為 3D XPoint(英特爾品牌為 Optane)的新型存儲級內存 (SCM) 媒體推向市場。 P4800X 作為傳統的 2.5 英寸 NVMe 驅動器 (U.2) 和 PCIe 附加卡推出。 初始容量從 375GB 開始,計劃到 1.5 年底達到 2017TB。容量目標沒有實現,但英特爾確實推出了 750 月的 XNUMXGB Optane 型號. 無論容量如何,P4800X 都有一項工作,那就是為數據中心中對延遲敏感的應用程序提供盡可能高速的存儲。

鑑於驅動器的容量較小,企業不太可能將 JBOD 裝滿 P4800X SSD 用於主存儲。 儘管對於可以從更快的存儲中受益的應用程序(如小型分析數據集和 BI 用例)來說,這當然是可能的。 企業陣列供應商也沒有急於在他們的系統設計中大量採用 Optane,這主要也是因為容量限制。 然而,HPE 探索了使用 Optane 作為 3PAR 系統的緩存,而其他人當然希望隨著技術的成熟將此類存儲集成到他們的系統中。 然而,在軟件定義存儲領域,基於 Optane 的 SSD 有一組直接的優秀用例,在這些領域中,設計具有更大的靈活性來考慮這種新型存儲。

VMware vSAN 可能是這個領域中最引人注目的,因為他們提供 P0X 的第 4800 天支持 並在 HCI 領域處於領先地位。 vSAN 還具有得天獨厚的優勢,可以利用這些較小的驅動器,因為它們在兩層架構中運行。 vSAN 存儲被協調到磁盤組中,具有一個用於所有傳入寫入活動的層以及一個面向容量的讀取層。 目前,vSAN 在寫入層中每個驅動器最多只能利用 600GB,因此 P4800X 的較小容量並不是真正的限制。 對於 vSAN 用戶,這意味著對於將 P4800X 用作緩存驅動器的部署,寫入將以最快的速度寫入 vSAN 集群。

這篇評論是針對 4800GB U.375 外形規格的 P2X。 雖然主要作為我們的磁盤組的一部分工作 即將進行的 vSAN 審核,我們能夠運行正常企業級 SSD 測試的子集,以更全面地了解 P4800X 的性能概況。

Intel Optane SSD DC P4800X 規格

外形尺寸 AIC HHHL,U.2
容量 375GB,750GB
介面 PCIe 3×4,NVMe
潛伏 <10μs
服務質量
4KB 隨機,隊列深度 1,讀/寫 <60/100μs
4KB 隨機,隊列深度 16,讀/寫 <150/200μs
倉庫工作量統計
4KB 隨機,隊列深度 16,讀/寫 高達 550/500K IOPS
4KB 隨機,隊列深度 16,混合 70/30 R/W 高達 500K IOPS
耐力
DWPD  30
PB 寫入
375GB 20.5體重體重
750GB 41體重體重

性能

試驗台

我們的企業級 SSD 評測利用 Lenovo ThinkSystem SR850 進行應用程序測試和 戴爾 PowerEdge R740xd 用於綜合基準。 ThinkSystem SR850 是一個裝備精良的四 CPU 平台,提供的 CPU 能力遠遠超過對高性能本地存儲施加壓力所需的能力。 不需要大量 CPU 資源的綜合測試使用更傳統的雙處理器服務器。 在這兩種情況下,目的都是以盡可能符合存儲供應商最大驅動器規格的最佳方式展示本地存儲。

聯想 ThinkSystem SR850

  • 4 個 Intel Platinum 8160 CPU(2.1GHz x 24 核)
  • 16 x 32GB DDR4-2666Mhz ECC 內存
  • 2 個 RAID 930-8i 12Gb/s RAID 卡
  • 8 個 NVMe 托架
  • VMware ESXI 6.5

戴爾 PowerEdge R740xd

  • 2 個英特爾金牌 6130 CPU(2.1GHz x 16 核)
  • 16 x 16GB DDR4-2666MHz ECC 內存
  • 1x PERC 730 2GB 12Gb/s RAID 卡
  • 附加 NVMe 適配器
  • Ubuntu-16.04.3-桌面-amd64

測試背景和比較

 StorageReview 企業測試實驗室 提供了一個靈活的架構,用於在與管理員在實際部署中遇到的環境相當的環境中對企業存儲設備進行基準測試。 企業測試實驗室結合了各種服務器、網絡、電源調節和其他網絡基礎設施,使我們的員工能夠建立真實世界的條件,以便在我們的審查期間準確地衡量性能。

我們將這些關於實驗室環境和協議的詳細信息納入審查,以便 IT 專業人員和負責存儲采購的人員能夠了解我們取得以下成果的條件。 我們的評論都不是由我們正在測試的設備製造商支付或監督的。 有關的其他詳細信息 StorageReview 企業測試實驗室   其網絡功能的概述 在這些相應的頁面上可用。

本次審查的可比性:

SideFX 的胡迪尼

Houdini 測試專門用於評估與 CGI 渲染相關的存儲性能。 此應用程序的測試台是核心的變體 戴爾 PowerEdge R740xd 我們在實驗室中使用的服務器類型具有雙 Intel 6130 CPU 和 64GB DRAM。 在這種情況下,我們安裝了運行裸機的 Ubuntu 桌面 (ubuntu-16.04.3-desktop-amd64)。 基準測試的輸出以秒為單位來衡量,越少越好。

Maelstrom 演示代表了渲染管線的一部分,它通過演示其有效使用交換文件作為擴展內存形式的能力來突出存儲的性能。 測試不會寫出結果數據或處理點,以隔離延遲對底層存儲組件的影響。 測試本身由五個階段組成,我們將其中三個階段作為基準測試的一部分運行,如下所示:

  1. 從磁盤加載打包點。 這是從磁盤讀取的時間。 這是單線程的,可能會限制整體吞吐量。
  2. 將點解壓縮到一個平面數組中,以便對其進行處理。 如果這些點不依賴於其他點,則可以調整工作集以保留在核心中。 這一步是多線程的。
  3. (未運行)處理點。
  4. 將它們重新打包成適合存儲回磁盤的分桶塊。 這一步是多線程的。
  5. (未運行)將分桶塊寫回磁盤。

英特爾傲騰固態硬盤 DC P4800X 以 1,520.4 秒的成績在 Houdini 測試中名列榜首。 P4800X 擁有所有傲騰驅動器中最好的性能,也是最好的整體性能。

VDBench 工作負載分析

在對存儲設備進行基準測試時,應用程序測試是最好的,綜合測試排在第二位。 雖然不能完美代表實際工作負載,但綜合測試確實有助於為具有可重複性因素的存儲設備設定基準,從而可以輕鬆地在競爭解決方案之間進行“同類”比較。 這些工作負載提供了一系列不同的測試配置文件,從“四個角”測試、常見的數據庫傳輸大小測試到來自不同 VDI 環境的跟踪捕獲。 所有這些測試都利用通用的 vdBench 工作負載生成器,以及一個腳本引擎來自動化和捕獲大型計算測試集群的結果。 這使我們能夠在各種存儲設備上重複相同的工作負載,包括閃存陣列和單個存儲設備。 我們針對這些基準測試的測試過程用數據填充整個驅動器表面,然後將驅動器部分分區為驅動器容量的 25%,以模擬驅動器如何響應應用程序工作負載。 這與使用 100% 的驅動器並使它們進入穩定狀態的全熵測試不同。 因此,這些數字將反映更高的持續寫入速度。

簡介:

  • 4K 隨機讀取:100% 讀取,128 個線程,0-120% 重複率
  • 4K 隨機寫入:100% 寫入,64 線程,0-120% iorate
  • 64K 順序讀取:100% 讀取,16 線程,0-120% 迭代
  • 64K 順序寫入:100% 寫入,8 個線程,0-120% 迭代
  • 綜合數據庫:SQL 和 Oracle
  • VDI 完整克隆和鏈接克隆跟踪

對於 4K 峰值隨機性能,Intel Optane SSD DC P4800X(以下簡稱 P4800X)以比其他驅動器低得多的延遲開始,然後在 500K IOPS 後突然上升,最後以 585,754 IOPS 結束,延遲為 213μs .

憑藉 4K 峰值寫入性能,P4800X 表現更佳,以大約 554K IOPS 的峰值性能和僅 155μs 的延遲排名第二。

切換到順序工作負載,在我們的 64K 讀取中,我們看到了與 4K 讀取類似的模式。 P4800X 開始時的延遲比其他驅動器低得多,然後以約 35K IOPS 的速度飆升,並以 40,558μs 的延遲達到 2.53 IOPS 或 394GB/s 的峰值。 這使該驅動器總體排名第四。

對於 64K 寫入,P4800X 位居第二,峰值性能約為 34,700 IOPS 或 2.17GB/s,延遲為 380μs,然後略有下降。

對於我們的 SQL 工作負載,我們看到 P4800X 以 286,548 IOPS 的峰值得分大幅躍居前列,延遲僅為 111 微秒。

在我們的 SQL90-10 中,P4800X 以 276,530 IOPS 的最高分和 114 微秒的延遲繼續其統治地位。

在 SQL 80-20 中保持第一名的 P4800X 在大約 266K IOPS 時達到峰值,延遲大約為 111μs,然後出現小幅下降。

轉到我們的 Oracle 工作負載,P4800X 以接近 248K IOPS 的峰值得分和 127μs 的延遲位居第二。

在 Oracle 90-10 中,P4800X 以 276,703 IOPS 的峰值性能和僅 79 微秒的延遲擊敗了其他驅動器。

同樣在 Oracle 80-20 中,我們看到 P4800X 以 265,769 IOPS 和僅 82 微秒的延遲領先。

接下來,我們切換到 VDI 克隆測試、完整克隆 (FC) 和鏈接克隆 (LC)。 對於 VDI FC Boot,P4800X 起步非常強勁,隨後以 167,856 IOPS 的峰值性能和 199μs 的延遲躍居第三。

在 VDI FC Initial Login 中,P4800X 以 108,159 IOPS 和 274μs 的延遲再次排名第三。

對於 VDI FC Monday Login,P4800X 以 97,198 IOPS 的峰值性能和 163μs 的延遲躍居第二。

接下來是 VDI LC Boot,P4800X 以 93,095 IOPS 的分數和 171μs 的延遲位居榜首。

VDI LC Initial Login 以 4800 IOPS 的得分和 66,463μs 的延遲獲得了 P118X 的另一個冠軍。

最後,在我們的 VDI LC 星期一登錄測試中,P4800X 以 67,085 IOPS 和 235μs 的延遲位居第二。

結論

英特爾傲騰固態硬盤 DC P4800X 是另一款採用英特爾 3D XPoint 技術發布的驅動器。 顧名思義,該驅動器專為數據中心設計,採用常見的 U.2 和 AIC HHHL 外形規格。 立即變得明顯的缺點之一是該驅動器僅提供 375GB 和 750GB 容量。 這一方面限制了它的用例,但另一方面,它的用例主要面向低延遲比容量更重要的工作負載和應用程序。 在這方面,Optane 技術已證明自己在企業和最終用戶工作負載方面處於行業領先地位。

P4800X 的小容量是我們在正常的基準測試中出現小漏洞的原因。 驅動器容量不夠大,無法運行 SQL 或 Sysbench,因此它們沒有出現在單驅動器評測中。 在我們能夠運行的第一個應用程序分析工作負載(SideFX 的 Houdini)中,P4800X 以 1,520.4 秒的總成績名列前茅。 在我們的 VDBench 中,P4800X 在隊列深度較低的情況下全面佔據主導地位。 高端性能更多地與 P4800X 混合在一起,一些傳統的 NVMe 產品在性能上超過了它。 然而,它確實在 SQL 和 Oracle 90-10 和 80-20 等領域擊敗了其他人。 P4800X 的亮點包括在兩個 4K 測試中均超過 2.53 萬次 IOPS,在 64K 讀取中為 2.17GB/s,在 64K 寫入中為 4800GB/s。 在所有三個 SQL 測試中,P250X 的 IOPS 超過 4800 萬,在我們的 Oracle 測試中達到或超過 4800K IOPS。 但撇開峰值性能不談,英特爾傲騰 P79X 的延遲極低。 在每項測試中,延遲開始時都非常低,通常比所有其他驅動器低得多。 在少數情況下,P90X 具有峰值性能,Oracle 10-82 中的延遲低至 80μs,Oracle 20-XNUMX 中的延遲低至 XNUMXμs。

對於低延遲工作負載,目前沒有什麼能比得上英特爾傲騰固態盤 DC P4800X。 雖然傳統 NVMe 產品在某些方面可以在總帶寬和 IOPS 方面超越它,但一般來說,P4800X 不適合基於其價格/容量指標的這些用例。 不過,一旦企業驅動器達到更高的容量點,想想英特爾傲騰技術的可能性是令人興奮的; 尤其是 2TB 級別的產品,它仍然是陣列供應商的最愛,儘管 30TB SAS SSD 很常見。 在我們圍繞 vSAN 的特定用例中,P4800X 為寫入緩存層提供了最快的性能。 對於想要充分利用 vSAN 的任何人來說,P4800X 是事實上的標準。

英特爾 P4800X 產品頁面

討論這篇評論

註冊 StorageReview 時事通訊