Lenovo ThinkSystem SR665 是一款功能豐富、 第二代 AMD 霄龍 雙插槽 2U 服務器,支持端到端 PCIe Gen4 支持。 類似於其較小的 1U 兄弟 SR635,它還支持廣泛的存儲配置選項,包括 Gen4 U.2 NVMe SSD。 作為 AMD EPYC 服務器具有多項優勢,包括通常更高的性能、更快的 RAM、更多的 DIMM 和 PCIe Gen4 支持。 該服務器非常適合推理、虛擬化、VDI、HPC 和超融合基礎架構。
Lenovo ThinkSystem SR665 是一款功能豐富、 第二代 AMD 霄龍 雙插槽 2U 服務器,支持端到端 PCIe Gen4 支持。 類似於其較小的 1U 兄弟 SR635,它還支持廣泛的存儲配置選項,包括 Gen4 U.2 NVMe SSD。 作為 AMD EPYC 服務器具有多項優勢,包括通常更高的性能、更快的 RAM、更多的 DIMM 和 PCIe Gen4 支持。 該服務器非常適合推理、虛擬化、VDI、HPC 和超融合基礎架構。
與競爭對手相比,AMD EPYC 7002 具有多項優勢。 馬上,它們往往擁有更多的內核和線程,並帶來更高的性能。 它們支持更快、更多的 DRAM,並支持 PCIe Gen4 技術(在本例中為端到端),進而可以帶來巨大的性能提升。 高內核數還可以幫助某些許可模型節省成本,從而提高具有單個 CPU 的雙路系統或具有兩個 CPU 的四路平台的性能。 SR665 充分利用了上述一切。
具體來說,Lenovo ThinkSystem SR665 支持高達 64 核 128 線程的 CPU,核心速度高達 3.7GHz。 內存方面,SR665最多支持32條TruDDR4內存DIMM,8條內存通道,每通道2條DIMM。 每個通道安裝 1 個 DIMM(總共 8 個 DIMM),內存運行頻率高達 3200 MHz。 每個通道 2 個 DIMM(總共 32 個 DIMM),內存運行頻率高達 2933 MHz。 該服務器最多可支持 4TB 的 DRAM。 對於 GPU,SR665 最多可支持 3 個雙寬或 8 個單寬 GPU。
存儲,特別是存儲可配置性,在 Lenovo ThinkSystem SR665 服務器上非常有趣。 據聯想稱,該服務器在服務器前、中、後提供了 28 種不同的驅動器托架配置,在服務器後部提供了 5 種不同的插槽配置。
對於 2.5 英寸驅動器,服務器可以通過前中後組合最多支持 40 個。 該服務器支持多達 16 個 NMVe SSD,沒有 PCIe 通道超額訂閱,最多支持 32 個 1:2 超額訂閱。 相反,SR665 最多可支持 20 個 3.5 英寸驅動器以實現最大存儲容量。 對於 M.2,服務器支持 RAID1 中的一個或兩個驅動器用於引導或數據存儲。
對於管理,SR665 結合使用 聯想XClarity 管理、ThinkShield 安全功能和聯想服務。 這個想法是提供強大、簡單和安全的管理。 對於那些希望了解更多信息的人,我們對上面鏈接的 XClarity 進行了相當深入的研究。
Lenovo ThinkSystem SR665 規格
外形 | 2U機架式服務器 |
處理器 | 最多兩 (2) 個 AMD EPYC 7002 代處理器,最高 64C,280W |
記憶體應用 | 32 個 DDR4 內存插槽; 使用 4GB RDIMM 時最大 128TB; 在 1MHz 時高達 3200DPC,在 2MHz 時高達 3200DPC |
驅動器托架 | 多達 20 個 3.5 英寸或 40 個 2.5 英寸驅動器; 最多 32 個 NVMe 驅動器,1:2 連接 |
擴展插槽 | 多達 8 個 PCIe 4.0 插槽,1 個 OCP 3.0 適配器插槽 |
GPU | 多達 8 個單寬 GPU 或 3 個雙寬 GPU |
網絡接口 | OCP 3.0 夾層適配器、PCIe 適配器 |
電力 | 雙冗餘 PSU(最高 1800W 白金級) |
連接埠數量 | 正面:1 個 USB 3.0、1 個 USB 2.0、1 個 VGA(可選) 背面:3 個 USB 3.1、1 個串行端口(可選)、1 個 RJ-45(管理) |
系統管理 | 聯想 XClarity 控制器 |
OS支持 | Microsoft Windows Server、SUSE Linux Enterprise Server、Red Hat Enterprise Linux、VMware ESXi |
有限保修 | 1 年和 3 年客戶可更換單元和現場服務,下一工作日 9×5,可選服務升級 |
聯想 ThinkSystem SR665 設計和建造
Lenovo ThinkSystem SR665 是一款 2U 服務器,整體外觀與所有 ThinkSystem 產品組合或 Lenovo 一般外觀相同,主要是黑色和紅色亮點。 橫跨服務器正面的 24 個驅動器托架。 左側有一個外部診斷端口和一個可選的 VGA 端口。 右側有兩個USB 3.1接口、一個XXC接口、一個電源鍵和指示燈。
設備後部頂部最多支持 8 個 PCIe 插槽。 底部是 OCP 3.0 插槽、一個錯誤 LED、一個管理以太網端口、定位器 LED、一個 XCC 管理端口、一個視頻端口、另外三個 Gen1 USB 3.1 端口、一個 NMI 和兩個熱插拔 PSU。
在引擎蓋下,我們可以看到兩個 CPU 和 RAM DIMM 上方的氣流罩。 它們前面是風扇,後面是 PCIe 插槽的提升板。 M.2 啟動卡和 RAID 卡電源備份連接到蓋子的頂部。
安裝在空氣擋板上的 M.2 引導模塊為系統存儲提供快速閃存存儲,而無需佔用主存儲槽來執行低優先級任務。
聯想 ThinkSystem SR665 性能
聯想ThinkSystem SR665配置:
- 2 個 AMD 霄龍 7742
- 512GB,每個 CPU 256GB
- VDbench 性能存儲:8 x 3.84Tb Micron 9300 (Gen3) 或 8 x 3.84TB SK hynix PE8010 (Gen4)
- SQL Server 和 Sysbench 存儲:8 x 3.84Tb Micron 9300 (Gen3)
- CentOS 8(2004)
- ESXi 6.7u3
SQL Server 性能
StorageReview 的 Microsoft SQL Server OLTP 測試協議採用事務處理性能委員會的基準 C (TPC-C) 的最新草案,這是一種模擬複雜應用程序環境中活動的在線事務處理基準。 TPC-C 基準比綜合性能基準更接近於衡量數據庫環境中存儲基礎設施的性能優勢和瓶頸。
每個 SQL Server VM 都配置有兩個虛擬磁盤:100GB 卷用於啟動,500GB 卷用於數據庫和日誌文件。 從系統資源的角度來看,我們為每個虛擬機配置了 16 個 vCPU、64GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。 雖然我們之前測試的 Sysbench 工作負載在存儲 I/O 和容量方面使平台飽和,但 SQL 測試尋找延遲性能。
此測試使用在 Windows Server 2014 R2012 來賓虛擬機上運行的 SQL Server 2,並由戴爾的數據庫基準工廠進行壓力測試。 雖然我們對該基準的傳統用法是在本地或共享存儲上測試 3,000 規模的大型數據庫,但在本次迭代中,我們專注於在我們的服務器上均勻分佈四個 1,500 規模的數據庫。
SQL Server 測試配置(每個虛擬機)
- 在Windows Server 2012 R2
- 存儲空間:分配 600GB,使用 500GB
- SQL Server 2014的
-
- 數據庫大小:1,500 規模
- 虛擬客戶端負載:15,000
- 內存緩衝區:48GB
- 測試時長:3 小時
- 2.5 小時預處理
- 30分鐘採樣期
對於 SQL Server 平均延遲,SR665 可以毫無問題地最大化此工作負載,平均總延遲為 1 毫秒,每個虛擬機為 1 毫秒。
Sysbench MySQL 性能
我們的第一個本地存儲應用程序基準測試包括通過 SysBench 測量的 Percona MySQL OLTP 數據庫。 該測試測量平均 TPS(每秒事務數)、平均延遲和平均 99% 延遲。
每個 Sysbench VM 配置了三個虛擬磁盤:一個用於啟動 (~92GB),一個用於預構建數據庫 (~447GB),第三個用於測試中的數據庫 (270GB)。 從系統資源的角度來看,我們為每個虛擬機配置了 16 個 vCPU、60GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。
Sysbench 測試配置(每個虛擬機)
- 中央操作系統 6.3 64 位
- Percona XtraDB 5.5.30-rel30.1
-
- 數據庫表:100
- 數據庫大小:10,000,000
- 數據庫線程:32
- 內存緩衝區:24GB
- 測試時長:3 小時
- 2 小時預處理 32 個線程
- 1 小時 32 個線程
通過 Sysbench OLTP,我們看到 17,238 個虛擬機的總得分為 8 TPS,32,649 個虛擬機的總得分為 16 TPS。
通過 Sysbench 平均延遲,我們看到 14.85 個虛擬機的總分數為 8 毫秒,15.68 個虛擬機的總分數為 16 毫秒。
對於我們最壞情況下的延遲(第 99 個百分位數),SR665 的總得分為 30.27 個虛擬機的 8 毫秒和 30.12 個虛擬機的 16 毫秒。
VDBench 工作負載分析
在對存儲陣列進行基準測試時,應用程序測試是最好的,綜合測試排在第二位。 雖然不能完美代表實際工作負載,但綜合測試確實有助於為具有可重複性因素的存儲設備建立基線,從而可以輕鬆地在競爭解決方案之間進行同類比較。
這些工作負載提供了一系列不同的測試配置文件,包括“四個角”測試、常見的數據庫傳輸大小測試,以及來自不同 VDI 環境的跟踪捕獲。 所有這些測試都利用通用的 vdBench 工作負載生成器,以及一個腳本引擎來自動化和捕獲大型計算測試集群的結果。 這使我們能夠在各種存儲設備上重複相同的工作負載,包括閃存陣列和單個存儲設備。
簡介:
- 4K 隨機讀取:100% 讀取,128 個線程,0-120% 重複率
- 4K 隨機寫入:100% 寫入,64 線程,0-120% iorate
- 64K 順序讀取:100% 讀取,16 個線程,0-120% 迭代
- 64K 順序寫入:100% 寫入,8 個線程,0-120% 迭代
- 綜合數據庫:SQL 和 Oracle
- VDI 完整克隆和鏈接克隆跟踪
在這裡我們對 PCIe Gen3 和 Gen4 驅動器進行了比較, 美光 9300 vs SK海力士PE8010. 與其說是看哪種驅動器更好,不如說是看每種技術在服務器中的表現如何。 下圖是我們的八個 Micron 9300 NVMe SSD 位於 SR665 AnyBay 插槽中,上面有一個硬盤驅動器供參考。
對於隨機 4K 讀取,配備 SK Hynix Gen665 驅動器的 Lenovo ThinkSystem SR4 以 75.9µs 的延遲和 412,428 IOPS 開始,然後達到 3,851,738 IOPS 的峰值和 170.2µs 的延遲。 美光 9300 Gen3 驅動器的峰值更高,為 4,076,949 IOPS,但延遲更高,為 197.2µs。
4K 隨機寫入看到 Gen4 驅動器在 SR665 中的性能顯著提高,保持在 100µs 以下,直到大約 2.6 萬 IOPS,並繼續達到 2,898,564 IOPS 的峰值,延遲為 154.4µs。 Gen3 驅動器在大約 1.2µs 時出現了約 200 萬次 IOPS 的峰值,然後下降了一些。
切換到 64K 順序工作後,Gen4 驅動器以 521,788µs 的延遲達到 32.6 IOPS 或 366.1GB/s 的峰值。 Gen3 驅動器以 425,209µs 的延遲達到 26.6 IOPS 或 545GB/s 的峰值。
對於 SR64 的 665K 寫入,Gen4 驅動器以 213,099µs 的延遲達到 13.3 IOPS 或 442.1GB/s 的峰值,然後下降一些。 Gen3 驅動器在大約 123µs 的延遲下達到約 7K IOPS 或 460GB/s 的峰值,然後下降一些。
我們的下一組測試是我們的 SQL 工作負載:SQL、SQL 90-10 和 SQL 80-20。 從 SQL 開始,SK hynix Gen4 驅動器保持在 100µs 以下,直到大約 1.75 萬 IOPS,然後達到 2,111,582 IOPS 的峰值,延遲僅為 113.6µs。 Gen3 的峰值為 1,602,112 IOPS,延遲為 153.4µs。
對於 SQL 90-10,Gen4 驅動器再次啟動並保持在 100µs 以下,這一次直到它們突破約 1.2 萬次 IOPS。 驅動器繼續達到 1,769,165 IOPS 的峰值,延遲為 130.7µs,然後略有下降。 Gen3 SSD 也表現出色,峰值為 1,441,311 IOPS,延遲為 156.8µs。
SQL 80-20 發現 SR4 中的 Gen665 驅動器峰值為 1,657,107 IOPS,延遲為 141.9µs。 Gen3 驅動器能夠達到 1,246,384 IOPS 的峰值,延遲為 168.9µs。
接下來是我們的 Oracle 工作負載:Oracle、Oracle 90-10 和 Oracle 80-20。 從 Oracle 開始,配備 Gen665 SSD 的 Lenovo ThinkSystem SR4 開始時低於 100µs,並一直保持到突破約 900K IOPS。 驅動器繼續達到 1,484,001 IOPS 的峰值,延遲為 154.4µs。 對於 Gen3 驅動器,服務器為我們提供了 1,140,743,178.8 IOPS 的峰值性能和 XNUMXµs 的延遲。
對於 Oracle 90-10,Gen4 驅動器的峰值為 1,511,538 IOPS,延遲為 110.5µs。 Gen3 驅動器也表現出色,峰值為 1,231,073 IOPS,延遲為 134.8µs。
Oracle 80-20 發現 Gen4 驅動器的峰值性能為 1,369,215 IOPS,延遲為 117.7µs。 Gen3 SSD 達到 1,089,788 IOPS 和 141.6µs 的延遲。
接下來,我們切換到我們的 VDI 克隆測試,完整和鏈接。 對於 VDI 完整克隆 (FC) 啟動,SR665 上的 SK hynix 驅動器以低於 100µs 的延遲性能開始,直到 700K IOPS 並達到 1,379,893 IOPS 的峰值和 174.6µs 的延遲。 Micron Gen3 驅動器的峰值為 1,185,395 IOPS,延遲為 198.1µs,之後有所下降。
通過 VDI FC Initial Login,我們可以看到兩代 PCIe SSD 之間存在相當大的差異。 Gen4 開始時的延遲低於 100µs,直到大約 400K IOPS,峰值達到 636,576 IOPS,延遲為 268.3µs。 Gen3 的峰值為 324,073 IOPS,延遲為 356µs。
VDI FC Monday Login 再次看到更大的差異,Gen4 驅動器峰值為 526,115 IOPS,延遲為 179.5µs,而 Gen3 驅動器峰值為 293,012 IOPS,延遲為 235.5µs。
切換到 VDI 鏈接克隆 (LC) 啟動後,加載了 Gen665 驅動器的 SR4 峰值達到 684,910 IOPS,延遲為 149.6µs。 Gen3 以 538,330µs 的延遲驅動峰值 189 IOPS。
VDI LC Initial Login 再次看到兩代之間的更大差異,Gen4 峰值為 288,211,延遲為 156µs,Gen3 峰值為 161,852 IOPS,延遲為 227.8µs。
最後,在 VDI LC Monday Login 中,我們看到 Gen4 驅動器達到 386,865 IOPS 的峰值和 237µs 的延遲,而 Gen3 驅動器達到 181,515 IOPS,延遲為 309.3µs。
結論
Lenovo ThinkSystem SR665 是一款 2U 服務器,可以容納並利用兩個 AMD EPYC Gen2 CPU。 作為基於 AMD EPYC 的服務器具有多項優勢,例如能夠在存儲、GPU 和 FPGA 中使用 PCIe Gen4 技術以及更快的 RAM。 硬件方面,服務器最多可搭載兩顆AMD EPYC CPU,最高支持64核128線程,核心速度高達3.7GHz,最高4TB RAM(速度最高3200 MHz),並有9個擴展插槽.
SR665 也有很多存儲配置。 該服務器具有前、中、後驅動器托架功能,最多可支持 40 個 2.5 英寸驅動器。 服務器支持 NVMe 和 SATA 驅動器。 利用 XClarity 進行管理,SR665 旨在推理、虛擬化、VDI、HPC 和超融合基礎設施用例。
為了測試性能,我們同時運行了應用程序工作負載分析和 VDBench。 在我們的應用程序工作負載分析中,我們運行了 SQL Server 平均延遲和我們的 Sysbench 測試。 在我們的 SQL Server 平均延遲中,SR665 的總延遲為 1 毫秒。 在 Sysbench 中,我們運行了 8VM 和 16VM。 在 OLTP 中,我們看到 17,238 個虛擬機的總得分為 8 TPS,32,649 個虛擬機的總得分為 16,14.85 個虛擬機的平均延遲為 8 毫秒,15.68 個虛擬機的平均延遲為 16 毫秒,30.27 個虛擬機的總得分為 8 毫秒,30.12 個虛擬機的最壞情況延遲為 16 毫秒。
Lenovo ThinkSystem SR665 可以利用 PCIe Gen3 和 Gen4 設備。 這意味著希望在其環境中部署 SR665 的用戶可以使用其中一種。 為了更好地全面了解服務器的工作原理,我們將兩種類型的存儲都放入其中並進行了測試。 需要明確的是,這不是“哪個更好”類型的測試。 雖然 Gen4 存儲還沒有完全飽和,但它通常在幾乎所有情況下都比 Gen3 快。 所以在大多數情況下 Gen4 會更快。 但是,在對這兩種驅動器進行測試後,用戶將知道他們選擇使用哪種類型的存儲會發生什麼,例如,如果他們現在使用的是 Gen3,他們將知道會發生什麼,如果他們將來改用 Gen4,他們將知道會發生什麼結果應該是。
在進入性能部分之前,請務必注意,我們只是觸及了 SR665 可能實現的功能的皮毛。 我們有 16 個托架配置,僅支持 8 個 NVMe 設備。 Lenovo 提供了許多配置選項,其中一些選項最多可達 16 個 NVMe 托架。 因此,為了獲得更高的潛力,您可以進一步指定該服務器,超出我們所能看到的範圍。
在我們的 4K 讀取中,我們看到 Gen4 的峰值達到 3.9 萬 IOPS,Gen3 達到 4.1 萬 IOPS,其中 Gen4 領先,延遲減少了 14%,對於 4K 寫入,峰值 Gen2.9 為 4 萬 IOPS,Gen1.2 為 3 萬 IOPS ,對於順序工作,我們看到 Gen32.6 的峰值為 4GB/s,在 26.6K 讀取中寫入為 64GB/s,而在 64K 寫入中,Gen13.3 的峰值為 4GB/s,Gen7 為 3GB/s。 我們的下一個測試是 SQL、SQL 90-10 和 SQL 80-20,其中服務器為我們提供了 Gen2.1 4 萬 IOPS 和 Gen1.6 3 萬 IOPS、Gen1.8 4 萬 IOPS 和 Gen1.4 3 萬 IOPS 以及 SQL 90-10,以及SQL 80-20 為 Gen1.7 達到了 4 萬次 IOPS,為 Gen1.2 達到了 3 萬次。
下一批測試是 Oracle、Oracle 90-10 和 Oracle 80-20,其中 S665 達到 Gen1.5 的 4 萬 IOPS 和 Gen1.1 的 3 萬 IOPS,Oracle 90-10 的 Gen1.5 達到 4 萬 IOPS 和 Gen1.2 達到 3 萬 IOPS ,Oracle 1.4-4 的 Gen1.1 IOPS 為 3 萬,Gen80 IOPS 為 20 萬。 我們看到突破百萬 IOPS 障礙的最後一個測試是具有 Gen4(1.4 萬 IOPS)和 Gen3(1.2 萬 IOPS)的 VDI FC Boot。
Lenovo ThinkSystem SR665 是一款高度可配置的 2U 服務器,可以真正發揮 AMD EPYC CPU 的性能。 無論用戶將其與 PCIe Gen3 還是 Gen4 打包在一起,他們都會對其功能印象深刻。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | Facebook | RSS訂閱