Comino Grando 液冷系統的強大動力確保即使在滿載情況下 GPU 效能也不會受到影響。
對於外行人來說,Comino 是一家在液冷伺服器領域佔有一席之地的公司,創造了多功能且高效的工作站和伺服器。在本次評測中,我們將研究他們的旗艦系統 Comino Grando 伺服器和工作站。這些系統設計為可用作 19 吋機架安裝單元和獨立桌上型電腦,可滿足各種高效能運算需求。無論是數據分析、圖形設計、遊戲或其他要求苛刻的任務,這些伺服器都旨在提供效能、可靠性和冷卻效率。
Comino Grando 6x NVIDIA 4090 系統
這些 Grando 系統的「酷炫因素」怎麼強調都不為過。它們散發出強大的力量和性能,無縫整合最先進的液體冷卻技術以保持最佳溫度。即使在繁重的工作負載下,這也能確保最佳性能,使酷成為字面上和象徵性的屬性。冷卻平台設計還可以實現沒有液體冷卻就無法實現的 GPU 密度。例如,在 Grando Server 上,Comino 可以並排安裝 4090 個 NVIDIA XNUMX GPU,而這在空氣冷卻中是不可能實現的。液冷設計為一槽寬,而庫存風冷部分為雙槽寬。
伺服器和工作站型號是高度可自訂的,為用戶提供了一系列選擇,包括強大的多核心處理器(AMD Threadripper PRO)、高達1TB的記憶體配置和大量儲存容量。使用者還可以選擇增加多達 6000 個頂級專業 GPU,包括 NVIDIA RTX A48 (6000GB)、NVIDIA RTX 46 ADA (100GB)、NVIDIA H80 (100GB)、NVIDIA A80 (40GB)、NVIDIA L48s (4090GB)、NVIDIA A24 (XNUMXGB)、NVIDIA LXNUMXs (XNUMXGB) 和IDIDIA AXNUMX (XNUMXGB)、NVIDIA LXNUMXs (XNUMXTXGB) 和IDIDIA RTXGB) 和IDID (XNUMXGB)。這使得 Comino Grando 成為尋求強大運算解決方案、提供強大功能和可靠性的專業人士和企業的可靠選擇。
我們有機會測試了科米諾的兩個液冷系統。從 Grando 伺服器開始,我們的配置配備了六個 NVIDIA RTX 4090。它還配備了 AMD 的 Threadripper PRO 5995WX CPU(我們在 64 核心處理器中看到的) 聯想ThinkStation P620)、512GB DDR5 DRAM、2TB NVMe SSD 和四個 1600W PSU 用於冗餘,以增強針對電源故障的可靠性。
我們從Comino 收到的第二個系統是工作站迭代,其亮點是四個NVIDIA A100 專業GPU、一個Threadripper Pro 3975WX 處理器(36 核心、64 執行緒、睿頻速度高達4.2 GHz)、512GB DDR5 DRAM 和2TB NVMe SSD。本產品專為近乎靜音的操作而設計;考慮到內部的 GPU 令人震驚。
Comino Grando 液冷 GPU 系統
如上所述,兩種型號的主要區別在於GPU和CPU能力,這意味著它們的目標應用場景也有所不同。伺服器型號中的 5995WX CPU 擁有更高的核心數量,非常適合平行處理任務。它顯著提高了同時處理多個任務至關重要的伺服器環境的效能。
相比之下,工作站的 3975WX 雖然仍然功能強大,但提供的核心較少,適合需要在各種應用程式之間實現平衡效能的工作站使用。 GPU 的選擇進一步區分了兩者; RTX 4090 在圖形渲染方面處於領先地位,非常適合需要密集圖形計算的任務,而 NVIDIA A100(每台配備 40GB 內存)專為深度學習和科學計算而定制。
Comino Grando 組件和構建
儘管發生了最初的運輸事故(服務器從送貨卡車上摔下來——我發誓不是我們造成的!),Comino 的徹底包裝確保了系統的完整性保持完好。這種彈性部分歸功於其緊湊的水冷設計,從本質上降低了運輸過程中損壞的風險。該系統已在會議上展示並由美國各地的技術專家進行分析,因此它對旅行的磨損並不陌生。
Comino Grando 6x 4090(左)和 4x A100(右)
打開 Grando Server 模型的包裝,我們發現了一個井井有條的內部結構,配有電源線、導軌以及有關預填充冷卻系統的通知,包括用於維護的工具和資源。該伺服器的前端擁有令人印象深刻的六台 RTX 4090 陣容,由於採用了水冷頭,每台都被精簡為單插槽外形尺寸,從而實現了時尚、高效的設計。考慮到這些緊湊型裝置所擁有的功率,這種設置當然很有趣。
Comino Grando 伺服器後部
兩種型號均使用幾乎相同的外殼;從內部來看,除了冷卻配置之外,它們看起來幾乎相同。除非另有說明,我們將專注於佈局部分的伺服器迭代。前面板連接包括額外的 I/O 選項,包括用於直接音響系統整合的音訊輸入/輸出插孔、用於外圍連接的多個 USB 連接埠以及允許連接到各種裝置的網路連接埠。兩種型號都強調易於維護和用戶交互,這與 Comino 高效能運算硬體的設計概念一致。
LED 顯示器位於伺服器前面板的最左側,可提供一系列有用的遙測數據,包括有關泵浦、空氣溫度、冷卻劑溫度和風扇速度的資訊。冷卻模組上的發光按鈕可輕鬆瀏覽選單,短按(2 秒以內)即可捲動瀏覽資訊。長按 PB2(超過 2 秒)可開啟對其他選單分支的訪問,包括命令、服務(設定)和事件日誌,從而增加對設定和系統診斷的進一步控制。總體而言,該介面非常直觀,具有易於導航的選單,並透過背光按鈕增強了操作的簡單性。
Comino Grando 液冷 GPU 系統遙測顯示器
打開頂板,首先映入眼簾的當然是液體管路,呈現出精緻、統一的感覺。我們也被機殼內 GPU 和 SSD 所在區域的支撐桿所吸引,這將顯著減少運輸過程中敏感組件的移動,確保它們到達時狀態良好。
Comino Grando 6x 4090 系統內部
系統的中心是一個大型水分配塊,提供冷卻液體和返迴路徑。這些都透過無滴水快速斷開接頭連接,體現了科米諾的高品質工程實力。
Comino Grando 6x 4090 歧管
Grando 伺服器內的 4090 個 NVIDIA RTX 100 GPU 封裝在專有的 Comino 冷板中,排列得非常緊湊,以最大限度地利用伺服器內的空間,同時確保每個單元都能有效冷卻。工作站型號採用四個 NVIDIA AXNUMX GPU。
Comino Grando 4x A100 歧管
兩者都使用垂直穿過它們的固定支架牢固地固定在伺服器內。這有助於穩定和對齊 GPU,並在移動過程中保持其結構完整性。
Comino Grando GPU 冷板
去掉 GPU 以獲得更好的外觀,每塊都是現成的技嘉 NVIDIA RTX 4090,採用 Comino 的客製化冷板設計。這些卡的重量相當大,毫無疑問,部分原因在於 GPU 上夾著巨大的散熱器組件。
每張卡片上返回配水塊的配件都是無滴水連接,這樣可以在拆卸卡進行維修時不會到處漏液。它們在配合表面上有極少量的殘留物,但那是在將其與系統斷開連接之後。
配電塊上也有相同的配件。
CPU 和電壓調節器有一個直接連接到冷卻液軟管的冷板,以保持冷卻並避免在高工作負載下出現瓶頸。 CPU 兩側均配備 DRAM 插槽,總計 512GB。
Comino Grando CPU 冷板
雖然這兩個系統的背面都有一個巨大的散熱器來減輕熱量,但兩個平台之間最大的區別是風扇配置和整體噪音。雖然兩個系統都非常安靜,但工作站配置更安靜,風扇設定也較不激進。
Comino Grando 4x A100 工作站內部
在設計方面,我們唯一真正的抱怨是將 I/O 連接埠放在前面,並將電源輸入放在後面。在機架式資料中心環境中,這種設計提出了挑戰。透過使用現成的主機板,Comino 的選擇就只有這麼多。最終的結果是在一個經過深思熟慮的設計中產生了一點小煩惱。
科米諾格蘭多遠端管理
Grafana 用於管理 Comino Grando Server,作為強大的開源分析和監控解決方案,透過儀表板提供即時資料視覺化。它與各種資料來源集成,並提供警報、多租戶支援和 API 存取等功能,使其可用於追蹤和診斷系統效能。
查看一般資訊儀表板,Grafana 顯示 Comino Grando 上的即時指標,例如熱管理的冷卻劑流量、環境濕度水平、系統管理 (STM)、電壓調節器模組 (VRM) 等關鍵組件的溫度和印刷電路板( PCB)。
它還監控能耗,顯示各個元件的使用情況,例如 CPU 和 GPU 功耗,這對於管理此等級的伺服器至關重要。該介面有效地整合了以易於使用的方式顯示的所有這些關鍵資訊。這可確保伺服器的效能和可靠性保持在最佳水平,同時為管理員提供可操作的見解,以預先解決任何潛在問題。
科米諾格蘭多規格
格蘭多伺服器 | 格蘭多工作站 | |
---|---|---|
中央處理器 | Threadripper Pro W5995WX | 線程撕裂者 Pro 3975WX |
公羊 | RAM 512GB | RAM 512GB |
GPU | 6 個 NVIDIA RTX 4090 | 4X A100 |
電源供應器 | 4 個 1600w PSU | 3x 1000 SFX-L 電源 |
儲存應用 | 2TB NVMe | 2TB NVMe |
科米諾格蘭多表演
為了比較 Comino Grando 系統的兩種配置(伺服器和工作站)之間的效能,我們使用了一系列基準來評估運算效能的不同方面,包括渲染、運算和資料處理能力。這些基準測試包括Blender 4.0、Luxmark、OctaneBench、Blackmagic RAW Speed Test、7-zip Compression 和Y-Cruncher,每個基準測試均因其在評估這些系統在各種運算環境中的具體優勢方面的相關性而被選擇。
攪拌機4.0
Blender 是一款全面的開源 3D 創建套件,適用於建模、動畫、模擬和渲染專案。 Blender 基準測試評估系統渲染複雜場景的效能,這對於視覺效果、動畫和遊戲開發專業人士來說是一個至關重要的方面。此基準測試衡量 CPU 和 GPU 渲染能力,這與專為高階圖形處理和運算任務而設計的伺服器和工作站相關。
Blender 4.0(每分鐘樣本數,越高越好) | Grando 伺服器(TR W5995WX,512GB,6x 4090) | Grando 工作站(TR 3975WX,512GB,4x A100) |
---|---|---|
怪物(CPU) | 568.02 | 334.40 |
廢品店 (CPU) | 386.53 | 231.90 |
課堂(CPU) | 293.91 | 174.21 |
Blender 4.0 GPU 測試 | ||
怪物(GPU) | 5,880.71 | 1,656.34 |
垃圾店(GPU) | 2,809.36 | 1,137.73 |
課堂(GPU) | 2,895.54 | 953.46 |
結果凸顯了 Grando Server 在渲染方面的強大效能,這要歸功於其高效能的 CPU 和卓越的 GPU 設定。雖然 Grando 工作站的效能也令人讚嘆,特別是在需要詳細 3D 建模和渲染的專業設定中,但該伺服器的配置專為要求更高的圖形處理任務而設計。效能差異反映了伺服器為高階渲染作業做好了準備,為期限緊迫或渲染需求複雜的專案提供了寶貴的工具。
樂士馬克
Luxmark 是一個 GPU 基準測試,它使用開源光線追蹤渲染器 LuxRender 來評估系統在處理高度詳細的 3D 場景方面的效能。此基準測試適用於評估伺服器和工作站的圖形渲染能力,特別是對於視覺效果和建築視覺化應用程序,其中準確的光模擬至關重要。
Luxmark(越高越好) | Grando 伺服器(TR W5995WX,512GB,6x 4090) | Grando 工作站(TR 3975WX,512GB,4x A100) |
---|---|---|
大廳長凳 | 240,303 | 92,156 |
食品 | 98,459 | 27,194 |
Grando Server 的效能展現了其卓越的光線追蹤功能,這要歸功於其先進的 6x RTX 4090 GPU 設定。儘管 Grando 工作站展示了強大的功能,特別有利於需要詳細架構視覺化的任務,但伺服器模型面向更密集的渲染任務。這種區別強調了伺服器對於最大化光線追蹤效能至關重要的專案的適用性,以確保渲染場景的效率和真實感。
辛烷值台
OctaneBench 使用 OctaneRender(強大且受歡迎的 GPU 加速光線追蹤渲染器)評估 GPU 的渲染效能。該基準對於評估伺服器和工作站在內容創建、建築視覺化和視覺效果方面的執行能力至關重要,其中渲染速度直接影響生產力和專案時間表。
辛烷值台 | 核心 | Grando 伺服器(TR W5995WX,512GB,6x 4090) | Grando 工作站(TR 3975WX,512GB,4x A100) |
---|---|---|---|
室內 | 資訊頻道 | 275.25 | 68.05 |
室內 | 直接照明 | 826.70 | 244.65 |
室內 | 路徑追踪 | 1,065.47 | 297.89 |
思維 | 資訊頻道 | 156.00 | 36.22 |
思維 | 直接照明 | 642.48 | 191.03 |
思維 | 路徑追踪 | 785.45 | 232.82 |
亞視 | 資訊頻道 | 431.21 | 73.74 |
亞視 | 直接照明 | 896.54 | 220.35 |
亞視 | 路徑追踪 | 1,130.18 | 273.55 |
包裝盒 | 資訊頻道 | 222.37 | 51.48 |
包裝盒 | 直接照明 | 789.55 | 224.08 |
包裝盒 | 路徑追踪 | 885.74 | 254.17 |
總得分 | 8,106.94 | 2,168.02 |
Grando Server 在 OctaneBench 測試中表現出色,顯示其非常適合受益於 GPU 加速的要求嚴苛的渲染工作流程。 Grando 工作站在提供強大的渲染功能的同時,也進行了最佳化,以平衡專業環境中的效能和多功能性。這種效能差異強調了伺服器針對需要無與倫比的渲染速度的特殊任務的設計,支援更有效率的專案完成。
Blackmagic RAW 速度測試
Blackmagic RAW速度測試可測量高品質視訊格式的處理速度,這是影片製作和編輯中伺服器和工作站的重要方面。它評估系統如何管理 RAW 視訊文件,影響媒體製作環境中的工作流程效率和生產力。
Blackmagic RAW 速度測試 | Grando 伺服器(TR W5995WX,512GB,6x 4090) | Grando 工作站(TR 3975WX,512GB,4x A100) |
---|---|---|
8K CPU | FPS 132 | FPS 135 |
8K 圖形處理器 | FPS 345 | FPS 309 |
Grando 伺服器和工作站在 Blackmagic RAW 速度測試中展示了穩定的效能,伺服器在 CUDA 加速任務中略有優勢。這意味著伺服器模型為涉及大量影片編輯和處理的工作流程(尤其是受益於 GPU 加速的工作流程)提供了稍微更好的效能。然而,該工作站仍然為視訊處理任務提供了強大的功能,這說明了其針對媒體製作的全面構建。
7-zip 壓縮
7-zip 壓縮基準測試系統處理資料壓縮和解壓縮的效率,這對於管理大型資料集和最佳化儲存至關重要。此基準測試反映了資料密集型操作中伺服器和工作站的效能,其中資料操作的速度和效率至關重要。
7-Zip 壓縮基準(越高越好) | Grando 伺服器(TR W5995WX,512GB,6x 4090) | Grando 工作站(TR 3975WX,512GB,4x A100) |
---|---|---|
當前 CPU 使用率 | 3,379% | 3,439% |
電流額定值/使用 | 7.630 吉普斯 | 7.094 吉普斯 |
額定電流 | 257.832 吉普斯 | 243.994 吉普斯 |
產生的 CPU 使用率 | 3,362% | 3,406% |
結果評級/使用 | 7.697 吉普斯 | 7.264 吉普斯 |
結果評級 | 258.756 吉普斯 | 247.396 吉普斯 |
解壓縮 | ||
當前 CPU 使用率 | 6,015% | 6,286% |
電流額定值/使用 | 5.585 吉普斯 | 5.434 吉普斯 |
額定電流 | 335.958 吉普斯 | 341.599 吉普斯 |
產生的 CPU 使用率 | 6,053% | 6,269% |
結果評級/使用 | 5.603 吉普斯 | 5.468 吉普斯 |
結果評級 | 339.171 吉普斯 | 342.766 吉普斯 |
總評分 | ||
總 CPU 使用率 | 4,708% | 4,837% |
總評分/使用情況 | 6.650 吉普斯 | 6.366 吉普斯 |
總評分 | 298.963 吉普斯 | 295.081 吉普斯 |
7-zip 壓縮基準測試的結果顯示 Grando 伺服器和工作站在處理資料壓縮和解壓縮任務方面有能力執行。它們的性能表明,系統可以有效地管理大量數據,略有差異反映了各自的 CPU 配置。這些功能突顯了系統對重要資料管理任務的適用性,確保高效率的儲存和檢索過程。
Y-粉碎機
Y-Cruncher 是一個計算基準測試,用於測試系統處理複雜數學運算的能力,將 Pi 精確計算到數萬億位數字。此基準測試顯示伺服器和工作站的運算能力,特別是用於需要密集數位運算的科學研究和模擬。
Y-Cruncher(總計算時間) | Grando 伺服器(TR W5995WX,512GB,6x 4090) | Grando 工作站(TR 3975WX,512GB,4x A100) |
---|---|---|
1億位數字 | 11.023秒 | 11.759秒 |
2.5億位數字 | 28.693秒 | 32.073秒 |
5億位數字 | 61.786秒 | 69.869秒 |
10億位數字 | 130.547秒 | 151.820秒 |
25億位數字 | 353.858秒 | 425.824秒 |
50億位數字 | 788.912秒 | 971.086秒 |
Y-Cruncher 基準測試揭示了 Grando Server 稍微優越的運算能力,專為高要求的任務而客製化。雖然 Grando 工作站提供強大的運算能力,適用於各種科學和分析應用,但該伺服器針對需要最大運算效能的場景進行了明確最佳化。這強調了伺服器在支援複雜模擬和分析、促進更快、更有效地處理計算任務方面的作用。
Geekbench 6
Geekbench 6 衡量 CPU 和 GPU 的運算效能,涵蓋單核心和多核心功能以及圖形處理能力。此基準對於評估伺服器和工作站在各種任務(包括模擬、資料分析和圖形渲染)中的整體運算效率至關重要。
Geekbench 6(越高越好) | Grando 伺服器(TR W5995WX,512GB,6x 4090) | Grando 工作站(TR 3975WX,512GB,4x A100) |
---|---|---|
CPU單核 | 2,127 | 2,131 |
CPU 多核 | 21,621 | 20,411 |
GPU | 294,894 | 193,447 |
Geekbench 6 結果顯示 Grando Server 和 Workstation 迭代之間的 CPU 單核心效能幾乎相同,顯示依賴單執行緒處理的任務的效率相當。然而,Grando Server 在多核心尤其是 GPU 測試中表現出了卓越的效能,反映出其處理更複雜、平行處理任務和更密集的圖形運算的能力。這表明該伺服器適合需要強大的多執行緒應用程式和高階圖形處理的環境,從而提高計算和圖形密集型工作流程的生產力。
Cinebench R23
Cinebench R23衡量CPU的渲染能力,重點在於單核心和多核心效能。它是評估伺服器或工作站在內容創建、3D 渲染和其他 CPU 密集型任務方面的執行情況的重要基準。 MP 比率(多核心效能比)進一步深入了解系統如何有效地利用其多個核心。
Cinebench R23(越高越好) | Grando 伺服器(TR W5995WX,512GB,6x 4090) | Grando 工作站(TR 3975WX,512GB,4x A100) |
---|---|---|
CPU 多核 | 73,556 | 49,534 |
CPU單核 | 1,484 | 1,468 |
MP比率 | 49.56x | 33.75x |
在這裡,Grando Server 在多核心測試中優於工作站,展現了其處理要求較高的渲染任務的卓越能力,這些任務受益於平行處理。單核結果的細微差異顯示不需要多核心的任務的效率相似。 Server模型較高的MP Ratio體現了其對多核心利用率的熟練程度,使其擅長處理渲染和模擬專案中複雜的多執行緒應用。
Cinebench 2024
Cinebench 2024 將 GPU 效能與傳統 CPU 基準測試結合,擴展了 2023 年對應版本的範圍。這種綜合策略對於評估系統在管理當前 3D 內容創建和渲染活動的嚴格要求方面的熟練程度至關重要。它提供了關於其計算和圖形渲染功能的全方位視角。
Cinebench 2024(越高越好) | Grando 伺服器(TR W5995WX,512GB,6x 4090) | Grando 工作站(TR 3975WX,512GB,4x A100) |
---|---|---|
GPU | 140,842 | 52,829 |
CPU 多核 | 4,430 | 2,817 |
CPU單核 | 90 | 89 |
MP比率 | 49.49x | 31.73x |
Grando Server 在 GPU 和 CPU 多核心基準測試中表現出令人印象深刻的效能,這表明它非常適合處理利用大量資源的複雜渲染任務。相反,Grando 工作站表現出值得稱讚的效率,特別是考慮到與伺服器模型相比其架構和配置。兩個系統之間接近的 CPU 單核分數表明,對於不嚴重依賴多核心處理的任務來說,效率相當。最後,49.49x 的 MP 比率分數突顯了伺服器模型在最大化其多核心配置方面的能力,使其成為需要高 CPU 和 GPU 吞吐量以實現最佳效能和速度的苛刻專案的理想選擇。
虛擬化桌面效能
除了查看整體系統效能的基準之外,我們還希望對 Grando Server 系統進行虛擬化,以共享六個虛擬桌面,每個虛擬桌面都有專用的 4090 GPU。我們部署了 Windows Server 2022 Standard 並設定了六台虛擬機器 (VM),每個 GPU 一台,使我們能夠有效率地分配任務並測試系統的真實功能。
透過為每個 RTX 4090 GPU 設定虛擬機,我們創建了一個模擬專用工作站的隔離環境,從而可以集中評估每個 GPU 的效能。以下是passthrough過程的powershell流程。
此設定還可以方便地識別多 GPU 系統中的優勢和潛在瓶頸,因為它確保可以獨立評估每張卡的效能,而不會受到共享資源的干擾。
勒克斯馬克
LuxMark 基準測試結果顯示 Hallbench 中的分數從 38,599 到 40,797 不等。這表示效能具有顯著的一致性,可能由於操作波動或特定於虛擬機器的配置而出現輕微變化。最高分數(VM1 和 VM4)突顯了 RTX 4090 GPU 在執行要求嚴格的光線追蹤任務(食品類別)時的峰值效能能力。
總體而言,這些結果顯示了 Comino 伺服器使用單一 GPU 執行高階運算任務的能力,為多個並發工作負載提供了強大的功能和精確度。當您將總分與獨立客戶端系統的效能進行比較時,6 個單獨的系統表現都非常好。我們在 Hallbench 中測量了 241,183 點,在 Food 中測量了 103,399 點,而獨立結果分別為 240,303 和 92,156。
Grando 伺服器(TR W5995WX、512GB、6 個 NVIDIA RTX 4090) | 大廳長凳 | 食品 |
骨料 | 241,183 | 103,399 |
VM1 | 40,797 | 17,370 |
VM2 | 38,599 | 17,415 |
VM3 | 40,363 | 16,898 |
VM4 | 40,651 | 17,129 |
VM5 | 40,138 | 17,111 |
VM6 | 40,635 | 17,476 |
Cinebench 2024
Cinebench 2024 基準測試可以評估每個 GPU 如何在虛擬化環境下處理複雜的渲染任務。此工作負載的重點實際上是 GPU,因為我們沒有為每個虛擬機器完全配置可用的主機 CPU 資源。在這裡,我們測得的 GPU 總分為 183,348 分,而客戶端系統的得分為 140,842 分。
Grando 伺服器(TR W5995WX、512GB、6 個 NVIDIA RTX 4090) | ||||
GPU | CPU(多核心) | CPU(單核心) | MP比率 | |
骨料 | 183,348點 | 2,333點 | 487點 | 4.78x |
VM1 | 31,178點 | 394點 | 82點 | 4.83x |
VM2 | 30,925點 | 392點 | 81點 | 4.81x |
VM3 | 29,406點 | 384點 | 81點 | 4.74x |
VM4 | 30,816點 | 391點 | 81點 | 4.81x |
VM5 | 30,440點 | 386點 | 81點 | 4.76x |
VM6 | 30,583點 | 386點 | 81點 | 4.75x |
GPU得分範圍為29,406分至31,178分,表現出高度的效能一致性。 CPU多核心得分緊密分佈在384到394分之間,對應的單核心得分為81到82分,展示了伺服器在所有虛擬機器上有效處理密集型任務的能力。
多核心與單核心效能比(MP 比)略有不同,從 4.74 倍到 4.83 倍,反映了有利於多執行緒渲染任務的處理能力的均衡分佈。至於分數本身,總的來說,這些結果展示了 Comino Grando 伺服器在虛擬化環境中的可靠性能,使其非常適合要求嚴格的 3D 渲染和運算任務,其中效率和速度至關重要。
攪拌機4.0
在 Blender 基準測試中,每個虛擬機器在三個不同的場景中表現出一致的效能:怪物、垃圾店和教室。 VM6 在 Monster 場景中以 5,949 分的最高分數脫穎而出,這表明效能略有差異可能是由於 VM 資源分配或工作負載處理方面的細微差異所致。 Junkshop 場景得分相對接近,VM5 得分最低,為 2,656。課堂場景結果更加多樣化,VM2 獲得了最高分 2,868,這表明在處理幾何豐富的場景方面存在差異。
當我們將這些結果與非虛擬化伺服器(無法擴展 Blender 中的工作負載)進行比較時,我們發現效能和使用率要高得多。客戶端系統在Monster 中的最高數量為5,881,在Junkshop 中為2,809,在Classroom 中為2,896,而在我們的Windows HyperV 部署中,我們測量到的總體數量為Monster 中的34,729、Junkshop 中的16,270 和Classroom 中的16,836。
Blender 4.0 – Grando 伺服器(TR W5995WX,512GB,6x NVIDIA RTX 4090) |
||||
Monster | 舊貨店 | 課堂 | ||
骨料 | 34,726 | 16,270 | 16,836 | |
VM1 | 5,773 | 2,764 | 2,791 | |
VM2 | 5,766 | 2,748 | 2,868 | |
VM3 | 5,741 | 2,716 | 2,750 | |
VM4 | 5,828 | 2,683 | 2,810 | |
VM5 | 5,669 | 2,656 | 2,837 | |
VM6 | 5,949 | 2,703 | 2,780 |
結論
Comino Grando 伺服器和工作站是正確使用 GPU 驅動的效能係統的典型範例,可滿足資料分析、人工智慧研究和圖形密集任務的高需求領域。伺服器型號配置了 4090 個 NVIDIA RTX 5995,是一款專為繁重運算工作而設計的強大處理器,並輔以 AMD Threadripper PRO 512WX CPU 和 5GB DDRXNUMX 記憶體。這種配置使其成為需要並行處理和高速資料操作的伺服器環境的絕佳選擇。
相較之下,雖然核心數量略少,但 Workstation 模型透過四個 NVIDIA A100 GPU 平衡了方程式,展示了其在詳細 3D 建模和深度學習任務中的強大能力。該系統設計略有不同,允許更安靜的操作。但公平地說,與任何風冷伺服器相比,它們在我們的實驗室中都非常安靜。
在效能方面,基準測試結果描繪了一幅清晰的圖景:Grando Server 在 OctaneBench 和 Blender 4.0 等 GPU 密集型測試中表現出色,突顯了其輕鬆完成高端渲染作業的能力。憑藉其定制的 CPU-GPU 平衡,工作站版本為各種專業應用程式提供了多功能性。 7-zip 壓縮和 Y-Cruncher 基準測試證明了這兩個系統在管理大型資料集方面的速度和效率,強調了它們處理資料密集型操作的能力,這是當今資料驅動領域的關鍵優勢。
當我們將 6x 4090 系統轉變為 VDI 盒時,系統的靈活性得到了進一步強調。我們也看到了一致的效能,這意味著組織可以有效地劃分這些系統中的任何一個,以支援具有專用 GPU 存取的多個遠端桌面。該用例完全由液體冷卻板實現,這是在單一機箱中獲得這種 GPU 密度的唯一方法。
總的來說,這些 Comino Grando 系統是我們所見過的最令人印象深刻的系統之一。是的,有很多液冷的企業伺服器替代品,但這不是這裡的目標。這些 Comino 系統在配置(客戶端和企業 GPU 選項)和機架密度/效率方面具有極高的靈活性。這些方面的整體執行力令人印象深刻,使 Comino Grando 系統成為我們的 2024 年最佳獲獎者之一。
參與 StorageReview
電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | 的TikTok | RSS訂閱