存儲評論網

播客第143期:KIOXIA 245TB SSD來了!

企業  ◇  SSD

KIOXIA 的 Maulik Sompura 與 Brian 就 Flash 的方方面面以及其他行業動態展開了深入而富有啟發性的討論。鑑於人工智慧和現代工作負載的快速發展,此主題可謂切合時宜且意義重大。

Maulik Sompura 是 KIOXIA 的產品規劃與管理高級總監,在 NAND 快閃記憶體、記憶體和固態硬碟領域擁有超過 13 年的經驗,其中最近六年就職於 KIOXIA。此外,他也曾在英特爾和東芝工作。

KIOXIA LC9系列

討論的內容不僅限於儲存和內存,還延伸到液冷、超大規模資料中心和產品外形尺寸。他們還討論了開源軟體、新型晶圓廠、擴展性問題以及對再次出現「新冠疫情式繁榮與蕭條」的擔憂。

這是一場引人深思的對話,它會促使你進行一些長遠的思考。我們把播客分成了幾個五分鐘的片段,你可以直接跳到與你和你的環境最相關的部分。不過,完整地觀看一遍也絕對值得。

Brian 和 Maulik 首先討論了 SSD 和快閃儲存的徹底發展,尤其是在人工智慧和超大規模資料中心的壓力下。

0:00–5:00:超大規模資料中心悄悄主導市場

  • SSD 產品組合的複雜性呈現爆炸性成長:外形尺寸、耐用度等級和性能等級多種多樣。
  • 人工智慧的蓬勃發展使得儲存技術的重要性僅次於 GPU/HBM,成為首要任務。
  • 超大規模資料中心營運商(Meta、Google、Amazon 等)會規定詳細的硬碟需求,而這些客製化設計最終決定了企業能夠獲得什麼。
  • OCP 規範透過為每個人在 NVMe 之上提供一個共同的目標,幫助統一和簡化混亂局面。
  • 儘管傳統外形尺寸仍然存在,但業界正在積極嘗試減少 SKU 數量,並向 E3 等現代外形尺寸靠攏。

5:00–10:00:E3、E2 和 PB 級硬碟

  • 由於其更佳的功率和散熱特性,E3 正在成為第六代及以上機型的首選企業級外形尺寸。
  • 由於產品生命週期長,2.5 吋硬碟還會繼續存在多年,但新的設計正在轉向 EDSFF(擴展硬碟)。
  • E2 是一款更大、容量優先的 SSD 外形尺寸,可在大容量情況下真正取代硬碟。
  • 借助先進的 NAND 堆疊技術,單一 E2 驅動器最終可以達到 1 PB 的容量。
  • 超大規模資料中心利用分片、糾刪碼和預測分析來降低巨型硬碟的風險;巨型 SSD 的重建時間仍然比大型 HDD 好得多。

10:00–15:00:固態硬碟也開始採用液冷散熱。

  • 人工智慧訓練系統正在推動液冷技術的廣泛應用,現在這種趨勢也延伸到了儲存領域。
  • E3 外形尺寸的 SSD 正在重新設計,以便與冷板直接接觸(表面平整度、材料和連接器細節)。
  • 液冷式第五代固態硬碟將為第六代固態硬碟鋪路,而第六代固態硬碟的耗電量和發熱將會更高。
  • 企業對在資料中心引入水冷卻持謹慎態度,但不斷上漲的電力成本和 GPU 密度將使避免使用液冷變得更加困難。

15:00–20:00:人工智慧儲存:容量、效能和架構壓力

  • 人工智慧推動儲存技術朝兩個方向發展:海量容量和極高性能。
  • KIOXIA 的 245 TB 等級硬碟(採用 32 層 QLC 快閃記憶體)面向資料湖和大型儲存庫,而不僅僅是通用工作負載。
  • 在現代機殼中,儲存速度可以達到 250–280 GB/s;瓶頸越來越在於網路架構,而不是驅動器。
  • 超大規模資料中心正在競相推出 400/800 GbE 和更智慧的網路卡/DPU,而中階市場客戶卻難以跟上這種規模的網路架構投資。
  • 傳統資料庫和光纖通道仍然存在,但向量資料庫和以人工智慧為中心的資料儲存也正在加入其中。

20:00–25:00:更聰明的軟體和真正的快閃記憶體超級循環

  • 鎧俠不只是在出貨硬碟,還在投資軟體(例如 ISAAC),以減少對 HBM/DRAM 的需求,同時保持 AI 效能。
  • 此策略是整體性的:在系統層面提高成本效益,而不僅僅是透過更快的 NAND 快閃記憶體。
  • 像北上晶圓廠 (K2) 這樣的新晶圓廠正在加速生產,但在經歷了新冠疫情時代的繁榮與蕭條週期(給該行業造成了約 30 億美元的損失)後,供應商們仍然保持謹慎。
  • NAND快閃記憶體的擴展(更多層、更精細的光刻技術)成本越來越高,發展速度也越來越快,因此供應量將會成長,但成長方式是可控的。
  • 許多人認為這是一個由人工智慧和數據成長驅動的多年“超級週期”,而不僅僅是正常的 1-2 年的快速成長。

25:00–結束:人工智慧無所不在、快閃記憶體與硬碟的比較,以及從高效能運算中學習

  • 資料不斷增長,很少被刪除;人工智慧正在向資料所在的任何地方遷移,包括邊緣、備份和二級儲存層。
  • 高容量 SSD 每個機架可提供約 100 PB 的容量,而相同容量則需要多個機架的 HDD,而且 SSD 的性能和效率要好得多。
  • HDD 的性能不會隨著容量的增加而提升;SSD 的 IOPS/GB 和吞吐量要高出幾個數量級,從而改善了總體擁有成本,並且在大規模應用中更傾向於使用閃存。
  • 像 OCP 和超級計算 (SC) 這樣的展會,讓我們得以先睹為快未來:寬大的機架、800V 母線、奇特的冷卻和電源設計。
  • 超大規模資料中心和高效能運算領域的創新正在穩步塑造「普通」企業伺服器和資料中心的未來面貌,使其更具彈性和效率。

參與 StorageReview

電子報 | YouTube | 播客 iTunes/Spotify | Instagram | Twitter | TikTok | RSS訂閱

哈羅德弗里茨

自 IBM 創建 Selectric 以來,我一直在科技行業工作。 不過,我的背景是寫作。 因此,我決定退出售前業務,回歸本源,從事一些寫作工作,但仍從事技術工作。