理財周刊
a month ago

#理財周刊

HBM屬於GPU鄰近的近端記憶體,透過TSV垂直堆疊技術,在每層設有數千條傳輸通道,單堆疊(如HBM3E)即可達1–1.2TB/s頻寬,下一代HBM4則可超過1.5TB/s。這讓GPU能以奈秒級延遲處理即時計算資料,但因封裝複雜、成本高昂且容量有限(最新GB200搭載192GB),無法容納大型語言模型全部參數。

GPU外部「擴展性儲存層」

鎧俠(Kioxia Holdings)與輝達(NVIDIA)正在以「AI SSD+HBM 共存」為中心思想,建立一種分層記憶體架構,使兩者在頻寬、延遲、容量與存取模式上形成功能互補,目標是透過二顆SSD組合達到二億IOPS,隨機讀取效能約一億IOPS,接近一百倍的速度提升現有SSD效能。

AI SSD採用High-Bandwidth Flash(HBF)或XL-Flash架構設計,其單模組可達64GB/s頻寬、容量5TB以上。雖慢於HBM,但其8-16倍容量優勢與持久性,使其成為GPU外部的「擴展性儲存層」。每個快閃記憶體模組具備獨立控制器並以PAM4鏈接串接,支援PCIe 7.0直接連線GPU,從而在微秒級延遲下實現高頻隨機存取。

最核心的創新在於SSD可直接連接GPU,而非透過CPU橋接,以消除資料交換瓶頸。此架構將使GPU能直接訪問SSD資料,極度適用於生成式AI與RAG類模型。

AI SSD支援HBM達記憶體虛擬化

HBM承擔「熱資料」使用,例如AI推論中模型權重、當前上下文與運算暫存,AI SSD則作為「冷資料層」,儲存大量embedding、KV-cache或歷史資料,下次運算時透過GPU直連快速載入。

這樣的結構讓GPU可在HBM區完成高頻矩陣運算,同時從AI SSD即時拉取大型語料或模型分片,減少CPU中轉與I/O瓶頸。輝達將此定位為HBM-expander role,即以AI SSD支援HBM達到記憶體虛擬化。

鎧俠與輝達的合作使 NAND-based 記憶體首次被納入 GPU 記憶體階層體系中,形成「HBM + AI SSD」的混合記憶體分層架構,這將讓AI伺服器以接近HBM級的體驗擴張數倍容量,同時降低總擁有成本(TCO),為未來兆參數級模型提供更高效的記憶體支撐。

NAND產業的AI轉折點

鎧俠將此AI SSD視為NAND產業的AI轉折點。隨著AI伺服器對高頻小區塊隨機讀取的需求暴增,傳統高階HBM記憶體成本過高,鎧俠的SSD有望扮演「高頻次資料緩存」角色,目標在以NAND-based SSD減少HBM依賴,形成「GPU直連快閃記憶體」的新型AI記憶體階層。

預定2027年正式商用,2026年下半年開始提供樣品。鎧俠估計到2029年,約34%全球NAND需求將來自AI應用,總市場規模可增加約290億美元,甚至可能在2026年底到2027年初觸發新一波NAND供應吃緊。

市場推估鎧俠的控制器ASIC由具備高速介面整合與AI伺服器經驗的設計服務商承接,AI SSD控制器不只是典型SSD邏輯,需要同時支援PCIe 7.0/CXL 3.1高速互連,AI加速與預取引擎(支援GPU cache hierarchy),低延遲Link Training 與多控制core架構。

目前在全球具備開發AI SSD等級ASIC控制器能力的潛在競爭廠商為Marvell、慧榮科技、世芯-KY、創意、博通、三星、Western Digital等,其中創意被外資點名能拿下此專案,主要看好具備高頻封裝、NVLink Fusion架構整合、HBM控制器IP、2.5D/3D先進封裝能力,以及晶片級生態協作的全面優勢。

輝達NVLink Fusion 關鍵生態夥伴

創意於2024年即完成HBM3E控制器與PHY IP,支援台積電CoWoS-S/R封裝,可達9.2Gbps/pin的實體傳輸速率。該技術體系涵蓋從IP設計、interposer繞線到高速信號完整性驗證完整鏈條,使創意能處理高頻HBM與快閃記憶體I/O混合系統的複雜封裝設計。由於AI SSD需與GPU在單封裝內或同主板直連,而記憶體與儲存橋接設計正是創意的強項。

2025年10月,創意正式宣布成為輝達NVLink Fusion關鍵生態夥伴,可直接參與輝達面向CSP與HPC客戶的半客製ASIC開發框架。NVLink Fusion使合作夥伴可在輝達認證生態中製造半客製控制器或協同晶片,直接接入GPU模組,這正是AI SSD需採用的GPU直連設計。因此,創意能第一時間存取NVLink、UCIe、C2C協定IP,並能為SSD控制器實作peer-to-peer架構,這是優勢之一。

「控制器+封裝共設計」 整合型優勢

創意作為台積電的子公司,能直接整合CoWoS、InFO、LIPINCON等高頻封裝技術。鎧俠AI SSD若採CSP(晶片尺寸封裝)或chiplet架構,需要與GPU模組維持較佳訊號延遲與熱管理平衡,而創意可在台積電內部流程中完成「控制器+封裝共設計」,此能力大幅縮短時程並降低驗證風險,是鎧俠、輝達最看重的整合型優勢。

創意自家高速I/O IP與UCLink平台能同時整合PCIe、UCIe、SerDes與HBM PHY,具備為AI SSD定制複雜互連的條件。這樣多協定SoC整合能力與TSMC封裝協同,就連Marvell與博通也難滿足。

鎧俠AI SSD的目標市場是輝達GPU伺服器與美系四大CSP資料中心。創意在美系雲端AI加速器ASIC專案已具成功Tape out實績,能提前串接輝達的OCP資料中心規格(Rubin、MGX架構)。這讓創意在專案管理、時程同步與標準驗證上遠勝傳統SSD控制器廠。

總結來看,創意能中選的關鍵在於與輝達建立正式NVLink Fusion合作關係,擁有HBM3E/4級高速介面IP與實測成功經驗,台積電封裝整合優勢支撐chiplet SSD架構,具備多協定SoC整合與CSP專案量產實績。這使得創意成為唯一同時能在邏輯控制器、封裝、互連協定與製程接口層四軸同時滿足鎧俠與輝達需求的合作夥伴。

將成AI ASIC產品線第三成長支柱

一顆AI儲存控制ASIC設計專案的總合約價值約1.5-2億美元,ASIC設計公司可認列約20-25%的毛利率,專案開發期約兩年、量產後三到四年維持穩定貢獻。

如果創意承接鎧俠專案中「主控制器與封裝整合」兩項,推估整體專案金額約1.8億美元,貢獻期約五年。保守預估創意淨利率12%,此專案完整期約可貢獻累積EPS約2.5-3元,自2026年起將逐步成為創意AI ASIC產品線的第三成長支柱(繼GPU 與CSP 晶片之後)。

更多精彩內容 就在 [理財周刊1314期] 點紅字看更多