導讀:報道稱英偉達攜手 Meta、三星電子、SK 海力士等科技巨頭,為提升 AI 性能,正探索將 GPU 核心集成至下一代 HBM(高帶寬存儲器)的技術方案。
11 月 26 日消息,韓媒 ETNews 11 月 26 日發布博文,報道稱英偉達攜手 Meta、三星電子、SK 海力士等科技巨頭,為提升 AI 性能,正探索將 GPU 核心集成至下一代 HBM(高帶寬存儲器)的技術方案。
據多位業內人士透露,Meta 和英偉達正在積極探討此方案,并已開始與三星電子、SK 海力士進行合作洽談。
援引博文介紹,該技術旨在打破傳統計算架構中內存與處理器分離的模式,通過在 HBM 的基底裸片(Base Die)中植入 GPU 核心,實現計算與存儲的深度融合。
HBM 作為一種通過垂直堆疊多個 DRAM 芯片實現的高性能存儲器,專為處理人工智能(AI)所需的海量數據而設計,其最底層的基底裸片目前主要負責內存與外部設備間的通信。
即將于明年量產的 HBM4 已計劃在基底裸片上集成控制器,以提升性能和效率。而此次討論的“GPU 核心內嵌”方案,則是在此基礎上更進一步的重大技術跨越,它將原本集中于主 GPU 的運算功能部分轉移至 HBM 內部。
將 GPU 核心植入 HBM 的主要目的在于優化 AI 運算的效率,通過將運算單元與存儲單元的物理距離縮至最短,可以顯著減少數據傳輸延遲和隨之產生的功耗,從而減輕主 GPU 的負擔。
這種“存內計算”的思路,被視為突破當前 AI 性能瓶頸的關鍵路徑之一,有助于構建更高效、更節能的 AI 硬件系統。
要實現這一設想仍面臨諸多技術挑戰。首先,HBM 基底裸片受限于硅通孔(TSV)工藝,可用于容納 GPU 核心的物理空間非常有限。
其次,GPU 運算核心是高功耗單元,會產生大量熱量,因此如何有效解決供電和散熱問題,防止過熱成為性能瓶頸,是該技術能否落地的關鍵。