“HBM之父”:“內(nèi)存中心計算”時代來臨,GPU或成配角
關(guān)鍵詞: 內(nèi)存中心計算 AI架構(gòu) 內(nèi)存瓶頸 HBM HBF
在人工智能(AI)領(lǐng)域,一場深刻的架構(gòu)革命正在醞釀。長期以來,以英偉達(NVIDIA)圖形處理器(GPU)為核心的計算體系被視為AI發(fā)展的引擎。
近日,被譽為“HBM(高帶寬內(nèi)存)之父”的韓國科學(xué)技術(shù)院(KAIST)教授金正浩預(yù)言,這一格局即將發(fā)生根本性轉(zhuǎn)變,未來十年,半導(dǎo)體產(chǎn)業(yè)的核心將從計算單元徹底轉(zhuǎn)向內(nèi)存,一個“內(nèi)存中心計算”(Memory-Centric Computing, MCC)的新時代正在到來。
金正浩指出,當(dāng)前我們正處于GPU主導(dǎo)一切的時代,但這一局面正面臨根本性挑戰(zhàn)。隨著AI技術(shù)從執(zhí)行單一指令的“生成式AI”向能夠自主判斷、規(guī)劃并生成完整報告的“AI智能體”演進,數(shù)據(jù)處理的需求模式發(fā)生了質(zhì)變。
“AI已經(jīng)從只執(zhí)行指令,發(fā)展到能夠自主判斷并生成完整報告。伴隨而來的,是一次性處理海量文檔和視頻的‘上下文工程’?!苯鹫平忉尩?。這種演進要求系統(tǒng)具備前所未有的數(shù)據(jù)處理能力,內(nèi)存的帶寬和容量需要提升到現(xiàn)有水平的千倍,才能滿足AI智能體對海量信息的實時存取和分析需求。
更關(guān)鍵的是,金正浩認(rèn)為當(dāng)前AI模型備受詬病的“幻覺問題”,其根源也在于內(nèi)存限制。當(dāng)內(nèi)存不足以支撐模型調(diào)用足夠多的相關(guān)信息時,系統(tǒng)只能基于有限的已有信息進行拼湊,從而產(chǎn)生錯誤答案。因此,要實現(xiàn)真正可靠、具備強大記憶能力的智能體,突破內(nèi)存瓶頸是關(guān)鍵。
為應(yīng)對這一挑戰(zhàn),金正浩提出了一個由HBM和HBF(高帶寬閃存)共同構(gòu)成的層級化內(nèi)存架構(gòu)。在他看來,當(dāng)前主導(dǎo)AI加速器市場的HBM,通過堆疊DRAM(動態(tài)隨機存取存儲器)實現(xiàn)高速數(shù)據(jù)傳輸,扮演著“短期記憶”的角色。“HBM就像手邊的參考書,用于快速響應(yīng)?!?/span>
然而,僅有“短期記憶”遠遠不夠。金正浩將HBF比作一個龐大的“圖書館”,它由NAND閃存堆疊而成,代表著“長期記憶”。只有引入類似HBF的層級結(jié)構(gòu),AI才能在全球數(shù)據(jù)中進行檢索,并給出完整、準(zhǔn)確的答案。HBF的出現(xiàn),將有效彌補HBM在容量上的不足,為AI智能體提供近乎無限的“知識庫”。
這一技術(shù)路線的演進,預(yù)示著半導(dǎo)體產(chǎn)業(yè)權(quán)力結(jié)構(gòu)的深刻變革。過去,GPU和CPU是計算架構(gòu)的絕對核心,而內(nèi)存則是為其服務(wù)的配套組件。但在“內(nèi)存中心計算”時代,HBM和HBF將成為核心,GPU和CPU反而可能成為其中的組成部分,扮演“配角”。
圍繞這一未來方向,全球存儲巨頭已經(jīng)展開激烈競爭。SK海力士已與閃迪(SanDisk)聯(lián)手推動HBF的標(biāo)準(zhǔn)化,試圖搶占生態(tài)主導(dǎo)權(quán)。三星電子則在推進下一代HBM4E的同時,也加大了對NAND架構(gòu)的投入。金正浩認(rèn)為,這場競爭與HBM早期發(fā)展階段高度相似,提前投入并掌握核心技術(shù)的企業(yè)將贏得未來。他特別強調(diào),未來十年的勝負(fù)將由HBM和HBF共同決定,而真正決定最終格局的,將是HBF。
金正浩預(yù)計,HBF的工程樣品將在2027年前后出現(xiàn),最早到2028年,谷歌、英偉達或AMD中的一家將率先導(dǎo)入這一技術(shù)。屆時,計算架構(gòu)的根本性轉(zhuǎn)移將拉開序幕。誰能率先構(gòu)建起以HBM和HBF為核心的“內(nèi)存中心計算”體系,誰就將主導(dǎo)AI時代的下一階段。而馬斯克計劃建設(shè)涵蓋封裝、內(nèi)存和晶圓制造的大型工廠,也被金正浩視為對這一趨勢的精準(zhǔn)判斷。