Token爆發 AI算力全鏈漲價 開啟“能效競爭”時代
算力,正成為AI時代最稀缺的“硬通貨”,目前全鏈價格不斷攀升。 海外英偉達H100一年期租賃價格漲幅近40%;國內云廠商集體調價——騰訊云Tencent HY 2.0 Instruct模型輸入價上漲463%后再次整體提價5%,阿里云平頭哥真武810E等算力卡產品上調5%~34%,百度智能云相關服務上調5%~30%,科大訊飛智算平臺AI推理服務漲價8%,商湯科技SenseCore大模型訓練費用平均上浮12%,智譜2月以來3次提價……近期算力產品全鏈漲價,持續兩年多的AI“價格戰”驟然逆轉。 這是短期供需錯配的周期性波動,還是AI驅動下的趨勢性上漲?產業未來的競爭焦點將落在哪里?近日,記者采訪了工信部信息通信經濟專家委員會委員盤和林與中國信通院云計算與數字化研究所總工程師郭亮,深度探尋算力漲價潮背后的產業變革趨勢。 Token激增是算力漲價潮的“核心引擎” “漲價的根源是人工智能的需求驅動。”盤和林認為,其中既包括AI訓練所帶來的算力消耗,也包括AI應用爆發所激發的推理算力需求。 郭亮分析,漲價包含四方面因素:一是硬件成本“逆向”暴漲。高帶寬內存(HBM)存儲與高端芯片處于絕對賣方市場,2026年第一季度存儲價格翻倍,硬件采購及運維成本高企。二是需求結構從訓練轉向推理。隨著AI智能體爆發,推理端的Token調用量激增。推理屬于持續性運營支出,海量并發帶來的電力和帶寬成本已超出云廠商的補貼上限。三是商業模式從“圈地”轉向“盈利”。早期算力價格戰已完成初步生態綁定,在財務壓力下,廠商必須通過提價來覆蓋昂貴的算力折舊。四是算力資源的戰略性稀缺。全球高端算力租賃容量告急,電力配額緊張,供需極度失衡,導致價格失去下行空間。 此前兩年多時間里,云廠商以“燒錢換市場”的邏輯持續降價,Token成本被壓縮至每百萬Token不到一元。但當前,復雜推理讓單日調用費用高達數百元,價格不斷上漲,此前大模型的免費公測也同步結束。 “行業集體提價是從‘燒錢擴規模’轉向‘商業可持續’的必然結果。”郭亮表示,這宣告廉價算力時代終結,將進入以利潤為導向的“價值重估”階段。 談及價格競爭,盤和林認為,此前云計算廠商尚未發掘出具有大規模用戶黏性的AI應用場景,多數廠商采購的算力服務器主要應用于AI模型訓練環節,而非直接面向企業或個人用戶提供算力服務支持。今年以來,以“龍蝦熱”“歡樂馬”為代表的AI開源作品涌現,憑借其創新性與易用性極大激發了普通用戶對云計算產品的使用熱情,不僅顯著推動了Token銷售量的爆發式增長,更進一步帶動了算力資源及存儲服務的整體需求提升。 存儲與芯片是算力價格上漲的“成本推手” 當前,算力產業鏈的漲價態勢從上游硬件蔓延至下游服務,包括國內外主流云廠商在內的數十家企業,相繼上調了AI算力及相關服務的價格。那么,在算力產業鏈中,哪些環節是漲價的根源? 郭亮認為:“從算力產業鏈的結構來看,存儲供應、先進封裝、芯片制造和晶圓生產都對算力漲價產生了影響。” 具體而言,在存儲供應方面,尤其是HBM和高容量閃存方面,隨著模型參數規模持續擴大、多模態交互日益普及,推理任務對內存帶寬的要求已超越了對算力本身的追求,比如三星、SK海力士等廠商的HBM產能在2026年之前便已被長期訂單鎖定。在CoWoS等先進封裝技術方面,盡管晶圓制造產能正在擴張,但將計算芯片與HBM堆疊集成的先進封裝工藝擴產周期較長、技術門檻較高。即便晶圓供應充足,若無法完成封裝出貨,市場上的算力資源仍將處于缺貨狀態。在晶圓生產環節,相比存儲與封裝,先進制程的晶圓產能雖同樣緊俏,但在全球主要代工廠大規模擴建的背景下,其產能釋放節奏相對可預期,已不再是當前價格波動的主要推手。 “漲價主要集中在兩個環節。”盤和林分析說,“一是算力服務器本身的價格上漲,例如英偉達等廠商的AI算力服務器;二是云計算廠商提供的算力及存儲租賃服務價格上調。” 其中,算力服務器漲價主要源于兩個因素:一方面,芯片制造能力受限,核心瓶頸在于光刻機產能無法滿足AI產業快速發展的需求。另一方面,存儲芯片不足,內存芯片自身存在固有產能周期,而AI需求的爆發式增長進一步加劇了供不應求的局面。存儲芯片產能的擴張通常需要3年左右,即便考慮到廠商已提前布局,至少也需要1~2年才能有效緩解供給壓力。 算力漲價是一場加速產業出清的壓力測試 “此輪漲價是一場‘壓力測試’。”郭亮形象地概括,它將加速產業出清,告別粗放的發展時代,邁向高門檻、高效率的Token生產和使用“深水區”。 此輪算力漲價正在深刻重塑整個AI產業鏈的競爭格局,對頭部廠商、中小企業產生不同影響。 對于頭部廠商,郭亮認為,漲價將有助于利潤與生態修復。一方面,提價緩解了云廠商巨額的算力折舊壓力,使其從“虧損獲客”轉向“質量增長”;另一方面,頭部廠商憑借自研芯片帶來的成本優勢,可能進一步壓縮二線云服務商的生存空間,強化自身在算力生態中的控制地位。 對于中小企業,盤和林分析說:“算力漲價將顯著增加中小企業和個人用戶使用AI的成本。”當前,多數中小企業主要依賴在云端購買算力與存儲資源完成模型訓練,為AI應用提供算力支持。如果AI能夠產出更多價值、創造更多利潤,中小企業很可能選擇忽視短期成本上升,選擇“AI+”戰略來提升經營效率與市場競爭力。 郭亮總結道:“算力產業高質量發展將加速‘脫虛向實’。”算力成本高企將使得“PPT創業”逐漸失去土壤。行業的投資重心將從純模型研發轉向能夠產生實際流水、算力投入產出比更高的商業化場景。 “算力銀行”與“算力超市”將為中小企業量身減負 面對算力供需緊張態勢,政策端已加速破局。今年4月,工業和信息化部發布《關于開展普惠算力賦能中小企業發展專項行動的通知》,推出“算力銀行”與“算力超市”兩大創新模式,直擊中小企業算力成本痛點。 郭亮表示:“專項行動是針對2026年AI算力成本激增的問題,為中小企業量身定制的‘減負’方案,關鍵在于有效落實兩項創新業務。” “算力銀行”類似金融銀行模式,將散落的閑置算力資源化、標準化、金融化,通過“零存整取”和跨域調度實現普惠供給。 具體分四步:首先,資源歸集(存款),將不同品牌、規格的算力標準化為“標準算力單元”,像吸收存款一樣,將科研機構、云廠商、企業的富余算力接入中國算力平臺。其次,資源池化(金庫),利用平臺將分散的服務器整合為虛擬資源池,跨地域調度,平衡波峰波谷,解決“有的地方卡死,有的地方閑死”的問題。再次,按需配給(貸款),企業像申請貸款一樣按需下單。中小企業通過“算力券”或按量付費等靈活套餐,低成本獲取高性能算力。最后,價值清算(結算),建立計量與返利機制,提供方獲得收益或未來優先使用權,使用方按實支付,政府通過平臺數據實現精準補貼。 “一家自動駕駛初創公司需要大量算力處理路測數據,而某大學實驗室的算力夜間閑置。通過算力銀行,實驗室存入算力獲得未來積分;初創公司用政府發放的‘算力券’低價提取算力,避開公有云高峰高價。”郭亮舉例說明。 “算力超市”的核心是算力資源的“商品化”與“便捷化”,讓企業像網購一樣獲取AI算力。 其中包括四個關鍵環節:一是資源標準化上架,將底層硬件性能轉化為標準化商品,按Token數、單精度浮點運算能力、核時計費的算力規格計算,消除技術門檻。二是智能搜索與比價,基于中國算力平臺中小企業專區,實現動態比價和算力選型,自動推薦成本低、延遲低的算力包,解決信息不對稱等問題。三是開箱即用服務,預裝模型環境和開發工具,用戶可一鍵部署主流大模型鏡像和數據集,實現“下單即運行”,縮短開發周期。四是普惠政策與支付結算,對接政府補貼,支持“算力券”直接結算,提供預付、后付、包年包月等模式,平臺承擔QoS監控確保真實性能。 “如果說算力銀行負責的是底層的‘資源流動’,解決的是‘資源流動’問題;那么算力超市負責的就是前端的‘用戶體驗’,解決的是‘交易門檻’問題,讓算力變得看得見、買得起、好上手。”郭亮認為,這兩個創新業務,將算力從高門檻的“資本密集型資產”轉變為像水、電一樣的“即用即付型信息基礎設施”,是中小企業在2026年算力競爭中突圍的關鍵。 針對中小企業的困境,盤和林建議要做好兩手準備:一是企業主動與云計算廠商合作,推動傳統算力服務向“算力超市”“算力銀行”創新模式升級,依托其市場經驗與資源優勢,降低算力基礎設施建設成本;二是政府引導國企跨領域融合金融、通信、算力資源,構建業務生態體系。他特別強調,企業是產業發展的核心主體,必須通過市場化機制充分激發其積極性;政府則需配套“算力券”補貼、利率貼息等精準政策工具,加速創新模式落地生效,最終實現中小企業從“被動承壓”到“主動受益”的實質性轉變。 未來算力產品價格或將保持較高水平 面向未來,此輪漲價是周期性波動還是趨勢性上漲? 盤和林認為,答案取決于AI應用能否真正創造價值。算力漲價的長期性本質取決于AI應用的價值轉化能力。若AI僅停留在“玩具”層面,缺乏實際生產力支撐,此輪漲價將如曇花一現般短暫;若AI成為驅動產業變革的生產力工具,其漲價則將演變為具有持續性的趨勢性特征。 基于當前產業態勢,盤和林判斷:“趨勢性價格上漲的概率更大。”AI仍處于技術爆發周期,算力產業將長期維持“需求激增—供給滯后”的緊平衡狀態,短期內算力供給難以匹配需求增速。然而,未來尚存不確定性——AI究竟是泡沫還是生產力工具,仍需市場持續驗證。 郭亮提出:“此輪漲價是‘短期供需錯配’與‘長期成本剛性’共同作用的結果。”他預計,算力價格的高位震蕩將持續至2027年初。隨著全球先進制程產能逐步釋放、CoWoS封裝瓶頸得到突破以及HBM4內存的大規模交付,當前由極度缺貨所導致的溢價將逐步回落。盡管短期內的極端漲幅會趨于平抑,但由于能源成本、地緣政治溢價以及芯片制造工藝正逼近物理極限,算力的價格中樞仍將保持在較高水平,其中高性能算力將獲得更多溢價。 郭亮進一步表示,未來產業發展將有三大趨勢。首先,算力將從通用走向異構,昂貴的處理器(GPU)不再是唯一解。針對特定算法優化的ASIC專用芯片將大規模普及,企業也將不再盲目追求萬億參數級別的模型,而是通過模型蒸餾等技術,在更廉價的算力上實現高效運行。其次,需求重心將從訓練轉向推理,推理所消耗的Token量將逐步超越訓練階段。大規模推理任務對實時性和并發性的要求,使得算力供給必須更加靈活。為降低單次調用的成本,產業將加速向低功耗推理芯片及端云協同模式轉型。最后,算力將真正成為“新電力”,實現基礎設施化。 “未來競爭的勝負手,將聚焦‘能源調度+算力能效+算法優化’的綜合成本控制能力。”郭亮判斷,從這個意義上說,漲價正是算力行業的“成年禮”——它將倒逼整個產業從粗放的擴張模式轉向極致的能效競爭。(記者 李瑞璐)
【責任編輯:朱家齊】