歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

馬斯克最大算力中心建成了:全球首個GW級超算集群,再創世界紀錄

2026-01-19 來源:鳳凰網
672

關鍵詞: 馬斯克 xAI

1月18號,全球首個GW級超算集群Colossus 2,正式投入運行。

馬斯克興奮喊話:

這是全球首個達到1GW的超算集群,4月還將進一步升級至1.5GW。

網友直呼瘋狂:「1.5GW,光是插座估計都得給墻壁裝滿了。」

有了這劑算力強心針,Grok的忠實擁躉已經提前開香檳,開始暢想Grok5的統治時代。

但在全網狂歡的背后,更多的人是苦不堪言——

2026年夏天,美國13個州的6700萬居民,可能要因數據中心的存在被停電,沒空調吹了。

全球首個GW級訓練集群

老馬的執行力太恐怖了。

不靠亞馬遜,不靠微軟,也沒有「星際之門」計劃,一己之力于孟菲斯平地建起一座1GW的超級超算集群。

前一代超算集群Colossus 1從無到有僅用了122天。

它配備約20萬顆英偉達H100/H200和約3萬顆英偉達GB200 NVL72。

而在此基礎上翻了好幾倍,功率達到1GW的Colossus 2,只花了僅僅不到一年。

1GW是什么概念?

一般來說,1GW可以為75萬戶家庭供電,輕松供電一整個舊金山。

一座核電站的功率差不多也就是1GW。

如果按馬斯克所說,今年4月份,Colossus 2將升級至1.5GW,最終總裝機容量達到2GW,這個數字將與美國大多數主要城市的用電量相當。

按照規劃,徹底完工后的Colossus 2將內置55張GPU,遠超Meta的15萬、微軟10萬,以及谷歌的分布式基礎設施。

而這龐大的資源,全部為Grok獨自享用。

此前,曾有爆料稱Grok 5的參數將達到驚人的6萬億左右,是Grok 4的兩倍以上。

原因便是基于Colossus 2:

當時有觀點認為Grok 5將在擁有數十萬張英偉達GPU的Colossus 2上訓練,耗電量約為1GW。

如今,Colossus 2已正式上線,1GW的條件也正正好好滿足。

而隨著前段時間xAI E輪融資200億美元的進賬,Grok 5的Scaling籌碼還在進一步增加。這意味著更大的模型參數,更快的訓練速度、迭代速度,部署速度。

當OpenAI還在為2027年的算力基礎設施發愁時,xAI已經把一座「城市級」AI 工廠開機運行,將Grok 5提前扶上了市場心目中的下一個SOTA。

正如網友所說,AI時代,速度就是最強的護城河。

居民受不了啦!

不過,并非所有人都因這種「速度」受益。

據《華爾街日報》消息,美國非營利電網運營商PJM,未來可能在極端高溫或嚴寒天氣期間,輪流對區域內的居民斷電。

這意味著,美國13個州的6700萬人,在今年不得不迎來一個相當難熬的夏天。

要說清楚這個問題,得先明白PJM是干嘛的。

PJM,簡單來說就是美國能源系統的交通指揮中心,它根據實時用電需求,協調發電廠何時增發、何時降載,以維持供需平衡。

然而,大模型大力出奇跡的競賽正在破壞這種平衡。

在數據中心建設熱潮推動下,PJM預計未來10年電力需求將以年均4.8%的速度增長。

對一個多年需求變化不大的系統來說,這樣的增速相當罕見。

一邊需求激增,另一邊,供給的增速卻相當緩慢。新建電廠的速度甚至都跟不上老電廠的退役速度,電網容量面臨飽和。

供需一旦出現偏差,電網頻率就會波動,進而可能損壞發電廠等關鍵基礎設施。

為避免這些風險,PJM只能兩害相權取其輕,通過在用電高峰期輪流停電來卸壓。

PJM也不是沒想過其他辦法。

去年9月,PJM發布了一系列提議,希望數據中心在高峰時段主動降低用電量,或改從其他渠道獲取電力支持。

然而,亞馬遜、谷歌、微軟等幾乎都表示了反對,認為這是對數據中心的歧視。

值得一提的是,PJM主要負責美國東海岸地區,而xAI的Colossus位于中南部,并不在PJM電網覆蓋范圍內。

同時,為減少對當地電網的沖擊,xAI還部署了168個特斯拉Megapack電池儲能系統,在用電高峰期提供電力緩沖,盡量避免周邊居民遭遇停電。