SK海力士自建AI工廠,部署2000顆英偉達Blackwell GPU
4月24日消息,據多位業內人士透露,SK海力士近期已完成了一項重大的人工智能服務器采購招標,計劃在其清州工廠園區內部署一套獨立的AI基礎設施。這標志著該公司首次在生產現場直接引入大規模AI算力,不再單純依賴外部云服務,旨在通過“數字孿生”和“內部AI代理”技術,徹底重塑晶圓廠的運營模式。
據悉,此次部署將包括250臺高性能服務器,合計搭載2000塊英偉達Blackwell系列圖形處理器(GPU)。這批服務器預計將于今年6月開始交付并安裝,總投資額達數千萬美元。

此前,SK海力士的數字孿生操作主要依賴SK電訊(SK Telecom)的云基礎設施。然而,考慮到晶圓廠運營數據的極度敏感性以及實時性要求,SK海力士決定自建基礎設施。業內人士分析指出,與公共云服務相比,本地化部署能確保敏感的企業數據在內部循環,不會泄露到組織之外,這對于掌握核心制程工藝的半導體巨頭而言至關重要。
清州工廠之所以被選為這一AI基礎設施的“首秀”之地,主要得益于其充足的電力供應和空間優勢。相比之下,SK海力士位于利川的工廠在電力和空間上已難以支撐此類高能耗基礎設施的擴容。
目前,清州園區正經歷從以NAND閃存為主的生產基地,向涵蓋DRAM、高帶寬存儲器(HBM)及先進封裝技術的AI存儲器核心樞紐轉型。隨著M15X晶圓廠的全面投產以及投資約19萬億韓元的P&T7先進封裝工廠的開工,清州已成為SK海力士AI戰略的橋頭堡。
此次引入的2000塊Blackwell GPU,將首先服務于工廠的“數字孿生”系統。半導體制造是一個極其復雜的過程,一座現代化的晶圓廠內部署了數十萬個傳感器,持續測量設備溫度、振動、氣體流量等海量參數。
通過這套AI基礎設施,這些數據流將與虛擬環境中的“虛擬副本”實時同步,使其能夠像物理工廠一樣運行。在這種環境下,工程師可以預先模擬設備布局、工藝條件和物流流程。由于半導體生產線一旦停工將導致巨額損失,實際環境中的實驗往往受到嚴格限制。
而數字孿生技術允許在不影響生產的情況下,進行不同條件下的重復模擬。這意味著,實際生產線將僅應用經過虛擬驗證的優化條件,從而大幅提高良率和設備稼動率,減少意外停機帶來的損失。
除了數字孿生,該基礎設施還將支持“內部AI代理”的運行。與面向公眾的通用聊天機器人不同,這些AI代理是基于SK海力士專有的企業數據進行訓練的。它們能夠理解公司特有的術語、工藝手冊和內部文檔,從而勝任從工程分析、報告生成到員工培訓等各種復雜任務。
這一應用有望進一步實現晶圓廠運營的自動化。從長遠來看,AI代理不僅能取代相當一部分重復性的行政工作,還可能重塑操作人員和工藝監控人員的組織結構,讓人類員工從繁瑣的數據監控中解放出來,專注于更高階的決策與創新。
此次招標并未像過去三星電子等廠商那樣將內存組件單獨列出,而是要求提供包含內存在內的完整集成服務器系統,最終合同授予了出價最低的投標人。
業內分析師認為,這一策略轉變反映了當前存儲市場的供需變化。過去,內存制造商通常會自行供應DRAM和固態硬盤以降低成本。然而,由于DRAM和NAND閃存的價格在過去一年中幾乎翻了一番,內部采購的成本優勢已經大幅減弱,直接采購成品服務器反而成為了更具經濟效益的選擇。