歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

寒武紀完成DeepSeek-V4“Day 0”適配

2026-04-24 來源:愛集微
123

關鍵詞: 寒武紀 DeepSeek-V4 模型適配 Day0

4月24日,寒武紀宣布,基于自研NeuWare軟件生態與vLLM推理框架,已完成對深度求索公司最新開源大模型DeepSeek-V4的“Day 0”適配,適配代碼已同步開源至GitHub社區。這是寒武紀連續第二次在DeepSeek新模型發布首日便推出國產芯片適配方案。

此次適配針對DeepSeek-V4的全新模型結構,寒武紀通過自研高性能融合算子庫Torch-MLU-Ops,對模型中的Compressor、mHC等模塊進行了專項加速;并運用BangC編程語言編寫了稀疏/壓縮Attention、GroupGemm等熱點算子的極致優化Kernel,以充分釋放其MLU系列芯片的硬件底層潛力。此前,雙方通過持續的軟硬件協同優化,已在DeepSeek系列模型的部署中實現了業界領先的算力利用率水平。

深度求索于同日正式發布并開源了DeepSeek-V4預覽版。該模型擁有百萬字(約100萬Token)的超長上下文處理能力,在Agent能力、世界知識和推理性能上均實現了國內與開源領域的領先。模型按規模分為兩個版本:面向高性能的DeepSeek-V4-Pro(總參數1.6T)和主打高性價比的DeepSeek-V4-Flash(總參數284B)。

寒武紀表示,DeepSeek-V4能夠原生運行于寒武紀芯片,對中國AI產業具有里程碑意義。這一成就得益于其長期構建的NeuWare軟件棧,該平臺全面擁抱開源生態,原生支持PyTorch、vLLM、Diffusers等主流AI框架,并與眾智FlagOS生態深度合作,旨在降低模型在不同架構芯片間的遷移成本。(校對/鄧秋賢)