DeepSeek-V4預覽版百萬上下文成標配,華為昇騰首發適配國產算力
關鍵詞: DeepSeek-V4 開源模型 超長上下文 華為昇騰
4月24日,中國人工智能公司DeepSeek正式發布并開源全新系列模型DeepSeek-V4預覽版。

該系列包含Pro與Flash兩個版本,均支持百萬字(1M)超長上下文。官方表示,V4在Agent能力、世界知識和推理性能三大維度上達到國內與開源領域領先水平,其中Pro版本性能可比肩世界頂級閉源模型。

雙版本矩陣:旗艦對標頂尖,Flash普惠經濟
DeepSeek-V4采用MoE(混合專家)架構,按性能與成本劃分為兩個版本。

DeepSeek-V4-Pro:總參數1.6萬億,激活參數490億,預訓練數據33萬億tokens。官方定位其為性能比肩頂級閉源模型的旗艦版本。在Agentic Coding評測中,V4-Pro達到當前開源模型最佳水平,內部評測反饋使用體驗優于Anthropic Sonnet 4.5,交付質量接近Opus 4.6非思考模式,但仍與Opus 4.6思考模式存在一定差距。在世界知識測評中,V4-Pro大幅領先其他開源模型,僅稍遜于Google Gemini-Pro-3.1;在數學、STEM及競賽型代碼評測中,其超越所有已公開評測的開源模型,取得比肩世界頂級閉源模型的成績。官方技術報告指出,V4-Pro-Max(最大推理能力模式)在標準推理基準上總體約落后前沿閉源模型3–6個月。

DeepSeek-V4-Flash:總參數2840億,激活參數130億,預訓練數據32萬億tokens。該版本定位為更快捷、經濟的輕量化選項,世界知識儲備略遜于Pro,但推理能力接近。由于參數與激活規模更小,其API服務在速度與成本上具備明顯優勢。在Agent評測中,Flash在簡單任務上與Pro表現相當,高難度任務仍有差距。
1M上下文從“高端功能”變為“基礎設施”
DeepSeek-V4在底層架構上實現了重大創新。模型采用全新的Token維度注意力壓縮機制,結合自研DSA稀疏注意力技術(DeepSeek Sparse Attention),并引入CSA(Compressed Sparse Attention)與HCA(Heavily Compressed Attention)混合注意力架構。據官方技術報告披露,在1M token場景下,V4-Pro的單token推理FLOPs僅為前代V3.2的27%,KV緩存用量僅為10%。

這一架構創新的直接結果是:1M超長上下文將成為DeepSeek所有官方服務的標配。 一年前,百萬級上下文還是少數閉源旗艦模型的專屬能力;如今DeepSeek將其以開源形式普惠化,并同步開放API服務,開發者僅需修改model參數即可調用,接口兼容OpenAI ChatCompletions與Anthropic兩套標準。
功能層面,兩個版本均支持非思考模式與思考模式(可通過reasoning_effort參數設定high/max檔位),并支持Json Output、Tool Calls、對話前綴續寫等能力。此外,V4系列針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產品進行了專項適配與優化。
華為昇騰首發,CANN生態遷移
業界長期關注DeepSeek-V4是否會使用國產算力。從官方發布信息來看,DeepSeek-V4明確與華為昇騰合作。 華為云MaaS模型即服務平臺已為開發者提供免部署、一鍵調用DeepSeek-V4-Flash API的Tokens服務。昇騰CANN也于發布當日進行了DeepSeek V4在昇騰平臺的首發直播。

據多家媒體報道,DeepSeek-V4將運行于華為昇騰950系列芯片,技術架構從英偉達CUDA生態向華為CANN框架進行底層遷移。DeepSeek官方在API定價頁備注稱:“受限于高端算力,目前Pro的服務吞吐十分有限,預計下半年昇騰950超節點批量上市后,Pro的價格會大幅下調。”



這一消息直接刺激了國產AI芯片板塊。發布當日,海光信息上漲6.77%,寒武紀漲超3%,中芯國際港股漲7.96%,華虹半導體港股漲12.20%,科創芯片ETF易方達漲2.87%。 據悉,寒武紀已基于vLLM推理框架完成對DeepSeek-V4的Day 0適配,適配代碼已開源至GitHub社區。市場觀點認為,V4等國產模型積極適配昇騰等國產AI算力芯片,有助于形成國內“模型—芯片—云”的AI商業閉環。
開源與低價并行,閉源模型承壓
DeepSeek-V4以MIT許可證開源發布,模型權重已在Hugging Face、ModelScope平臺開放,配套58頁技術報告同步公開。

這一定價與開源策略,與幾乎同期發布的OpenAI GPT-5.5形成鮮明反差——GPT-5.5 API定價為每百萬輸出token 30美元(約合人民幣218元),而DeepSeek-V4-Pro輸出定價為每百萬token 24元人民幣,Flash版本更是低至2元人民幣。

海外開發者社區對此反應強烈。有網友評價稱:“在24小時內發布了兩個前沿模型,但商業模式完全相反。昨天GPT-5.5以30美元/百萬輸出token的價格推出,今天DeepSeek V4則以MIT許可發布。智能的成本底線剛剛崩塌,每一家AI產品公司都必須重新思考它們的利潤結構。”


資本市場的反應同樣直接。在DeepSeek-V4發布當日,港股大模型概念股智譜(02513.HK)跌超6.8%,Minimax(00100.HK)跌超4.6%,跌勢在消息發布后明顯擴大。


結語
DeepSeek-V4的發布,不僅是一次模型能力的迭代,更是一次對行業規則的重新定義:它將百萬字長上下文從“旗艦專屬”變為“基礎設施”,將頂級推理能力以開源形式交付,并將國產算力納入核心供應鏈。在OpenAI持續抬高閉源模型價格天花板的背景下,DeepSeek選擇以“開源+極致性價比”的路線,迫使全球AI產業鏈重新審視成本結構與商業邏輯。
正如DeepSeek在發布文末所引用的《荀子》之言——“不誘于譽,不恐于誹,率道而行,端然正己”——這家中國AI公司正試圖以長期主義的技術務實,推動大模型能力真正走向普惠。