DeepSeek-V4預覽版百萬上下文成標配，華為昇騰首發適配國產算力

2026-04-24 來源：電子工程專輯

1290

4月24日，中國人工智能公司DeepSeek正式發布并開源全新系列模型DeepSeek-V4預覽版。

該系列包含Pro與Flash兩個版本，均支持百萬字（1M）超長上下文。官方表示，V4在Agent能力、世界知識和推理性能三大維度上達到國內與開源領域領先水平，其中Pro版本性能可比肩世界頂級閉源模型。

雙版本矩陣：旗艦對標頂尖，Flash普惠經濟

DeepSeek-V4采用MoE（混合專家）架構，按性能與成本劃分為兩個版本。

DeepSeek-V4-Pro：總參數1.6萬億，激活參數490億，預訓練數據33萬億tokens。官方定位其為性能比肩頂級閉源模型的旗艦版本。在Agentic Coding評測中，V4-Pro達到當前開源模型最佳水平，內部評測反饋使用體驗優于Anthropic Sonnet 4.5，交付質量接近Opus 4.6非思考模式，但仍與Opus 4.6思考模式存在一定差距。在世界知識測評中，V4-Pro大幅領先其他開源模型，僅稍遜于Google Gemini-Pro-3.1；在數學、STEM及競賽型代碼評測中，其超越所有已公開評測的開源模型，取得比肩世界頂級閉源模型的成績。官方技術報告指出，V4-Pro-Max（最大推理能力模式）在標準推理基準上總體約落后前沿閉源模型3–6個月。

DeepSeek-V4-Flash：總參數2840億，激活參數130億，預訓練數據32萬億tokens。該版本定位為更快捷、經濟的輕量化選項，世界知識儲備略遜于Pro，但推理能力接近。由于參數與激活規模更小，其API服務在速度與成本上具備明顯優勢。在Agent評測中，Flash在簡單任務上與Pro表現相當，高難度任務仍有差距。

1M上下文從“高端功能”變為“基礎設施”

DeepSeek-V4在底層架構上實現了重大創新。模型采用全新的Token維度注意力壓縮機制，結合自研DSA稀疏注意力技術（DeepSeek Sparse Attention），并引入CSA（Compressed Sparse Attention）與HCA（Heavily Compressed Attention）混合注意力架構。據官方技術報告披露，在1M token場景下，V4-Pro的單token推理FLOPs僅為前代V3.2的27%，KV緩存用量僅為10%。

這一架構創新的直接結果是：1M超長上下文將成為DeepSeek所有官方服務的標配。一年前，百萬級上下文還是少數閉源旗艦模型的專屬能力；如今DeepSeek將其以開源形式普惠化，并同步開放API服務，開發者僅需修改model參數即可調用，接口兼容OpenAI ChatCompletions與Anthropic兩套標準。

功能層面，兩個版本均支持非思考模式與思考模式（可通過reasoning_effort參數設定high/max檔位），并支持Json Output、Tool Calls、對話前綴續寫等能力。此外，V4系列針對Claude Code、OpenClaw、OpenCode、CodeBuddy等主流Agent產品進行了專項適配與優化。

華為昇騰首發，CANN生態遷移

業界長期關注DeepSeek-V4是否會使用國產算力。從官方發布信息來看，DeepSeek-V4明確與華為昇騰合作。華為云MaaS模型即服務平臺已為開發者提供免部署、一鍵調用DeepSeek-V4-Flash API的Tokens服務。昇騰CANN也于發布當日進行了DeepSeek V4在昇騰平臺的首發直播。

據多家媒體報道，DeepSeek-V4將運行于華為昇騰950系列芯片，技術架構從英偉達CUDA生態向華為CANN框架進行底層遷移。DeepSeek官方在API定價頁備注稱：“受限于高端算力，目前Pro的服務吞吐十分有限，預計下半年昇騰950超節點批量上市后，Pro的價格會大幅下調。”

這一消息直接刺激了國產AI芯片板塊。發布當日，海光信息上漲6.77%，寒武紀漲超3%，中芯國際港股漲7.96%，華虹半導體港股漲12.20%，科創芯片ETF易方達漲2.87%。據悉，寒武紀已基于vLLM推理框架完成對DeepSeek-V4的Day 0適配，適配代碼已開源至GitHub社區。市場觀點認為，V4等國產模型積極適配昇騰等國產AI算力芯片，有助于形成國內“模型—芯片—云”的AI商業閉環。

開源與低價并行，閉源模型承壓

DeepSeek-V4以MIT許可證開源發布，模型權重已在Hugging Face、ModelScope平臺開放，配套58頁技術報告同步公開。

這一定價與開源策略，與幾乎同期發布的OpenAI GPT-5.5形成鮮明反差——GPT-5.5 API定價為每百萬輸出token 30美元（約合人民幣218元），而DeepSeek-V4-Pro輸出定價為每百萬token 24元人民幣，Flash版本更是低至2元人民幣。

海外開發者社區對此反應強烈。有網友評價稱：“在24小時內發布了兩個前沿模型，但商業模式完全相反。昨天GPT-5.5以30美元/百萬輸出token的價格推出，今天DeepSeek V4則以MIT許可發布。智能的成本底線剛剛崩塌，每一家AI產品公司都必須重新思考它們的利潤結構。”

資本市場的反應同樣直接。在DeepSeek-V4發布當日，港股大模型概念股智譜（02513.HK）跌超6.8%，Minimax（00100.HK）跌超4.6%，跌勢在消息發布后明顯擴大。

結語

DeepSeek-V4的發布，不僅是一次模型能力的迭代，更是一次對行業規則的重新定義：它將百萬字長上下文從“旗艦專屬”變為“基礎設施”，將頂級推理能力以開源形式交付，并將國產算力納入核心供應鏈。在OpenAI持續抬高閉源模型價格天花板的背景下，DeepSeek選擇以“開源+極致性價比”的路線，迫使全球AI產業鏈重新審視成本結構與商業邏輯。

正如DeepSeek在發布文末所引用的《荀子》之言——“不誘于譽，不恐于誹，率道而行，端然正己”——這家中國AI公司正試圖以長期主義的技術務實，推動大模型能力真正走向普惠。