歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

小米MiMo-V2.5系列大模型正式開源:MIT協議商用授權,首日完成國產芯片深度適配

2026-04-28 來源:電子工程專輯
105

關鍵詞: 小米 MiMo 開源 模型性能

4月28日凌晨,小米技術官方宣布旗艦大模型MiMo-V2.5-Pro及全模態模型MiMo-V2.5正式全球開源。 該系列模型權重已全量開放于Hugging Face等平臺,采用寬松的MIT協議,允許全球開發者自由商用、微調及二次訓練,無需額外授權。與此同時,小米推出MiMo Orbit計劃,宣布于30天內面向全球開發者發放總計100萬億免費Token權益,并與OpenCode、Hermes Agent、KiloCode等Agent框架團隊展開生態共建合作。

模型定位與技術架構:雙版本覆蓋Agent與全模態場景

MiMo-V2.5系列包含兩款模型,均支持100萬Token超長上下文窗口,但定位各有側重:

  • MiMo-V2.5-Pro:旗艦Agent模型,面向復雜任務場景,深度適配Agent與Coding應用。據小米公布的模型卡,該模型為擁有1.02萬億(1.02T)總參數、420億(42B)激活參數的混合專家(MoE)架構,基于混合注意力架構設計。其預訓練使用了27萬億Token,采用FP8混合精度,原生序列長度32K,后擴展至1M Token。技術細節上,局部滑動窗口注意力(SWA)與全局注意力(GA)以6:1比例交錯使用,窗口大小為128 Token;同時繼承并優化了多標記預測(MTP)機制,通過輕量級密集前饋神經網絡模塊,將輸出吞吐量提升約三倍。

  • MiMo-V2.5:原生全模態模型,支持文本、圖像、視頻和音頻理解,具備強大的Agent能力。該模型為3100億(310B)總參數、150億(15B)激活參數的稀疏MoE模型,在48萬億Token上完成預訓練。其語言主干繼承混合滑動窗口注意力機制,并搭載自研預訓練視覺與音頻編碼器,通過輕量化投影模塊實現跨模態融合。

在后訓練階段,MiMo-V2.5-Pro遵循三階段范式:監督式微調建立基礎指令跟蹤能力;領域專精訓練通過強化學習分別優化數學、安全、智能工具使用等能力;最終通過多教師策略蒸餾(MOPD)將各領域能力融合至統一模型。MiMo-V2.5則經歷五階段訓練,涵蓋文本預訓練、投影層預熱、多模態預訓練、上下文逐步擴容(32K→256K→1M)以及強化學習與多目標偏好蒸餾。

基準測試表現:多項榜單登頂,對標全球頂級閉源模型

根據小米官方公布的Benchmark Results及多家媒體報道,MiMo-V2.5系列在多項權威測評中表現突出:

GDPVal-AA(Elo):MiMo-V2.5-Pro以1581分、MiMo-V2.5以1559分位列全球開源模型第一;

Claw-Eval(pass^3):MiMo-V2.5-Pro以63.8%位列全球開源模型第一,在任務完成率與Token效率維度上處于最優前沿;

t3-bench:MiMo-V2.5-Pro得分72.9,全球開源第一;

SWE-bench Pro:MiMo-V2.5-Pro得分57.2,超過DeepSeek V4 Pro的55.4與Gemini 3.1 Pro的54.2;

MiMo Coding Bench:MiMo-V2.5-Pro得分73.7,領先于Gemini 3.1 Pro的67.8;

Terminal-Bench 2.0:MiMo-V2.5-Pro得分68.4,優于MiMo-V2-Pro的57.1與DeepSeek V4 Pro的67.9。

在Artificial Analysis綜合智能指數榜單中,MiMo-V2.5-Pro發布當天即位列全球開源大模型并列第一,同時Agent專項指數開源第一,躋身全球所有大模型(含閉源)總榜前五。小米方面指出,在通用智能體能力、復雜軟件工程以及長程任務等核心維度上,MiMo-V2.5-Pro已可對標Claude Opus 4.6、GPT-5.4等全球頂級Agent模型,且推理成本僅為國際閉源旗艦的2.5%

值得注意的是,智東西等媒體報道稱,MiMo-V2.5-Pro在GDPVal-AA、Claw-Eval、t3-bench等多項測評中超過了最新開源的DeepSeek-V4-Pro模型,也超過了Kimi K2.6等主流閉源模型。

國產芯片與推理框架Day 0適配:開源即部署

MiMo-V2.5-Pro于開源首日即完成與多家國內外主流芯片廠商的深度適配,實現了"開源即部署"的產業落地能力:

此外,MiMo-V2.5系列模型同步完成了SGLangvLLM兩大主流推理框架的Day 0適配,確保開發者可在開源首日即時投入生產級部署。小米集團副總裁屈恒此前在小米投資者日活動中透露,MiMo-V2.5系列"適配國內外多家主流推理芯片,其中幾乎覆蓋所有國產推理芯片"。

MiMo Orbit計劃:百萬億Token激勵與Agent生態共建

為降低開發者使用門檻并快速擴大生態,小米同步推出MiMo Orbit計劃,包含兩大組件:

  • 百萬億Token創造者激勵計劃:面向全球AI用戶,于北京時間2026年4月28日00:00至5月28日00:00的30天內,發放總計100萬億(100T)免費Token權益,贈完即止。該計劃采取申請制,通過審核的用戶最高可獲得Max檔位的Token Plan,包含16億Credits,官方標注價值659元。申請通道為100t.xiaomimimo.com。

  • Agent生態共建計劃:面向全球Agent框架團隊,提供限時免費模型接入服務及Token限免支持。目前已與OpenCode、Hermes Agent、KiloCode等框架廠商展開深度合作,同時參與和贊助框架平臺的AI Hackathon等共創活動。

結語

從2025年12月開源MiMo-V2-Flash,到2026年3月發布V2系列,再到4月V2.5-Pro登頂全球開源榜首,小米在大模型領域的迭代速度處于行業前列。此次MiMo-V2.5系列開源,不僅意味著小米成為首個登頂全球開源榜首的手機廠商,更通過Day 0級國產芯片全線適配,展現了開源模型從"參數競賽"向"產業落地"的轉向。在OpenRouter平臺,中國模型總調用量已連續五周超過美國,占比達61%。隨著小米、DeepSeek等國產開源模型在Agent能力與推理效率上的持續突破,中國AI開源生態正從追趕階段進入領跑階段。