具身智能評測將“有標可依”
近日,中國信息通信研究院聯合40余家單位共同起草的具身智能領域首個行業標準正式發布。該標準為具身智能領域構建了統一基準測試框架,標志著具身智能評測邁入“有標可依”的新階段。 據了解,這項標準聚焦人工智能關鍵基礎技術和具身智能基準測試方法,明確了具身智能系統框架和能力要求,將于6月1日正式實施。 “具身智能正處于從實驗室走向商業化落地的關鍵階段。”中國信息通信研究院人工智能研究所所長魏凱說。 數據顯示,2025年,國內整機企業數量超140家,發布人形機器人產品超330款。 然而,魏凱認為,目前具身智能產業發展面臨兩大瓶頸。一是“作坊式”研發模式。模型調優和部署往往極度依賴算法工程師的經驗;數據散落在各家數采廠,難以有效整合和復用;硬件多為非標組裝,交付后往往需要廠家進行“保姆式”維護和調試,難以規模化交付。二是“碎片化”生態格局。模型性能與本體強綁定,換個硬件就容易失效;系統能力高度依賴具體場景的實訓效果,場景一變就容易失靈;供應鏈缺乏統一標準,導致技術成果難以復用,產業鏈協同效率不高。 “可信具身智能評測體系正是連接技術研究與大規模產業應用的橋梁,為行業提供統一的技術規范框架,建立互信基礎,推動具身智能從‘作坊式’開發走向產業化發展。”魏凱說。 在他看來,建立評測體系就是為行業打造一把可信標尺,量出真智能、好產品、強可靠。 一方面,通過驗證模型在真實場景下的泛化能力和部署成效,標準幫助用戶區分真智能與炫技,可以倒逼企業研發真正可規模化、可復制的具身基礎模型。另一方面,標準讓企業明確什么是合格的產品,從而降低技術選型和適配成本,優化整個產業鏈供應鏈的資源配置。 “全面評估具身智能在復雜環境下的穩定性與可靠性,也可以為產品大規模落地提供安全保障。”魏凱說,“更重要的是,有了這把可信標尺,產業鏈上下游就有了共同的協同基礎,技術研發、硬件制造、場景應用能夠有效銜接。” 新發布的標準規范了在仿真環境和真實環境下,面向具身智能系統的基準測試框架、方法和指標。這項標準提出的評測體系支持基礎能力、認知推理能力以及全鏈路閉環能力的測試,覆蓋靜態仿真測試、動態仿真測試、真實環境測試和組合式測試四種方法。 “作為具身智能領域首份正式發布的行業標準,具身智能基準測試方法的出臺對推動技術進步、應用落地和產業發展具有重要意義,為行業發展指明了方向。”魏凱說。 其中,技術研發層面,這項標準為具身智能的能力評估提供了統一的度量依據,能夠指引技術迭代方向,幫助行業及早識別高價值技術路線,減少研發資源的無效投入;應用落地層面,為行業用戶開展產品選型與應用驗證提供標準規范支撐,避免“劣幣驅逐良幣”;產業發展層面,將加速具身智能從實驗室走向真實場景,促進具身智能技術成果的工程化落地和產業化應用。 魏凱認為,自主評測標準的建立有助于引導全國的創新資源向符合我國產業優勢和技術路線的方向匯聚,避免在他人設定的賽道上被動追趕。此外,評測標準一旦成熟并被國際采納,將有利于我國具身智能產品、方案、平臺出海,進一步打造具身智能領域的“中國樣板”。(記者 崔 爽)
【責任編輯:朱家齊】