世界模型未能建立、算力成本極其高昂、操作和安全問題尚未解決,如何跨越具身智能浪潮的三大挑戰(zhàn)性問題,推動行業(yè)從“炫技”轉(zhuǎn)向產(chǎn)業(yè)落地,一直是業(yè)內(nèi)關(guān)注的焦點。
在由智友?雅瑞科創(chuàng)平臺主辦的2025科技創(chuàng)變者大會上,智友·雅瑞科創(chuàng)平臺發(fā)起人、北航機器人研究所名譽所長王田苗教授發(fā)布《2025中國具身智能產(chǎn)業(yè)星圖》,并提出以“智能定界”突破當前產(chǎn)業(yè)落地瓶頸的新思路。
《2025中國具身智能產(chǎn)業(yè)星圖》將產(chǎn)業(yè)劃分為五大核心板塊:底座技術(shù)、通用具身智能、專用具身智能、靈巧手及末端執(zhí)行器、核心部件,涵蓋國內(nèi)產(chǎn)業(yè)鏈上下游300余家代表企業(yè)。從技術(shù)演進角度來看,五大核心板塊始終互相牽引,推動整體產(chǎn)業(yè)的協(xié)同發(fā)展。
王田苗回顧了具身智能發(fā)展各個階段的主要推動力:1950年代-1980年代,人工智能機器人以技術(shù)底座開始,十多年間技術(shù)并沒有特別大的進展,然而日本率先推動引入通用底座的硬件平臺,技術(shù)底座來到具體的工業(yè)場景,從焊接、鑄造到裝配等重工業(yè),延伸到汽車、摩托車、家電等日用消費,形成了相對通用的六軸四缸和并連技術(shù),中國的小六軸和協(xié)作有了長足進步,世界工業(yè)機器人一半由中國制造。
2010年代-2020年代,發(fā)展突破點重新回到技術(shù)底座,人工智能的深度學習得到了實質(zhì)性的突破,ChatGPT和特斯拉人形機器人又引爆了具身智能的浪潮?!凹夹g(shù)”成為推動本輪具身智能產(chǎn)業(yè)鏈變革的直接變量。
然而,盡管通用技術(shù)的泛化能力為實現(xiàn)應(yīng)用落地提供了可能,但目前仍面臨安全、效能與維護成本等多重挑戰(zhàn)。下一輪具身智能產(chǎn)業(yè)鏈變革將由“應(yīng)用”引發(fā)。
王田苗教授發(fā)布《2025中國具身智能產(chǎn)業(yè)星圖》
“2025年將開啟以‘智能定界’為牽引的產(chǎn)業(yè)落地?!蓖跆锩缣岢觥爸悄芏ń纭备拍睿和ㄟ^在制造、消費、醫(yī)療、商務(wù)等具體場景中定義邊界,重新審視模型、算力和平臺問題,理解不同場景具身智能的多樣化需求,拉動通用底座Agent支持,同時重新定義核心部件和專用執(zhí)行器。其目的是“率先在垂類的頭部形成拉動性,同時能夠設(shè)計制造出全球智能硬件產(chǎn)品,形成制造服務(wù)的生態(tài)”。
王田苗進一步表示,無人配送、無人環(huán)衛(wèi)、陪護交流、Agent助理、商超藥店、醫(yī)院應(yīng)用以及制造物流與焊接打磨等一系列細分領(lǐng)域,將有望率先實現(xiàn)落地。
產(chǎn)業(yè)界期待具身智能下半場探索“智能定界”的可行性,將復雜、時變、不確定的世界模型構(gòu)建難題,轉(zhuǎn)化為構(gòu)建專注于具體現(xiàn)實環(huán)境、更容易“有限范圍求解”的垂類小模型。
這一過程關(guān)鍵要以“運營”為牽引,系統(tǒng)性地驅(qū)動“Al Agent模型”、“VLM/VLA模型與數(shù)據(jù)訓練的多模態(tài)工具”、“適配算力域控”、“操作環(huán)境”、“工藝流程”等各節(jié)點的整合與調(diào)整,最終解決泛化性難、實時性難、數(shù)據(jù)質(zhì)量差、操作容錯低以及成本高昂等問題,加速催生頭部的新勢力創(chuàng)業(yè)公司的產(chǎn)生。
王田苗指出,具身智能是我國應(yīng)對“百年未有之大變局”的關(guān)鍵技術(shù)與高端科技產(chǎn)業(yè)的突破口。面對大國戰(zhàn)略博弈、傳統(tǒng)產(chǎn)業(yè)過剩、過度依賴地產(chǎn)等問題,AI科技創(chuàng)新、物理AI(具身智能)、全球合作與貿(mào)易等,將推動中國未來經(jīng)濟復蘇與長期增長發(fā)展。
中國具身智能產(chǎn)業(yè)有望告別追求通用模型的混沌狀態(tài),轉(zhuǎn)向以垂直場景“智能定界”為牽引的落地突破。