9月9日,紅星新聞記者從成都人形機器人創(chuàng)新中心獲悉,該中心基于世界模型完成了全國首個機器人任務(wù)執(zhí)行系統(tǒng)R-WMES。通過給到機器人一個“我想達成”的目標的圖片,機器人自動判斷現(xiàn)有的狀態(tài),并自主規(guī)劃任務(wù)和執(zhí)行任務(wù),最終達到與目標圖片相符合。
視頻演示截圖
在該中心提供的視頻中,成都人形機器人創(chuàng)新中心做了兩段演示。其中一段演示中,給到機器人一個插有吸管的玻璃瓶的圖片作為目標。機器人通過對現(xiàn)場環(huán)境的觀察,看到了一個沒有吸管的玻璃瓶。通過在隱空間規(guī)劃,R-WMES系統(tǒng)規(guī)劃出完成任務(wù)的完整機器人動作:需要機器人抓取一根吸管插入玻璃瓶,以達到預設(shè)目標圖片(帶吸管的玻璃瓶)一致的效果。
據(jù)介紹,機器人世界模型由4大要素組成,他們是:任意指定目標(Any Specified Target)、隱空間規(guī)劃(Latent Space Planning)、動態(tài)物理交互(Dynamic Physical Interaction)、視角變換(View Transformer)。
R-WMES 在本次成果中率先實現(xiàn)了在陌生環(huán)境中無監(jiān)督訓練(Unsupervised Training)的任務(wù)執(zhí)行,展示了其任意指定目標(Any Specified Target)和隱空間規(guī)劃能力(Latent Space Planning)。值得一提的是,R-WMES也實現(xiàn)了中國在機器人世界模型上零的突破,為人形機器人更聰明、更接近人類思考推理方式打下了堅實的基礎(chǔ)。
據(jù)介紹,世界模型是一種真正接近人類大腦思考方式的系統(tǒng)框架,通過學習現(xiàn)實世界中的物理和因果規(guī)律,具備“類似條件反射的物理直覺”,可在內(nèi)部模擬環(huán)境變化,基于當前環(huán)境狀態(tài)推演未來狀態(tài),并評估規(guī)劃出的行為所產(chǎn)生的后果。這一概念源于心理學中的“心智模型”。舉個例子,當人們看到烏云密布時,就會自然地預判“馬上就要下雨了”,因為人的大腦已經(jīng)提前模擬了未來的天氣變化。
世界模型是目前人工智能與人形機器人技術(shù)競爭的最高地。越來越多的機構(gòu)和學者認為,如果希望 AI 具備真正的類人智能,不能僅依賴數(shù)據(jù)驅(qū)動的模式匹配,真正的智能應包含對物理規(guī)律的建模能力以及對環(huán)境變化的內(nèi)部模擬機制。這就是世界模型。
紅星新聞記者 彭祥萍
編輯 成序