具身智能小鎮(zhèn)來了！機(jī)器人逛超市買菜滿街跑

來源：量子位編輯：非小米時(shí)間：2024-07-23 00:35人閱讀

#機(jī)器人 #人工智能

超逼真的機(jī)器人小鎮(zhèn)來了！

在這里，機(jī)器人可以像人一樣在超市里購物：

買菜回家做飯：

在辦公室里接咖啡（旁邊還有人類同事）：

不只有人形機(jī)器人，機(jī)器狗、臂式機(jī)器人也在這個(gè)“城市”里穿梭自如。

這就是由上海AI實(shí)驗(yàn)室最新提出的首個(gè)模擬交互式3D世界：GRUtopia（中文名：桃源）。

在這里，由多達(dá)100k個(gè)交互式、帶精細(xì)注釋的場景自由組合成逼真城市環(huán)境。

包含室內(nèi)室外，餐廳、超市、辦公室、家庭等89個(gè)不同場景類別。

由大模型驅(qū)動的NPC，可以在這個(gè)世界里和機(jī)器人對話交互。

這樣一來，各種機(jī)器人能在虛擬小鎮(zhèn)里完成各種行為模擬，也就是最近流行的Sim2Real路線，能大幅降低具身智能現(xiàn)實(shí)世界數(shù)據(jù)收集難度和成本。

該項(xiàng)目計(jì)劃開源，現(xiàn)階段在GitHub上已提供demo安裝指南。

安裝成功后，就能在demo里控制一個(gè)人形機(jī)器人在房間內(nèi)活動，并支持調(diào)整不同視角。

機(jī)器人的虛擬桃源

其核心工作共有三項(xiàng)：

GRScenesGRResidentsGRBench

其中，GRScenes是一個(gè)包含大規(guī)模場景數(shù)據(jù)的數(shù)據(jù)集。

它極大程度上擴(kuò)展了機(jī)器人可以活動和操作的環(huán)境范圍，此前的工作更聚焦于家庭場景。

該研究表示，他們的目標(biāo)是將通用機(jī)器人的能力擴(kuò)展到各種服務(wù)場景，比如超市、醫(yī)院等。同時(shí)覆蓋室內(nèi)室外環(huán)境，包括游樂園、博物館、展覽館等。

對于各個(gè)場景，他們都進(jìn)行了精細(xì)高質(zhì)量建模，100 個(gè)場景包含 96 個(gè)類別的 2956 個(gè)交互式物體和 22001 個(gè)非交互式物體。

GRResidents是一個(gè)NPC系統(tǒng)。

它由大模型驅(qū)動，同時(shí)對模擬環(huán)境中的場景信息非常了解。因此NPC可以推斷物體之間的空間關(guān)系，參與動態(tài)對話和任務(wù)分配。

借助于這個(gè)系統(tǒng)，GRUtopia可以生成海量場景任務(wù)供機(jī)器人完成。

通過與人類進(jìn)行交叉驗(yàn)證，NPC系統(tǒng)在描述和定位對象上的準(zhǔn)確率都不錯(cuò)。

在描述實(shí)驗(yàn)中，讓NPC系統(tǒng)隨機(jī)選擇一個(gè)物體進(jìn)行描述，人類能找到對應(yīng)物體就算成功。

在定位實(shí)驗(yàn)中則反過來，如果NPC系統(tǒng)能根據(jù)人類給出的描述找到對應(yīng)物體就算成功。

調(diào)用不同大模型的成功率不盡相同，綜合來看GPT-4o的表現(xiàn)最好。

GRBench是一個(gè)評估具身智能表現(xiàn)的benchmark。

它包含3個(gè)基準(zhǔn)，涉及目標(biāo)定位導(dǎo)航（Object Loco-Navigation）、社交定位導(dǎo)航（Social Loco-Navigation）和定位操作（Loco-Manipulation），這三種評估的難度逐漸遞增。

為了分析NPC和控制API的性能，研究提出了基于LLM和VLM的基線，以驗(yàn)證基準(zhǔn)設(shè)計(jì)的合理性。

實(shí)驗(yàn)結(jié)果表明，與隨機(jī)策略相比，在所有基準(zhǔn)測試中，使用大型模型作為后端代理的表現(xiàn)都更好。

而且Qwen-VL在對話上的表現(xiàn)超過了GPT-4o。

最后整體對比來看，GRUtopia其他平臺在各個(gè)維度上都更強(qiáng)大。

該研究工作由上海人工智能實(shí)驗(yàn)室OpenRobot Lab領(lǐng)銜。

該實(shí)驗(yàn)室聚焦研究具身通用人工智能，致力于構(gòu)建軟硬虛實(shí)一體化的通用機(jī)器人算法體系。

今年5月，該團(tuán)隊(duì)還發(fā)布了具身多模態(tài)大模型Grounded 3D-LLM，能夠自動化生成物體到局部區(qū)域的場景描述與具身對話數(shù)據(jù)，有效緩解了目前三維場景理解的局限性。

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱：business@qudong.com

標(biāo)簽：機(jī)器人人工智能

上一篇:澳洲淺水區(qū)驚現(xiàn)數(shù)以萬計(jì)蜘蛛蟹當(dāng)?shù)厝梭@了：能吃嗎？

下一篇:啟動時(shí)間不到1秒！鴻蒙原生版淘寶已完成Beta版本開發(fā)

玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

具身智能小鎮(zhèn)來了！機(jī)器人逛超市買菜滿街跑

相關(guān)文章

猜你喜歡

網(wǎng)購9.9元商品后惡意“僅退款”！拼多多商家起訴買家贏了：獲賠150元

網(wǎng)紅撒鹽哥硬拉梅西合照遭網(wǎng)暴網(wǎng)友吐槽：不禮貌、純蹭熱度

女子32層窗外無防護(hù)擦玻璃拍攝者：太危險(xiǎn)了

鱷魚冬眠罕見畫面曝光：只有鼻孔露出冰層仿佛凍僵

《美人魚2》曝2024年春節(jié)上映周星馳經(jīng)紀(jì)人辟謠

媒體：梅西爽約突破商業(yè)底線人形廣告牌被踢飛腦袋

玩弄放荡人妇系列av在线网站,日韩黄片,人人妻人人添人人爽,欧美一区,日本一区二区三区在线 |观看,日本免费a级毛一片

具身智能小鎮(zhèn)來了！機(jī)器人逛超市買菜滿街跑

相關(guān)文章

猜你喜歡

網(wǎng)購9.9元商品后惡意“僅退款”！拼多多商家起訴買家贏了：獲賠150元

網(wǎng)紅撒鹽哥硬拉梅西合照遭網(wǎng)暴 網(wǎng)友吐槽：不禮貌、純蹭熱度

女子32層窗外無防護(hù)擦玻璃 拍攝者：太危險(xiǎn)了

鱷魚冬眠罕見畫面曝光：只有鼻孔露出冰層 仿佛凍僵

《美人魚2》曝2024年春節(jié)上映 周星馳經(jīng)紀(jì)人辟謠

媒體：梅西爽約突破商業(yè)底線 人形廣告牌被踢飛腦袋

具身智能小鎮(zhèn)來了！機(jī)器人逛超市買菜滿街跑

網(wǎng)購9.9元商品后惡意“僅退款”！拼多多商家起訴買家贏了：獲賠150元

網(wǎng)紅撒鹽哥硬拉梅西合照遭網(wǎng)暴網(wǎng)友吐槽：不禮貌、純蹭熱度

女子32層窗外無防護(hù)擦玻璃拍攝者：太危險(xiǎn)了

鱷魚冬眠罕見畫面曝光：只有鼻孔露出冰層仿佛凍僵

《美人魚2》曝2024年春節(jié)上映周星馳經(jīng)紀(jì)人辟謠

媒體：梅西爽約突破商業(yè)底線人形廣告牌被踢飛腦袋