av国产japan在线播放|av人人干|黄网站国产|日韩日韩日韩日韩日韩日韩日韩,先锋资源在线播放,嗯嗯啊啊网站,尤物一区

數(shù)字報(bào)
小程序
公眾號(hào)
我科研團(tuán)隊(duì)在機(jī)器人空間智能領(lǐng)域取得新突破
2026-05-06 09:57:10
來(lái)源:科技日?qǐng)?bào)  作者: 夏凡

記者5日從浙江人形機(jī)器人創(chuàng)新中心獲悉,該中心聯(lián)合香港中文大學(xué)、浙江大學(xué)等團(tuán)隊(duì)在機(jī)器人空間智能領(lǐng)域取得重要突破,提出名為RAM的三維空間理解與操作模型,為提升機(jī)器人在復(fù)雜長(zhǎng)程任務(wù)中的操作可靠性提供了新的技術(shù)路徑。相關(guān)成果近日發(fā)表于國(guó)際學(xué)術(shù)期刊《科學(xué)·機(jī)器人》。

以視覺(jué)語(yǔ)言大模型為代表的人工智能(AI)技術(shù),提升了機(jī)器人理解自然語(yǔ)言指令和分解復(fù)雜任務(wù)的能力。但從“聽(tīng)懂指令”到“完成動(dòng)作”之間,仍存在關(guān)鍵鴻溝:機(jī)器人需要在三維空間中理解物體的位置、朝向、尺度、可操作區(qū)域及相互關(guān)系,并將這些信息轉(zhuǎn)化為可執(zhí)行的運(yùn)動(dòng)約束?,F(xiàn)有大模型多依賴二維圖文數(shù)據(jù)訓(xùn)練,缺乏直接的物理世界經(jīng)驗(yàn),在推理物體位姿和空間關(guān)系時(shí)易產(chǎn)生不符合物理規(guī)律的判斷。如何讓模型獲得可驗(yàn)證、可遷移的三維空間知識(shí),并將高層語(yǔ)義規(guī)劃與底層物理執(zhí)行連接起來(lái),是具身智能和機(jī)器人操作領(lǐng)域的重要課題。

“針對(duì)這一挑戰(zhàn),我們提出了RAM模型,其借鑒檢索增強(qiáng)生成的思想,為大模型配備可查詢的外部三維知識(shí)庫(kù)。機(jī)器人執(zhí)行任務(wù)時(shí),模型可以按需檢索物體類(lèi)別、幾何屬性、功能平面、抓取點(diǎn)等信息,從而彌補(bǔ)視覺(jué)語(yǔ)言模型自身三維空間理解不足的問(wèn)題?!眻F(tuán)隊(duì)成員、浙江人形機(jī)器人創(chuàng)新中心首席技術(shù)官許學(xué)成介紹。

研究團(tuán)隊(duì)還專門(mén)構(gòu)建了面向機(jī)器人操作場(chǎng)景的空間理解問(wèn)答評(píng)測(cè)集,結(jié)果顯示,在該評(píng)測(cè)集覆蓋的多類(lèi)空間推理任務(wù)中,RAM模型的整體表現(xiàn)優(yōu)于多種代表性視覺(jué)語(yǔ)言大模型。除核心任務(wù)外,RAM展現(xiàn)出一定通用性與擴(kuò)展性。

“人形機(jī)器人走向真實(shí)應(yīng)用場(chǎng)景,不僅需要硬件本體、靈巧手和運(yùn)動(dòng)控制能力,也需要理解三維環(huán)境、判斷物理約束并規(guī)劃可執(zhí)行動(dòng)作的算法能力?!痹S學(xué)成介紹,該研究讓機(jī)器人不僅能“聽(tīng)懂人話”,還能“精準(zhǔn)動(dòng)手”,即通過(guò)給大模型配備一套結(jié)構(gòu)化的幾何知識(shí)庫(kù),打通了從語(yǔ)義推理到精確操作的“最后一公里”。

據(jù)悉,浙江人形機(jī)器人創(chuàng)新中心由寧波市政府與浙江大學(xué)團(tuán)隊(duì)聯(lián)合共建,成立于2023年12月。目前,該中心已形成軟硬件深度融合,覆蓋多行業(yè)、多場(chǎng)景的產(chǎn)品矩陣,正助力寧波打造以人形機(jī)器人為引領(lǐng)的全國(guó)具身智能創(chuàng)新高地。

編輯:韓夢(mèng)晨
相關(guān)閱讀:
高新視頻 更多
高新熱榜 全部本月
編輯推薦 更多

友情鏈接: 政府 高新園區(qū)合作媒體

Copyright 1999-2026 中國(guó)高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號(hào)-5

電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證060344號(hào)主辦單位:《中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)》社有限責(zé)任公司