近日,大曉機器人聯(lián)合南洋理工大學(xué)S-Lab發(fā)布全球首個統(tǒng)一物理3D生成框架PhysX-Omni。該成果重構(gòu)了具身智能訓(xùn)練數(shù)據(jù)的生產(chǎn)模式,讓AI生成的3D資產(chǎn)無需人工調(diào)試即可直接部署至物理模擬器,大幅加速機器人交互策略的迭代速度,推動通用機器人從“感知智能”向“物理智能”跨越。
研究團隊跳出傳統(tǒng)3D生成“先外觀后物理”的割裂思路,從具身智能的真實訓(xùn)練需求反向推導(dǎo)技術(shù)路徑,確立了“統(tǒng)一建模+顯式物理表征”的核心研究方向,首次實現(xiàn)剛體、可形變物體與關(guān)節(jié)物體的一體化物理建模,能同時生成絕對尺度、材料屬性、運動學(xué)參數(shù)、交互能力等核心物理信息,讓AI生成的3D模型真正做到“生成即可仿真”。
該框架的核心突破在于首創(chuàng)面向視覺語言模型的模板化游程編碼幾何表征。受經(jīng)典二維游程編碼啟發(fā),團隊先將3D資產(chǎn)體素化并按部件層級拆分,再沿Z軸切分為二維二值掩碼進行緊湊編碼;同時引入模板層概念,讓結(jié)構(gòu)相似的切片共享基礎(chǔ)模板、僅記錄殘差變化,既保留了精細幾何信息,又大幅壓縮了詞元數(shù)量,從而避免引入分割步驟帶來的誤差。
此前,絕大多數(shù)3D生成方法僅能輸出靜態(tài)幾何與視覺效果,無法還原真實世界的物理屬性與運動規(guī)律,生成的模型一進入仿真場景就會出現(xiàn)穿模、尺寸錯亂、關(guān)節(jié)失效等問題,完全無法支撐物理交互與機器人訓(xùn)練需求。PhysX-Omni通過采用統(tǒng)一物理3D生成技術(shù),實現(xiàn)從文本描述到可直接仿真的物理資產(chǎn)的端到端生成,為具身智能提供了規(guī)模化、低成本的訓(xùn)練數(shù)據(jù)解決方案。除單個物體外,它還支持從2D圖像或文本描述生成完整的仿真就緒場景,可快速搭建家居、工業(yè)、辦公等多樣化交互環(huán)境,滿足機器人導(dǎo)航、操作、協(xié)作等復(fù)雜任務(wù)的訓(xùn)練需求。
通過3D布局與可交互物體結(jié)合來構(gòu)建符合真實物理規(guī)律的完整室內(nèi)外場景,為機器人導(dǎo)航、多智能體協(xié)作、復(fù)雜環(huán)境交互等高階任務(wù)提供了多樣化的訓(xùn)練環(huán)境,同時也為具身智能構(gòu)建對物理世界的全局認知、實現(xiàn)通用世界建模奠定了重要基礎(chǔ)。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2026 中國高新網(wǎng)chinahightech.com All Rights Reserved.京ICP備14033264號-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證060344號主辦單位:《中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報》社有限責任公司