Advantech
event
 

MIT最新3D建模技術 提升機器人空間感知能力

美國麻省理工學院(MIT)以Kimera資料庫為基礎,結合了3D幾何建模與3D語義網面模型,打造了一套全新的3D動態場景圖模型(3D Dynamic Scene Graphs)。機器人可透過這套模型模擬人類觀察環境的方式,提升對周遭空間的感知能力。

 點擊圖片放大觀看

MIT新研究讓機器人的空間感知能力更上一層樓。法新社

據The Robot Report報導,MIT研究團隊認為,要使機器人聽從較高階的指令,首先得讓機器人以人類的方式觀察周遭環境,於是研究團隊利用開放源碼的Kimera資料庫,打造出一套名為3D動態場景圖的模型,協助機器人迅速生成周遭環境的3D地圖,並將環境中的物件與語義標籤都包含在內。如此機器人在收到指令後,便能更快下決定並規劃路徑。

以往機器人的視覺與導航能力主要依賴3D製圖與語義分割兩種途徑。MIT團隊先前開發的Kimera資料庫,能夠同時建構環境的3D幾何模型,並將物件依概似(likelihood)編碼,研究團隊便以此為基礎,打造第一個能即時生成3D地圖,同時為3D地圖中動態的人物、架構註記標籤的系統。

Kimera模型可藉由攝影機影像及感測器的測量資料,即時重建3D場景。在建立3D語義網面時,Kimera利用了既有的神經網路,預測每個畫素的標籤,再將標籤以光線投射(ray-casting)的方式建立3D網面。

然而如果機器人只依靠Kimera模型執行導航任務,需耗費大量的運算資源與時間,因此研究團隊開發出了新的演算法,將原本高度密集的Kimera 3D語義網面,拆解成一個個語義階層,如此機器人就能透過特定的層次,例如物件人物、房間,乃至整棟建築物,觀看周圍的場景,不必再經由繁複的3D網面。此外,演算法也能即時追蹤物件人物層的人物移動與形狀。

研究人員指出,機器人學會以人類的方式感知環境後,不論對自駕車、搜救、協作生產、居家機器人,或是AR發展,都能產生相當大的影響。


  •     按讚加入DIGITIMES智慧應用粉絲團
更多關鍵字報導: 機器人