智慧眼鏡革命:免機器人訓練,第一視角示範讓AI學會家務
科技
06-15
近年來,機器人已逐步進駐購物中心、機場、醫院等場域,甚至開始走入部分家庭與辦公室。但要讓機器人真正成為日常生活的好幫手,它們必須掌握清潔、洗碗、烹飪等各類家務技能。
紐約大學與加州大學柏克萊分校的研究團隊近期開發出「EgoZero」創新系統,透過Meta開發的Project Aria智慧眼鏡,以人類第一視角記錄任務示範影片。這項突破性技術發表於arXiv預印本伺服器,有望解決機器人訓練資料不足的瓶頸。
論文資深作者Lerrel Pinto指出:「我們認為通用型機器人的發展受限於網路級數據的缺乏,而最佳解決方案就是收集並學習人類的第一視角數據。」這套系統特別強調三大目標:精確標記動作數據、優化穿戴裝置的人體工學設計,以及實現零機器人數據的行為轉移。
有別於傳統需要多台校準攝影機或動作捕捉手套的方法,EgoZero僅需一副智慧眼鏡就能建立3D動作模型。共同第一作者Ademi Adeniji解釋:「機器人只需20分鐘的人類示範影片,無需遠端操控就能學會新任務。」
研究團隊實際測試系統效能,讓機器手臂成功完成開烤箱門等家務動作。令人驚豔的是,即使訓練數據量極少,機器人仍能準確執行多項任務。Pinto強調:「這項技術的最大價值在於完全不需要機器人數據,僅憑智慧眼鏡就能實現人類行為轉移。」
目前研究團隊已將系統程式碼公開於GitHub平台,供學界自由取用。共同第一作者Vincent Liu透露未來研究方向:「我們將深入探討2D與3D表徵的取捨,並嘗試結合大型語言模型,擴展3D點雲學習的應用框架。」
這項突破性技術不僅簡化機器人訓練流程,更為未來智慧家電發展開闢新徑。隨著資料收集系統的普及,可望加速機器人技術革新,讓更多家庭享受AI助理帶來的便利生活。
[end]