當前位置:
首頁 > 科技 > AI 動作翻譯神器:一句指令讓機器人與虛擬角色動起來

AI 動作翻譯神器:一句指令讓機器人與虛擬角色動起來

布朗大學的研究團隊開發出一款名為 MotionGlot 的人工智慧模型,能將文字指令轉換成機器人與動畫角色的動作,就像 ChatGPT 生成文字一樣簡單。這項突破性研究已發表在 arXiv 預印本伺服器上。

這套系統的厲害之處在於,使用者只需輸入「向前走幾步然後右轉」這樣的指令,模型就能精準生成對應動作,並套用在各種機器人或虛擬角色上。更特別的是,它能自動適應不同型別的實體,從人形機器人到四足機器人都能完美轉換動作模式。

主導這項研究的電腦科學博士生 Sudarshan Harithas 表示:「我們把動作視為另一種語言。就像能翻譯不同語言一樣,現在我們可以將文字指令轉換成跨實體的對應動作,這開啟了無數新的應用可能性。」這項研究將在 2025 年國際機器人與自動化會議上正式發表。

MotionGlot 的運作原理類似大型語言模型,將動作分解成「動作單元」。就像 ChatGPT 預測下一個詞彙,這套系統能預測下一個動作單元,從而生成流暢的動作序列。研究團隊特別克服了不同實體動作差異的挑戰,例如「走路」這個指令,在人形機器人和機器狗身上會自動產生符合各自特性的動作。

為訓練模型,研究人員使用了兩個大型資料集:QUAD-LOCO 包含四足機器人的各種動作與文字描述,QUES-CAP 則收錄真人動作與詳細註解。測試結果顯示,模型不僅能執行「機器人後退、左轉再前進」等具體指令,連「機器人開心地走路」這種抽象描述也能完美呈現。

指導教授 Srinath Sridhar 指出:「這類模型需要大量資料才能發揮最佳效果。若能擴大資料規模,模型的表現還能更上一層樓。」研究團隊計劃公開模型原始碼,讓更多開發者能參與擴充與應用。

這項技術在人機協作、遊戲開發、虛擬實境及影視動畫等領域都具有廣闊應用前景。從讓機器人理解人類指令,到為虛擬角色賦予自然動作,MotionGlot 正在重新定義人機互動的方式。

[end]