AI 動作翻譯神器：一句指令讓機器人與虛擬角色動起來

科技 05-09

布朗大學的研究團隊開發出一款名為 MotionGlot 的人工智慧模型，能將文字指令轉換成機器人與動畫角色的動作，就像 ChatGPT 生成文字一樣簡單。這項突破性研究已發表在 arXiv 預印本伺服器上。

這套系統的厲害之處在於，使用者只需輸入「向前走幾步然後右轉」這樣的指令，模型就能精準生成對應動作，並套用在各種機器人或虛擬角色上。更特別的是，它能自動適應不同型別的實體，從人形機器人到四足機器人都能完美轉換動作模式。

主導這項研究的電腦科學博士生 Sudarshan Harithas 表示：「我們把動作視為另一種語言。就像能翻譯不同語言一樣，現在我們可以將文字指令轉換成跨實體的對應動作，這開啟了無數新的應用可能性。」這項研究將在 2025 年國際機器人與自動化會議上正式發表。

MotionGlot 的運作原理類似大型語言模型，將動作分解成「動作單元」。就像 ChatGPT 預測下一個詞彙，這套系統能預測下一個動作單元，從而生成流暢的動作序列。研究團隊特別克服了不同實體動作差異的挑戰，例如「走路」這個指令，在人形機器人和機器狗身上會自動產生符合各自特性的動作。

為訓練模型，研究人員使用了兩個大型資料集：QUAD-LOCO 包含四足機器人的各種動作與文字描述，QUES-CAP 則收錄真人動作與詳細註解。測試結果顯示，模型不僅能執行「機器人後退、左轉再前進」等具體指令，連「機器人開心地走路」這種抽象描述也能完美呈現。

指導教授 Srinath Sridhar 指出：「這類模型需要大量資料才能發揮最佳效果。若能擴大資料規模，模型的表現還能更上一層樓。」研究團隊計劃公開模型原始碼，讓更多開發者能參與擴充與應用。

這項技術在人機協作、遊戲開發、虛擬實境及影視動畫等領域都具有廣闊應用前景。從讓機器人理解人類指令，到為虛擬角色賦予自然動作，MotionGlot 正在重新定義人機互動的方式。

[end]