羅納爾多「Siuuu」慶祝動作:全身訓練模型讓機器人模仿名將動作
卡內基美隆大學的一組人工智慧與機器人研究團隊,聯手科技公司輝達(NVIDIA)的兩位同仁,開發出一種全新模型,可用於訓練機器人模仿人類運動員的動作。他們將研究成果釋出於arXiv預印本伺服器的論文中,詳細闡述瞭如何開發出這種能讓人形機器人進行全身運動訓練的新方法,以及截至目前該方法的成效。
在這項新研究中,研究團隊指出,過往大多訓練機器人的工作主要聚焦於移動能力。這使得許多機器人在移動方面表現出色,但團隊也提到,這些機器人的動作缺乏優雅感,欠缺流暢性和運動員般的靈活性,而這些正是自然界動物動作的顯著特徵。因此,他們認為解決之道是將重點轉向全身訓練。
在開發全身訓練方法的過程中,研究團隊發現現有的訓練模型缺乏適應性,且常常使用過多引數,導致機器人的動作過於保守。於是,他們開發出一種分為兩階段的新模型,也就是他們所稱的框架。
第一階段是訓練一個人工智慧模組,使其理解人類全身運動的影片,並重新定位關鍵點,結合運動追蹤技術,考慮機器人的能力。第二階段則是收集現實世界的資料,以找出並協調現實世界中的動作(影片中人們的動作方式)與機器人能夠做出的動作之間的差異。最終形成了一個被團隊稱為「模擬與真實物理對齊」(Aligning Simulation and Real Physics,簡稱ASAP)的框架。
為了測試這個新框架,研究人員訓練了一臺機器人做出體育迷們熟悉的動作。這臺機器人完成了科比・布萊恩特著名的後仰跳投、勒布朗・詹姆斯的「噤聲」動作,以及克里斯蒂亞諾・羅納爾多帶著空中旋轉的「Siu」躍起動作。每個全身動作技巧在執行時都被記錄下來,並將結果上傳到YouTube。
觀看這些影片時,很容易辨認出這些著名的動作,也能看到在改善全身動作方面所取得的進展。但同時也不難發現,要讓機器人被誤認為是職業人類運動員,仍有許多工作要做。
將人類影片動作轉換為機器人動作的流程如下:(a)從影片中捕捉人類動作;(b)使用TRAM [93],以SMPL引數格式重建3D人類動作;(c)在模擬環境中訓練強化學習(RL)策略,以追蹤SMPL動作;(d)將學習到的SMPL動作在模擬中重新定位到宇樹G1人形機器人上;(e)將訓練好的RL策略部署到真實機器人上,使其在現實世界中執行最終動作。這個流程確保了重新定位的動作在物理上可行,且適合在現實世界中應用。(資料來源:arXiv (2025). DOI: 10.48550/arxiv.2502.01143 )