AI模擬人類目標設定:從遊戲創造中學習
人類從孩提時代的玩耍到成年後的目標設定,展現了非凡的能力,然而,我們至今仍缺乏能夠理解這種能力的電腦模型。不過,紐約大學的科學家團隊最近開發出一種電腦模型,能夠透過學習人們創造遊戲的方式來模擬和生成類似人類的目標。這項研究發表在《自然機器智慧》期刊上,可能使AI系統更好地理解人類意圖,並更忠實地模擬和對齊我們的目標。此外,它也可能幫助我們設計更符合人類特質的遊戲。
「目標是人類行為的核心,但我們對人們如何呈現和產生目標知之甚少,並且缺乏能夠捕捉人類生成目標豐富性和創造性的模型,」論文的主要作者、紐約大學博士生蓋伊·戴維森解釋道。「我們的研究提供了一個新的框架,用於理解人們如何創造和呈現目標,這可能有助於開發更具創意、原創性和有效性的AI系統。」
儘管在目標和目標導向行為方面已經進行了大量的實驗和計算工作,AI模型仍然無法捕捉到日常人類目標的豐富性。為瞭解決這一差距,論文的作者研究了人類如何創造自己的目標或任務,以期揭示這兩者是如何產生的。
研究人員首先透過一系列線上實驗捕捉了人類描述目標設定行為的方式。他們將參與者放置在一個包含多種物件的虛擬房間中,要求參與者想像並提出與房間內容相關的各種有趣的目標或遊戲,例如將球彈入垃圾桶,或使用木塊堆疊成塔的遊戲。研究人員記錄了參與者對這些與設計遊戲相關的目標的描述,總共近100個遊戲。這些描述形成了一個遊戲資料集,研究人員的模型從中學習。
雖然人類目標生成看似無限,但研究參與者創造的目標受到有限數量的簡單原則指導,這些原則包括常識(目標必須在物理上可行)和重組(新目標由共享的遊戲元素建立)。例如,參與者創造了球可以合理地投進垃圾桶或從牆上彈回的規則(可行性),並結合基本的投擲元素來創造各種遊戲(從牆上彈回、投到床上、從桌子上投擲,是否擊倒木塊等,作為重組的例子)。
研究人員隨後訓練AI模型使用人類參與者開發的規則和目標來建立目標導向的遊戲。為了確定這些AI生成的目標是否與人類創造的目標一致,研究人員請另一組參與者根據幾個屬性(如趣味性、創造性和難度)對遊戲進行評分。參與者對人類生成和AI生成的遊戲進行了評分,結果顯示,參與者對人類創造的遊戲和AI模型生成的遊戲給出了相似的評分。這些結果表明,該模型成功地捕捉了人類開發新目標的方式,並生成了與人類創造的遊戲無異的趣味目標。
這項研究進一步幫助我們理解如何形成目標,以及如何將這些目標呈現給電腦。它還可以幫助我們建立系統,以協助設計遊戲和其他有趣的活動。