AI學習新突破!「分群強化學習」讓機器人與遊戲AI更快上手
科技
06-01
教導AI探索環境,就像讓機器人在巨大迷宮中尋找寶藏一樣困難。在機器人訓練或複雜遊戲等實際應用中,AI常常面臨「獎勵稀少」的困境,導致大量時間浪費在無效的嘗試上。
為了解決這個難題,南京大學與加州大學柏克萊分校的研究團隊開發出創新的「分群強化學習」(Clustered Reinforcement Learning, CRL)方法。這項技術不是讓AI盲目探索或只追求高分,而是將相似情境歸類成「群組」,同時獎勵AI嘗試新事物與累積成功經驗。
該研究成果已發表於《計算機科學前沿》期刊。研究主持人李武軍教授表示:「透過經驗分群與平衡好奇心及成功經驗,我們賦予AI更接近人類的學習方式。」
CRL的運作原理是運用K-means演算法,將相似狀態歸類成群組。每個群組會評估兩個關鍵指標:探索頻率(新奇度)與平均成果(品質)。系統根據這兩項因素發放額外獎勵,引導AI探索既新穎又可能獲得好結果的區域。
這種方法有別於傳統只追求新奇度的做法,有效避免AI陷入無效探索的困境。結合好奇心與成果導向的雙重優勢,CRL讓AI學習速度更快、錯誤更少。在機器人控制任務與高難度Atari遊戲等多項標準測試中,CRL表現超越多種最先進的方法。
特別值得一提的是,CRL能作為模組化升級輕鬆整合至現有AI系統。這項特性使其在自動駕駛、能源優化與智能排程等高風險領域極具應用潛力,這些領域都迫切需要安全且高效的學習方式。
透過簡單的分群技術與獎勵機制微調,CRL為AI訓練開創了更安全、快速且可靠的新途徑。隨著智能機器日益融入日常生活,從倉儲機器人到城市導航系統,這類方法將幫助它們快速學習、避免代價高昂的錯誤,並減少對人工監控的依賴。
[end]