突破性AI架構模擬人類高階心智狀態,開啟人工智慧新紀元
人工智慧(AI)與神經生物學研究密不可分,兩者相互啟發。最新神經科學研究發現,人類心智狀態轉換(如從清醒到慢波睡眠再到快速動眼期睡眠)會調節第五層錐體雙點神經元(TPNs)的暫時性互動,這些神經元會根據人的心智狀態進行調整。
這種互動發生在來自外部世界的訊息(稱為感受野RF1)與內部狀態產生的輸入(稱為情境場CF2)之間。過去研究顯示,RF1和CF2輸入分別在神經元的基底部位與頂端部位進行處理。
現行採用注意力機制的AI演演算法(如transformer、perceiver和flamingo模型)雖受人類大腦啟發,但尚無法可靠模擬人類的高階感知處理與想像狀態。
斯特林大學副教授Ahsan Adeel近期發表突破性研究,開發出能重現這些高階心智狀態的AI模型,此舉不僅能加速AI學習,更能大幅降低運算負荷。這項發表於arXiv預印本伺服器的研究,提出名為Co4的創新架構,專門模擬人類新皮質第五層錐體TPNs的雙輸入狀態依賴機制。
Adeel教授在論文中強調:「無論是哺乳動物大腦還是現代機器學習模型,專注於相關資訊都是核心能力。然而,判斷相關性仍是傳統學習演演算法(如反向傳播)面臨的主要挑戰。本研究從神經生物學證據出發,展示如何讓AI模型模擬高階感知處理與清醒思考(想像)狀態,在應用注意力前預先篩選相關資訊。」
這項創新transformer模型透過預選相關資訊並識別其關鍵部分,成功模擬人類感知推理與想像狀態。其運作遵循特定推理模式:聚焦問題本身、尋找相關線索、形成可能假設。這種「推理迴圈」完美再現人類解決問題時的動態思考過程。
「問題(Q)、線索(鍵,K)與假設(值,V)之間的三元神經調節迴圈,能在表徵層面實現多元深度平行推理鏈,並使系統從初始偏見快速過渡到精煉理解。」Adeel解釋道:「這種架構能以約O(N)的運算成本(其中N是輸入標記數量),實現數量級更快的學習速度,同時大幅減少運算需求(如更少的注意力頭、層數和標記)。測試結果涵蓋強化學習、電腦視覺與自然語言問答等多個領域。」
經過一系列學習、電腦視覺與語言處理任務驗證,這項改良版transformer架構展現驚人潛力,有望大幅提升AI模型的推理能力,使其更接近人類水準。
Adeel總結道:「這項研究證明,模擬從高階感知處理到深度刻意想像推理等高階心智狀態的神經基礎,可能是實現具認知意義的機器智慧的關鍵一步。此方法不僅能開發大量輕量高效的AI模組,更能推動這些系統超越單純資訊處理,邁向情境推理,從原始效率提升到真正理解。」
[end]