AI讀不懂時鐘與日曆?研究揭示其基本技能缺失
一項最新研究指出,全球最先進的人工智慧(AI)系統在辨識時鐘與日曆日期方面仍面臨重大挑戰。儘管AI模型能夠完成撰寫文章、生成藝術等複雜任務,但對於人類輕而易舉的基本技能,AI卻顯得力不從心。
愛丁堡大學的研究團隊發現,即便是最先進的AI模型,也無法可靠地解讀時鐘指標的位置,或正確回答與日曆日期相關的問題。研究人員表示,與單純辨識形狀不同,理解類比時鐘和日曆需要結合空間感知、上下文理解與基本數學能力,而這些對AI來說仍是難題。若能克服這些挑戰,AI系統將能更有效地應用於時間敏感的領域,例如排程助理、自主機器人以及視障輔助工具。
研究團隊測試了能夠處理文字與影象的多模態大型語言模型(MLLMs),讓其透過觀察時鐘或日曆的圖片來回答時間相關問題。測試中使用了多種時鐘設計,包括羅馬數字、有無秒針以及不同顏色的錶盤。結果顯示,AI系統在辨識指標位置時,準確率不到四分之一。當時鐘使用羅馬數字或特殊設計的指標時,錯誤率更高。此外,移除秒針並未提升AI的表現,這表明AI在指標檢測與角度解讀方面存在深層問題。
在日曆相關問題的測試中,研究人員要求AI模型回答一系列問題,例如辨識節假日或計算過去與未來的日期。結果顯示,即使是表現最佳的AI模型,日期計算的錯誤率仍高達五分之一。這項研究結果已發表於同行評審論文,並將於2025年4月28日在新加坡舉行的第十三屆國際學習表徵會議(ICLR)上進行報告。
研究負責人、愛丁堡大學資訊學院的Rohit Saxena表示:「大多數人從小就能讀懂時鐘與日曆,但我們的研究凸顯了AI在這些基本技能上的重大缺失。若想將AI成功整合到時間敏感的實際應用中,例如排程、自動化與輔助技術,這些不足必須被解決。」
同為資訊學院研究人員的Aryo Gema則指出:「當前的AI研究往往強調複雜的推理任務,但諷刺的是,許多系統在處理更簡單的日常任務時仍顯得吃力。我們的研究表明,是時候正視這些基本差距了,否則AI在時間敏感應用中的整合可能永遠停留在最後一刻。」