AI讀不懂時鐘與日曆？研究揭示其基本技能缺失

科技 03-14

一項最新研究指出，全球最先進的人工智慧（AI）系統在辨識時鐘與日曆日期方面仍面臨重大挑戰。儘管AI模型能夠完成撰寫文章、生成藝術等複雜任務，但對於人類輕而易舉的基本技能，AI卻顯得力不從心。

愛丁堡大學的研究團隊發現，即便是最先進的AI模型，也無法可靠地解讀時鐘指標的位置，或正確回答與日曆日期相關的問題。研究人員表示，與單純辨識形狀不同，理解類比時鐘和日曆需要結合空間感知、上下文理解與基本數學能力，而這些對AI來說仍是難題。若能克服這些挑戰，AI系統將能更有效地應用於時間敏感的領域，例如排程助理、自主機器人以及視障輔助工具。

研究團隊測試了能夠處理文字與影象的多模態大型語言模型（MLLMs），讓其透過觀察時鐘或日曆的圖片來回答時間相關問題。測試中使用了多種時鐘設計，包括羅馬數字、有無秒針以及不同顏色的錶盤。結果顯示，AI系統在辨識指標位置時，準確率不到四分之一。當時鐘使用羅馬數字或特殊設計的指標時，錯誤率更高。此外，移除秒針並未提升AI的表現，這表明AI在指標檢測與角度解讀方面存在深層問題。

在日曆相關問題的測試中，研究人員要求AI模型回答一系列問題，例如辨識節假日或計算過去與未來的日期。結果顯示，即使是表現最佳的AI模型，日期計算的錯誤率仍高達五分之一。這項研究結果已發表於同行評審論文，並將於2025年4月28日在新加坡舉行的第十三屆國際學習表徵會議（ICLR）上進行報告。

研究負責人、愛丁堡大學資訊學院的Rohit Saxena表示：「大多數人從小就能讀懂時鐘與日曆，但我們的研究凸顯了AI在這些基本技能上的重大缺失。若想將AI成功整合到時間敏感的實際應用中，例如排程、自動化與輔助技術，這些不足必須被解決。」

同為資訊學院研究人員的Aryo Gema則指出：「當前的AI研究往往強調複雜的推理任務，但諷刺的是，許多系統在處理更簡單的日常任務時仍顯得吃力。我們的研究表明，是時候正視這些基本差距了，否則AI在時間敏感應用中的整合可能永遠停留在最後一刻。」