當前位置:
首頁 > 科技 > AI突破性技術:巧妙解決「偽相關性」難題

AI突破性技術:巧妙解決「偽相關性」難題

人工智慧模型常因「偽相關性」問題,誤將無關緊要的特徵作為判斷依據。最新研究發現,這些誤判竟源自極小部分的訓練資料,並成功開發出革命性的解決方案。這項突破性成果已發表於arXiv預印本平臺。

「這項技術最厲害之處在於,即使完全不清楚AI依賴哪些錯誤特徵,依然能有效解決問題。」論文通訊作者、北卡羅來納州立大學電腦科學助理教授金正恩強調,「若已掌握偽相關特徵,本技術能更精準處理;但就算只是發現模型表現異常卻找不出原因,照樣能派上用場。」

偽相關性主要源自AI訓練過程中的「簡化偏誤」。以辨識狗狗照片為例,若訓練資料中多數狗都戴項圈,AI可能偷懶地將「項圈」當成辨識關鍵——畢竟比起耳朵或毛色等複雜特徵,項圈更容易辨認。「這種走捷徑的學習方式,甚至會讓AI把戴項圈的貓誤判成狗。」金教授舉例說明。

傳統解決方法需先人工識別錯誤特徵,再調整訓練資料權重。但最新研究證實,許多情況下根本無法鎖定問題特徵,導致傳統手段失效。這篇名為《透過資料修剪下斷偽相關性》的論文,將於4月24-28日在新加坡舉辦的ICLR國際會議發表。

創新技術的關鍵在於「刪除法」——僅需移除訓練資料中極小部分樣本。「訓練資料的複雜度差異很大,」金教授解釋,「我們假設最難解讀的樣本往往包含噪音與模糊資訊,正是迫使模型依賴無關特徵的元兇。剔除這些『問題樣本』後,既能解決偽相關性,又不會明顯影響整體效能。」

實驗證明,即便與已知錯誤特徵的傳統模型相比,這項技術仍展現出頂尖的表現提升,為AI訓練開創全新里程碑。

[end]