科學家突破性研究!神經網路「遷移學習」效能預測新模型問世
科技
05-08
荷蘭唐德斯神經科學研究所研究員Alessandro Ingrosso與義大利兩所研究機構合作,開發出革命性的數學方法,能精準預測神經網路中「遷移學習」的實際成效。這項重大研究成果已刊登於國際頂尖期刊《物理評論快報》。
現行AI系統通常需要海量資料進行訓練。舉例來說,要讓影像辨識系統學會辨識照片中的狗隻,就必須用大量犬隻照片反覆訓練神經網路,才能在新影像中達到高準確度。然而在某些專業領域,往往面臨訓練資料不足的困境。
Ingrosso特別指出:「以醫療領域的超音波癌症診斷為例,現有病例數量根本不足以完整訓練神經網路。這會導致『過度擬合』現象,使網路無法有效推論未見過的新病例,進而產生大量誤判結果。」
研究團隊針對此難題,聚焦於「遷移學習」技術——將已訓練完善的大型網路(源模型)的知識,轉移至資料有限的新網路(目標模型)。Ingrosso說明:「我們建立單隱藏層網路的最簡模型,並發展出對應的數學理論框架。」
該理論創新結合兩種分析方法:新近發展的「核重整化」技術,以及自旋玻璃理論中的經典「Franz-Parisi」形式。透過整合這些工具,研究人員能直接處理真實資料集,不再受限於統計模型或近似計算。
Ingrosso強調:「我們的新方法可直接精準預測,當目標網路吸收源網路的知識後,其資料推論的實際效能表現。」這項突破將為醫療診斷等資料稀缺領域的AI訓練,開創革命性的解決方案。
[end]