當前位置:
首頁 > 科技 > 韓國AI團隊開發「連鎖放大」技術 突破現有影像超解析度限制

韓國AI團隊開發「連鎖放大」技術 突破現有影像超解析度限制

韓國科學技術院(KAIST)的AI研究團隊近期發表一項創新技術「連鎖放大框架」(Chain-of-Zoom),能夠在不重新訓練模型的情況下,實現極致的影像超解析度放大效果。這項突破性研究已發表於arXiv預印本伺服器。

由金炳秀、金正率與芮鐘哲三位研究人員組成的團隊,開發出一套漸進式影像放大流程。與傳統直接放大影像導致模糊失真的做法不同,他們採用分階段處理方式,在每個放大步驟都運用現有的超解析度模型來精修影像,逐步提升畫質。

研究團隊指出,現有影像放大技術多採用插值或回歸方法,往往會產生模糊的結果。為解決這個問題,他們創新地設計了「連鎖放大」流程,透過多重階段處理不斷最佳化影像品質。

這套系統運作方式相當巧妙:首先由預訓練的視覺語言模型(VLM)產生描述性提示,這些提示與原始影像一起輸入超解析度模型進行處理。研究團隊特別運用強化學習技術來確保VLM產生的提示確實有效。這個「提示-放大」的迴圈過程會不斷重複,直到獲得最終的高解析度影像。

實驗結果顯示,這項技術能夠讓單一現成模型達成16倍至256倍的極致放大效果,同時保持影像細節的銳利度與語意準確性。相較於傳統固定放大倍率的超解析度方法,新框架能避免放大超過訓練範圍時產生的模糊與偽影問題。

研究人員特別強調,這項技術的最大優勢在於無需重新訓練模型即可提升影像品質,大幅增加了技術的適用性。不過他們也提醒使用者需謹慎應用,因為放大後的影像內容是AI生成的結果,可能與實際情況存在差異。例如在刑案偵查中放大車牌號碼時,雖然可能呈現清晰的數字,但這些數字未必與真實車牌相符。

[end]