當前位置:
首頁 > 科技 > AI技術革新:用文字指令輕鬆打造完美肖像光影

AI技術革新:用文字指令輕鬆打造完美肖像光影

一項突破性的AI模型問世,讓使用者僅需輸入文字指令,就能在肖像照片與影片中創造出動態光影效果。這項技術讓使用者能夠輕鬆調整色彩,例如輸入「溫暖的剛出爐烤雞」或「冰藍色光線」等描述性指令,無需繁複的編輯工具即可完成。

這項名為Text2Relight的AI驅動光影專用基礎模型,由UNIST人工智慧研究所的Seungryul Bak教授團隊研發。如圖所示,該模型能根據創意文字指令對單張肖像照片進行重新打光。這項與Adobe合作的研究,將於2025年2月25日至3月4日在費城賓夕法尼亞會議中心舉行的第39屆AAAI人工智慧年會(AAAI 2025)上展示,並已獲得人工智慧促進協會(AAAI)的認可,相關論文也已發表在arXiv預印本伺服器上。

這款新模型擅長透過自然語言輸入來表現多樣化的光影特徵,包括情感氛圍、色彩和亮度等。值得一提的是,它能同時調整主體和背景的色彩,保持原始影象的完整性。相較於現有的文字驅動影象編輯模型,Text2Relight提供了更精緻的解決方案,克服了傳統模型因缺乏光影資料專業化而導致的影象失真或光影控制有限的問題。

為了讓AI學習創意文字與光影之間的關聯,研究團隊開發了大規模的合成資料集。他們利用ChatGPT和文字驅動的擴散模型來生成光影資料,同時採用OLAT(一次一光)技術和光影轉移方法來探索各種光影條件。此外,團隊還透過訓練專注於陰影移除和照明定位的輔助資料集,進一步提升了模型的功能,從而提高了光影效果的視覺連貫性和真實感。

Bak教授表示:「Text2Relight在內容創作方面具有巨大潛力,包括減少照片和影片製作中的編輯時間,以及提升虛擬和擴增實境環境中的沉浸感。」這項技術的應用前景廣闊,將為影像創作領域帶來革命性的變革。