當前位置:
首頁 > 科技 > AI生成文字無所遁形?數位浮水印技術大突破

AI生成文字無所遁形?數位浮水印技術大突破

隨著人工智慧技術的快速發展,教育界和職場正面臨一個棘手的問題:如何辨識提交的文字作品究竟出自人類之手,還是AI代筆?佛羅裡達大學的一位工程學教授,正致力於開發一種能夠徹底解決這個困擾的數位浮水印技術。

「如果我是學生,用ChatGPT完成作業,我當然不希望被教授發現。」佛羅裡達大學電機與電腦工程學系助理教授Yuheng Bu博士如此表示。Bu教授與其研究團隊正利用該校的超級電腦HiPerGator,開發一種針對大型語言模型的隱形浮水印技術,即使文字經過修改或重述,仍能有效偵測出AI生成內容,同時維持寫作品質。

大型語言模型如Google的Gemini,能夠產生與人類書寫極為相似的文字。使用者只需輸入提示,這些AI模型便能從龐大的資料庫中提取資訊,完成指定的寫作任務。這在學術和專業領域引發了嚴重的問題。

為瞭解決這個問題,英國雷丁大學的Peter Scarfe博士與其他研究人員去年在課堂上測試了AI偵測的成效。他們建立虛擬學生檔案,並使用基礎的AI生成平臺完成作業。研究結果顯示,高達94%的AI生成作業未被偵測出來,僅有6%被發現,而這個數字可能還高估了實際偵測能力。

Bu教授指出,大型語言模型的不斷進步,使得AI生成文字與人類書寫內容越來越難以區分,偵測難度也隨之增加,最終可能變得完全無法辨識。而浮水印技術提供了一個有效且前瞻性的解決方案,透過在AI生成文字中嵌入特別設計的隱形訊號,作為可驗證的AI生成證據。

Bu教授的研究著重於兩個關鍵面向:在新增浮水印後維持大型語言模型生成文字的品質,以及確保浮水印在各種修改下的穩定性。與原始的大型語言模型相比,這種自適應方法能確保嵌入的浮水印對人類讀者來說難以察覺,同時保持文字的自然流暢度。

一些科技公司已經開始開發AI生成文字的浮水印技術。例如,Google DeepMind的研究人員去年就開發了一種文字偵測浮水印,並將其部署到數百萬名聊天機器人使用者中。Bu教授表示,佛羅裡達大學的方法「只在生成過程中對部分文字新增浮水印,因此我們相信能達到更好的文字品質和更高的抗移除攻擊能力。」

此外,Bu教授的研究還增強了系統對日常使用中常見文字修改的抵抗力,如同義詞替換和重述,這些修改往往會使AI偵測工具失效。即使使用者完全重寫了帶有浮水印的文字,只要語意保持不變,浮水印仍能以高機率被偵測到。而浮水印的金鑰則由平臺本身提供。

「新增浮水印的實體也持有偵測所需的金鑰。如果文字是由ChatGPT新增浮水印,OpenAI將擁有驗證浮水印所需的相應金鑰。」Bu教授解釋道,「終端使用者若想驗證浮水印,必須從新增浮水印的實體取得金鑰。我們的方法採用私鑰機制,意味著只有金鑰持有者才能偵測和驗證浮水印。」

Bu教授表示,目前的關鍵問題在於終端使用者如何取得浮水印金鑰。在現行框架下,教授必須聯絡新增浮水印的實體以取得金鑰,或使用該實體提供的應用程式介面來偵測浮水印。金鑰持有者及其對智慧財產權的主張能力,是大型語言模型浮水印技術發展中的關鍵議題。

「下一步的關鍵是建立一個全面的生態系統,強制執行浮水印使用和金鑰分配,或開發出更先進、不依賴金鑰的技術。」Bu教授說道。

Bu教授已發表多篇關於AI浮水印的論文,包括去年發表於arXiv預印本伺服器的《Adaptive Text Watermark for Large Language Models》(國際機器學習會議ICML 2024),以及同樣發表於arXiv的《Theoretically Grounded Framework for LLM Watermarking: A Distribution-Adaptive Approach》。

「浮水印有潛力成為生成式AI時代中,確保信任和真實性的關鍵工具。」Bu教授表示,「我希望看到它們無縫整合到學校中,用於驗證學術材料,並廣泛應用於數位平臺,以區分真實內容和錯誤資訊。我期待廣泛的採用能簡化驗證流程,並增強我們日常依賴資訊的信心。」