Meta涉用盜版書籍訓練AI 美國法院將裁定是否構成「合理使用」
開發AI模型的企業如OpenAI和Meta,需要透過龐大資料集來訓練系統。這些資料來源包括報章雜誌、書籍(常取自未經授權的資料庫)、學術論文及各類網路內容,其中不乏受版權保護的作品。
《大西洋月刊》近期揭露,Facebook和Instagram的母公司Meta疑似使用非法電子書平臺LibGen來訓練其生成式AI工具。LibGen由俄羅斯科學家於2008年建立,收錄超過750萬本書籍和8100萬篇研究論文,堪稱全球最大的盜版文獻資料庫之一。
此舉引發激烈法律辯論,更令作家與出版商深感憂慮,擔心自身作品可能因此貶值甚至被取代。雖然OpenAI等公司已與部分內容供應商建立正式合作,但多數出版業者與創作者仍強烈反對其智慧財產權在未經同意或付費的情況下遭挪用。
作家崔西·史派瑟批評Meta此舉是「科技資本主義的極致表現」,澳洲作家協會主席蘇菲·康寧漢更直指該公司「對作家表現出輕蔑態度」。目前Meta在美國正面臨包括麥可·謝朋、塔-奈西斯·科茨和喜劇演員莎拉·席佛曼等作家團體提起的侵權訴訟。法院檔案顯示,執行長祖克柏明知LibGen含有盜版內容,仍批准將其用於AI訓練。對此Meta拒絕評論訴訟進展。
這些法律攻防聚焦核心問題:大規模擷取資料訓練AI是否構成「合理使用」?爭議關鍵在於,AI公司不僅利用公開資料訓練模型,更可能透過聊天機器人產出與原創作品形成競爭的內容。
AI業者以創新和「合理使用」原則辯護——該法律原則允許在特定情境(如研究、教學、評論)未經授權使用版權內容。他們主張訓練過程具有「轉化性」,但當AI能精準模仿作家風格或重現大量受保護內容時,侵權疑慮便油然而生。
具指標性的《紐約時報》訴OpenAI與微軟案於2023年底提起,目前仍在審理中。儘管訴訟範圍已限縮至版權與商標淡化等核心主張,但法院近期裁定準予進入審判程式,被視為紐時的重要勝利。新聞集團等媒體也相繼對AI公司提告。
威脅更波及獨立創作者生計。2023年包括喬納森·弗蘭岑、約翰·葛裡遜和喬治·R·R·馬丁等作家發起集體訴訟,指控OpenAI未經許可或付費即複製其作品。這些訴訟結果將深遠影響出版媒體與AI產業發展。
現況尤其令人憂心:2023年美國全職作家年收入中位數僅2萬餘美元,澳洲作家年均收入更僅1萬8200澳幣。澳洲作家協會已呼籲政府監管AI,要求業者須取得授權並合理付費,同時應明確標註AI生成內容及訓練素材來源。
若允許使用版權內容訓練AI,如何公平補償創作者?2024年哈珀柯林斯與150餘位澳洲作家簽訂三年非獨家協議,允許有限使用其非小說舊作訓練AI,作者可選擇參與並獲取2500美元(與出版社五五拆分)。但作家公會主張作者應獲75%分成才合理。
出版界日益擔憂智財權失控——AI系統鮮少標註來源,削弱作品歸屬價值;若其產出能替代原創內容,更可能壓縮市場需求。亞馬遜已充斥AI生成的仿作與書籍摘要等電子書產品。
各國正研議修訂《著作權法》因應AI發展。歐盟《人工智慧法》試圖平衡創新與版權保護,雖相關條款被評為力度不足,但為權利人提供更多侵權識別工具。美國副總統J·D·凡斯則公開反對監管,稱「過度規範」將阻礙AI發展。OpenAI與谷歌皆主張應依「合理使用」原則自由訓練模型。
除法律框架外,全球正發展各類授權模式。2023年中以來,包括泰勒弗朗西斯母公司Informa、威立和牛津大學出版社等學術機構已與AI公司簽訂授權協議。澳洲Black Inc.出版社也開始要求作者簽署AI訓練授權書。新興平臺如「人類創作」則致力建立合法授權機制,協助讀者辨識真偽創作。
澳洲政府尚未制定AI專法,2024年9月提出包含透明度、責信與公平等八項AI倫理自願性準則。當前AI訓練素材的版權爭議仍屬法律灰色地帶,需在技術創新與原創內容永續發展間取得平衡。這將仰賴司法判例、新型商業模式與完善政策的共同作用。
隨著法院陸續作出裁決,可望釐清AI訓練的合理使用界線與適當補償模式。人類創作的未來,正處於關鍵十字路口。