OpenAI指控DeepSeek抄襲ChatGPT,自身卻也面臨版權糾紛
直到幾週前,西方世界鮮少有人聽說過中國一家名為DeepSeek的小型人工智慧(AI)公司。但在1月20日,它發布了一款名為R1的新AI模型,吸引了全球目光。
R1是一種「推理」模型,也就是說它會一步一步處理任務,並向使用者詳細說明其工作過程。它是DeepSeek去年12月發布的V3模型的升級版本。DeepSeek的這款新模型幾乎和競爭對手OpenAI最先進的AI模型o1一樣強大,但成本卻只有其一小部分。
短短幾天內,DeepSeek的應用程式在新增下載量上超越了ChatGPT,還導致美國科技公司的股價下跌。這也使得OpenAI聲稱,其中國競爭對手實際上是從OpenAI的模型中「偷取」了一些精華部分來構建自己的模型。
該公司在給《紐約時報》的宣告中表示:「我們已經注意到並正在審查有關DeepSeek可能不恰當地提煉我們模型的跡象,待掌握更多資訊後將會公佈。我們會積極主動地採取對策來保護我們的技術,並將繼續與美國政府密切合作,保護在美國研發的最強大模型。」《對話》雜誌曾聯絡DeepSeek置評,但該公司未予回應。
即便DeepSeek在構建R1時複製了(用科學術語來說是「提煉」)至少部分ChatGPT的內容,但值得注意的是,OpenAI在開發自身模型時也被指控不尊重智慧財產權。
模型提煉是一種常見的機器學習技術,即透過一個更大、更複雜的「老師模型」的預測結果來訓練一個更小的「學生模型」。完成後,學生模型可能幾乎和老師模型一樣出色,但能更有效、更精簡地呈現老師模型的知識。要做到這一點,無需瞭解老師模型的內部運作機制,只需向老師模型提出足夠多的問題來訓練學生模型即可。
這就是OpenAI所稱DeepSeek的做法:大規模地向OpenAI的o1模型提問,並利用觀察到的輸出來訓練自己更高效的模型。DeepSeek稱,訓練和使用R1所需的資源僅為其競爭對手開發最佳模型所需資源的一小部分。
確實有理由對該公司的一些行銷宣傳持懷疑態度,例如,一份新的獨立報告顯示,R1的硬體投入高達5億美元。但即便如此,與競爭對手的模型相比,DeepSeek的開發速度仍然很快且效率很高。
這可能是因為DeepSeek提煉了OpenAI的輸出結果,但目前還沒有確鑿的方法來證明這一點。目前處於早期開發階段的一種方法是給AI輸出加上水印,就像給受版權保護的圖片新增水印一樣。理論上有各種方法可以做到這一點,但目前還沒有一種方法足夠有效或高效到可以應用於實踐。
DeepSeek的成功也有其他原因,比如該公司艱鉅且深入的技術研發工作。DeepSeek取得的技術進步包括利用效能較弱但成本較低的AI晶片(也稱為圖形處理單元,即GPU)。在美國禁止企業向中國出口最強大的AI晶片後,DeepSeek別無選擇,只能進行適應性調整。
西方AI公司可以購買這些強大的晶片,但出口禁令迫使中國公司進行創新,以充分利用更便宜的替代方案。OpenAI的使用條款明確規定,任何人不得使用其AI模型來開發競爭性產品。然而,它自己的模型是基於從網路抓取的大量資料集進行訓練的。這些資料集中包含大量受版權保護的材料,OpenAI稱其有權根據「合理使用」原則使用這些材料:「使用公開的網路材料訓練AI模型屬於合理使用,這有長期且廣泛認可的先例支援。我們認為這一原則對創作者公平,對創新者必要,對美國的競爭力至關重要。」
這一論點將在法庭上接受檢驗。報社、音樂家、作家和其他創作者已就版權侵權問題對OpenAI提起了一系列訴訟。當然,這與OpenAI指控DeepSeek的行為截然不同。即便如此,OpenAI稱DeepSeek非法獲取其模型輸出的說法並未贏得多少同情。
這場口水戰和訴訟反映出AI的快速發展已經超過了該行業明確法律規則的制定速度。儘管近期的這些事件可能會削弱現有AI巨頭的力量,但很多事情還取決於目前各種法律糾紛的結果。
DeepSeek已經證明,以低成本、高效率開發先進模型是可行的。它們能否在公平的競爭環境中與OpenAI抗衡,還有待觀察。上週末,OpenAI試圖透過公開發布其最先進的消費者模型o3 - mini來展示其霸主地位。OpenAI稱,該模型的效能大幅超越了其之前的市場領先版本o1,是「我們推理系列中最具成本效益的模型」。
這些發展預示著消費者將迎來一個選擇更多的時代,市場上將有多樣化的AI模型可供選擇。這對使用者來說是個好訊息,競爭壓力將使模型的使用成本更低。而且,其好處還不止於此。訓練和使用這些模型會給全球能源消耗帶來巨大壓力。隨著這些模型變得越來越普及,它們效率的提高將使我們所有人受益。DeepSeek的崛起確實為更便宜、更高效地構建模型開闢了新領域。也許它還會引發全球對於AI公司應如何收集和使用訓練資料的討論。