OpenAI指控DeepSeek抄襲ChatGPT，自身卻也面臨版權糾紛

科技 02-07

直到幾週前，西方世界鮮少有人聽說過中國一家名為DeepSeek的小型人工智慧（AI）公司。但在1月20日，它發布了一款名為R1的新AI模型，吸引了全球目光。

R1是一種「推理」模型，也就是說它會一步一步處理任務，並向使用者詳細說明其工作過程。它是DeepSeek去年12月發布的V3模型的升級版本。DeepSeek的這款新模型幾乎和競爭對手OpenAI最先進的AI模型o1一樣強大，但成本卻只有其一小部分。

短短幾天內，DeepSeek的應用程式在新增下載量上超越了ChatGPT，還導致美國科技公司的股價下跌。這也使得OpenAI聲稱，其中國競爭對手實際上是從OpenAI的模型中「偷取」了一些精華部分來構建自己的模型。

該公司在給《紐約時報》的宣告中表示：「我們已經注意到並正在審查有關DeepSeek可能不恰當地提煉我們模型的跡象，待掌握更多資訊後將會公佈。我們會積極主動地採取對策來保護我們的技術，並將繼續與美國政府密切合作，保護在美國研發的最強大模型。」《對話》雜誌曾聯絡DeepSeek置評，但該公司未予回應。

即便DeepSeek在構建R1時複製了（用科學術語來說是「提煉」）至少部分ChatGPT的內容，但值得注意的是，OpenAI在開發自身模型時也被指控不尊重智慧財產權。

模型提煉是一種常見的機器學習技術，即透過一個更大、更複雜的「老師模型」的預測結果來訓練一個更小的「學生模型」。完成後，學生模型可能幾乎和老師模型一樣出色，但能更有效、更精簡地呈現老師模型的知識。要做到這一點，無需瞭解老師模型的內部運作機制，只需向老師模型提出足夠多的問題來訓練學生模型即可。

這就是OpenAI所稱DeepSeek的做法：大規模地向OpenAI的o1模型提問，並利用觀察到的輸出來訓練自己更高效的模型。DeepSeek稱，訓練和使用R1所需的資源僅為其競爭對手開發最佳模型所需資源的一小部分。

確實有理由對該公司的一些行銷宣傳持懷疑態度，例如，一份新的獨立報告顯示，R1的硬體投入高達5億美元。但即便如此，與競爭對手的模型相比，DeepSeek的開發速度仍然很快且效率很高。

這可能是因為DeepSeek提煉了OpenAI的輸出結果，但目前還沒有確鑿的方法來證明這一點。目前處於早期開發階段的一種方法是給AI輸出加上水印，就像給受版權保護的圖片新增水印一樣。理論上有各種方法可以做到這一點，但目前還沒有一種方法足夠有效或高效到可以應用於實踐。

DeepSeek的成功也有其他原因，比如該公司艱鉅且深入的技術研發工作。DeepSeek取得的技術進步包括利用效能較弱但成本較低的AI晶片（也稱為圖形處理單元，即GPU）。在美國禁止企業向中國出口最強大的AI晶片後，DeepSeek別無選擇，只能進行適應性調整。

西方AI公司可以購買這些強大的晶片，但出口禁令迫使中國公司進行創新，以充分利用更便宜的替代方案。OpenAI的使用條款明確規定，任何人不得使用其AI模型來開發競爭性產品。然而，它自己的模型是基於從網路抓取的大量資料集進行訓練的。這些資料集中包含大量受版權保護的材料，OpenAI稱其有權根據「合理使用」原則使用這些材料：「使用公開的網路材料訓練AI模型屬於合理使用，這有長期且廣泛認可的先例支援。我們認為這一原則對創作者公平，對創新者必要，對美國的競爭力至關重要。」

這一論點將在法庭上接受檢驗。報社、音樂家、作家和其他創作者已就版權侵權問題對OpenAI提起了一系列訴訟。當然，這與OpenAI指控DeepSeek的行為截然不同。即便如此，OpenAI稱DeepSeek非法獲取其模型輸出的說法並未贏得多少同情。

這場口水戰和訴訟反映出AI的快速發展已經超過了該行業明確法律規則的制定速度。儘管近期的這些事件可能會削弱現有AI巨頭的力量，但很多事情還取決於目前各種法律糾紛的結果。

DeepSeek已經證明，以低成本、高效率開發先進模型是可行的。它們能否在公平的競爭環境中與OpenAI抗衡，還有待觀察。上週末，OpenAI試圖透過公開發布其最先進的消費者模型o3 - mini來展示其霸主地位。OpenAI稱，該模型的效能大幅超越了其之前的市場領先版本o1，是「我們推理系列中最具成本效益的模型」。

這些發展預示著消費者將迎來一個選擇更多的時代，市場上將有多樣化的AI模型可供選擇。這對使用者來說是個好訊息，競爭壓力將使模型的使用成本更低。而且，其好處還不止於此。訓練和使用這些模型會給全球能源消耗帶來巨大壓力。隨著這些模型變得越來越普及，它們效率的提高將使我們所有人受益。DeepSeek的崛起確實為更便宜、更高效地構建模型開闢了新領域。也許它還會引發全球對於AI公司應如何收集和使用訓練資料的討論。