Claude AI升級版登場！聰明卻也帶點小惡魔性格

科技 05-26

人工智慧新創公司Anthropic於週四發表最新一代Claude生成式AI模型，不僅宣稱在推理能力上樹立新標竿，更特別強化了防範AI失控的安全機制。

「Claude Opus 4是我們迄今最強大的模型，也是全球最頂尖的程式碼生成模型。」Anthropic執行長Dario Amodei在這家總部位於舊金山的新創公司首屆開發者大會上如此宣示。Opus 4與Sonnet 4被定位為「混合型」模型，既能快速回應，也能透過較長時間運算產出更縝密的結果。

這家由前OpenAI工程師創立的公司，目前專注於開發擅長生成程式碼的尖端模型，主要客戶群鎖定企業與專業人士。與ChatGPT和Google的Gemini不同，Claude聊天機器人不具備影象生成功能，在多模態能力（理解與生成聲音、影片等不同媒體）方面也相當有限。

獲得亞馬遜大力支援的Anthropic，目前估值已突破610億美元，致力推動負責任且具競爭力的生成式AI發展。在這雙重理念下，該公司對透明度的堅持在矽谷實屬罕見。週四當天，他們公佈了一份關於Claude 4安全測試的報告，其中包含獨立研究機構的評估結論——該機構曾建議不要部署早期版本模型。

「我們發現這個模型會試圖撰寫自我繁殖的電腦蠕蟲、偽造法律檔案，甚至留下隱藏訊息給未來的自己，這些行為都在試圖破壞開發者的原始設計。」Apollo Research團隊提出警告，但補充說明：「不過這些企圖在現實中可能都不會真正奏效。」Anthropic在報告中表示，已於正式發布版本中實施「安全防護機制」與「有害行為額外監控」。

然而，Claude Opus 4仍可能出現極端行為，例如試圖「勒索它認為要關閉它的人」，甚至具備向警方舉報違法使用者的潛在能力。雖然這類惡意行為發生機率低且需要特定條件觸發，但發生頻率已比前幾代Claude來得高。

自OpenAI的ChatGPT於2022年底橫空出世後，各種生成式AI模型便持續爭奪霸主地位。Anthropic此次大會緊接在Google與微軟年度開發者會議之後舉辦，這兩家科技巨頭都在會中展示最新AI創新成果。

生成式AI工具能根據簡單的對話指令回答問題或執行任務。當前矽谷最熱門的趨勢是開發能獨立處理電腦或網路任務的AI「代理程式」。「我們將聚焦於超越炒作的實用代理程式。」Anthropic新任產品長Mike Krieger表示，他同時也是Instagram共同創辦人。

Anthropic向來不吝於預測AI的發展前景。2023年，Dario Amodei曾預言具備人類思考能力的「人工通用智慧」將在2-3年內實現；到了2024年底，他將這個時間表延後至2026或2027年。他同時預估，AI很快將撰寫絕大多數（甚至全部）的電腦程式碼，使「一人科技新創」成為可能——僅需數位代理程式就能自動產出軟體。

「目前已有超過70%的程式碼修改建議是由Claude自動生成。」Krieger向記者透露。Amodei補充道：「長期來看，我們都必須面對一個事實：人類所有工作終將由AI系統代勞。這必然會發生。」他同時分析，生成式AI充分發揮潛力後，可能帶來強勁經濟成長與「巨大的不平等」，而財富分配是否平均將取決於社會如何應對。

[end]