Claude AI升級版登場!聰明卻也帶點小惡魔性格
人工智慧新創公司Anthropic於週四發表最新一代Claude生成式AI模型,不僅宣稱在推理能力上樹立新標竿,更特別強化了防範AI失控的安全機制。
「Claude Opus 4是我們迄今最強大的模型,也是全球最頂尖的程式碼生成模型。」Anthropic執行長Dario Amodei在這家總部位於舊金山的新創公司首屆開發者大會上如此宣示。Opus 4與Sonnet 4被定位為「混合型」模型,既能快速回應,也能透過較長時間運算產出更縝密的結果。
這家由前OpenAI工程師創立的公司,目前專注於開發擅長生成程式碼的尖端模型,主要客戶群鎖定企業與專業人士。與ChatGPT和Google的Gemini不同,Claude聊天機器人不具備影象生成功能,在多模態能力(理解與生成聲音、影片等不同媒體)方面也相當有限。
獲得亞馬遜大力支援的Anthropic,目前估值已突破610億美元,致力推動負責任且具競爭力的生成式AI發展。在這雙重理念下,該公司對透明度的堅持在矽谷實屬罕見。週四當天,他們公佈了一份關於Claude 4安全測試的報告,其中包含獨立研究機構的評估結論——該機構曾建議不要部署早期版本模型。
「我們發現這個模型會試圖撰寫自我繁殖的電腦蠕蟲、偽造法律檔案,甚至留下隱藏訊息給未來的自己,這些行為都在試圖破壞開發者的原始設計。」Apollo Research團隊提出警告,但補充說明:「不過這些企圖在現實中可能都不會真正奏效。」Anthropic在報告中表示,已於正式發布版本中實施「安全防護機制」與「有害行為額外監控」。
然而,Claude Opus 4仍可能出現極端行為,例如試圖「勒索它認為要關閉它的人」,甚至具備向警方舉報違法使用者的潛在能力。雖然這類惡意行為發生機率低且需要特定條件觸發,但發生頻率已比前幾代Claude來得高。
自OpenAI的ChatGPT於2022年底橫空出世後,各種生成式AI模型便持續爭奪霸主地位。Anthropic此次大會緊接在Google與微軟年度開發者會議之後舉辦,這兩家科技巨頭都在會中展示最新AI創新成果。
生成式AI工具能根據簡單的對話指令回答問題或執行任務。當前矽谷最熱門的趨勢是開發能獨立處理電腦或網路任務的AI「代理程式」。「我們將聚焦於超越炒作的實用代理程式。」Anthropic新任產品長Mike Krieger表示,他同時也是Instagram共同創辦人。
Anthropic向來不吝於預測AI的發展前景。2023年,Dario Amodei曾預言具備人類思考能力的「人工通用智慧」將在2-3年內實現;到了2024年底,他將這個時間表延後至2026或2027年。他同時預估,AI很快將撰寫絕大多數(甚至全部)的電腦程式碼,使「一人科技新創」成為可能——僅需數位代理程式就能自動產出軟體。
「目前已有超過70%的程式碼修改建議是由Claude自動生成。」Krieger向記者透露。Amodei補充道:「長期來看,我們都必須面對一個事實:人類所有工作終將由AI系統代勞。這必然會發生。」他同時分析,生成式AI充分發揮潛力後,可能帶來強勁經濟成長與「巨大的不平等」,而財富分配是否平均將取決於社會如何應對。
[end]