人工通用智慧:迷霧中的未來之光
在2025年3月的巴塞隆納世界行動通訊大會上,人工智慧(AI)的進展成為焦點。然而,人工通用智慧(AGI)的目標卻依然模糊且充滿爭議。儘管科技公司紛紛投入研發,AGI的定義與測量方式仍未有共識,甚至被質疑是否僅是行銷術語。
今年初,中國AI新創公司DeepSeek的崛起引發熱議,其高效且低成本的生成式AI技術令人矚目。然而,與美國競爭對手一樣,DeepSeek的終極目標並非僅限於效率提升,而是打造真正的AGI。多年來,從小型新創公司到科技巨頭,AI開發者們都在追逐這個難以捉摸的目標。他們認為,AGI將成為關鍵轉捩點,使電腦系統取代人類勞動力,並成為社會進步的終極工具。
然而,AGI的定義至今仍不明確。20世紀中期,AGI被定義為能執行任何人類任務的自主電腦,包括煮咖啡或修車等實體活動。隨著機器人技術的進展落後於電腦運算,AI領域逐漸將AGI的定義縮小為能執行「經濟價值」任務的系統,例如程式設計和撰寫準確文章。即便如此,AGI是否應涵蓋靈活的推理能力和自主性,仍是爭議焦點。
為瞭解決這些不確定性,研究人員開發了類似學生考試的基準測試來評估系統是否接近AGI。例如,2019年法國電腦科學家François Chollet發布了「人工通用智慧抽象推理語料庫」(ARC-AGI),旨在測試AI模型的推理能力。儘管OpenAI的最新模型在ARC-AGI上取得顯著進步,但這是否代表AGI的突破,仍存疑慮。
AI測試的另一大問題是無法捕捉現實世界的複雜性。例如,OpenAI的模型在「前沿數學基準」中表現優異,但這可能與其參與測試開發有關。此外,AI模型在處理高階科學問題時表現出色,卻可能在簡單任務上失誤,顯示其理解問題的方式存在根本性偏差。
即使AI模型在特定測試中表現優異,例如透過律師考試或醫學測驗,這並不保證其在現實世界中能達到專家級表現。例如,生成式AI在撰寫法律檔案時仍常虛構資訊,而在模擬真實條件的測試中,其表現遠不如實際醫生。
AGI被視為AI開發者的指引燈塔,一旦實現,將標誌著社會的重大轉折點。然而,AI已對社會產生深遠影響,無論是好是壞,卻未有共識表明我們是否接近或已超越這一轉折點。例如,科學家利用AI工具開發可能拯救生命的新分子,但生成式聊天機器人卻在課堂上引發作弊問題。
總之,AGI的追求固然重要,但過度聚焦於此可能讓我們忽視AI當前的實際影響與挑戰。真正的關鍵或許不在於AI是否具備通用智慧,而在於其能否以可負擔的成本為社會帶來實質效益。