AI進化驚人！未來幾年將如何改變我們的生活？

科技 04-30

最新研究顯示，人工智慧（AI）的能力正以驚人速度成長，每7個月就能處理比現在複雜一倍的任務。這項由AI組織METR進行的研究，提出了一個嶄新的評估方式：透過測量AI完成任務所需的時間長短，來判斷其真實能力。

研究發現，現有AI系統在4分鐘內能完成的任務，成功率接近100%；但當任務時間拉長到4小時以上，成功率就驟降至10%。這顯示AI雖然在短時間任務上表現優異，但要處理長時間、複雜的工作仍面臨挑戰。不過好訊息是，過去6年來，AI能可靠完成（50%成功率）的任務長度，大約每7個月就翻倍成長。

研究團隊測試了多種主流AI模型，從Sonnet 3.7、GPT-4到Claude 3 Opus等，讓它們執行各種難度的任務。簡單如維基百科查詢，複雜如編寫CUDA核心或修復PyTorch的細微錯誤。結果顯示，最新AI系統在長時間任務上的表現，確實比舊版系統進步許多。

IEEE會員、奇點大學AI倫理工程師Eleanor Watson認為，這項研究提出的評估方式「既直觀又有價值」，因為它直接反映了AI在現實世界中的複雜應用能力，而不只是測量AI在短暫、孤立問題上的表現。

研究預測，按照目前發展速度，到2032年AI就能自動完成相當於人類一個月的軟體開發工作。Watson更樂觀估計：「到2026年，我們將看到AI變得更加通用，能夠處理整天或整週的各種任務，而不僅限於短時間的特定工作。」

這種進步將對社會產生深遠影響。對企業而言，AI將能承擔更多專業工作，不僅降低成本、提高效率，還能讓人類更專注於創意、策略和人際互動。對一般消費者來說，AI將從簡單助手進化成可靠的個人管家，能夠處理旅行規劃、健康監測或財務管理等複雜生活事務。

雖然專業化AI工具仍會在特定領域發揮作用，但Watson預測：「能夠靈活切換多種任務的通用型AI代理將成為主流，它們會將專業技能整合到更廣泛的工作流程中，從根本上重塑我們的日常生活和專業實踐方式。」

這項研究不僅提供了一個評估AI能力的新指標，更凸顯了AI技術的驚人進展速度。隨著AI處理長時間任務的能力持續提升，未來幾年我們與AI的互動方式，很可能會發生革命性的改變。