AI進化驚人!未來幾年將如何改變我們的生活?
最新研究顯示,人工智慧(AI)的能力正以驚人速度成長,每7個月就能處理比現在複雜一倍的任務。這項由AI組織METR進行的研究,提出了一個嶄新的評估方式:透過測量AI完成任務所需的時間長短,來判斷其真實能力。
研究發現,現有AI系統在4分鐘內能完成的任務,成功率接近100%;但當任務時間拉長到4小時以上,成功率就驟降至10%。這顯示AI雖然在短時間任務上表現優異,但要處理長時間、複雜的工作仍面臨挑戰。不過好訊息是,過去6年來,AI能可靠完成(50%成功率)的任務長度,大約每7個月就翻倍成長。
研究團隊測試了多種主流AI模型,從Sonnet 3.7、GPT-4到Claude 3 Opus等,讓它們執行各種難度的任務。簡單如維基百科查詢,複雜如編寫CUDA核心或修復PyTorch的細微錯誤。結果顯示,最新AI系統在長時間任務上的表現,確實比舊版系統進步許多。
IEEE會員、奇點大學AI倫理工程師Eleanor Watson認為,這項研究提出的評估方式「既直觀又有價值」,因為它直接反映了AI在現實世界中的複雜應用能力,而不只是測量AI在短暫、孤立問題上的表現。
研究預測,按照目前發展速度,到2032年AI就能自動完成相當於人類一個月的軟體開發工作。Watson更樂觀估計:「到2026年,我們將看到AI變得更加通用,能夠處理整天或整週的各種任務,而不僅限於短時間的特定工作。」
這種進步將對社會產生深遠影響。對企業而言,AI將能承擔更多專業工作,不僅降低成本、提高效率,還能讓人類更專注於創意、策略和人際互動。對一般消費者來說,AI將從簡單助手進化成可靠的個人管家,能夠處理旅行規劃、健康監測或財務管理等複雜生活事務。
雖然專業化AI工具仍會在特定領域發揮作用,但Watson預測:「能夠靈活切換多種任務的通用型AI代理將成為主流,它們會將專業技能整合到更廣泛的工作流程中,從根本上重塑我們的日常生活和專業實踐方式。」
這項研究不僅提供了一個評估AI能力的新指標,更凸顯了AI技術的驚人進展速度。隨著AI處理長時間任務的能力持續提升,未來幾年我們與AI的互動方式,很可能會發生革命性的改變。