當自駕車學會「思考未來」:AI如何預測瞬息萬變的都市叢林?
自駕技術已初步實現,但讓車輛在空蕩的高速公路上行駛只是第一步。真正的考驗在於:如何讓AI適應歐洲狹窄蜿蜒的街道,以及充滿不確定性的都市環境。這裡有標線模糊的交叉口、行人專用區、圓環,還有與汽車爭道的腳踏車與滑板車——要駕馭這樣的「移動迷宮」,光靠精密感測器遠遠不夠。
關鍵在於破解人類行為的「動態密碼」。行人可能突然衝出馬路、在人群中穿梭,或是像追著狗跑的孩子般做出令人措手不及的動作;單車族與滑板車更以靈活卻難以預測的行徑,讓交通方程式複雜十倍。瑞士聯邦理工學院VITA實驗室主持人Alexandre Alahi指出:「自駕系統不能只被動反應當下,必須像人類一樣『思考未來』——預測、模擬各種可能性,這才是AI進化的下一站。」
今年六月,VITA團隊將在CVPR'25發表七篇突破性論文,核心正是教AI「預見未來」。從預測人類移動軌跡到生成連續影像,所有模型與資料集都將開源,推動全球產學界共同打造真正具備前瞻能力的自駕系統。其中最創新的GEM模型,僅憑單一車載鏡頭畫面,就能推演出數秒後的完整場景變化。
這套「未來模擬器」的訓練過程堪稱史詩級:集結瑞士五大學術機構,分析4,000小時的自駕影像、第一人稱視角影片與空拍畫面。GEM不僅解讀RGB色彩與3D景深,更同步分析鏡頭移動軌跡、人體姿態與物體動態,藉此生成逼真度破錶的預測影片。研究員Mariam Hassan強調:「這讓自駕系統能在虛擬世界經歷無數『壓力測試』,大幅提升真實環境中的決策韌性。」
當然,預測人類本就是「超級任務」。VITA實驗室多管齊下:MotionMap用機率模型應對行人突發動作,另有研究專攻資料缺失時的軌跡認證。但最大挑戰始終是——人類會受情緒、意圖等隱性因素影響,這讓「不按牌理出牌」成為AI最難破解的終極謎題。
[end]