瑞士學界聯手打造!全球首個開放原始碼的多語言AI模型即將問世
科技
07-13
今夏將掀起AI界革命性變革!瑞士洛桑聯邦理工學院(EPFL)與蘇黎世聯邦理工學院(ETH Zurich)宣佈,將在阿爾卑斯超級電腦上訓練完成的大型語言模型(LLM)開源釋出,這項突破性進展標誌著開源AI與多語言技術的重大里程碑。
本週在日內瓦舉行的「國際開源LLM開發者高峰會」聚集全球50多個頂尖開源組織,這場由EPFL和ETH Zurich AI中心共同主辦的盛會,為建立開放基礎模型的國際合作生態系邁出關鍵一步。與會專家普遍認為,開源LLM已成為美中兩國封閉商業系統的可靠替代方案。
即將發布的開源模型由瑞士學研機構與CSCS工程團隊共同開發,目前正進行最終測試。特別值得關注的是,這個模型主打三大特色:
- 完全透明公開的原始碼與權重引數
- 支援逾1,500種語言的多語種處理能力
- 符合瑞士資料保護法與歐盟AI法案的合規設計
ETH AI中心研究科學家Imanol Schlag強調:「全開放模型不僅能促進高信任度應用,更是研究AI風險與機遇的必要基礎。透明化流程也有助於監管合規。」
在技術規格方面,模型將推出80億與700億引數兩種版本,後者將躋身全球最強大的全開放模型之列。團隊採用超過15兆個高品質訓練標記(token),確保語言理解的可靠性與廣泛應用性。
特別值得一提的是,模型訓練全程使用位於盧加諾的Alps超級電腦,這臺配備上萬張NVIDIA Grace Hopper超級晶片的運算巨獸,不僅提供頂尖AI運算平臺,更全程採用100%碳中和電力。
EPFL教授Martin Jaggi指出:「有別於商業公司的封閉開發模式,我們堅持完全開放的路線,這不僅能促進瑞士與歐洲的創新動能,更是吸引頂尖人才的關鍵因素。」模型預計夏末在Apache 2.0授權下開源,並附詳盡技術檔案供各界運用。
[end]