AI科學家助手:LLM4SD加速科學發現的新利器
在《Nature Machine Intelligence》期刊上,由澳洲蒙納許大學研究團隊領軍開發了一款生成式AI工具,名為LLM4SD(大型語言模型用於科學發現)。這款AI系統不僅能模擬科學家的研究步驟,更能加速科學發現的程序。LLM4SD是一個互動式的大型語言模型工具,能夠執行科學研究的基本步驟,例如從文獻中擷取有用資訊,並透過資料分析提出假設。這款工具不僅免費,更是開源軟體,讓全球研究人員都能自由使用。
與現有的科學驗證工具不同,LLM4SD不僅能提供分析結果,還能解釋其推理過程,這項功能在當前許多工具中並未具備。研究團隊在四個不同科學領域(生理學、物理化學、生物物理學和量子力學)中,針對58項與分子特性相關的研究任務進行測試,結果顯示LLM4SD表現優異。例如,在預測材料設計中關鍵的量子特性時,其準確率提升了高達48%。
研究的主要共同作者之一,蒙納許大學資訊科技學院資料科學與AI系的博士生鄭奕臻表示:「就像ChatGPT能寫文章或解決數學問題,我們的LLM4SD工具能閱讀數十年的科學文獻,並分析實驗資料來預測分子的行為。例如,它能回答『這種藥物能否穿越大腦的保護屏障?』或『這種化合物會溶於水嗎?』等問題。」鄭奕臻進一步指出:「除了超越現有如『黑盒子』般的驗證工具,這套系統還能用簡單的規則解釋其分析過程、預測和結果,這有助於科學家信任並根據其洞察採取行動。」
另一位共同作者,蒙納許大學資料科學與AI系與蒙納許藥物科學研究所的博士生Huan Yee Koh,以及格里菲斯大學資訊與通訊技術學院的博士生Jiaxin Ju,也強調了LLM4SD的獨特價值。Ju表示:「LLM4SD並非取代傳統的機器學習模型,而是透過整合知識並生成可解釋的說明來增強它們。」Koh補充道:「這種方法確保了AI驅動的預測在不同科學領域中仍能保持可靠且易於理解。」
蒙納許大學資訊科技學院的資料科學與AI專家、研究共同作者Geoff Webb教授指出,LLMs能準確模擬科學發現的關鍵技能,包括從文獻中整合知識並透過資料解讀提出假設。Webb教授表示:「我們已經完全進入生成式AI的時代,需要盡可能利用這項技術來推動科學進步,同時確保其開發過程符合倫理。這款工具有望使藥物發現過程更簡單、快速且準確,並成為全球各領域科學家的強大研究助手。」
格里菲斯大學資訊與通訊技術學院的資料探勘與機器學習專家、ARC未來研究員Shirui Pan教授也對LLM4SD的潛力表示認同。Pan教授說:「像LLM4SD這樣的模型能迅速整合數十年的先前知識,並從資料中發現可能未被廣泛報導的新模式。我們認為這是加速研發過程及其他領域的關鍵進展。」
LLM4SD的問世,不僅為科學研究帶來了新的可能性,更開啟了AI與科學家協作的嶄新篇章。這款工具將如何改變未來的科學發現?讓我們拭目以待。