當前位置:
首頁 > 科技 > 科學文獻革命:讓機器直接讀懂研究資料的「重生論文」

科學文獻革命:讓機器直接讀懂研究資料的「重生論文」

儘管數位科技突飛猛進,現代科學研究成果卻仍在使用過時的傳播方式。400年來,科學文獻從實體印刷品進化到PDF電子檔,但這些檔案本質上仍是文字內容,電腦無法直接解讀其中資訊。每年數百萬篇論文問世,機器輔助檢索與處理的需求正急速增長。

多數解決方案試圖透過人工智慧訓練機器理解文字內容,成效卻相當有限。德國萊布尼茲科學技術資訊中心(TIB)的研究團隊提出全新思維:與其教機器學習人類語言,何不直接用機器能理解的格式產出研究成果?

在《Scientific Data》期刊發表的論文中,團隊推出開源解決方案「重生論文」。計畫主持人Markus Stocker博士指出:「許多科學家使用的資料分析工具本來就能產出機器可讀的結果,但傳統發表方式卻將這些資料塞進PDF檔案,迫使其他研究者必須重新提取整理——這完全違背了學術分享的初衷。」

「重生論文」相容R、Python等常用分析工具,產出的研究成果能同時被人類閱讀與機器解析。其他研究者不僅能重現實驗,還可直接下載Excel或CSV格式的原始資料。相較於從PDF手動複製資料(耗時且易出錯)或使用準確度存疑的AI提取工具,這種方式顯然更有效率。

共同作者Lauren Snyder博士坦言:「當前學界對AI提取工具的狂熱令人憂心。就像用電鑽處理所有裝修工程,這種單一思維可能讓我們錯失開發更高效工具的契機。」Stocker博士更強調:「過去25年來,我們不斷指出現行科研傳播方式的低效,若持續迷信資料提取是唯一解方,到本世紀中葉恐怕仍在原地踏步。」

研究團隊呼籲學界擁抱破壞性創新:「若能早點運用現有技術確保科研成果的機器可讀性,今日我們早已擁有龐大的結構化知識庫。雖然起步稍晚,但現在正是改變的最佳時機。」

[end]