AI革命性突破:DNA資料儲存速度提升3,200倍
來自亨利與瑪麗蓮陶布電腦科學學院的科研團隊,成功開發出一套基於人工智慧的創新方法,不僅大幅提升DNA資料檢索的速度達三個數量級,更顯著提高了資料的精準度。這項研究由博士生歐默·薩巴里、丹妮拉·巴爾-列夫博士、伊泰·奧爾博士、艾坦·雅科比教授以及圖維·埃齊翁教授共同完成,並已發表於《自然機器智慧》期刊。
DNA資料儲存是一項新興技術,利用DNA作為資訊儲存的媒介。相較於傳統僅使用0與1兩種數位進行編碼的電腦系統,DNA儲存技術則以四種核苷酸(A、C、G、T)為基礎,大幅增加了可能的組合數量,展現出極大的儲存潛力。
在這項技術中,資料的寫入(儲存)需要透過DNA合成來完成,即根據編碼序列創造出相應的DNA分子;而資料的讀取則需依賴DNA定序技術。然而,開發DNA儲存技術仍面臨多項技術挑戰。
當前研究提出了一套全面的計算解決方案,用於檢索並修正複雜DNA儲存系統中的錯誤。研究團隊運用先進的演演算法與編碼技術,成功將資料檢索與讀取時間從數天縮短至僅需10分鐘。
這套由以色列理工學院開發的方法,名為DNAformer,基於變壓器模型,並利用模擬資料進行訓練,以從錯誤的DNA序列副本中重建出準確的序列。此外,該方法還包含一套專為DNA設計的錯誤修正碼,確保了資料的完整性。
更進一步,DNAformer還配備了一種額外的安全邊際機制,能夠偵測到特別嘈雜的DNA序列(即定序過程中產生的幹擾訊號或錯誤,這些都可能影響資料的準確解讀),並應用強大的演演算法工具進行高效處理。最終,資料會被轉換回數位資訊。
這項新方法能夠以比現有最精確方法快3,200倍的速度讀取100MB的資料,且完全不失精準度。與先前已知的快速方法相比,DNAformer還將精準度提升了高達40%,同時顯著縮短了處理時間。這一切都在一個3.1MB的資料集上得到了驗證。
研究團隊計劃開發針對不同需求定製的DNAformer版本。他們強調,這項技術具有可擴充套件性和適應性,意味著它可以針對大規模資料儲存應用進行最佳化,滿足市場需求並適應未來DNA合成與定序技術的進步。