Meta科學家運用AI解碼腦部磁場,揭開思維轉化為文字的奧秘
Meta的科學家們透過人工智慧(AI)與非侵入性腦部掃描技術,成功解開了思維如何轉化為文字的謎團。兩項最新研究顯示,他們開發的AI模型能夠在不需植入任何裝置的情況下,透過掃描大腦磁場,將你的想法轉化為文字。
其中一項研究中,科學家們開發了一種AI模型,能夠解碼大腦訊號,重現志願者所打出的句子。另一項研究則進一步探討了大腦如何實際產生語言,將思維轉化為文字。這些發現未來可能支援非侵入性的大腦-電腦介面,幫助因腦部損傷或受傷而失去溝通能力的人。
德州大學奧斯汀分校的計算神經科學家Alexander Huth表示:「這在解碼領域,尤其是非侵入性解碼方面,是一個真正的突破。」雖然類似的解碼技術已經被植入失去溝通能力的人的大腦中,但這項新研究可能為未來的可穿戴裝置鋪平道路。
在第一項研究中,研究人員使用了一種稱為腦磁圖(MEG)的技術,這種技術能夠測量大腦電脈衝產生的磁場,從而追蹤參與者在打出句子時的神經活動。接著,他們訓練了一個AI語言模型,從MEG資料中解碼大腦訊號並重現句子。該模型解碼出參與者打出的字母,準確率達到68%。常見字母的解碼正確率較高,而較少出現的字母如Z和K則有較高的錯誤率。當模型出錯時,它傾向於替換QWERTY鍵盤上與目標字母相近的字元,這表明模型使用了大腦的運動訊號來預測參與者打出的字母。
第二項研究則進一步展示了語言在大腦中產生的過程。科學家們在每位參與者打出幾句話時,每秒收集1000張MEG快照。從這些快照中,他們解碼了句子產生的不同階段。研究發現,大腦首先產生關於句子上下文和意義的資訊,然後在參與者打出句子時,逐步產生每個單詞、音節和字母的細粒度表示。研究作者寫道:「這些結果證實了長期的預測,即語言生產需要將句子意義分層分解為逐漸變小的單位,最終控制運動動作。」
為了防止一個單詞或字母的表示幹擾下一個,大腦使用了一種「動態神經程式碼」來保持它們的分離。這種程式碼不斷地改變每個資訊在大腦語言產生區域中的表示位置,從而讓大腦能夠在較長時間內保持對每個字母、音節和單詞的資訊連結。然而,MEG實驗無法精確定位這些語言表示在大腦區域中的具體位置。
這兩項尚未經過同行評審的研究,未來可能幫助科學家設計出非侵入性裝置,改善失去說話能力的人的溝通。儘管目前的裝置在受控的實驗室環境外過於笨重和敏感,但MEG技術的進步可能為未來的可穿戴裝置開啟大門。Huth表示:「我認為他們在這裡的方法確實處於前沿。就目前技術而言,他們從這些訊號中提取的資訊已經達到了極限。」