人工智慧能否革新醫療照護?潛力與挑戰並存
美國的醫療體系問題叢生,許多美國人都有切身體會。取得高品質的醫療照護並不容易,而且醫療費用可能會讓人因治療而背負終生債務,而這些治療也不一定有效。人們對醫療體系失靈的挫折感和憤怒,在總統大選中成為焦點,甚至可能是聯合健康保險公司首席執行官去年12月被謀殺的原因之一。
真正要革新醫療照護,需要政治、科學和醫學領域共同尋求解決方案。而新型人工智慧有潛力提供幫助。創新者們正爭先恐後地部署人工智慧技術,期望讓醫療照護更有效、更公平且更人性化。
人工智慧有望早期發現癌症、研發救命藥物、協助醫生進行手術,甚至透視人們的未來,預測和預防疾病。它幫助人們延長壽命、保持健康的潛力巨大。然而,醫生和研究人員要充分發揮人工智慧的潛力,必須克服諸多挑戰。
醫生如何確保人工智慧準確無誤、所有患者都能使用、沒有偏差、尊重患者隱私且不被用於邪惡目的?去年8月,在約翰霍普金斯大學布隆伯格中心的一次研討會上,人工智慧專家拉瑪·切拉帕就提出疑問:「它在任何地方都能發揮作用嗎?對所有人都有效嗎?」
我們與數十位科學家和醫生交談,了解人工智慧在醫學領域的現狀。研究人員再三強調,在大多數醫療領域,人工智慧仍處於起步階段,充其量算是剛學步。但這個領域發展迅速。自20世紀90年代以來,具備人工智慧功能的醫療器械就已投入使用,而在過去幾年,人們對此的興趣、投資和相關技術都大幅提升。
如今,一些診所利用人工智慧分析乳房X光照片和其他醫學影像、仔細檢查心跳並診斷眼部疾病,但改善醫療照護仍有很大的提升空間。不過,人工智慧不太可能取代醫生。在很多情況下,它將成為與人類的雙手、智慧和情感並用的工具。
這件事的風險不容小覷。如果努力失敗,不僅意味著數十億美元的浪費,還會使資金從其他可能挽救生命的干預措施中分流。但一些研究人員、臨床醫生和工程師認為,人工智慧改善生活的潛力如此之高,值得一試。
為了更深入了解其影響力,我們設想了六種患者可能遇到人工智慧的情景。六位虛構人物在人生不同階段的經歷,讓我們窺見人工智慧改善健康的眾多方式,以及研究人員可能面臨的重重障礙。
人工智慧的承諾能否兌現?時間會給出答案。
數位分身可預測未來健康
米蘭達出生時,她的數位分身米拉貝拉也一同「誕生」。隨著米蘭達長大,米拉貝拉也在成長。米蘭達生活的方方面面都被數位化,並在米拉貝拉的電腦程式碼中進行分析。
醫生詳細研究了米蘭達的基因指令書,也就是基因組。從她臍帶採集的細胞被重新編程為幹細胞,再培育成類器官和組織,並用數千種藥物和化學物質進行測試。這些數據被輸入米拉貝拉,以便醫生進行電腦模擬,了解米蘭達日後對藥物或意外接觸化學物質的反應。
定期的糞便樣本和皮膚拭子追蹤了米蘭達體內和體表的細菌、病毒、真菌和其他微生物。這些數據構成了米拉貝拉的數位微生物庫,有助於預測米蘭達的腸道發育、皮膚狀況、食物過敏反應,甚至是腦部健康。
成年後,米蘭達患上了胰腺癌。米拉貝拉上運行的模擬曾預測到這種可能性,因此她的醫生早早發現了腫瘤。醫生檢查了腫瘤的基因組以及癌細胞對治療的反應。米拉貝拉獲得了一個數位複製腫瘤。米拉貝拉和這個虛擬腫瘤參與了模擬臨床試驗,測試未來的治療方案。試驗結果幫助醫生選擇了有效的治療方法,治癒了米蘭達的癌症。
藉由虛擬實驗提供的抗老化干預措施,米蘭達得以健康地安享晚年。米蘭達在102歲去世後,米拉貝拉作為永久的臨床試驗參與者繼續存在,幫助改善其他人的健康。
目前,至少到現在為止,還無法創造出如此完整的數位分身。構建這樣的虛擬人類需要整合和分析各種各樣的數據,才能打造出真正符合患者個性化的模型。但研究人員正在努力。如今的數位分身還不能呈現整個身體。有些只代表單一器官,比如心臟。這些分身可以幫助設計定制化的醫療器械、規劃複雜的心臟手術,或者了解性激素如何影響心律。其他仍處於實驗階段的分身則用於模擬免疫或神經系統。
麻省理工學院林肯實驗室的電氣工程師兼電腦科學家魯茲貝·賈法里表示,或許永遠無法完全複製一個人。但數位分身可以幫助醫生更好地提供個性化醫療照護。他說:「醫生有很多數據,但他們在為你做診斷時所依據的知識,是基於對群體、社區的研究。理想情況下,這些群體能代表你。」但通常研究群體的數據並不能代表某個患者,即便能代表,匯總數據也並非真正的個性化。
史丹福大學的醫學資訊學家蒂娜·赫南德茲 - 布薩爾德表示,數位分身不僅僅是個人數據庫。它們應該像多維度模擬預測颶風路徑一樣,預測健康狀況。而且它們將超越基於基因數據的精準醫學,邁向精準照護。這種照護會考慮可能影響健康的社會和環境因素,比如生活在食物沙漠地區。
史丹福大學的心臟病專家約瑟夫·吳認為,這種整體觀念很重要。他說:「人類的思維在健康中起著重要作用。」我們的思維模式決定了我們的飲食種類和攝入量、社交對象以及人際關係的質量、運動模式、工作、壓力水平、是否接種疫苗以及是否按處方用藥等等。DNA和幹細胞數據無法預測一個人出生時所處的社會環境,也無法預測他們可能接觸到的傳染病。約瑟夫·吳說,真正的數位分身將納入這些因素,並隨著人的生活環境變化而改變。
對於弱勢群體,包括未投保者以及來自邊緣化或服務不足社區的人來說,很難獲得這樣的數據。有些人可能不願意分享自己的數據。赫南德茲 - 布薩爾德說:「想到有一個虛擬的你、數位的你,可能會讓人感到害怕。」還有些人由於無法請假、沒有交通工具去就診,或者負擔不起保險不涵蓋的額外檢查費用,導致缺乏全面的數據。
赫南德茲 - 布薩爾德還表示,透明化人工智慧使用的數據及其原因也很重要。例如,西班牙裔或黑人的孕期不良結果風險較高。但僅以種族作為解釋這種關聯的數據點是不對的。她說:「這並沒有基因或祖先方面的原因。當我們深入分析時,就會發現,這與營養、慢性高血壓以及產前護理有關。」她認為,向臨床醫生和患者解釋這些模型使用了哪些信息以及如何構建,對建立信任至關重要。
人工智慧化學家可發現新型抗生素
在一次摔跤比賽後,高中生埃斯特班發現肩膀上的一處擦傷一直未癒合。傷口處皮膚發熱、發紅且硬邦邦的。醫生診斷他患上了細菌性皮膚感染,並開了抗生素。但藥物並沒有效果。
這些細菌是令人畏懼的「超級細菌」耐甲氧西林金黃色葡萄球菌,簡稱MRSA,它們對常用的抗生素無動於衷。如果醫生找不到有效的藥物,細菌可能會擴散到血液中,危及生命。幸運的是,人工智慧識別出一種新型抗生素,控制住了感染。埃斯特班很快痊癒,又回到了摔跤墊上。
人工智慧已經在搜尋數百萬種化合物的資料庫,尋找可以治療各種疾病的藥物,包括超級細菌感染。全球非營利組織CARB-X的研發主管艾琳·達菲表示,自20世紀90年代以來,人們就開始使用電腦演算法預測化學結構及其功能。CARB-X支持新型抗生素的研發。
然而,目前迫切需要尋找新型抗病毒、抗真菌藥物和殺菌抗生素的工具。耐抗生素細菌的種類不斷增加,2019年,它們在全球導致超過一百萬人死亡。但大多數人對抗生素並未予以太多關注。達菲說:「抗生素被認為就像水一樣,直到沒有了才會在意。」
許多製藥公司以藥物研發成本高、無利可圖為由,退出了抗生素研發業務。但達菲認為,人工智慧可能會簡化發現、開發和設計流程,足以吸引大型製藥公司重新投入這一領域。
麻省理工學院的生物工程師吉姆·柯林斯表示,在過去十年左右的時間裡,基於人工神經網路的深度學習,已成為許多藥物研發人員青睞的人工智慧方法。他和同事最近對大量化學化合物進行了測試,尋找可以殺死特定類型細菌的物質,並用這些數據訓練了一個圖神經網路。這些用於處理可以用圖表描述數據的工具,擅長識別圖像和化學化合物中的聯繫。研究人員隨後要求人工智慧在數百萬種它從未見過的化學物質中篩選,標出可能是優良抗生素的物質。
經過訓練以尋找對付不同細菌的抗生素的人工智慧模型,發現了兩類新型抗生素。柯林斯和同事在2020年的《細胞》雜誌上發表報告稱,以電影《2001太空漫遊》中失控的人工智慧命名的哈爾西菌素,可以殺死多種細菌。研究人員在2023年的《自然化學生物學》雜誌上發表的文章指出,阿巴辛可以殺死鮑曼不動桿菌,這是一種對多種藥物產生耐藥性的病原菌。
一個問題是,沒有人真正知道任何一個人工智慧模型是如何判定某個分子是否能成為優良抗生素的。研究人員可能會對無法深入探究和理解的事物心存疑慮。約翰霍普金斯大學的電腦和生物工程師、數據科學與人工智慧研究所的臨時聯合主任拉瑪·切拉帕說:「如今的人工智慧就像一個黑盒子。你會好奇它是如何做到的?如果出了錯,你希望能有個解釋。」
柯林斯是位於波士頓的非營利組織Phare Bio的聯合創始人,他希望了解人工智慧看到的模式。揭開這個過程的神秘面紗,可能會幫助研究人員發現和完善新型抗生素。這也可能會讓對黑盒子預測持謹慎態度的科學家們放心。柯林斯說:「我的許多同事不滿意只有一個數字,而沒有機理學解釋或合理依據。」
為了讓人工智慧展示其推理過程,他和同事製作了一種新的圖演算法。他們向人工智慧輸入了有關一個可以殺死細菌且人工智慧預測不會對人類細胞造成傷害的化學物質庫的數據。人工智慧為每種化學物質內部的原子和鍵的排列賦值,繪製出它們的結構圖。一旦了解了抗生素應有的特徵,研究人員便讓人工智慧在超過1200萬種它從未見過的化合物中篩選。
柯林斯和同事在2024年的《自然》雜誌上發表報告稱,人工智慧找到了一些含有已知殺菌環狀結構的潛在抗生素。它還發現了一些化學結構,科學家此前並不知道這些結構具有抗菌活性。其中包括兩種化合物,它們殺死金黃色葡萄球菌和枯草芽孢桿菌的效果,幾乎與強效抗生素萬古黴素相當。在其他實驗中,這類新型抗生素也殺死了MRSA和其他一些耐抗生素細菌。
柯林斯表示,人工智慧在發現新型抗生素以及預測藥物是否會在殺菌的同時對人體造成毒害方面很有前景,但毒性預測器也帶來了倫理問題。「這些工具可能會更容易識別出具有新作用機制且無解藥的有毒化合物。」
但他認為這不應限制人工智慧工具的使用。「讓它們公開且廣泛可用非常重要,這樣世界各地的團隊都能為了有益的目的使用它們。」與此同時,科學家們應該針對惡意人工智慧可能設想的情況以及天然毒素,研發對策。柯林斯已經在研發一種用於海洋毒素解毒劑的人工智慧。
聊天機器人能否助力心理健康照護?
21歲的艾瑪有飲食失調病史,醫生建議她住院治療厭食症,但預計等待時間長達一個月。為填補等待期間的空缺,她下載了一款心理健康AI聊天機器人。然而,機器人不僅未幫助改變她對食物的困擾想法和行為,反而提供了飲食建議。
這個故事中的女子是虛構的,但情節卻源於現實。2023年,美國國家飲食失調協會停用了聊天機器人泰莎,因其向使用者提供了不恰當的飲食建議。
澳洲布里斯班昆士蘭大學的飲食失調研究員兼臨床心理學家傑瑪·夏普表示,使用聊天機器人解決心理健康問題存在諸多隱憂。她指出:「聊天機器人的表現取決於其訓練數據。」若機器人未學會如何回應某些問題,可能會給出錯誤甚至危險的答案。
夏普及該領域的其他專家還列舉了AI聊天機器人的一系列潛在問題,包括如何保護人們的隱私、機器人能否識別緊急危機並提供適當幫助,以及對人們的問題做出不自然回應的可能性。
然而,這些並不完美的助手也有一些內在優勢。它們易於獲取,全天候可用,可能會使人們在討論敏感信息時感到更自在。
如今,使用者可以從眾多心理健康聊天機器人應用程式中挑選,如Woebot、Mello和Earkick等。可愛的虛擬形象往往掩蓋了其複雜的計算能力。AI聊天機器人使用自然語言處理技術,讓電腦能以人類語言進行交流。許多聊天機器人使用像ChatGPT這樣的大型語言模型,科學家利用大量數據對其進行訓練,包括網頁文本、文章和書籍等。
此外,像夏普這樣的研究人員可以利用治療師和患者之間的真實對話訓練AI,使其回應更自然。夏普最新的聊天機器人旨在支持等待飲食失調治療的患者。她在去年12月完成了一項臨床試驗,並計劃在今年初推出該聊天機器人。
聊天機器人也在心理健康的其他領域得到應用。加拿大新不倫瑞克大學的數字健康研究員盧克·麥克尼爾對患關節炎和糖尿病的人群測試了心理健康聊天機器人Wysa。在一項涉及68人的試驗中,麥克尼爾及其同事在2024年發表於JMIR Formative Research的研究報告指出,使用Wysa四周的人比使用前焦慮和抑鬱情緒有所減輕,而未使用的人則無變化。
麥克尼爾表示,人們喜歡聊天機器人的便利性,「可以對它暢所欲言,而不必擔心被評判」。但Wysa的回答可能會重複,使用者有時會覺得它不理解自己的意思。
這些發現與計算機科學家薩比拉特·魯比亞分析10款心理健康聊天機器人應用程式的6000多條用戶評論時的發現相呼應。但總體而言,魯比亞在密爾沃基馬凱特大學的團隊在2023年的報告中稱,使用者喜歡聊天機器人類人的互動方式。
魯比亞表示,這些應用程式「離完美還差得很遠」。它們的回應往往千篇一律。例如,大多數聊天機器人往往忽視人們是否有身體殘疾,這可能會讓無法進行機器人推薦的某些運動的使用者感到沮喪。而且聊天機器人對待不同年齡、性別或文化背景的人方式相同。
魯比亞認為,在聊天前要求使用者填寫問卷可以幫助聊天機器人了解對方。未來,更多聊天機器人可能會依賴ChatGPT,使對話更自然,但目前與這些聊天機器人的對話容易產生偏差且可能包含錯誤。
麥克尼爾表示,他不會在心理健康緊急情況下信任聊天機器人,因為可能會出問題。他建議:「你可能應該尋求真正的心理健康專業人士的幫助。」
夏普的團隊訓練等待名單聊天機器人,若檢測到使用者有心理健康緊急情況,會向適當的服務機構發出警報。但即便如此,人類的幫助仍有機器人無法替代之處。夏普說,如果她診室裡的患者遇到危機,她可以送他們去醫院,而聊天機器人「永遠做不到這一點」。
或許將人類和AI服務相結合是最佳選擇。患者在需要時,或有臨床醫生在場時,可以獲得臨床醫生的個人支持;其餘時間則可依靠AI聊天機器人的電子支持。夏普稱:「我很高興有這項技術,但人際接觸有著某種非常特殊的東西,我認為很難被取代。」
AI機器人能否獨立進行手術?
2049年,一小隊宇航員正在前往火星的途中,這是人類首次前往這顆紅色星球的任務。在穿梭機內部,40歲的工程師艾娃注意到自己下腹部有陣陣疼痛。起初疼痛時隱時現,但走路時疼痛加劇。她被診斷為闌尾炎。若不進行手術,艾娃可能會死亡。然而,穿梭機上沒有真人外科醫生,她的生命只能依靠人工智慧。
能在無人類監督下進行闌尾切除手術的AI機器人聽起來可能像科幻小說情節,尤其是考慮到目前的技術水平。最常用的手術機器人「達文西」仍需人類操作。約翰霍普金斯大學的醫用機器人專家阿克塞爾·克里格表示,完全自主、能切割、縫合並自行做出決策的機器人「還有很長的路要走」。但他和其他科學家、醫生正在為這樣的系統奠定基礎。
世界各地的團隊都在探索AI在手術中提供幫助的方法。許多技術輔助手段依賴於計算機視覺,這是一種能解讀視覺信息(如腹腔鏡手術的視頻畫面)的AI技術。科學家最近在一次切除患者膽囊的手術中測試了名為SurgFlow的系統。皮埃特羅·馬斯卡尼及其同事在2024年發表於《英國外科雜誌》的概念驗證演示中報告稱,SurgFlow可以識別手術步驟、跟蹤手術器械、識別解剖結構,並評估外科醫生是否完成了關鍵步驟。
法國斯特拉斯堡IHU的手術數據科學家馬斯卡尼表示,有朝一日,這樣的系統可能會成為「外科醫生的另一雙眼睛」。
在荷蘭烏得勒支的瑪克西瑪公主兒童腫瘤中心,名為Sturgeon的系統已在腦部手術中常規使用。Sturgeon並非提供另一雙眼睛,而是賦予外科醫生一種超能力:能快速翻查腫瘤的DNA,確定其亞型。這些信息有助於外科醫生在手術中確定需要切除多少組織。
病理學家通常通過顯微鏡檢查樣本鑑定腫瘤亞型,但結果可能不確定。而Sturgeon可以實時分析DNA數據並做出診斷。整個過程只需90分鐘或更短時間,足以讓外科醫生在手術中獲取並利用這些信息。烏得勒支大學醫學中心和Oncode研究所的生物信息學家耶羅恩·德·里德表示。
德·里德的團隊在2023年發表於《自然》雜誌的研究中稱,在25例手術中的18例,Sturgeon做出了正確診斷,在其餘7例中,AI放棄診斷。德·里德認為這很重要,因為做出錯誤診斷「可能是最糟糕的事情」,可能導致外科醫生切除過多腦組織,或留下部分侵襲性腫瘤。
但德·里德也清楚AI存在的風險。像Sturgeon這樣的演算法給出答案時,可能顯得非黑即白,沒有不確定性。他說:「很容易假設它是完美無缺的,但顯然並非如此。」
馬斯卡尼指出,這些缺陷很難事先確定,這是AI作為黑箱的部分問題所在。如果我們不知道系統的工作原理,就很難預測它可能如何出錯。設計能在不確定時告知使用者的AI是一種解決方案。德·里德稱,另一種方案是進行嚴格驗證。無論AI是幫助外科醫生做決策,還是完全自行做出決策,都需要驗證。
克里格花了十年時間研發一款名為「智能組織自主機器人」(STAR)的AI外科醫生。2022年,克里格及其同事報告稱,STAR可以在無人類幫助的情況下縫合活豬體內的傷口,將小腸的兩段管狀部分縫合在一起。
克里格的團隊通過將手術任務分解為步驟,然後教AI在每個步驟中正確操作機器人,從而訓練STAR。但如今,他對另一種方法感到興奮,即將ChatGPT背後的神經網絡架構與一種基於專家示範的AI訓練方法相結合。這種方法稱為模仿學習,它使AI模型能直接從視頻數據中學習。克里格的團隊去年11月在機器人學習會議上報告稱,研究人員向模型輸入「達文西」機器人提起一塊組織或打縫合結的視頻,模型就能自行掌握如何完成這些任務。
目前,該團隊正在更複雜的手術任務上測試其系統。克里格很樂觀,他表示:「我真的相信這是我們領域最有前途的未來方向。」儘管已經有一些具有一定自主性的手術程序(如改善視力的雷射矯視手術),但也許有一天,克里格的方法可以使機器人自主完成複雜手術,甚至在不同星球上也能做到。
穿戴式裝置能否預測即將出現的症狀和疾病?
60多歲的琳達退休了,她正準備去打一場晨間匹克球。
她走向球場時,衣服中織入的傳感器會跟蹤她的體溫、血壓、汗液中的化學物質以及胃腸蠕動情況。這項技術幾乎無痕,琳達甚至都沒注意到胸罩中嵌入的掃描器。
六個月前,醫生對琳達乳房中的一個腫塊進行了活檢,結果為良性,但隨後的掃描發現附近又有一個腫塊。此後,琳達一直佩戴UltraBra胸罩監測新腫塊的生長。胸罩會定期對她的乳房進行超聲檢查,內置的AI會標記任何異常情況。到目前為止,一切看起來都很好。胸罩為她節省了時間(減少了去醫生診所的次數),也讓她安心(如果AI發現可疑之處,她會盡快從醫生那裡得知)。現在,琳達可以專注於打匹克球,而不用擔心癌症問題。
這個虛構的場景(和胸罩)聽起來像是漫威電影中的情節,就像人工智慧賈維斯監測東尼·史塔克的生命體徵並診斷出焦慮症發作一樣。洛杉磯南加州大學的計算機科學家埃米利奧·費拉拉表示:「我們離那種技術水平還很遠。」但我們正邁向能提供那種個性化健康洞察的穿戴式裝置。
費拉拉稱,在不久的將來,AI設備可以像虛擬生活教練一樣,從人體發出的大量數據中挖掘信息,並將其整理成建議提供給使用者。有朝一日,人工智慧可以利用個人的實時數據,預測如果他們改變飲食、活動或睡眠習慣,六個月或一年後健康狀況可能會如何變化。
科學家們正在實驗室中探索這些想法。AI已經集成到數百萬人每天使用的Fitbit、蘋果手錶和谷歌Pixel手錶中。這些設備可以跟蹤心率、判斷你是醒著還是睡著,並識別體育活動。西雅圖的谷歌研究科學家劉鑫表示:「這些都是AI模型。」
例如,基於人類運動數據訓練的AI演算法可以將人們的活動分類,如跑步、騎自行車或步行。其他演算法則幫助從其他噪音中分離出設備試圖檢測的信號,比如某人的心跳。
劉鑫正在研究更先進的基於AI的系統。他正在探索利用大型語言模型的方法。費拉拉稱,大型語言模型「是學習數據模式的極其強大的架構」。劉鑫及其同事最近報告了一個版本的谷歌Gemini,它可以查看某人的穿戴式數據,並提供有關睡眠和健身的建議。
他的團隊還在研究一個將Gemini與其他計算工具相結合的系統,以回答有關健康的現實開放式問題,如「我在不同季節的睡眠模式是怎樣的?」以及「告訴我我上個月步數的異常情況。」劉鑫及其同事去年報告稱,在針對此類問題的測試中,回答的準確率超過80%。但他表示,研究仍處於早期階段。
劉鑫指出,與許多健康問題一樣,其中一個挑戰是「沒有唯一答案」,「有10種不同的可能解決方案,而且它們都合理」。
其他團隊也在探索用於醫療應用的AI穿戴式裝置。紐約西奈山伊坎醫學院的胃腸病學家羅伯特·赫爾滕正在研究一個模型,該模型利用Fitbit、蘋果手錶和Oura戒指收集的數據,預測某人的炎症性腸病何時可能發作。赫爾滕的團隊在2024年消化疾病周會議上報告稱,這些裝置收集的數據足以讓科學家識別患有該疾病的人的炎症。
赫爾滕表示,長期監測穿戴式數據的AI可以在症狀出現前幾周向患者發出警告。「與其等到有人出現腹瀉、出血或疼痛症狀,不如提前採取行動。」
赫爾滕指出,任何用於醫學的AI工具在現實世界中的驗證至關重要。他說:「我們需要非常確定它是可靠的,並且它提供給醫生或患者的信息是準確的。」
加拿大卡爾加里大學的生物醫學工程師烏坦達拉曼·桑達拉拉傑表示,由於我們的數字設備之間有大量健康數據流動,隱私是另一個需要謹慎對待的重要領域。個人健康數據有被黑客攻擊的風險,桑達拉拉傑稱,對數據進行加密或以其他方式保護至關重要。
人工智慧助力醫療:精準預測敗血症及其他健康風險
一位退役海軍老兵,帶著流鼻涕的曾孫去了寵物園後,覺得自己染上了感冒。小傢伙很快就康復了,但這位「曾祖父」的身體卻每況愈下。最後,他因咳嗽、發燒、肌肉酸痛和呼吸困難被送進了急診室。胸部X光檢查顯示他患上了肺炎。
一種用於分析他血液的人工智慧揭示,他有發展成敗血症的風險。敗血症是一種危及生命的病症,在這種情況下,免疫系統會對感染產生過度反應。在美國,每年有超過170萬成年人患上敗血症,如果不及時治療,這種病症可能導致組織或器官損傷、住院甚至死亡。大約35萬在住院期間患上敗血症的人死亡或被送往安寧病房。
醫生將這位「曾祖父」收治入院,並為他輸液和使用抗生素。作為備用措施,他的醫生還使用了另一種人工智慧,該人工智慧梳理了他過去和現在的電子病歷,並警告醫生,儘管進行了治療,但這名男子正接近敗血症危險區。醫療團隊為他使用了類固醇,以幫助平穩他的免疫系統。「曾祖父」最終康復,很快又和他的曾孫展開了新的冒險。
約翰霍普金斯大學懷廷工程學院的人工智慧研究員蘇奇·薩里亞表示,一些基於人工智慧的敗血症風險預測器已經在臨床中使用,或很快就會上線。其中一款由芝加哥的普雷諾西斯公司生產的預測器,於去年4月獲得了美國食品藥品監督管理局的授權。這種人工智慧的幫助非常重要,因為敗血症很難被察覺。在大多數肺炎病例中,標準檢測無法識別感染性微生物。而且,敗血症和非敗血症之間並沒有明確的界限。薩里亞說:「由於早期症狀不太為人所知,很容易被忽視。在這種情況下,每一分每一秒都至關重要。」
薩里亞創立了貝葉斯健康公司,她幫助開發了一種人工智慧,用於梳理電子健康記錄,以檢測敗血症的早期症狀。2022年,薩里亞和同事在《自然醫學》雜誌上發表報告稱,這款名為TREWS(靶向實時早期警告系統)的人工智慧,能正確識別82%的敗血症病例。
與那些醫生在收到人工智慧警報後超過三小時才做出反應的敗血症患者相比,醫生能迅速對人工智慧警報做出反應的患者,死亡可能性更低,住院時間也更短。
英弗拉瑪蒂克斯公司的聯合創始人兼首席執行官蒂姆·斯威尼表示,許多敗血症預測器都會梳理電子健康數據。另外,他的公司開發了一種機器學習血液檢測方法,目前正在接受美國食品藥品監督管理局的審查。該檢測方法可以測量白血球中的29種信使核糖核酸(作為製造蛋白質藍圖的分子),以判斷感染是細菌性的還是病毒性的,並預測患者在接下來一周內是否會患上敗血症。
斯威尼說,即使該檢測方法獲得批准,公司也需要監測其性能,並相應地更新檢測。他說:「如果沒有一種機制,以某種方式用更多數據更新演算法,那是不道德的。」政府的批准可能取決於是否有正確的更新計劃。美國食品藥品監督管理局、加拿大衛生部和英國藥品和保健產品管理局,已經就更新基於機器學習或更先進人工智慧的醫療設備達成了指導方針。
納什維爾范德比爾特大學醫學中心的生物信息學家邁克爾·馬西尼表示,人工智慧不是一勞永逸的事情。馬西尼和同事開發了一種人工智慧,用於評估醫院在預防心導管插入術後急性腎損傷方面的表現。心導管插入術是一種常用於發現和疏通阻塞動脈的手術,急性腎損傷是指腎臟從血液中過濾廢物的能力突然下降。一些研究表明,如果美國的醫院一直採用良好的預防策略,每年14萬例急性腎損傷中,大約有一半是可以避免的。
馬西尼和同事訓練了這款人工智慧,並確保它在各種環境下都能正常工作。但隨著時間的推移,馬西尼說:「我們試圖使用這些模型,但它們不斷出問題。」這是因為人工智慧訓練所使用的數據,並不總是與現實生活中遇到的數據相同。現實世界中的數據會隨著時間而變化,也就是所謂的「漂移」,因此需要更新。
但馬西尼的團隊希望避免不必要的全面修改。研究人員使用另一種人工智慧監督第一種人工智慧,當結果看起來有問題時發出警報。當新冠疫情襲擊時,監督人工智慧的價值就顯而易見了,疫情帶來了極端的數據漂移。
在疫情之前,大多數心導管插入術都是擇期門診手術,腎損傷的風險較低。但在2020年3月,馬西尼說:「數據亂套了。所有擇期(心導管插入術)都停了三、四個月。在此之後被送回心導管室的患者,與典型的普通患者大不相同。所以演算法出了問題。」但監督人工智慧發現了這個問題,科學家們進行了修正。
馬西尼說:「如果我們採用固定的策略,就會有一段時間模型完全無法使用。」
使用了這款人工智慧的醫院,急性腎損傷的發病率低於預期。但在研究結束後,這些醫院就不再使用該系統了。范德比爾特大學的信息學家、馬西尼的同事莎倫·戴維斯表示,這表明人工智慧開發者需要確保他們的系統既有用又值得信賴,並有計劃保持其可靠性。她說:「你可以開發出世界上最準確的模型,但如果我們不能很好地應用它,不能為醫護人員提供可操作的信息,那它也不會帶來任何改變。」 ——蒂娜·赫斯曼·薩伊