當前位置:
首頁 > 科技 > AI 食物掃描器:手機拍照即時分析營養成分

AI 食物掃描器:手機拍照即時分析營養成分

想像一下,只需拍下你的餐點照片,人工智慧便能立即告訴你它的卡路里、脂肪含量和營養價值,再也不需要手寫飲食日記或靠猜測來管理飲食。這樣充滿未來感的場景,如今已離我們不遠。紐約大學坦登工程學院的研究團隊開發出一套 AI 系統,為數百萬想要控制體重、管理糖尿病或其他飲食相關健康問題的人提供了一項全新工具。

這項技術的詳細內容已發表於第六屆 IEEE 國際行動計算與永續資訊學會議。它利用先進的深度學習演演算法,辨識照片中的食物並計算其營養成分,包括卡路里、蛋白質、碳水化合物和脂肪。研究團隊的靈感來自於對消防員健康問題的關注。多項研究顯示,73% 至 88% 的職業消防員以及 76% 至 87% 的志願消防員面臨過重或肥胖問題,這增加了心血管疾病和其他健康風險,影響了他們的執勤能力。這些發現直接促成了這套 AI 食物追蹤系統的開發。

「傳統的飲食追蹤方法依賴於自我報告,但這種方式往往不可靠,」紐約大學坦登工程學院機械工程系副教授 Prabodh Panindre 表示。「我們的系統消除了人為誤差。」儘管概念看似簡單,但開發可靠的 AI 食物辨識系統多年來一直困擾著研究人員。過去的研究面臨三大挑戰,而紐約大學坦登團隊似乎已成功克服。

「食物的視覺多樣性令人驚嘆,」紐約大學阿布達比分校機械工程教授 Sunil Kumar 解釋道。「與外觀標準化的工業製品不同,同一道菜可能因烹飪者的不同而呈現截然不同的樣貌。例如,不同餐廳的漢堡外觀差異極大,而家庭自製版本更增加了辨識的複雜性。」此外,過去的系統在估算食物份量時也常出錯,而這正是計算營養成分的關鍵因素。紐約大學團隊的突破在於其體積計算功能,利用先進的影像處理技術精確測量每種食物在盤子中佔據的區域。

這套系統將每種食物的佔據面積與密度和巨量營養素資料相結合,將二維影像轉化為營養評估。這種體積計算與 AI 模型的整合,解決了自動化飲食追蹤中的長期難題,無需手動輸入即可進行精確分析。第三個挑戰是運算效率。過去的模型需要過多的處理能力,難以實現即時應用,通常需要依賴雲端運算,這不僅帶來延遲,還引發了隱私問題。

研究人員使用名為 YOLOv8 的強大影像辨識技術,並結合 ONNX Runtime(一種提升 AI 程式運算效率的工具),打造了一套食物辨識程式。這套程式以網站形式執行,而非下載式應用程式,使用者只需透過手機瀏覽器訪問網站,即可分析餐點並追蹤飲食。在測試中,系統對一片披薩的分析結果為 317 卡路里、10 克蛋白質、40 克碳水化合物和 13 克脂肪,與參考標準非常接近。對於更複雜的菜餚,如南印度特色料理 idli sambhar(蒸米糕配扁豆燉菜),系統同樣表現出色,計算出 221 卡路里、7 克蛋白質、46 克碳水化合物和僅 1 克脂肪。

「我們的目標之一是確保系統能適用於各種菜系和食物呈現方式,」Panindre 表示。「無論是熱狗(系統計算為 280 卡路里)還是中東甜點 baklava(系統辨識為 310 卡路里和 18 克脂肪),我們都希望系統能保持精確。」研究人員透過合併相似的食物類別、剔除樣本過少的食物型別,並在訓練過程中對某些食物給予額外關注,解決了資料挑戰。這些技術使訓練資料集從無數初始影像精簡為 95,000 個例項,涵蓋 214 種食物類別。

系統的技術效能指標令人印象深刻:在 IoU(交併比)閾值為 0.5 的情況下,系統的平均精度(mAP)達到 0.7941。這意味著 AI 能夠在大約 80% 的情況下準確定位和辨識食物,即使食物重疊或部分被遮擋。這套系統已部署為可在行動裝置上執行的網頁應用程式,任何擁有智慧型手機的人都能輕鬆使用。研究人員將目前的系統描述為「概念驗證」,並表示它很快就能進一步完善,應用於更廣泛的健康照護領域。

除了 Panindre 和 Kumar,這篇論文的作者還包括紐約大學坦登工程學院電腦科學與工程系的碩士生 Praneeth Kumar Thummalapalli 和 Tanmay Mandal。