守護聲音隱私:Kirigami技術讓智慧裝置兼顧實用與安全
聲音蘊含豐富的資訊寶藏。透過演演算法訓練辨識特定聲紋,連你在廚房炒菜、用吸塵器打掃或洗碗的日常活動都能被偵測。這種技術雖然在特定情境下極具價值,卻也引發隱私疑慮——畢竟麥克風可能竊取我們最私密的對話。
為解決這個難題,卡內基美隆大學研發團隊開發出名為「Kirigami」的嵌入式過濾技術。這項創新能在音訊感測器進行活動辨識前,即時偵測並刪除錄到的人聲片段,從源頭守護隱私。
「聲學資料能驅動許多實用功能,像活動追蹤、健康監測甚至環境感知。但這些資料同時可能侵犯個人隱私。」剛取得軟體與社會系統博士學位的蘇德山·布瓦拉加凡解釋:「Kirigami能安裝在各式感測器上,在資料傳出裝置前就過濾人聲,建立隱私防火牆。」
現有音訊隱私技術多透過頻譜調整或訓練系統忽略人聲來處理,雖然能讓對話難以辨識,但像OpenAI的Whisper這類AI語辨系統,仍可能從處理過的音訊中拼湊出對話片段。「這些模型擁有海量資料,舊技術殘留的零星語音碎片,都可能被用來重建內容。」跨領域副教授雅夫拉吉·阿加瓦爾指出:「Kirigami能徹底阻斷AI取得這些碎片。」
當今智慧喇叭等裝置往往重功能輕隱私,形同全天候監聽。雖然最極端的解決方案是禁用麥克風,但這也會讓人們錯失聲音感測的便利。阿加瓦爾團隊因此致力開發能平衡隱私與效能的解決方案。
研究團隊設計出連最基礎的微控制器都能執行的輕量過濾器,直接在裝置端(edge computing)識別並刪除疑似語音內容。這個二元分類器是透過分析深度學習語辨模型的語音洩漏率所開發,並提供可調閾值——高敏感設定能徹底清除人聲,但可能誤刪有用環境音;低敏感設定雖保留更多活動音訊,卻增加語音外流風險。
「Kirigami精準切除大部分語音,同時保留活動辨識所需的環境音。」主導研究的周浩哲博士候選人補充:「還能搭配既有技術強化隱私防護。」目前這項技術正應用於失智症患者的日常提醒、過動症兒童行為監測等醫療場景,梅安克·高爾教授強調:「全球有無數類似情境需要非侵入式的日常生活監測。」
隨著智慧家庭與物聯網蓬勃發展,研究團隊相信開發者能輕鬆調整Kirigami來滿足各類隱私需求。相關論文已發表於《ACM互動移動穿戴普適技術匯刊》及第30屆國際移動計算會議。
[end]