AI語音助手「Speak Ease」:讓語言障礙者重拾自然表達
全球有超過2.5億人因語言障礙而難以使用自動語音辨識(ASR)技術。對他們來說,即便是簡單地透過ASR表達晚餐想吃什麼,都可能成為一場挑戰。傳統的ASR系統不僅操作繁瑣,生成的語音也缺乏情感,無法反映使用者的真實情緒。更令人困擾的是,當溝通工具聽起來像機器,甚至完全無法運作時,使用者可能會擔心自己的個性被誤解。
為此,東北大學的研究團隊正在開發一款名為「Speak Ease」的AI整合應用程式,旨在為語言障礙者提供更自然的溝通方式。這款應用程式結合了語音辨識、文字輸入、整詞選擇、表情符號以及個人化文字轉語音合成等多種功能,讓使用者能夠更流暢地表達自己。
「目前,人們要麼單獨使用語音辨識,要麼單獨使用文字轉語音,或者單純打字,」研究團隊成員Aanchan Mohan教授表示,「沒有人將這些功能整合在一起。」Speak Ease的獨特之處在於,它不僅能預測使用者的下一句話,還能讓使用者以自己選擇的情緒和語調進行溝通,真正實現個性化表達。
研究團隊的另一位成員Mirjana Prpa教授指出,現有的技術大多專注於提升速度,而忽略了表達性的重要性。「我們的研究目標是讓語音聽起來符合使用者的期望,而不僅僅是快速完成溝通。」
Speak Ease屬於輔助與替代性溝通軟體(AAC),強調語境感知和真實性。使用者可以編輯轉錄內容以修正錯誤,而AI則會根據上下文建議相關詞句,並提供情感語調的選項。此外,應用程式還能根據使用者的語音樣本,將非典型語音轉換為更易理解的版本。
這款應用程式在開發過程中得到了語言病理學家的協助,他們強調,使用者需要的是強調表達性而不僅僅是速度的數位工具。透過焦點小組評估,研究團隊發現Speak Ease能夠透過提供更多個性化溝通方式來增強表達性。
對於患有退化性疾病或中風後康復的人來說,Speak Ease更是一大福音。Prpa教授表示,儲存的語音樣本可以讓使用者在溝通能力逐漸喪失的情況下,繼續以他們希望的方式「說話」。同樣地,對於正在恢復語言能力的人,這款應用程式也能提供支援。
除了提升表達性,Speak Ease還致力於提供清晰度。例如,在醫療場景中,許多語言障礙者難以被醫護人員理解。Mohan教授舉例:「假設一位唐氏症患者正在描述病情,醫護人員可能會禮貌地請他重複,因為他們沒有聽懂。」Speak Ease則能提供即時轉錄,並以使用者的語音朗讀,確保溝通無礙。
儘管這項技術面臨挑戰,但研究團隊的目標是捕捉轉錄內容與最終表達之間的差異,並利用這些資料來訓練系統,使其更加精準。Speak Ease的推出,將為語言障礙者帶來全新的溝通體驗,讓他們能夠更自信地表達自己。