當前位置：

首頁 > 科技 > 突破性多模態AI技術：打造更精準的英語口說能力評估系統

突破性多模態AI技術：打造更精準的英語口說能力評估系統

科技 06-09

在當今全球化時代，流利的英語口說能力已成為學術與職場成功的關鍵要素。傳統上，這項能力的評估往往依賴耗時且成本高昂的人工測驗。然而，隨著人工智慧技術的快速發展，自動化英語口說評量系統正逐漸受到全球研究者的重視。

日本先進科學技術研究所（JAIST）的岡田教授研究團隊，在助理教授Candy-Olivia Mawalim的帶領下，開發出一套革命性的多輸出學習框架。這項發表於《Computers and Education: Artificial Intelligence》期刊的研究成果，能夠同時評估英語口說能力的多個面向，突破了傳統單一模態評估的限制。

研究團隊採用Vericant公司提供的獨特語料庫，該資料集收錄了9至16歲青少年在升學面試中的即時對話紀錄，包含同步錄製的語音、影像及文字轉錄內容。特別值得一提的是，這些資料均由美國教育測驗服務社（ETS）專家進行評分，為多模態分析提供了堅實基礎。

Mawalim博士指出：「我們的框架能整合口說能力的各個層面，包括語調變化等聲學特徵、面部表情等視覺線索，以及話輪轉換等語言模式。相較於單一模態方法，這種多模態策略大幅提升了預測準確率，使用LightGBM演演算法可達到約83%的整體評分預測準確度。」

研究團隊還發現，應試者的初始發言內容對整體表現預測具有重要意義。此外，面試官的說話方式、性別差異，以及面試形式（現場或遠距）等因素，都會顯著影響應試者的回答連貫性。

岡田教授強調：「這項研究不僅能幫助學生提升英語能力，更能讓教師根據個別需求調整教學方式。隨著AI技術的快速發展，多模態評估很可能在不久的將來成為教育現場的標準配備。」

Mawalim博士補充說明：「這項技術的應用將超越語言能力評估，未來可望發展出更智慧化的學習工具，幫助學生培養公開演說、簡報技巧等人際溝通軟實力，為教育與職場帶來革命性的變革。」

[end]