全新AI模型精準辨識網路惡意留言,準確率高達87%
科技
03-05
電腦科學家近日開發出一款強大的機器學習模型,能夠以驚人的準確度辨識社群媒體上的惡意留言,為打造更安全的數位互動環境鋪路。這項由澳洲與孟加拉研究團隊共同開發的模型,無需人工辨識即可將文字分類為惡意與非惡意,準確率達87%。這項研究成果已於2024年國際資訊、計算與技術創新與智慧會議上發表。
來自孟加拉東西方大學與南澳大學的研究人員表示,該模型較現有的自動偵測系統有所改進,許多現有系統容易產生誤判。研究團隊首席作者、資料科學專家Afia Ahsan女士指出,近年來網路霸凌與仇恨言論的激增,已導致嚴重的心理健康問題、自殘行為,甚至極端情況下的自殺事件。
「儘管社群媒體平臺努力限制惡意內容,但由於全球56.6億網路使用者產生的龐大互動量,人工辨識有害留言顯得力不從心,」她表示,「從網路平臺移除惡意留言對於遏制日益嚴重的網路濫用行為,並確保社群媒體空間的尊重互動至關重要。」
南澳大學資訊科技與人工智慧研究員Abdullahi Chowdhury博士指出,研究團隊在從Facebook、YouTube和Instagram等社群媒體平臺收集的英文與孟加拉文留言資料集上測試了三種機器學習模型。其最佳化演演算法達到了87.6%的準確率,優於其他模型的69.9%(基準支援向量機)和83.4%(隨機梯度下降模型)。
「我們最佳化的支援向量機模型在三者中最為可靠有效,因此在需要精準分類惡意留言的實際應用場景中成為首選,」Chowdhury博士表示。未來研究將著重於整合深度學習技術來改進模型,並擴充套件資料集以包含更多語言與地區方言。研究團隊目前正與社群媒體公司及線上平臺探討合作,以實際應用這項技術。