當前位置:
首頁 > 科技 > 突破工業資料瓶頸!新特徵選取法提升小樣本分析效能

突破工業資料瓶頸!新特徵選取法提升小樣本分析效能

在工業資料分析領域,一項突破性的研究成果正引起廣泛關注。由中國科學院寧波材料技術與工程研究所的研究團隊所開發的新型特徵選取方法,透過消除互資訊中的噪聲熵,為小樣本工業資料分析帶來了革命性的進展。這項研究成果已發表於《IEEE工業資訊學報》上。

特徵選取在機器學習與資料探勘中扮演著關鍵角色,其目的在於透過去除不相關或多餘的特徵來降低維度,從而提升模型效能。然而,工業資料往往具有樣本量小、維度高的特性,這不僅導致計算成本高昂,更增加了過度擬合的風險。傳統方法在處理這類資料時,特別是面對感測器噪聲時,往往難以維持準確度,因為噪聲會扭曲互資訊指標,降低分類效能。

為解決這些挑戰,研究團隊提出了一種創新方法,將特徵噪聲建模為截尾正態分佈。他們利用最大熵原理,透過求解傳輸中的方差方程來確定噪聲的熵。此外,研究人員開發了一種無噪聲的互資訊指標,用於評估標籤與受噪聲汙染特徵之間的相關性。這種方法在保留噪聲樣本的同時,消除了互資訊中未知特徵噪聲的熵,從而有效去除噪聲對小樣本分類的影響。

與傳統技術相比,該方法能夠更可靠地評估所有噪聲樣本中的噪聲。在此基礎上,研究人員提出了一項新標準——最大無噪聲相關性與最小冗餘(MNFR-MR),確保了特徵選取的穩健性。這種方法特別適用於樣本量受限的工業資料處理場景,為解決這一關鍵瓶頸提供了有效方案。

隨著工業物聯網(IIoT)和數位孿生等資料驅動技術在產業中的應用日益廣泛,這項方法在挖掘可操作見解和提升各領域決策效能方面展現出巨大潛力。這項研究不僅推進了對噪聲高維資料集中特徵選取的理論理解,更為實際工業應用提供了實用解決方案,為更準確、高效的資料驅動智慧鋪平了道路。

這項突破性的研究成果,將為工業資料分析領域帶來深遠影響,特別是在樣本量受限的情況下,為企業提供更精準的資料洞察,助力產業智慧化轉型。隨著技術的不斷發展,這項方法有望在更多工業場景中發揮重要作用,推動資料驅動決策的革新。