當前位置:
首頁 > 科技 > 雙域架構:運行神經網路能效提升近40倍

雙域架構:運行神經網路能效提升近40倍

許多傳統電腦架構在應付基於機器學習模型的運算需求方面顯得力不從心。近年來,一些工程師便著手設計更適合運行這些模型的替代架構。

在運行人工神經網路(ANNs)方面,所謂的「記憶體內運算」(CIM)系統是頗具潛力的解決方案之一。這些系統旨在於單一硬體系統中處理和儲存資料,能夠降低功耗並提升基於ANN模型的效能。

CIM系統大致可分為兩大類:數位CIM(DCIM)和類比CIM(ACIM)系統。清華大學的研究人員在《自然電子學》期刊發表的一篇論文中,提出了一種新型的雙域ACIM系統,該系統能更高效地運行ANNs,同時提升其在一般推理任務中的表現。

論文第一作者王澤向《科技探索》表示:「神經網路運算的ACIM研究已受到相當關注,但進展主要集中在分類任務(如圖像分類)。截至目前,ACIM在處理複雜迴歸任務(如用於物件偵測的YOLO)時仍面臨重大挑戰,主要有兩大限制。一是運算雜訊高,二是浮點(FP)資料相容性問題,這使得它不適用於通常需要高精度FP運算的迴歸任務。」

為克服ACIM系統常見的挑戰,王澤及其團隊設計了一種新型混合架構,將高精度FP相容的數位運算與良好的能源效率相結合。研究發現,他們提出的架構在運行神經網路方面很有前景,還能讓這些網路完成一般推理任務。

王澤解釋道:「ACIM在執行高度並行且高能效的矩陣乘法方面表現出色,這是神經網路中廣泛使用的基本運算,相比數位運算具有顯著優勢。ACIM基於基爾霍夫電流定律和歐姆定律,直接在類比域中執行基於電壓的乘法和基於電流的求和。然而,製造差異會引入運算雜訊,影響神經網路運算的準確性。」

除了容易引入影響ANNs準確性的雜訊外,到目前為止,ACIM系統主要應用於涉及線性乘法和加法的任務。相反,它們迄今被發現與FP運算不相容,FP運算是在所謂的FP數(即數字的運算表示)上執行的更複雜的數學運算。

王澤寫道:「我們首次在真實的ACIM系統上展示了一個完全硬體實現的多目標、多類別物件偵測任務——YOLO(你只看一次)。這是一個重要的里程碑,將ACIM的能力從僅支援分類任務擴展到完全支援具有FP資料流的一般神經網路推理。」

王澤及其團隊在一系列測試中評估了他們的架構,發現其能源效率非常出色,比運行基於ANN模型的普通FP - 32乘法器高出39.2倍。研究人員還根據他們的設計製作了一個基於憶阻器的運算系統原型,發現其精度很高(平均比純ACIM系統高出2.7倍)。

這項最新研究可能會激發其他混合ACIM架構的發展,使其更適合在複雜運算任務中運行基於機器學習的模型。與此同時,王澤及其團隊計劃在現有架構基礎上繼續改進,進一步提高其精度和能源效率。

王澤補充道:「我們目前的工作仍有很大的探索和改進空間。未來的研究將聚焦於架構、演算法和硬體的共同設計與優化,以提高混合類比 - 數位運算系統的能源效率和準確性。最終,我們的目標是支援更廣泛的神經網路運算,開闢新的應用場景。」