雲端運算:邁向安全儲存與經濟運算之路
如今,無論是個人還是企業,將資料儲存於雲端已成為常態。然而,網路安全風險依舊存在,尤其是在安全處理使用者驗證和存取控制方面。研究人員正開發新方法,以安全且具成本效益的方式儲存資料,並透過直接對加密資料進行運算,有效利用這些資料。
雲端運算對現代商業運作而言不可或缺,但也因大量敏感資料線上儲存,而成為網路攻擊的主要目標。目前,超過90%的組織依賴雲端服務進行關鍵業務,全球有超過36億活躍的雲端使用者,相當於全球47%的人口在使用雲端服務,凸顯出對雲端的高度依賴。
遺憾的是,這種對雲端運算的依賴伴隨著更高的風險。資料外洩事件在頻率和嚴重程度上都在攀升。根據2024年泰雷茲雲端安全研究報告,44%的企業表示其雲端環境曾發生過外洩事件,其中14%是在過去12個月內發生的。
隨著組織將更多敏感資料遷移至雲端(近一半的雲端儲存資料被列為敏感資料),網路罪犯的攻擊面也隨之擴大。這使得外洩事件不僅更為常見,而且破壞性更大,因為敏感資訊的遺失可能會造成深遠影響,包括重大的財務損失和聲譽受損。2024年,全球資料外洩的平均成本估計達到488萬美元。
目前,所謂的「客戶端加密」在雲端資料儲存的資料安全和隱私保護方面頗有成效。然而,要讓加密資料真正發揮作用,在對其進行實際安全運算方面仍有很長的路要走。我們仍面臨著顯著的可擴充套件性和效能障礙。研究人員持續探索彌合這一差距的方法,使可擴充套件、保護隱私的運算對大規模應用而言更加高效和可行。
使用者驗證和存取控制是防止資料外洩的關鍵機制。使用者驗證,即驗證試圖存取雲端資源的使用者身份的過程,是第一道防線,但它被廣泛認為是安全鏈條中最薄弱的一環。據估計,81%與駭客攻擊相關的外洩事件都是利用了被盜或弱密碼。儘管近年來使用者驗證技術有了很大發展,但針對使用者驗證的攻擊手段也在不斷演變。
存取控制,即規範誰可以檢視、使用或與雲端資源(如資料、應用程式或服務)進行互動的過程,是第二道防線。有效的存取控制可確保只有授權的使用者或裝置擁有存取特定資源的適當許可權,從而降低安全風險,防止未經授權的存取或濫用雲端資產。
在如今的雲端運算環境中,雲端伺服器全權負責正確執行存取控制策略。因此,由於人為錯誤或軟體漏洞導致的伺服器配置錯誤,或因惡意攻擊導致的伺服器被入侵,都可能導致嚴重的外洩事件。事實上,美國國家安全域性(NSA)認為配置錯誤是雲端環境中的主要漏洞。
資料可以在終端使用者裝置上進行加密和解密,再上傳至雲端或從雲端下載。這種方法可確保資料在傳輸和儲存過程中都處於加密狀態,使任何沒有解密金鑰的人(包括服務提供商和其他潛在攻擊者)都無法存取資料。只要終端使用者妥善保管解密金鑰,即使使用者的雲端帳戶和雲端伺服器被入侵,資料的安全性和隱私性也能得到保障。
現有的雲端運算客戶端加密解決方案可以使用私鑰或公鑰。例如,谷歌工作空間客戶端加密使用線上金鑰分發伺服器,在授權使用者之間進行分發,以實現資料加密和共享。然而,線上金鑰分發伺服器可能成為安全和效能的瓶頸。為此,另一款客戶端加密服務MEGA使用公鑰加密,因此不需要線上金鑰分發伺服器。但它需要複雜的公鑰憑證管理,因為公鑰加密的數量與共享檔案的潛在資料使用者數量成正比,這使得該策略難以擴充套件。
假設一家醫院想將患者的電子病歷外包給雲端儲存,並希望制定特定的存取政策。在將病歷外包之前,醫院可能會指定只有某大學醫院的心臟病專家,或生命科學研究所的科學家才能存取這些病歷。我們用「CT」表示加密的病歷,用「AP」 = (心臟病專家 AND 大學醫院) OR (科學家 AND 生命科學研究所)表示存取政策。CT和AP在加密上繫結在一起,並上傳至雲端儲存。只有屬性符合AP的使用者才能解密CT,獲得解密後的病歷。
這是一個可擴充套件的加密系統,因為其存取政策無需列出每一個可以存取資料的授權使用者,只需列出潛在使用者的屬性。加密資料的存取控制(即解密)不是由雲端伺服器執行,而是透過理論上被證明安全的加密和解密演演算法來實現。
此類已部署系統的主要效率缺點之一是,對於資源有限的裝置而言,解密的計算成本很高。為瞭解決這個問題,我們提出了一種協定,透過將大部分解密工作負載外包給公共雲端伺服器,將終端使用者的解密效率提高了兩個數量級。
部署中的另一個關鍵問題是「使用者撤銷」:只要使用者離開系統、更換職位或遺失現有的私鑰,就必須撤銷該金鑰,以防止未經授權的使用者存取敏感資料。目前的系統大多使用時間戳來阻止被撤銷的使用者解密新內容,但時間戳需要定期更新,這在大型系統中可能會導致計算負擔過重。我們提出了基於硬體的可撤銷屬性加密方法,以降低撤銷成本。
理想情況下,伺服器應該能夠在不解密加密資料的情況下對其進行有意義的運算,在每一個步驟都保護隱私。這就是所謂的「全同態加密」發揮作用的地方。它是一種前沿的加密技術,可讓伺服器直接對加密資料執行數學運算(具體而言是加法和乘法),而無需解密。
然而,由於「雜訊」(即加密運算引入的不需要的、看似隨機的資料)會威脅到結果的完整性,目前最先進的系統對於大規模運算而言並不實用。需要頻繁進行減少雜訊的程式,而這又是一種計算成本很高的方法,尤其是對於大型資料集而言。
我們針對加密資料的安全運算提出的新方法,允許進行無限次的算術運算,而無需進行「自舉」(即降低雜訊的數學運算),在各種安全運算任務(如保護隱私的人員重新識別)中都取得了卓越的效能。