云時代的安全挑戰(zhàn)-運營商泄露數(shù)據(jù)隱私
安全一直是制約云計算發(fā)展的主要問題,很多企業(yè)選擇將非關鍵應用部署到公有云上,關鍵應用部署在本地私有云——對于公有云安全問題的擔憂是催生混合云的一個主要技術原因。企業(yè)對于公有云安全最根本的擔憂是云計算運營商對數(shù)據(jù)的保密問題——企業(yè)把應用和數(shù)據(jù)放到公有云上,公有云運營商泄露數(shù)據(jù),企業(yè)是無法防范的。
對于運營商保密的擔憂已經(jīng)成為云計算的時代性技術挑戰(zhàn)。云計算出現(xiàn)以來,數(shù)據(jù)的所有者和使用者正在不斷分離,越來越多的企業(yè)和政府在向云環(huán)境遷移,將系統(tǒng)和數(shù)據(jù)托管在第三方云平臺上。
同態(tài)加密是目前被認為解決這個問題最好、最有前景的技術。
同態(tài)加密——過程加密
同態(tài)加密(Homomorphic encryption,HE)是基于數(shù)學難題中計算復雜性理論的密碼學技術,其目的是解決外包計算(outsourced computation)中數(shù)據(jù)隱私和安全保密問題。同態(tài)加密的直觀定義是一種數(shù)據(jù)加密形式,它允許人們對加密的數(shù)據(jù)進行特定的代數(shù)運算得到加密的輸出,將加密的輸出解密所得到的結果與對明文進行指定的運算結果一致。一個同態(tài)加密方案包含四個過程:
(1) 同態(tài)加密系統(tǒng):系統(tǒng)管理者生成各過程所需的參數(shù)和密鑰,建立同態(tài)加密系統(tǒng)。
(2) 明文加密過程:數(shù)據(jù)擁有者利用公鑰對明文數(shù)據(jù)進行加密獲得密文,以保護數(shù)據(jù)隱私。
(3) 密文計算過程:數(shù)據(jù)處理者利用公鑰對密文進行同態(tài)計算獲得密文輸出。
(4) 密文解密過程:數(shù)據(jù)擁有者利用私鑰對密文輸出進行解密獲得計算結果。
通俗的說,使用云計算的過程,相當于消費者把黃金(數(shù)據(jù))交給金匠加工(計算)成為首飾(結果)的過程。消費者帶著的原材料去首飾店交付(外包)給工匠做首飾,又不希望工匠看到自己的原材料具體是什么,以防暴露自己的財產(chǎn)。這時候消費者就需要一個特殊的盒子(同態(tài)加密系統(tǒng)),將自己的原材料裝進盒子里面并鎖住(明文加密)。這個盒子只有消費者自己的鑰匙能打開,工匠也可以通過盒子上兩個不透光的孔將手和工具伸入里面對原材料進行加工(密文計算),但是從盒子外面是看不到里面任何物體。工匠在盒子里面加工完成后,消費者將盒子打開(密文解密)拿到自己想要的首飾。
同態(tài)的應用-云、區(qū)塊鏈、AI……
同態(tài)加密仍然是一個非常新穎和前沿的領域,其理論在1978 年首次推出,被認為是密碼學領域的圣杯之一,直到目前為止仍像傳奇一樣遙不可及。最近的重要發(fā)展是計算機科學家Craig Gentry在2009年博士論文中首次提出數(shù)字領域的第一個全同態(tài)加密(Fully Homomorphic Encryption,F(xiàn)HE)方案。
同態(tài)加密解決了數(shù)據(jù)計算與數(shù)據(jù)所屬主體不一致造成的隱私安全問題。因此,該技術能夠應用在所有計算服務和數(shù)據(jù)所屬主體不一致的場景中,例如:云計算的外包服務、人工智能的訓練與推理、區(qū)塊鏈的去中心化、物聯(lián)網(wǎng)的數(shù)據(jù)采集與處理、政治投票與選舉等。以下重點介紹同態(tài)加密在深度學習和區(qū)塊鏈中的應用及其作用。
深度學習作為人工智能領域的重要研究和應用方向,近年來在算法、數(shù)據(jù)和算力三大引擎的驅(qū)動下得到飛速發(fā)展。數(shù)據(jù)作為AI的重要驅(qū)動力之一,隱私和安全也就成為一項關鍵挑戰(zhàn),其中包括訓練數(shù)據(jù)安全、推理數(shù)據(jù)隱私以及模型應用保密。很多公司都在出售標記數(shù)據(jù),但是這些數(shù)據(jù)被AI算法公司買去以后做什么用幾乎沒法控制。今年6月,微軟刪除了全球規(guī)模最大的人臉識別數(shù)據(jù)庫MS Celeb,一個直接原因就是無法控制數(shù)據(jù)的使用。
現(xiàn)在AI正處于起步階段,未來隨著AI產(chǎn)業(yè)分工的不斷細化,在AI應用過程中保護數(shù)據(jù)安全和數(shù)據(jù)隱私也將成為一個普遍性的行業(yè)問題。顯然同態(tài)加密技術非常適合解決這一問題,同態(tài)加密技術可以在密文狀態(tài)下執(zhí)行深度學習神經(jīng)網(wǎng)絡的模型訓練、數(shù)據(jù)推理和保密應用,AI將是同態(tài)加密的一個熱點應用領域。
區(qū)塊鏈被作為我國核心技術自主創(chuàng)新的重要突破口,正在金融、供應鏈、公共安全、物聯(lián)網(wǎng)等領域發(fā)揮著越來越重要的作用。金融領域的區(qū)塊鏈+支付(國際清結算)、區(qū)塊鏈+保險理賠、區(qū)塊鏈+交易所、區(qū)塊鏈+數(shù)字資產(chǎn)等應用使得價值交互過程中人與人之間的信任關系能夠轉(zhuǎn)換為人與技術的信任。然而,區(qū)塊鏈在應用過程中的信任尚不完整,尤其缺乏對用戶隱私的保護。例如,區(qū)塊鏈+支付應用中,驗證交易有效性的同時會造成交易數(shù)據(jù)、交易賬戶(或匿名賬戶)等內(nèi)容的泄露。因此,區(qū)塊鏈應用中存在有效性驗證與數(shù)據(jù)隱私保護之間的矛盾。而同態(tài)加密的應用就能夠提供隱私保護的區(qū)塊鏈實現(xiàn)方法,在保證區(qū)塊鏈有效性得到驗證的同時實現(xiàn)區(qū)塊鏈數(shù)據(jù)的隱私保護。
浪潮對于同態(tài)加密的研究和應用
作為未來最具潛力的數(shù)據(jù)隱私保護解決方案,在同態(tài)加密的應用和理論研究過程中,浪潮在努力為其發(fā)展和成熟貢獻自己的力量。
應用研究方面,浪潮對當前各個同態(tài)加密的開源實現(xiàn)進行了跟蹤和研究,包括IBM的HElib和Microsoft的SEAL同態(tài)計算實現(xiàn)。目前,同態(tài)加密的應用面臨兩個關鍵瓶頸問題:一是復雜度高、計算效率低,二是可支持的同態(tài)計算操作少。正是由于同態(tài)加密技術在計算復雜性與同態(tài)安全性上的特點,吸引了越來越多的力量投入到其應用的探索研究中。另外,在隱私保護的深度學習領域浪潮重點跟蹤Intel提出的nGraph HE-Transformer:利用Microsoft的SEAL作為后端基礎技術,實現(xiàn)前端不同深度學習框架對同態(tài)加密計算的無縫調(diào)用,以保護人工智能應用中的數(shù)據(jù)隱私。然而,在研究過程中發(fā)現(xiàn),隱私保護的深度學習技術距離真正的商用還有很長的路要走,最為關鍵的就是在推理階段的計算延時達幾分鐘之久。因此,浪潮現(xiàn)階段正在致力于研究利用異構加速平臺提高 HE-Transformer的計算效率,以達到可以接受的計算和響應延時。
理論研究方面,浪潮一直關注國際最前沿的密碼學和信息安全發(fā)展,跟蹤各大頂級會議(例如Crypto、EuroCrypto、AsiaCrypto以及CF等)最先進同態(tài)加密的研究進展。同時,浪潮也在緊密聯(lián)系國內(nèi)各大高校的研究團隊(例如密碼科學技術國家重點實驗室、中科院信工所、浙江萬里學院、北京郵電大學、電子科技大學等),爭取更多的合作機會為同態(tài)加密在國內(nèi)的發(fā)展、實現(xiàn)和標準化做出自己的貢獻。此外,浪潮也在踐行自己的科研使命,力爭在已有方法的基礎上,開拓新的研究思路,突破舊的應用瓶頸,例如:針對深度學習圖像識別和分類應用中的數(shù)據(jù)特征,設計和實現(xiàn)既能滿足其安全和精度要求,又能保證性能的新方法和新技術。
展望
現(xiàn)在,正處于IT技術和應用的變革期,云、大數(shù)據(jù)、人工智能等技術的發(fā)展讓人類社會從信息化向智能化升級,數(shù)據(jù)作為當今信息化和未來智能化時代的關鍵生產(chǎn)資料已經(jīng)成為個人、組織和國家的重要經(jīng)濟資產(chǎn)和核心戰(zhàn)略資本。當前,保護數(shù)據(jù)的隱私和安全已經(jīng)成為全社會亟需且亟待解決的重要問題,因此同態(tài)加密的瓶頸一旦被突破,一定會擁有廣闊的前景!