螞蟻集團韋韜:數據密態是數據要素產業安全發展的關鍵技術路徑
1 月 11 日,在 機器之心 AI 科技年會上,螞蟻集團副總裁、首席技術安全官韋韜帶來了《擁抱數據密態 助力數實融合》的主題演講,分享了關于數據要素價值、數據安全與數據密態、隱私計算技術、數實融合等各方面的觀點。
韋韜認為,安全和發展在數據要素產業中是需要協同與平衡的兩個關鍵要素,數據安全是數字化持續升級的根基,離開安全談發展是不可行的;同時,數據安全的行業落地也需要有一個漸進的實現路徑,不能離開發展階段孤立的談安全。另一方面,數據要素產業要進一步發展也必然會與實體經濟緊密結合,數實融合將為數據要素產業的發展提供更大的空間。
韋韜提出,行業數字化發展正在呈現新的趨勢,我們正在邁入前所未有的數據密態時代。“數據密態” 是指在數據進入流轉進行共享、計算直到銷毀的完整傳播鏈路中,保持數據處于加密狀態不出現明文,將數據持有權與使用權分離,實現數據使用權的跨域管控,以確保數據流轉的全程安全可控。以隱私計算技術為代表的數據密態技術,是確保數據要素有效流轉,發揮數據要素市場價值的重要技術手段。我們展望未來,數據密態是數據要素產業安全發展的關鍵技術路徑。
以下為演講全部內容:
數據安全是數字化升級的基石
隨著全球數字經濟的發展,海量數據正在以空前的速度爆發式增長,數據將成為數字經濟發展的新動能。在我國,數據被列為了土地、勞動力、資本和技術之后的第五大生產要素。這意味著,作為一種生產要素形態,數據將參與市場化配置、交易和分配,并參與到產業數字化升級的全過程。
數據要素行業的健康發展成為實現數字化升級、助力實體經濟的關鍵所在,這主要體現在安全和發展兩大方面。
首先,數據安全是數字化持續升級的根基,離開安全談發展是不可行的。同時,數據安全的行業落地也需要有一個漸進的實現路徑,不能離開發展階段孤立的談安全。過去幾年,我國相繼出臺了《數據安全法》、《個人信息保護法》、《密碼法》、《民法典》等多部數據安全相關的法律法規,構建了數據安全法律體系。政策的落定為數據要素行業的發展提供了法律尺度,使得數據要素在發展中有法可依、健康發展成為可能。
同時,數據要素產業要進一步發展也必然會與實體經濟緊密結合,數實融合將為數據要素產業的發展提供更大的空間。只有把數據作為一項生產要素,深度融合到新業態、新模式中,才能帶來產業數字化的騰飛;實體經濟也會借助數據價值的發揮實現數字化升級,數字經濟與實體經濟的融合程度也將走向更加深入,實現真正的 “數實融合”。
當前,從政策、技術發展程度來看,數據要素市場迎來前所未有的發展機遇。我國出臺了多個關于促進數據要素的文件,特別是 2022 年 12 月 19 日,中共中央 國務院印發了《關于構建數據基礎制度更好發揮數據要素作用的意見》(即 “數據二十條”)。這是我國首個從生產要素高度部署數據要素價值釋放的國家級專項政策文件,對數據產權、流通和交易、分配、治理等基礎問題作出了實質性指導,在數據要素價值釋放歷程中具有里程碑式重大意義。
“數據二十條” 明確了探索數據產權結構性分置制度,建立了數據資源持有權、數據加工使用權、數據產品經營權 “三權分置” 的數據產權制度框架。我們認為,關注持有權、強調使用權和弱化所有權在數據要素加工、流轉、融合和市場交易的完整鏈條中都有著重要的意義。
從數據要素相關法律法規以及當前技術發展階段出發,2022 年初,螞蟻集團洞察出行業數字化發展的新趨勢 —— 整個數據流通領域正在邁入 “數據密態時代”,即在數據進入流轉進行共享、計算直到銷毀的完整傳播鏈路中,保持數據處于加密狀態,不出現明文,將數據持有權與使用權分離,實現數據使用權的跨域管控,以確保數據流轉的全程安全可控。
數據密態在理念上契合了近兩年國家對數據要素行業安全發展的要求,在實踐上也將分階段分級別逐步落地,助力數實融合,推動全行業數字化發展。數據密態是數據要素產業安全發展的關鍵技術路徑。
隱私計算技術實現數據密態的四個判斷
那么,如何實現數據密態?螞蟻集團在探索和實踐以隱私計算為代表的數據密態技術過程中再次證明:隱私計算技術可以實現數據持有權與使用權分離,是確保數據要素安全流轉,發揮數據要素市場價值的重要技術手段。在此,我將分享螞蟻對隱私計算技術的四個核心判斷。
第一點,隱私計算技術使得數據要素使用權和持有權的分離成為可能。
數據的持有權主要是持有明文數據或明文數據等價物的權利。數據要素和其他生產要素的顯著區別是數據非常容易被復制。傳統上基于明文的數據流轉難以將數據的持有權與使用權分離,在漫長的數據價值流轉鏈路上很容易導致持有權和使用權的失控,從而嚴重阻礙數據要素價值市場化。
當持有了明文數據后,意味著在技術上獲得了數據不受限的所有的使用價值。一方面,數據持有方需要非常謹慎地合法合規使用數據,并按照法律要求盡責保護好數據持有權不失控;另一方面,一旦數據持有權失控,使用權也將失控并大概率會被濫用,繼而導致數據要素作為商品的價值崩塌。
在數據流通領域,此前持有權和使用權從未被分離,直到隱私計算技術出現。隱私計算這類數據密態技術首次實現了數據持有權與使用權的分離,可以在保障數據持有權不喪失的前提下,對數據在跨域流轉的全程對其使用權實現管控。這種數據流轉全鏈路的使用權跨域管控能力,對于數據要素價值實現市場化而言至關重要。數據的使用權流通而非持有權流通,是數據要素行業發展的關鍵。
第二點,隱私計算技術突破性地實現了數據使用權跨域管控。
在數據要素流通中,數據使用權的跨域管控起到了非常核心的作用。跨域管控指的是即使數據的使用不在數據持有方的管控運維域內,同樣能夠在技術上保障數據持有方對數據如何使用進行決策。
隱私計算擁有幾個重要的技術路線,比如多方安全計算和聯邦學習需要數據持有者的參與,才能對數據進行融合計算,這是通過隱性的控制來實現使用權的跨域管控。
又比如可信執行環境(TEE),它離達到隱私計算的要求還有一定的距離。可信執行環境本質上是一個機密計算環境,它提供了可以遠程驗證、隔離且加密的執行環境,但本身并不為數據持有者提供數據使用權的跨域管控能力。這就需要 TEE 環境內的隱私計算平臺或應用對其進行專門保障,否則它就只是機密計算,而不是隱私計算。
所幸的是,可信執行環境的遠程驗證技術可以很好地支持數據使用權跨域管控的實現,也是我們在努力推動行業共同發展的方向。
第三點,隱私計算技術處于發展早期,需要持續的技術攻關以及大家共同打破一些技術認知的邊界。
如今,隱私計算已經在很多行業有成功的應用案例。但不可否認的是,隱私計算技術仍然處于發展早期,實際應用中能處理的數據規模、復雜性以及計算模式依然存在明顯限制。同時,很多技術概念還不甚明了,一些錯誤認知也阻礙了行業的發展。
比如,業界初期普遍認為 “數據不出域所以安全”,但實際上這種模糊的 “數據不出域” 概念既不是隱私計算安全保障的充分條件也不是必要條件。數據跨網交互過程中只要有一個比特的錯誤,就可能導致整個數據的泄漏。妥善的數據密態出域則能夠很好地保障數據的安全性。
一方面,數據的安全保障機制需要安全專家和專業化機構進行專業分析認可,而不能只靠比喻解釋。比如現階段的密碼學,每當新密碼協議產生,密碼專家們要對其設計安全性進行詳細論證,而安全專家們要對其實現進行長時間的攻擊分析研究。與之類似,今后隱私計算要從現在少數公司、機構間的數據流轉變成支撐全行業的基礎設施,真正專業的安全評測和保障能力非常關鍵。
另一方面,安全是有成本的,但與大家認知不太一樣的是,如今的專業安全可以在成本和業務效能之間找到非常好的平衡,甚至能做到在風險可控的條件下突破原有的業務技術瓶頸。
我們很高興看到 “數據二十條” 中再次明確 “原始數據不出域,數據可用不可見” 是重要的原則和要求,消除了 “數據不出域所以安全” 這樣的模糊定義。在這樣的原則基礎上,業界擁有了廣闊的技術發展空間。
之所以強調這是非常大的進步,是因為如果只考慮數據不出域,強調所有計算都需要數據持有方的跨網絡參與,則會導致數據持有方的網絡成為嚴重的業務瓶頸。從安全專業角度來看,這個瓶頸并不是必須的,無論是對同態加密技術還是可信密態計算技術來說,它們都能突破這個技術應用瓶頸,也能保證安全的數據管控能力。只有突破這樣的瓶頸后,分布式、大規模、可擴展的基礎設施才能被真正提供,從而支持全行業的數據要素價值安全流轉。
第四點,要真正實現數據密態,隱私計算必將走向技術大融合,解決大規模數據的安全和效率問題。
現在隱私計算技術有很多相對獨立發展的技術路線,未來各個技術融合是大勢所趨。這不僅僅是性能、場景適用性等方面的迫切需求,甚至在安全性上也有強烈需求。
現有的各條技術線,比如多方安全計算(半誠實模型安全問題)、聯邦學習(信息熵泄露問題)和 TEE(供應鏈攻擊與明文應用攻擊)都在實際應用中面臨各自的安全挑戰,需要相互之間的技術融合來實現補位增強,進而成為未來行業大規模安全可用的隱私計算技術基礎設施。
從另一個角度來看,隱私計算技術并不是免費的午餐。所有的東西都有成本,一般來說,安全性越高,成本要求越高。
現在多方安全計算和聯邦學習都需要跨公網或跨專線來大量交互,多方安全計算會產生動輒萬倍以上的性能損失,聯邦學習用信息熵泄露的代價來換取性能提升,但也依然有百倍、千倍以上的性能損失。全同態加密本身計算速度很慢,也會有千倍、萬倍以上的損失,但更大的問題在于它的數據會膨脹千倍、萬倍以上。可信執行環境則需要部署新的可信硬件,造成額外的代價。
好消息是,一方面我們可以用技術融合來突破這些性能瓶頸,另一方面應用成本會隨著基礎設施的規模效應而逐步降低。只有達到一定規模以后,邊際成本才能下來,高安全、高性能、高適用性的隱私計算技術才能被越來越多行業所用。
數據密態需要分步規模化
推動數據要素安全普惠
“數據二十條” 明確了 “三權分置” 的數據產權制度框架。我們認為,數據密態是壓實數據 “三權分置” 制度以及保障數據持有權、使用權分離的重要技術手段,也是未來數據要素市場化的發展趨勢。
我們相信,下一步發展的關鍵是通過分類分級來引導隱私計算等數據密態技術在各行業落地,這分別包括技術層面和應用場景的分類分級。一邊增加應用場景來獲取更多的數據要素收益,另一邊提升技術融合與基礎設施規模化,降低數據要素流轉的成本。同時也非常希望看到重點行業引導加速這一應用過程,通過共同推動擴大應用規模,從而降低邊際成本,普惠全行業。因此,未來發展的重點在于行業如何正確引導,特別是監管機構以及擔有頭部責任的大企業的共同推動。
數據密態并非一朝一夕所能實現,未來很長一段時間需要政府、行業、企業、社會共同協力共建。我們需要在政府主管部門的指導下,聯合行業伙伴、高等院校、科研機構在技術創新、生態共建上持續發力,打破認知瓶頸,通過技術突破與規模化降低行業邊際成本,共同推動數據要素產業的安全健康發展,普惠全行業。
*博客內容為網友個人發布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。