從網絡奴工到網絡公民,隱私計算將如何改變互聯網運作方式?
本文發佈於PlatON,作者:LatticeX 基金會。
自 2016 年隱私計算(Privacy-preserving Computation)概念被提出以來,歷經五年的發展,在各國對數據隱私保護的相關法律法規的推動下,加上全球疫情導致的人類社會數字化程度的日益加深,數據要素越來越成為驅動經濟發展的首要能源,這也讓隱私計算在信息科技中逐漸成為最基礎也是最重要的底層技術。
隱私計算是隱私信息的所有權、管理權和使用權分離時隱私度量、隱私洩漏代價、隱私保護與隱私分析複雜性的可計算模型與公理化系統。隱私計算讓數據或計算方法在保持「加密」狀態,不洩露給其他合作方的前提下,進行計算合作。
這種讓數據在密態下用於計算以發揮價值的方式,正在也將會徹底地改變互聯網乃至人類社會的運作方式。
明文數據到密文數據
作為信息網絡的基本組件,數據將人類在數字化狀態下生產生活的一切信息和軌跡都忠實地記錄下來,並在雲計算、大數據、人工智能等新興科技的廣泛採用下,被挖掘出大量價值,不斷改善甚至改造人類的生活。
依靠數據產生價值,是互聯網巨頭們的基本商業模式,而其前提是對用戶信息的採集。用戶信息數據在本質上屬於用戶個人權利的重要組成部分,其中用戶個人數據的隱私權已經越來越受到重視,在各國均受到法律保護。
所以一直廣受關注的數據安全問題,已經從過去的黑客防止、容災備份、數據恢復等傳統領域,逐漸轉向聚焦於在挖掘數據價值的同時如何保護好用戶隱私。
在當下,幾乎所有的應用場景中數據都是以明文的方式被共享和使用。由於數據以數字化形態而非實體存在,不存在獨占性特徵,所以「所見即所得」這一特性讓數據的「使用」和「擁有」實際上無從區分。
這種明文儲存數據的形式在事實上造成了數據共享和隱私保護之間存在天然的對立和矛盾,哪怕採用去除敏感信息後再發布的模式,也可以通過準標識符識別的手段來確定用戶身份。
這一矛盾的存在,是當前存有大量數據應用需求的行業的主要發展障礙。例如在 AI 行業,一方面需要海量數據來投餵,訓練 AI 變得更加聰明更強大;另外一方面受限於數據隱私保護的嚴格要求,可以合規使用的數據量又非常欠缺。
隱私計算的提出,為這一矛盾的解決提供了兩全其美的方案。
通過隱私計算,讓數據在密文的狀態進行流通和共享並用於計算,讓數據的「使用」和「擁有」這兩個狀態完全脫離,數據「不可見但可用」,讓數據隱私得以完全保護,但數據的價值依舊可以發揮。
所以可以預見,在隱私計算技術成為底層信息技術的未來,存留於社會每個角落的數據,除非得到數據所有人的授權確認,否則都會以完全不可讀的密文狀態進行共享和使用,從而在根本上解決數據隱私保護問題。
信息網絡到計算網絡
數據在從「明文」進入「密文」狀態後,實際上我們現在已經非常熟悉的互聯網將從基於數據交換的信息網絡,躍遷為基於計算互操作的計算網絡。
互聯網巨頭們今天掌握著海量的用戶數據,並通過數據挖掘來不斷從中攫取價值,以實現商業收入。這一狀態將在未來得以徹底的顛覆。
數據將在隱私計算技術的支持下,出現新的協同範式。
傳統的互聯網可以被定義為面向數據進行直接處理的信息型網絡,本地的數據被各種應用採集(很多情況下是未經其所有者許可的靜默採集)後傳送至雲端,並在雲端得以處理和挖掘,進而產生商業價值。但數據的所有者在全程都沒有授權,更沒有從其創造的商業價值中獲得對應回報。
更為嚴重的情況是,這些明文形式的數據在被採集後直接被販賣,從而導致大量隱私數據被洩露,造成極為惡劣的社會影響和經濟損失。
隱私計算將能夠讓用戶的數據保留在本地,並且在被加密的狀態下參與計算,並輸出計算結果後上傳至雲端提供給計算發起方。整個過程中數據明文都沒有被披露,數據隱私得到了根本性的保護。同時數據所創造的價值,可以通過合理的機制進行度量,並能夠讓數據所有者從中得到合理的回報。
互聯網進化的終極方向,就是從數據從端到雲進行傳輸的信息網絡形式,朝面向數據共享的協同計算的計算網絡演進。
正如分佈式隱私 AI 網絡 PlatON 所主張的,「一切皆可計算」。
單方計算到多方計算
作為計算的對象,「數據」本身具有不同於傳統生產要素的非常獨特的性質,除了在明文狀態下所見即所得之外,還存在著「天生」的部分公共屬性。
具體來說,單一來源的數據實際上可信性和價值是不充分和不足夠的,能夠真正持續創造價值的數據應該具有多來源、多維度、多方持續運營的特色。
所以在以數據為基本生產要素的數字化社會中,面向數據的分析和計算,一定不會僅僅局限於單一來源的供給。
例如自動駕駛的 AI,對其進行訓練所「投餵」的數據,就必須涵蓋全場景、全路況和全規則下的多種來源。可以簡單理解為,通過區域 A 以開闊道路為主的駕駛數據訓練出來的 AI,一定不適用於區域 B 主要是複雜路況下的自動駕駛。
而如果這個「區域 A」和「區域 B」所擁有的數據又存有數據所有權控制問題的話,那麼要麼通過單一來源數據訓練出來的自動駕駛 AI,由於自帶局限性的數據供給導致其根本無法通用;要麼就需要找到讓「區域 A」和「區域 B」的數據能夠進行聯合訓練,但又不會將數據披露出來的方式。
在數據的核心本質存在公共屬性的情況下,數據的價值也就需要在多方之間的協同來實現。所以面向數據的計算也不能像以前一樣,由中心化的單方計算來實現,而是應該在多方來源的數據都不離開本地的情況下,通過密態下的多方計算來輸出計算結果。
網絡奴工到網絡公民
在現實社會中,公民作為國家的基本組成單位,擁有受國家法律保護,受國家政府保障的基本權利。它也是根據法律規定,公民參與公共社會生活的權利。例如公民的民事權利中就包括財產所有權、人身權、隱私權等等。
公民在部分權利上的讓渡,構建了國家的權力。
但在網絡世界中,用戶使用著網絡服務提供者(例如網絡巨頭們)提供的公共數字產品,並且將個人的數據在非自願的情況下完全提供給了這些數字產品。網絡服務提供者們對用戶的數據擁有完全的、絕對的處置權力。
比如可以無須用戶許可就刪除用戶的帳號。
比如對用戶數據進行挖掘從而攫取商業利益,但完全不用向用戶支付回報。
所以從根本上來說,網絡服務提供者如同現實世界的國家一樣掌握著國家級的權力,但該權力獲取方式是強制的,不以服務使用者權利讓渡為前提的。
換句話說,在網絡世界中,我們每一個用戶沒有任何權利可言。我們無論現實世界中身份如何,只要連接了網絡使用了網絡服務,我們就會淪為這些網絡服務的奴工------貢獻價值,讓渡權利,沒有回報。
只有當隱私計算真正成為互聯網的基礎技術,所有網絡服務提供者都遵循隱私計算的範式來為我們提供服務,讓我們的數據都在密文下保存,讓數據的「擁有」和「使用」相分離,並且可以完全遵循我們的意願參與計算,網絡世界中的參與者才真正能夠成為擁有基本權利的網絡公民。
作為一項新近出現的信息技術,隱私計算所帶來的必將不是簡單的新應用,而將從根本上改變互聯網的基本運作模式,並讓網絡參與者以全新的身份使用各種各樣的網絡服務,改善生活水平,提升工作效率,保障數據權利,構建網絡世界。
總部位於新加坡的 LatticeX 基金會(LatticeX Foundation)以通過構建複雜計算歸還用戶數據主權,保護數據隱私,實現數據價值交換為願景,旨在構建一個完全去中心化的計算互操作網絡,在保護數據主權和隱私的前提下促進數據使用權的交易,並為實現 LatticeX 願景資助各類學術研究,培養管理各項應用,並對優質項目提供資金支持。LatticeX 基金會是分佈式隱私 AI 網絡 PlatON 和金融網絡 Alaya 主要的支持者和推動者。