矩陣元孫立林:隱私計算如何解決數據產權和交易難題?
本文發布於界面新聞,嘉賓:孫立林,撰文:司林威。
新冠疫情給全社會造成了極大衝擊,科技工具滲透到生活的各個角落,公共空間和私人空間的界線日漸模糊。和個人隱私相關的社會議題層出不窮,比如人臉識別才能進小區,房產公司用人臉識別給客戶分類,某些 App 甚至比用戶更了解其興趣愛好……無所不在的攝像頭究竟是讓人們更安全,還是犧牲了隱私,人們陷入兩難。
在讓渡個人信息以維護公共安全的同時,隱私和個人數據如何不被濫用?由此帶來的安全隱患和商業利益分配問題如何解決呢?
外交學院教授施展在他的《破繭》一書中曾提到一個名詞------隱私計算。「所有的數據都應該在自己的終端上,個人數據進到算法裡面就有點類似於進入了小黑箱,而技術上是能夠確保對數據的各種計算過程都是加密的,沒有人知道這數據究竟是什麼,它只能反饋出來一個計算結果。」施展認為,「一旦我承諾了我的隱私可以給你用,以什麼方式被你用,那麼我是應當獲得分紅的。」他認為,我們過去所熟悉的關於個人權利、產權等的定義,可能都會被迭代,各種新規則也會浮現出來。
究竟什麼是隱私計算?由個人信息構成的大數據,個人、公司、政府各方的責權利應該如何分配呢?界面新聞就此採訪了矩陣元創始人兼 CEO 孫立林。孫立林是 Chinaledger 創始成員及技術委員會副主任、中國證券基金業協會金融科技委員會委員。他長期從事支付清算金融基礎設施的工作,對區塊鏈如何傳統改造金融行業以及信息傳輸方面有著深入理解和豐富經驗。
成立於 2014 年的矩陣元,恰好把自己定位於隱私計算和區塊鏈技術提供商,目標正是解決數字時代數據協同計算過程中的數據安全和隱私保護問題。矩陣元於 2016 年獲得來自萬向控股的 1.5 億元投資,並與上海交通大學、復旦大學、武漢大學、中國科學院等高校研究機構有深入合作。就在上個月,上海市科學技術委員會發布了矩陣元全資子公司上海陣方科技有限公司獲批「上海市數據隱私安全計算企業重點實驗室」和「上海市分佈式隱私人工智能技術創新中心」的通知。
在孫立林看來,數據本身就是一個多方共同計算出的的結果,數據的所有權確實很難界定。而區塊鏈的最大價值,是解決了最根本的清結算問題,將多層級的數據托管變成了一個分佈式的高效率的體系。作為要素市場,數據一定不能被任何一個單一機構或者平台所把持。隱私計算的市場,未來會出現類似政府授權牌照的模式。
以下為採訪記錄,有一定刪改。
孫立林,矩陣元 CEO
一、如何確保技術持有者不會濫用我們的隱私信息
記者:能不能用比較簡單的話解釋一下,什麼是數據?
孫立林:Ackoff (1989)提出了一個著名模型---DIKW 模型,D 指數據(Data),I 指信息(Information),K 指知識(Knowledge),W 指智慧(Wisdom)。在該模型中,最底層是數據,上面是信息,然後是知識,最上面是智慧,這是人類原來的理解的方式。
數據其實是人與外部世界的交互過程,然後人類從當中抽象出信息,再從信息當中抽象出知識,最後升華為智慧。
數據是體現在服務或者說由服務過程中產生的,貫穿整個全服務過程的一個載體。簡單地說,對萬事萬物以及行為的客觀的觀察和記錄是數據,所以人是獨立於數據之外的。
記者:現在很多小區需要人臉識別才可進入,於是很多人都要去小區存儲人臉信息。而一般人們在進入辦公樓時,只需要登記包括身份證號、電話號碼在內的個人信息,你覺得這種方式是合理的嗎?
孫立林:這確實牽涉到隱私的好例子。以身份證登記進辦公樓來說,這反映就是訪客和物業管理者之間的關係。寫字樓作為一個私有領地當然是有權利,也有動機保護他的空間,即禁止閒雜人員進入。這種權利是正當的。但問題是,這種權利歸属于誰:物業的業主、物業的管理方,還是承租的公司。
但是接下來的問題是,他們之間在進行信息分享時如何保證信息的安全。
記者:當我在前台提供個人信息之後,相應的企業是不是有能力或者有義務來保護我的隱私?
孫立林:它不一定有能力,目前也不認為它有義務這麼做。
現在大家達成的默契是,物業管理方有權力來決定誰能否進入該空間,而不是承租公司。因為物業管理方在擁有權力的同時,它是有相應的義務和責任來承擔風險。
但是絕大多數物業又不具備這個能力真的來做,也沒有足夠動機去保護訪客的信息安全,因為它的主要動機保護他的私有空間。
當我們進入一個寫字樓、登記信息的時候,就與物業有了一個契約關係,這既是威懾,也是統計,出了事情物業可以找得到相應人員。
但現在普遍發生的情況是,物業並沒有另外一個承諾:我不會拿你的這些信息幹別的事。
於是乎,信息泄漏也就不可避免地屢屢發生。
記者:技術,尤其是區塊鏈,有沒有可能去改善信息泄漏問題?
孫立林:技術手段可以在相當的程度上解決這個問題,替代或者說成為人類社會公共治理的基礎設施。
但當技術徹底沉降為公共基礎設施的新的範式的時候,它在解決了一部分問題的同時,也帶來了更深刻的問題:就是由誰來掌握這個技術。
實際上我們把權利徹底地披露給了所謂的技術持有者。但是我們又如何確保技術持有者不會徹底地濫用我們的隱私信息?我們又怎麼確保阿里、騰訊這樣的大平台不會擅用我們的數據?
二、數據是多方計算出的結果,其所有權很難界定
記者:隱私計算到底是什麼意思?真的能保護隱私嗎?
孫立林:關於隱私計算,我最早在創辦矩陣元的用的詞是協同計算,協同計算的本質就是人類的協同。
數據計算根本的範式遷移,比金融範式遷移還要深刻。數據計算把大量的計算、大量的事務處理,從集中化的雲端向邊緣側、向個體和機構遷移,讓我們有更多的能力來處理計算,同時大大降低門檻。
比如隱私計算產品 Rosetta,它的口號是讓不懂密碼學的人可以使用密碼學技術。而我們所做的 AI 產品,是讓不懂 AI 的人可以使用。所以,實際上矩陣元真正要做的事情是讓沒有數據的人可以使用數據。
隱私計算解決方案,現在用在醫療領域特別合適。我原來也曾非常激進地認為,病例信息歸屬於病人,不歸屬於醫院,後來我發現這是錯的。為什麼呢?病人是生病的本體,如果沒有醫生的知識加持在我的身體之上,病人是不知道得了什麼病的。
病人是寫不出來病例的,病人只知道我感冒流鼻涕了,因為我對感冒有認知。但是假定有別的更嚴重的病,病人是不知道的,只有通過醫生通過設備檢測才能知道。
所以,今天說的絕大多數意義上的數據,都是被計算過後的結果,而這個計算別人是投了成本的,包括設備、人力等等。
所以,數據本身就是一個多方共同計算出的的結果,數據的所有權確實很難界定。
記者:區塊鏈可以在數據所有權的劃分裡面發揮什麼作用嗎?
孫立林:數據具有公共性,而數據計算本質上就是多方計算,這一點同樣適用於隱私計算。
而區塊鏈的最大價值,就是解決了最根本的清結算問題,由多層級的孤立的數據托管變成了一個一致性、分佈式、高效率的投入。
記者:有專家指出,區塊鏈的本質是一個公開的賬本,它的公開性和隱私保護之間是不是存在一種矛盾?
孫立林:隱私計算和區塊鏈是兩個維度的產品,是互相配合的兩個工具。
區塊鏈本身並不是加密的,比特幣只用了哈希簽名,其加密程度甚至不如某些高等級的手機。區塊鏈與隱私計算的關聯在於,它只是為隱私計算提供了清算能力。隱私處理的這部分基本都是在本地的。
三、機構間的利益博弈才構成商業模式
記者:如果說區塊鏈是公共的基礎設施,那麼,像矩陣元這類企業,能在隱私計算裡面發揮什麼作用呢?
孫立林:有一句特別經典的話,未經覺醒的權利就不是權利。當我沒有意識到這是我的權利,我是無所謂這個權利是不是被拿走了。因為隱私權利在產生了效用之後還產生了利益,人們才在利益面前覺醒,才會去保護自己的隱私權利。
人們在利益面前覺醒以後,這件事情就變得非常關鍵。所以,在做矩陣元的商業模式設計的時候,我就認為,2C (針對消費者)的隱私保護在相當長的時間裡只構成道德上的壓力,而不構成商業模式。只有機構間的信息保護才構成商業模式。
機構間的利益博弈才構成商業模式。因為機構會率先意識到它這個資產價值,而且機構有足夠的量。而個體掌握可以變現的利益太小,個體不構成博弈對等的實體,就沒有模式。
記者:那麼,2B 的業務和 2C 業務是沒有關係還是互相促進呢?
孫立林:2C 是個催化劑。中國過去 2C 業務的開展有一個默認的前提:它的物料供給是無限的,比如共享單車,自行車可以無限生產;比如美團外賣,餐廳可以無限供給,餐廳開的越大,吃飯的人越多,供應鏈就越便宜。在無限供給的前提下,就可以擴展規模。
在今天的區塊鏈行業,絕大多數人都只把它當成 2C 的應用,而沒有把它當基礎設施去做。
基礎設施領域的情況和 C 端的情況是相反的,所有基礎設施業務都是有限供給。比如電用得越多,你的電費越貴,高速公路跑的車越多,過路費越貴。區塊鏈同樣如此,以太坊就是典型。用得人越多,gas 費也越高。
造成此種情況的原因是,基礎設施所受到的天然限制,全人類的公共基礎設施只能提供這麼多服務。
回到金融領域,清算層的清算能力的供給是有限的,並不是大家想象的是無限的,所以才會出現雙十一的時候,很多消費者的購物車無法及時清空。即使堆疊很多硬件伺服器,優化數據庫,提升 TPS (每秒交易量),但是對不起,銀聯清算庫的清算能力是有限的。
作為基礎設施的銀聯,支付性能的改善是階段性、有限的,應用的迭代更新遠遠超過基礎設施,基礎設施的迭代演進的周期遠比應用漫長。
而基礎設施就意味著需要監管。在電商大規模興起之前,互聯網只有 HTTP 協議;當電商支付開始流行之後,才有 Https、SSL 協議。而只有當 SSL 和 HTTPS 受到了監管,人類才能信任。人類所有交易行為的本質就是信任。
今天從全球來看,如果認定數據是要素市場,那麼要素市場一定不能被任何一個單一機構或者平台所把持,無論它是哪個科技巨頭企業。
所以,我認為隱私計算的商業模式也回到了 20 多年前中國建設電信運營商的時代,一定會出現類似得到政府的授權牌照的運營商來運營,提供公共性基礎設施服務。
每個人都可以對自己能夠掌控和處理的數據主張權利。但是如果我們試圖建立一個交換和共享網絡的時候,我們不可以直接去取得其他參與者的數據和權利;參與網絡的各方都必須把自己對數據的部分所有權和使用權讓渡給一個第三方運營者,這個網絡才能運轉。
對於矩陣元而言,我們不尋求運營商地位,我們致力於做好技術,為未來的大型數據運營商提供技術解決方案。
記者:你們目前做了哪些工作?
孫立林:我們從 2017 年初開始做隱私計算的,當時只是覺得這個方向肯定是對的,但是路徑不清楚。直到去年新基建開始熱門起來以後,我認為路徑也基本清楚。目前,我們已經能夠具備基本的技術能力,可以滿足一些基本的需求和企業之間信息交互的基礎設施。
矩陣元 RosettaFlow 隱私 AI 平台
記者:你之前在銀聯工作,2013 年進入區塊鏈行業。金融和區塊鏈,是互相促進還是取代的關係?
孫立林:區塊鏈天然就是金融基礎設施,中本聰在比特幣論文表達的也是這個意思,Ta 在摘要裡寫過,人類在線交易時代徹底解決交易回溯和欺詐問題,首先要解決的就是金融基礎設施最基礎的清算機制問題。
區塊鏈的本質,不過是一個服務的中間件,它是面向交易的,區塊鏈其實還只是人類的一個手和腳,幫人類幹活。
而矩陣元從事的分佈式 AI 隱私計算,它不是面向交易的,而是面向數據本體的。矩陣元的目標並不是在複製手腳,而是要複製大腦。AI 分三個層次:感知------認知------決策。今天的區塊鏈還停留在感知的階段,矩陣元要做的事情就是利用區塊鏈的手段,匯集海量的數據,為人類的認知和決策提供幫助,最終成為「外腦」。