數據資產化後,隱私基礎設施能破圈切走多大蛋糕?

ChainCatcher 精選
2022-03-21 17:37:12
收藏
面對數據隱私、成本高昂、技術集中化等問題,人工智慧如何突破掣肘,邁上新的台階?

作者:Jason

70年前,當計算機普及剛剛燃起星星之火,我們絕不會想到,在全數位化社會迎面撲來之際,個體在數位世界擁有了「第二生命」,數位化的我們在遼闊的網絡「平行宇宙」中不斷拓寬自我邊界,不斷嘗試新鮮事物,不斷改善物質生活,同時我們也拓下了流動的印記------數據。

什麼是數據?這個信息科學中一個基本但複雜的問題,沒有顯而易見的答案。簡單地說,數據是觀察的產物。觀察對象包括物體、個人、機構、事件以及它們所處環境等。觀察是基於一系列視角、方法和工具進行的,並伴隨著相應的符號表達系統,比如度量衡單位。

數據就是用這些符號表達系統記錄觀察對象特徵和行為的產物。數據可以採取文字、數字、圖表、聲音和視頻等形式。在存在形態上,數據有數位化的(Digital),也有非數位化的(比如記錄在紙上)。但隨著信息和通訊技術(ICT)的發展,越來越多數據被數位化。

據Statista分析,預計到2025年,全球聯網設備的數量預計將達到309億台。聯網設備和服務創造了龐大的數據量,IDC預測到2025年,全球數據將擴展至163ZB(1ZB等於1萬億GB),相當於2016年所產生16.1ZB數據的十倍。這滾滾的數據洪流,如何挖掘其內在價值,人工智能給出了答案。

人工智能六十年

1956年夏天,在達特茅斯學院長達六個月的一場研討會中,「人工智能」一詞在明斯基等一眾年輕科學家的研討中被提出。

直到2006年,Hinton教授提出"深度學習"(Deep Learning)神經網絡使得人工智能性能獲得突破性進展,這一次的人工智能浪潮與前兩次的浪潮有著明顯的不同。基於大數據和強大計算能力的機器學習算法已經在計算機視覺、語音識別、自然語言處理等一系列領域中取得了突破性的進展,基於人工智能技術的應用也已經開始成熟。讓人工智能開始真正邁向"智能"和落地應用。

時至今日,人工智能對於大家已經不再是陌生的技術,它走進了人們生活的無數細節中,小到網上購物,大到工廠生產,都能看到人工智能技術帶來的便捷與進步。

理論與技術的日益成熟,促成了應用領域攻城拔寨,並帶動商業化的不斷躍遷。全球範圍內越來越多的政府和企業組織逐漸認識到人工智能在經濟和戰略上的重要性,並從國家戰略和商業活動上涉足人工智能。

十年前,移動互聯網的興起讓人工智能站上了爆發式發展的「奇點」。以Apple、Samsung為代表的移動終端設備提供商和以Alibaba、Tencent、Facebook、Google為代表的移動互聯網服務提供商。

它們的加速迭代,使得移動互聯網較之傳統的桌面互聯網,打破了既有的時空邊界,使得人機交互更加方便的同時,以自然語言處理、機器學習、視覺算法等技術為首的人工智能技術取得了突破性發展。

德勤在其2019全球人工智能發展白皮書中推算,預測未來2025年世界人工智能市場將超過6萬億美元,2017-2025年複合增長率達30%。普華永道在人工智能對世界經濟的經濟影響的研究報告稱,到2030年人工智能的出現將為全球GDP帶來額外14%的提升。

相當於15.7萬億美元的增長,超過中國和印度目前的國內生產總值總和。全球人工智能市場將在未來幾年經歷現象級的增長。

六十年,人工智能之火已成燎原之勢,面對第四次工業革命------科技革命,其天花板也逐漸顯現。

掣肘隱現

人工智能可以成為新一輪科技產業改革的變量與核心技術,缺少不了三大關鍵要素------數據、算法、算力。

自互聯網興起,尤其是移動互聯網走進千家萬戶,迎來了全球數據的海量增長。這些真實而富有價值的數據為人工智能投餵了「生產材料」。

同時,芯片處理能力的提升,雲計算的大規模運用以及計算硬件價格的大幅下降使得全球算力迎來計算熱潮,算力為人工智能帶來了真金白銀的「生產發動機」。

得力於深度學習、機器學習、神經網絡、計算機視覺的躍遷式突破,廣闊的產業及解決方案市場使得人工智能算法得以快速發展,從行業來看,人工智能已經在醫療、健康、金融、教育、安防等多個垂直領域得到應用。算法為人工智能提供了得力的「生產工具」。

三大要素的加持,人工智能隨之迎來了「黃金十年」,而懸在人工智能頭上的達摩克利斯之劍也隨之隱現。

首先出現的是數據監管與隱私的壓力。早在2018年,歐盟便出台了《通用數據保護條例》(GDPR),2021年我國《中華人民共和國數據安全法》與《中華人民共和國個人信息保護法》相繼實行。

尤其是《個人信息保護法》,側重於個人權益,是為了維護公民個人的隱私、人格、人身、財產等利益,其關於"個人信息"的定義,是指以電子或者其他方式記錄的與已識別或者可識別的自然人有關的各種信息,個人隱私數據監管的加強無疑是給數據濫用的行為加上了強有力的枷鎖。

不僅如此,數據隱私的壓力也來源於彼此,對於擁有數據的企業來說,面臨著很大的矛盾:通過數據分享和交互顯然可以提升AI算法的效果,但同時又必須要保障自己的數據不洩露出去。

無論是內部不同部門之間對於數據的使用,還是和第三方合作者的數據合作,都必須要嚴格的保障合規,上線各種涉及數據合作的項目時,往往首要的考慮就是數據流動中的安全問題。

其次,模型訓練成本高昂。雖然硬件和軟件的進步一直在推動人工智能培訓成本每年下降37%,但由於人工智能模型的規模增長更快(每年10倍),導致人工智能的總培訓成本繼續攀升。有機構認為,最先進的人工智能訓練模型成本可能會增加100倍,從目前大約100萬美元飆升至2025年超過1億美元。

面對數據隱私、成本高昂、技術集中化等問題,人工智能如何突破掣肘,邁上新的台階?

一些前沿技術的研究與應用為其鋪設了前進的道路。

人人都能用的人工智能

區塊鏈與隱私計算技術的出現為人工智能提供了新思路。

數據的巧妙穿插,令區塊鏈、隱私計算和AI三者以不同的方式產生了化學反應,這幾項技術的結合可以將數據的利用提高到新的水平,同時可以增強區塊鏈的基礎架構並增強AI的潛力。

區塊鏈的共識算法可以幫助人工智能系統中的主體完成協作任務,其技術特性也可使數據資產化,激勵更廣泛的數據、算法和算力加入,創造更高效的人工智能模型。

在有隱私數據應用的需求時,隱私計算可在保證數據提供方不洩露原始數據的前提下,對數據進行分析計算,保障數據在流通與融合過程中的"可用不可見",從而實現合規所需的隱私和安全控制,促進數據共享和價值交換。

目前市場上,我們已經可以看到形形色色基於隱私計算與區塊鏈的平台產品,例如螞蟻鏈摩斯多方安全計算平台、百度安全的MesaTEE平台等,而平台產品絕大多數都是面向B端服務,道理很簡單,企業與企業之間的數據業務是最基本的商業需求。

它解決了企業之間對於數據分享、交互、提升AI算法的基本矛盾,但並未在人工智能民主化及建立安全的通用人工智能上有所涉獵。

企業服務僅僅是人工智能目前所能達到的落地伊始,在可見的未來,數據所有權終將歸還給個人所有,技術、生產材料、生產工具也將讓渡及歸還給個人,以此才是圍繞數據這個「新一代生產要素」以AI、區塊鏈、隱私計算為技術設施,促進高級人工智能的湧現和進化,探索通往通用人工智能的道路之法。

近期,一家專注於前沿科技研究的企業發布的產品讓用戶與市場在普世化通用人工智能的應用上看到了新的方向。

PlatON隱私計算網絡(暫用名)是一個去中心化的數據共享和隱私計算基礎網絡,其從產品設計之初便另闢蹊徑,創新性地將人工智能的三要素------算力、算法、數據融入了產品中面向用戶,即只要你是用戶,就可以以數據所有者、數據使用者、算法開發者和算力提供者等多種身份登錄平台,並完成多種任務需求,以去中心化方式聚集計算所需的數據、算法和算力,創造安全、通用的人工智能新範式。

作為商用級產品,PlatON隱私計算網絡不再定位為To B的企業級產品,而是廣義範圍的面向機構及個人開放,例如:

作為數據擁有者,個人及機構可以作為數據節點添加數據,並參與平台上發布的計算任務,這實現了令人驚訝的創新------將數據有效確權、定價、保護,讓數據在隱私保護的前提下完成了真正的資產化。

作為算力提供者,在平台中個人與機構皆可提供算力,為其他人提供執行某個計算任務時需消耗的機器資源,將有閒置的伺服器(算力)對外提供,來支持網絡中的計算任務並獲得對應的任務獎勵。

而作為算法提供者,個人AI開發者可發揮最大的潛能,提供相應的AI算法,助力計算任務完成並獲得相應收益。

這形成了一個自由、開放、可持續發展的「AI市場」,基於平台發布數據和算力,利用數據和算力可對算法進行計算。基於區塊鏈上的密碼經濟學,可將數據、算力、算法貨幣化,形成有效的激勵機制,激勵更多的數據、算法和算力加入網絡。逐漸形成數據、算法和算力的去中心化的共享和交易市場。

此外,PlatON在數據隱私方面,也設置了重重保護,通過融合安全多方計算、零知識證明、同態加密、可驗證計算、聯邦學習等多種密碼學技術進行協同計算,將本地數據保護起來,真正做到了「數據可用不可見」。

不僅數據保護,計算結果如訓練完成的AI模型隱私也可得到保護。並且產品可高效地執行智能合約,也可流暢運行流行的深度學習框架,保障了其通用性、兼容性及高可用性。

從全景來看,隱私計算網絡是以平台化的方式,以AI、區塊鏈、隱私計算技術為核心能力,建立對數據全生命周期的管理能力,並按照應用需要,實現與下層、經濟模型、數據算法算力資源等的無縫協同,從個體數據出發,破解數據孤島難題,數據不僅可以被保護、可以被運用,更能成為個人或機構資產。

目前產品正在內測階段,不難想象,如此龐大及複雜的平台產品,勢必會面臨極大的挑戰。例如:數據如何多方定價?數據在多方流通中如何實現精確抓取及應用?核心的算法又何以吸引AI開發者提供?

即便如此,仍可以看到這是一個前所未有的超級數據商業體,新技術的融合應用需要時間,產品打磨更需要時間,PlatON隱私計算網絡產品在探索數據商業化的道路上已經邁出了一步。面向未來,數據經濟躍遷的「奇點」,有可能就此向上綻放。

鏈捕手ChainCatcher提醒,請廣大讀者理性看待區塊鏈,切實提高風險意識,警惕各類虛擬代幣發行與炒作,站內所有內容僅係市場信息或相關方觀點,不構成任何形式投資建議。如發現站內內容含敏感信息,可點擊“舉報”,我們會及時處理。
ChainCatcher 與創新者共建Web3世界