那些互联网大厂不想让你知道的数据隐私保护方案
本文发布于律动研Blockbeats。
近期特斯拉「刹车失灵」事件成为了公众舆论的焦点,而随后特斯拉公布事故车辆行驶数据的行为将数字经济的关键问题——用户个人隐私——推到了前台。
在新冠疫情的大环境下,人们的日常生活更加依赖互联网了,也让许多曾经不涉及线上业务的公司被迫通过线上拓展新的渠道。
人们与不同的平台、商家、应用交互产生大量的数据,算法使用数据更精准地满足用户需求。
随着科技的进步,商业范式的转移,数据变现的途径成几何式地飞跃,这也让数据成为了 21 世纪最大的市场。得数据者得天下。然而,在没有隐私保护下的数据就像遍地洒满的黄金,各大互联网平台贪婪地吞噬、滥用着这些他们并没有所有权的价值"原材料"。
这是一个不能被忽视的问题。
谈到数据隐私时,大多用户的第一反应都是:我并不想提供私人信息,但我没有办法不提供。
确实,Web2.0 世界的互联网应用现今本质就是用户以个人数据换取服务。说好听点,不提供信息你的外卖怎么送到你家?不提供信息应用怎么更全方位地服务于你?被迫无奈之下,你只能选择在互联网中裸奔。
更可怕的是,万物正在互联,互联网应用已经不局限于你的电脑和手机中了,慢慢你身边看得见摸得着的一切都将成为不断获取数据的应用,那时,用户将不再是主动选择性地提供数据,而是被被动「监控」。
这一切不该是这样的,数据的所有权应该属于数据产出者而不是数据使用者(应用服务提供商),服务提供商更不应使用用户数据进行寻租行为。
Web2.0 的世界有隐私解决方案吗?
技术不够,手动补救。这么多年来,每当技术条件不允许时,人工操作成为了唯一妥协方案,所有问题皆是如此,隐私也不例外。
Web2.0 时代解决隐私问题的方案是:完善立法。
各国都成立数据隐私保护相关部门且进行了立法。在中国,民法对数据权益进行了保护、刑法对侵犯个人信息犯罪进行了定性、经济法对数据分享流转进行了规范,以及国家市场监督管理总局颁布的关于平台经济领域的反垄断指南等等。
但这些法案真的能够保证用户隐私吗?用户数据真的能够不被滥用吗?
答案是不能。
去年 12 月份被曝出「明星健康宝照片泄露」事件,在某代拍群中,开始是花 1 元可购买 1 位明星健康宝照片,后来出现了 3 元可打包「tnt 时代少年团」7 人的健康宝照片,随后,又出现了 2 元打包 70 多位艺人健康宝照片,1000 多位艺人身份证号仅售 1 元等。不只明星的这些信息可以搜出来,只要搜索姓名即会显示该人的头像与核酸检测信息。
甚至在某外卖平台上,同样的订单、同一家商户、同一处送餐地址、同一个时间段,会员却比非会员支出更多,平台利用大数据对不同群体进行差别定价,大肆寻租的案例屡见不鲜。
问题出在哪?立法不明确,信息不对称,惩罚力度不够,最终导致发现难、举证难、认定难,平台铤而走险。
机制永远存在缺陷,法律总会存在死角,人工管控并非长久之计。
Web3.0 的世界把隐私还给用户
设想,如果用户不需要将提供任何信息,或者说,平台得不到你的任何信息,但还能够照常为你提供服务呢?
这一切听起来很神奇,但其实都是数学。是的,零知识证明可以实现这一切。
零知识证明是一种加密协议,证明者能够在不向验证者提供任何关于被证明消息的信息的情况下,使验证者相信某个论断是正确的。
读完下面这个阿里巴巴的小故事你就可以很直观地理解,什么是零知识证明。
阿里巴巴遇到劫匪,劫匪想从其口中获得进入山洞的咒语,但阿里巴巴却怕得知咒语后的劫匪不给其留活路。阿里巴巴心想,如何才能在不透露咒语的情况下证明他知道咒语这个事实呢?
阿里巴巴心生一计。阿里巴巴让劫匪距离他足够远的距离,远到无法听清其念出的咒语。当劫匪举起左手时,阿里巴巴会让洞穴的门打开,当劫匪举起右手时,阿里巴巴将不会念诵咒语。反复验证有效后,劫匪认定阿里巴巴确实知道打开洞穴的咒语。阿里巴巴也在没有透露咒语本身的情况下向劫匪证明了其知道咒语这个客观事实。
在现实生活中,用户就是证明者,而服务提供商就是验证者。由此,通过零知识证明用户可以在不留下任何数据中可榨取痕迹的情况下让服务提供商依旧能够提供服务。
现在链上已经有许多运用零知识证明的应用了,最典型的就是大家熟知的匿名币 Zcash。Zcash 通过 zk-SNARKs(简洁的非交互式零知识证明)共识证明让用户可以在信息完全加密的情况下进行转账,且保证交易的可验证性供节点进行验证。具体来说,Zcash 地址分为隐蔽地址 (z-addresses) 和透明地址 (t-addresses),隐蔽地址之间的交易也会出现在链上,所有人都会知道有一笔隐蔽交易发生了,手续费也会支付给矿工,但交易的地址、交易金额以及备注字段都被加密过,公众是看不见的。地址的拥有者也可以选择向可信第三方公开隐蔽地址和交易细节,以应对审计和监管需求。而两个透明地址之间的交易则与比特币交易没有区别,资金可以在隐蔽地址和透明地址之间转移。
再说回到近期特斯拉对外公布行驶数据的案例。特斯拉为自证清白,未经用户允许将事故车辆数据信息公布与众。若信息通过零知识证明加密后传输至特斯拉算法协议中,特斯拉将无法获得元数据,若特斯拉想使用用户数据需提前获得用户许可。发生事故后,若司法部门需数据取证,用户愿配合调查的情况下,可将加密信息公开。
设想未来在零知识证明的帮助下,用户无需提供姓名、照片、行踪即可证明自身健康,或是用户可以证明自身已对新冠病毒免疫,但无须提供是如何对病毒产生免疫的(已产生抗体或注射了疫苗)。或许有一天,人们点外卖无需向平台提供姓名、电话、住址,机器人即可将外卖送到家门口。
零知识证明并非全新产物。早在 20 世纪 80 年代初「交互零知识证明」理论就被 Goldwasser 等人所提出,在 80 年代末 Blum 等人进一步提出「非交互零知识证明」的概念。但当今互联网平台为什么不采用这项技术呢?
首先从技术层面来看,任何创新从理论到实践都需要经历数十年时间的努力和沉淀,近几年零知识证明才真正成为一个可被应用的技术。然而,相比于传统解决方案,零知识证明的使用成本还是过高,且效率低下,这对于平台和用户来说都是不可被接受的。
从经济层面来看,用户已经形成了必须提供信息才能得到服务的固化思维,平台现在获取信息是顺理成章的事情。在巨大利益面前,各平台巨头是很难进行妥协的。从用户角度来看,大多数用户还未意识到隐私的重要性以及自身所产生的数据的价值,所以用户并没有推动隐私解决方案的浓厚意愿。
从技术解决方案来看,Aleo 是一个很好的推动者范例。Aleo 从链上应用入手,降低了隐私应用开发门槛和使用成本,让隐私成为了应用的默认属性。这对于隐私应用得到大规模使用来说意义重大,正如 Cosmos SDK 以及 Substrate 在推动应用链范式中起到的作用。
然而,用户教育或许才是所有问题中的重中之重。若用户无法体会到隐私的重要性,那么用户将永远屈服于 Web2.0 平台的掌控下,任何多余成本的付出都将被回绝。用户要明白,最终平台只是算法的提供商,而非数据的拥有者,且无权滥用用户数据。