Zee Prime Capital: Web3 中的分布式存储和商业模式
注:本文系转载。 原文由 Luffistotle 于 2023 年 6 月 7 日发布于 Zee Prime Capital 平台。Zee Prime Capital 是在全球范围内投资可编程资产和早期创业者的风投公司,自我定位是超前且弹性(我们认为的确如此),专注于可编程资产、协同智能等热点领域。Luffistotle 是 Zee Prime Capital 投资人之一。本文仅代表作者个人观点,转载已获作者授权。
所有计算栈都需要存储,否则一切都是空谈。随着计算资源持续增加,出现了大量未被充分利用的存储空间。分布式存储网络(DSN)能够协调和利用这些潜在资源,将其转化为生产性资产。这些网络有潜力为 Web 3 生态引入第一个真正的商业垂直领域。
P2P发展史
Napster 的出现标志着严格意义上的P2P文件共享进入主流视线。此前也有其他文件共享方法,但 Napster 的 MP 3 文件共享才带动了P2P的普及。自此,分布式系统开始迅猛发展。由于 Napster 模式的中心化(用于索引),它很容易因触碰法律法规而被关停,但它为更强大的文件共享方法奠定了基础。
Gnutella 协议就是遵循这种思路,曾有许多不同前端以各自的方式利用该网络。作为一个更接近分布式的 Napster 式查询网络,Gnutella 更能应对审查,这一点在当时也有验证。AOL 收购了正在上升期的 Nullsoft,意识到了其能量并果断取消了发布。然而,产品已经流出并很快被逆向工程,带来了 Bearshare、Limewire 和 Frostwire 等为人们熟知的前端应用。最终导致此类应用失败的是带宽要求(当时属稀缺资源)以及缺乏活性和内容保证。
有印象吗?没有也没关系,它已经重生为一个 NFT 市场(https://limewire.com/product)……
接下来出现的 BitTorrent 是一个升级,这得益于该协议的双向性质和其维护分布式哈希表(DHT)的能力。DHT 的重要性在于它类似一个分布式的账本,存储文件的位置,可供网络中其他参与节点进行查找。
比特币和区块链诞生后,人们开始展望这种新型协调机制是否能连接潜在的未使用资源和商品网络,分布式存储网络(DSN)开始萌芽。
其实,很多人没有意识到,代币和P2P网络的起点并不是比特币和区块链。P2P网络的最初缔造者已经意识到以下几点:
-
因为分叉的存在,构建有用协议再变现十分困难。即使利用前端广告投放等方式实现变现,也会被分叉压价。
-
使用情况差异大。以 Gnutella 为例, 70% 的用户不共享文件,而 50% 的请求集中在前 1% 的主机托管的文件。
幂定律
如何解决这些问题?BitTorrent 是从分享率入手(下载/上传比率),其他协议则引入了原始的代币系统。它们通常将代币称为信用或积分,通过分发代币激励良好行为(促进协议的健康发展)和对网络的维护(比如通过可信度评级来管理内容)。关于这方面的历史,我强烈推荐阅读John Backus 的文章(现已删除,但可通过互联网档案馆阅读):
值得一提的是,Ethereum 的最初愿景中就包含分布式存储网络(DSN),并称其为“三位一体”,旨在为世界计算机的繁荣发展提供必要工具。有传言说,是 Gavin Wood 提出了 Swarm 作为存储层,Whisper 作为消息传递层的概念。
总之,主流的分布式存储网络诞生。接下来的事大家都知道了。
分布式存储网络格局
分布式存储网络的市场格局非常有趣,头部(Filecoin)的规模与新兴存储网络之间存在鸿沟。在一般人的印象中,存储领域由 Filecoin 和 Arweave 两个巨头主导,但按照使用量计算,Arweave 排名第四,位于 Storj 和 Sia 之后(尽管 Sia 的使用量似乎下滑)。虽然我们可以对 Filecoin 上的数据真实性提出怀疑,但即使打折 90% ,Filecoin 的使用量仍然是 Arweave 的约 400 倍。
从中可以推断出什么呢?
首先,目前市场上存在主导企业,但这种主导地位能否延续取决于存储资源是否有用。
这些分布式存储网络(DSN)大体使用相同架构,节点运营者拥有大量未使用的存储资产(硬盘),他们可以将这些资产作为质押,通过存储数据来挖掘区块并获得挖矿奖励。定价和实现永久存储的方法可以不同,最重要的差异化是让用户能够轻松且以合理的成本检索和处理存储的数据。
存储网络容量和使用量对比
注:
1. Arweave 的容量无法直接测量,不过,其机制鼓励节点运营者确保足够的缓冲区,增加供应满足需求。那么这个缓冲区有多大呢?由于无法测量,我们无法确定。
2. Swarm 的实际网络使用情况无法确定,能看到已支付的存储空间量,是否使用不得而知。
表格中的项目都在持续运作中,此外还有一些计划中的分布式存储网络(DSN),比如 ETH Storage、MaidSafe 等。
FVM
讨论 FVM 之前不得不提 Filecoin 最近推出的 FEVM(Filecoin Ethereum 虚拟机)。FEVM 是一个采用 hypervisor 概念,支持许多其他运行时的 WASM 虚拟机。例如,FEVM 是基于 FVM/FIL 网络的 Ethereum Virtual Machine 运行时。FEVM 值得强调的原因是它促进了 FIL 上智能合约(即 stuff)相关活动的爆发。三月份 FEVM 推出之前,FIL 上基本只有 11 个活跃的智能合约,而在 FVM 推出之后,智能合约数爆增。可组合性的好处凸显出来,Solidity 中完成的工作可用于在 FIL 之上建立新业务,种种创新因此成为可能,比如 GLIF 团队开发的准流动型质押基元,以及市场金融化方面的创新。我们认为 FVM 会加速存储提供者增长,因为资本效率提高了(存储提供者需要 FIL 来积极地提供存储/封装存储交易)。与传统 LSD 不同,个体存储提供者的信用风险需要评估。
永久存储
我相信 Arweave 在这方面风声最大,因为它的口号直击 Web 3 参与者最深层次的愿望:永久存储。
但永久存储究竟意味着什么?它无疑是令人向往的特性,然而现实中,执行才是一切。能否执行关键在于可持续性和终端用户的成本。Arweave 采用一次付费永久存储的模式(200 年的提前付款 + 存储价值递减的假设)。这种定价模型适用于处于通缩定价环境中的标的资产,依靠持续的商誉增值(即旧交易补贴新交易),但在通胀环境中则恰恰相反。历史上这种定价模型没有问题,因为计算机存储的成本从出现起保持下降趋势,但仅仅考虑硬盘成本是不全面的。
Arweave 通过 Succinct Proof of Random Access(SPoRA)算法的激励机制来创建永久存储,该算法鼓励矿工存储所有数据并证明他们可以随机生成历史区块。这样做可以增加矿工被选中创建下一个区块(并获得相应奖励)的概率。
虽然这种机制会让节点运营者想要存储所有数据,但并不能保证他们会这么做。即使设置了高冗余度并使用保守试探法来确定模型参数,也永远无法排除潜在的损失风险。
实现永久存储唯一的方法就是明确强制某个人(或所有人)去执行,执行不利就会被剔除。如何激励人们去承担这种责任?试探法本身没有问题,但最佳的永久存储实现途径和定价方式还需要我们去探寻。
经过一番铺垫,我们最终要问,对于永久存储,人们能接受怎样的安全水平,然后再在给定时间范围内考虑定价。现实中,消费者的偏好总会落在复制频谱(永久性)内,他们应该要能够选择安全水平,并获得相应的定价。
传统投资文献和研究充分展示了多样化对降低投资组合整体风险的好处。最初的分散投资可以降低组合的风险,但随着时间的推移,再增加一支股票的效益几乎为零。
我认为,在分布式存储网络中,如果复制量与存储的成本和安全性不成正比,超出默认复制份数的存储定价应该类似于图中曲线,
对于未来的发展,我最期待拥有易于访问的智能合约的 DSN 能为永久存储市场带来哪些机会。我认为,如果市场放开永久存储的不同选项,消费者将从中获益。
我们可以将上图的绿色区域看作实验领域,或许有可能在不大幅改变复制量和永久水平的情况下,实现存储成本的指数级下降。
实现永久存储也可以通过在不同存储网络之间进行复制,而不仅仅是在单个网络内部进行复制。这种路径更需要雄心壮志,但会自然产生不同层级的永久存储。在这里最大的问题是,我们是否可以让永久存储遍布分布式存储网络,如同用股票组合分散市场风险一样,让永久存储成为免费午餐。
可能性的确存在,但要考虑节点提供者重叠和其他复杂因素。也可以考虑保险的形式,比如让节点运营者承担更高级别的惩罚条件以换取保证。这样的系统维护起来也不容易,因为涉及多个代码库需要协调。尽管如此,我们期待此类设计的推广,为整个行业推动永久存储理念的发展。
Web3首个商业市场
Matti 最近在推文中表示存储是为Web3带来切实商业价值的应用案例。我觉得有可能。
最近我和一个 Layer 1 区块链团队聊了聊,我告诉他们,作为L1管理者,他们有义务将区块空间填满,但更重要的是,要通过经济活动来实现这一点。这一行经常忽视其名称的第二部分,即货币部分。
任何发行代币的协议,如果想避免被做空,就需要让代币支持某种形式的经济活动。对于L1协议来说,它们的原生代币用于处理支付(执行计算)并收取相应的 Gas 费。经济活动越多,Gas 越多,对代币的需求也越大。这是加密经济模型,其他协议可能会选择作为中介层提供 SaaS。
当加密经济模型与特定商品结合时,效果尤为显著,对于 Layer 1 协议来说,这个商品就是计算。然而,当面对金融交易,执行的价格浮动对用户体验是巨大打击。在掉期交换等金融交易中,执行费用应该是最不重要的部分。
鉴于糟糕的用户体验,依靠经济活动填充区块空间十分困难。虽然扩容解决方案正在不断出现,有助于解决这个问题(强烈推荐阅读《Interplanetary Consensus 白皮书》,PDF 格式),但 Layer 1 市场泛滥,任何协议想获得足够的经济活动都不容易。
而当计算能力与某种额外的商品结合起来时,问题就变得简单一些。就分布式存储网络而言,商品显然是存储空间。数据存储及其衍生出的金融以及证券化可以立即填补经济活动的空白。
但分布式存储还需要为传统企业提供有效解决方案,特别是需要满足数据存储相关规定的企业。这就需要考虑审计标准、地理限制以及优化用户体验等方面。
我们在中介层论文第 2 部分(https://zeeprime.capital/web-3-middleware)中讨论过 Banyan(https://banyan.computer/),他们的产品在这方面其实走在了正轨。他们与 DSN 的节点运营商合作,为所提供的存储获得 SOC 认证,并提供简单的用户界面来优化文件上传。
但这样还不够。
存储的内容还要能通过高效的检索市场轻松访问。Zee Prime 看好在 DSN 上构建内容分发网络(CDN)的前景。基本上,CDN 是一种将内容缓存在用户附近,并在检索内容时降低时延的工具。
我们认为这是 DSN 普及的下一个关键,因为它可以实现视频快速加载(就像分布式的 Netflix、YouTube、TikTok)。我们投资组合中的 Glitter 是这个领域的代表,它专注于 DSN 索引。它属于关键基础设施,能供提高检索市场效率,带来更丰富的使用案例。
这类产品已经展现出了很高的产品市场匹配度,在 Web 2 中有大量需求。尽管如此,许多产品仍面临一些摩擦,而 Web 3 的无需许可性质可能会成为它们的福音。
可组合性的意义
其实,我们认为在 DSN 领域的绝佳机会就在眼前。在 Jnthnvctr.eth的这两篇文章中,他谈到了市场如何发展以及即将推出的一些产品(以 Filecoin 为例):
其中最有意思的观点时是在存储和链上计算之外,与链下计算相结合的潜力。这是因为提供存储资源本身就需要算力。这种自然的结合能增加 DSN 中的商业活动,同时开启新的使用案例。
FEVM 的推出使得许多新尝试成为可能,也给存储领域带来了趣味和竞争。想要创造新产品的创业者可以通过资源库查看 Protocol Labs 希望人们搭建的所有产品,搭建有可能获得奖励金。
Web 2 让人们发现了数据引力,那些收集/创建大量数据的公司可以获得回报,它们会封闭数据从而保护自身利益。
如果我们理想中的由用户控制的数据解决方案成为主流,价值积累的场景就会变化。用户成为主要受益者,以数据交换现金流,解锁这一潜力的变现工具能够受益,数据的存储和访问方式也发生了巨大变化。这种类型的数据自然可以存储在 DSN 上,DSN 可以通过强大的查询市场利用数据获利。这是从剥削到流动的转变。
可能还有更神奇的发展等着我们。
畅想分布式存储的未来时,不妨考虑它与未来的操作系统(如 Urbit)如何互动。Urbit 是一种使用开源软件构建的个人服务器,允许用户参与P2P网络。它是一个真正的分布式操作系统,可以进行自我寄宿并与互联网以P2P方式进行交互。
如果未来像 Urbit 的追随者们所希望的那样,分布式存储解决方案无疑将成为个人技术栈中的关键组成部分。用户可以将所有个人数据加密存储在一个 DSN 上,并通过 Urbit 操作系统协调行动。此外,我们可以预期分布式存储与 Web 3 和 Urbit 的进一步融合,尤其是Uqbar Network等项目,可以将智能合约引入到 Nook 环境中。
这就是可组合性的威力,缓慢的累积最终会带来令人欣喜的成果。从小打小闹演变为一场革命,指明了一种在超连通的世界中的存在方式。虽然 Urbit 可能不是问题的最终答案(人们对它也有批评),但它向我们展示了这些尝试如何汇聚成一条通向未来河流。