全面解析去中心化 AI 网络 Bittensor
原文标题:《Demystify Bittensor :How's the Decentralized AI Network?》
作者:Ming Ruan,Wenshuang Guo,Animoca Brands Research
编译:Scof,ChainCatcher
简要概述
- 人工智能的发展已达到关键的临界点,其对世界的深远影响不仅不可避免,而且有望在范围和深度上呈指数级增长。预计未来五年市场规模将超过1万亿美元,能够加速AI增长的项目将创造巨大的价值。
- Bittensor由TAO代币驱动,是一个去中心化的人工智能网络,旨在让项目通过众包AI相关的“数字商品”作为去中心化AI训练的替代方案。
- Bittensor的功能依赖于两个核心机制。第一个是创新的Yuma共识,它使得验证者能够就矿工之间奖励分配达成一致。第二个是TAO代币的持续发行,每12秒发行1个代币。发行速率每四年减半,从而创造出一个可预测但逐渐减少的TAO供应量。
- Bittensor的基本构建单元是子网,子网由三个关键参与者组成:1)子网所有者,设定子网的目标;2)矿工,提供计算能力并竞争更大份额的奖励;3)验证者,评估矿工的表现并因其评估获得奖励。分配给子网的总奖励由“根子网”或子网0决定。
- 当前,Bittensor上运营着超过50个子网,涵盖了包括基础设施、数据源、模型训练、微调等在内的多种AI相关需求。一些子网在生成特定维度上超越了中心化替代品,并展示了早期的成功。
- 像许多新成立的生态系统一样,Bittensor的经济模型仍然存在缺陷。其自上而下的资金分配设计尚未完全对齐各方利益。此外,支持网络资金的TAO代币价格仍然容易受到即将到来的减半事件的影响。我们提出了一种方法来解决这些问题,提升Bittensor生态系统的利益对齐性和可持续性。
去中心化AI的需求
人工智能领域正在以前所未有的速度发展,但这并非没有挑战。目前,中心化的数据训练模型主导着这个领域,主要由OpenAI、Google和X(前身为Twitter)等科技巨头控制。
尽管中心化的AI训练近年来取得了显著的成就,但它也存在一定的局限性。首先,数据训练过程中存在一些问题,比如私密信息的未经授权使用、数据审查导致训练结果失真,以及数据来源缺乏可追溯性。在算法方面,中心化的模型严重依赖数据质量,并且往往难以进行实时评估以实现迭代改进。
去中心化AI训练提出了一个替代方案,但面临着巨大的挑战,尤其是资源不足。目前,训练大型模型的成本已超过1亿美元,使得社区驱动的项目几乎无法与之竞争。去中心化的努力依赖于计算能力、数据和人才的自愿贡献,但这些资源不足以支持类似规模的项目。因此,去中心化AI的潜力仍然受到限制,无法在规模和影响力上完全与中心化AI抗衡。
来源:Statista
Bittensor概述
Bittensor是一个去中心化网络,旨在形成一个智能市场,使高质量的AI模型能够以去中心化的方式开发。通过利用激励机制并奖励参与者提供计算资源、专业知识和创新贡献,Bittensor建立了一个开源的AI能力生态系统,其中原生货币TAO既是奖励代币,也是访问网络的凭证。
Bittensor的核心组件,包括其Yuma共识、子网和TAO代币,最初在2021年11月随着版本“中本聪”发布而推出,并构建为Polkadot的平行链。随后在2023年迁移到基于Polkadot Substrate构建的Layer 1链,TAO的发行计划保持不变。
Bittensor的创建者和运营主体——Opentensor Foundation,由前谷歌工程师Jacob Steeves和机器学习学者Ala Shaabana共同创立,基金会目前约有30名员工,几乎所有员工都从事工程职能,缺乏B2B市场拓展、商业发展、合作伙伴关系或开发者关系等职能。
基本原理:Bittensor如何运作?
Bittensor开发了一个创新的网络,基于动态激励共识框架,允许参与者为生产机器智能所需的资源贡献提供支持,每个子网作为一个特定任务的模型运作,拥有自己独立的性能评估标准,并通过Bittensor的整体Yuma共识分配激励。
让我们通过一个类比来说明子网如何运作。可以将子网类比为一本杂志的出版商,每月组织写作比赛。每月,一位编辑会发布一个主题,供作家竞逐10000美元的奖励池。标准是“最能体现web3精神的作品”。作家将文章提交给编辑进行审阅,所有编辑会评估所有提交的作品,编辑的评分结果会决定最终的排名。排名最高的文章将被发布,并获得最大的奖励份额,而排名较低的文章也可能会获得较小的奖励。所有提交的文章及其评分都会与参与的作家和编辑分享,以便反馈和学习。通过这样的激励结构,作家会持续参与并贡献,作家和编辑之间的标准也会逐步趋同,从而使杂志能够发布最能“体现web3精神”的高质量文章。
在这个类比中,杂志出版商代表了子网,作家代表了矿工,编辑则代表了验证者。编辑汇总对文章的评价过程就是Yuma共识机制。在实际的子网中,矿工将获得TAO代币而非美元,这些代币由根子网(子网0)分配;验证者也会受到激励,以便他们的标准与汇总的评分接近,从而获得更多奖励。
在这一框架下,子网所有者通过验证者的手段,从矿工那里训练和获取智能能力,构建出具有特定功能的AI模块。除了子网,Bittensor还设有支持整个网络功能的其他层次:
- 应用层:外部应用程序将请求发送到子网以获取智能响应。
- 执行层:由一组子网组成,每个子网都在训练和利用矿工以实现其开发智能及其他相关能力的目标。
- 资金层:根子网(子网0)负责向子网分配TAO发行量,用以资助其活动。
- 区块链层:发放TAO并在子网链上记录交易。
a. 应用层
用户可以通过各种应用程序与Bittensor进行互动,这些应用程序连接到子网或作为子网。用户提出服务请求,例如语言翻译或数据分析,应用程序通过验证者API将请求路由到子网。最佳的矿工答案由验证者共识选出,并返回给用户。
b. 执行层
该层由一组子网组成,所有子网都使用Yuma共识来训练和利用矿工。在不深入讨论各个子网的情况下,我们将在这里讨论Yuma共识及子网的参与情况。
子网
任务特定的子网使用一个为其目标设计的框架,称为“验证栈”。验证者执行该栈,指导矿工朝着创造价值的任务前进,确保子网目标得以实现。矿工的目标是超越同行,赢得更大份额的奖励。
成为子网所有者,需要首先支付注册费,然后才能连接子网。注册费会根据需求波动,目前大约为3000 TAO。子网注销时,费用将退还。
成为验证者需要抵押TAO。最小抵押门槛由抵押量排名第64的验证者决定。抵押规模更大的验证者在每个子网的服务请求和Yuma共识中具有更高的权重。此外,一个验证者可以在多个子网中服务。
要加入子网,无论是作为验证者还是矿工,都需要注册一个名为“神经元”的位置。注册费根据子网而有所不同,且会根据需求和供应变化,但通常低于1 TAO。注册一旦注销将被回收且不予退还。除了入场费,矿工还需要自定义配置其软硬件以服务于子网的目的。因此,矿工通常会绑定在一个子网内。
截至2024年12月,共有250个验证者由173个用户账户运营,11,856个矿工由2,709个用户账户运营。
激励分配
在每个子网内,分配的TAO发行量由根子网(funding layer中的root)决定,并按照预定比例分配给验证者和矿工:41%分配给矿工,41%分配给验证者,18%分配给子网所有者。在矿工中,激励依据验证者分配的“信任值”来确定。在验证者中,激励则根据验证者的“信任评分”和抵押量进行分配。对于有委托TAO抵押的验证者,验证者会与其他抵押者共享奖励,扣除其保留的“份额”后进行分配。
c. 资金层
根网络,也称为子网0,是Bittensor堆栈中的资金层。在根子网中,每个验证者运行所有子网的验证栈,评估各子网自身基准返回结果的质量、准确性和响应时间,从而确定其评分。然后,这些评分通过Yuma共识转换为子网在TAO发行中的份额。
根子网具有两个独特的特点:首先,矿工被子网替代,作为评估的主体;其次,根子网中的验证者数量固定为64个。在设计中,新的申请者必须抵押一个超过现有验证者最低抵押量的TAO才能加入根子网。然而,目前这一替代机制已暂停,因此,尽管抵押量有所不同,一组固定的64个验证者控制着根子网。
d. 区块链层
Subtensor是Bittensor中的区块链,负责发行TAO。子网中的验证者将权重评分、交易数据和性能指标提交到Subtensor区块链。Subtensor区块链的验证者节点由Opentensor基金会使用权威证明(Proof-of-Authority)进行运营,负责验证交易、更新Subtensor账本,并治理奖励分配。关于这一区块链层的去中心化声明存在争议,因为Opentensor基金会团队在需要时可以暂停区块链。
评估子网
截至2024年12月,共有56个活跃的子网。这些子网涵盖了AI开发的多个方面,例如训练数据管道、计算能力、训练平台、通用AI模型和特定应用AI工具。子网之间的发行分配不均,前10个子网占总发行量的约50%。
在本节的其余部分,我们将深入探讨三个有趣的子网,以说明子网所有者如何使用它们。
子网 18:Cortex.t
Cortex.t 是由 Corcel 在 DSIS 框架下开发的子网,目标是通过 GPT4o 和 GPT4 生成动态合成数据,用于模型测试和无偏人工智能评估。它创建了高质量的提示-响应对,并将其存档为 wandb.ai 上的合成问答数据,同时利用提示进化和数据增强等技术优化输出结果。
在 Cortex.t 子网中,矿工处理需要 GPT4o 和 GPT4 输出的提示,其准确性、速度和效率由验证者评估。这些验证者使用相同的模型形成合成数据库,同时管理 API 服务器以发送提示。此外,验证者还可以在 DSIS 框架下将带宽作为服务出售,用于生产级应用。
子网 37:模型微调
模型微调子网旨在利用去中心化能力训练先进的专业模型,例如聊天机器人或推理系统。模型微调通常耗时、计算密集,并需要特定技能。通过应用子网结构,矿工可以贡献其技能和资源以改进模型,并获得相应奖励。
矿工任务以微调模型的竞赛形式组织。每场竞赛都会公布基础模型、限制条件和目标。矿工以基础模型为起点,离线运行微调,将微调后的模型提交到 Hugging Face(一个人工智能社区网站),并将模型元数据提交到 Bittensor 链。
验证者会检索元数据以识别模型,并使用来自子网 18 的合成问答数据(Synthetic QA 数据)。随后,验证者在 SYNTHETIC_MMLU 任务中评估矿工模型的多项选择题准确性,从而衡量矿工的表现。矿工根据验证者的评分排名并获得相应奖励。
子网 5:Open Kaito
子网 5 专注于开发文本嵌入模型,以增强语义搜索和自然语言理解等应用的能力。矿工通过使用大规模文本数据集训练这些模型,以确保其在生成嵌入方面的高效性能。验证者通过与最先进的基准进行对比,评估模型表现,从而推动持续改进。
这些模型将通过公共验证者 API 提供访问权限,以便于集成到各种应用中,同时目标是超越现有的性能标准。
Open Kaito 团队最近宣称,子网 5 的矿工已在外部保留基准测试中超越 OpenAI 嵌入模型。这是在此前使用大规模合成数据集取得的较低损失和更高 Top-1 准确率的基础上实现的突破。这一成功具有重要意义,因为它表明去中心化的人工智能模型训练在某些方面能够超越中心化模型。
来源:wandb
从这些子网示例中,我们可以看出 Bittensor 作为一个去中心化人工智能生态系统的早期成功迹象。在单个子网层面,去中心化的模型训练和微调是可行的。这一点也得到了 Prime Intelligence 最近成功训练首个去中心化 100 亿参数模型 INTELLECT-1 的支持。在生态系统层面,各子网之间可以相互合作,形成价值链。因此,不仅模型训练部分,甚至整个人工智能价值链都有可能通过 Bittensor 实现去中心化。
在评估 Bittensor 上去中心化人工智能的技术可行性后,我们将进一步探讨其生态系统的经济性,以判断其设计是否能够支持一个可持续的人工智能训练价值链。
TAO 代币经济模型
Bittensor 的激励代币 TAO 建立在其区块链 Subtensor 之上。目前,每 12 秒生成一个新区块,每个区块铸造 1 个 TAO 作为奖励分发给网络参与者。TAO 的发行率在首批 10,500,000 个代币被铸造后将迎来首次减半,随后每当达到前一减半周期发行量的一半(如第 2 次减半为 5,250,000 个代币)时,发行率将继续减半。这一减半机制设定了 TAO 的总供应上限为 2100 万枚。截至 2024 年 12 月,约 37.8% 的总供应量,即 793 万 TAO,已经被铸造。
每次减半事件的时间主要由区块生成速率决定,同时也受到代币回收的影响。每回收 1 个 TAO(通常来自区块链手续费或子网参与者注册费用),便阻止了 1 个新 TAO 的铸造,从而延迟一个区块生成周期的减半时间。据最新估算,下一次减半日期为 2025 年 11 月 29 日。
在前文中,我们已提到 TAO 的主要用途是作为奖励代币以激励网络参与者。以下是 TAO 的其他用途:
- 质押:TAO 持有者可以将 TAO 直接质押到自己的验证者,或委托给验证者并分享验证者活动的奖励,最低质押金额为 0.1 TAO。
- 网络准入:矿工、验证者和子网所有者需要支付 TAO 注册费用才能加入 Bittensor 网络。
- 治理:TAO 持有者可以通过“参议院”影响网络治理决策,例如协议升级和发行调整,“参议院”成员包括活跃的子网验证者。
- 交易费用:TAO 是 Subtensor 区块链的燃料费用代币。
Bittensor 是否可持续?
Bittensor 被定位为一个智能市场,让寻求人工智能能力的用户可以通过建立子网吸引验证者和矿工进行合作。然而,其机制偏离了传统市场结构:子网所有者并未直接为矿工或验证者的服务支付报酬,这些贡献者的收入也未与其输出或工作量挂钩。
实际上,Bittensor 更像是一个自上而下的拨款系统,而非市场。子网活动通过由“根”网络分配的拨款来激励,但拨款金额的决定标准并不总是与子网的实际价值或工作量一致。此外,无论生态系统中子网数量如何变化,总拨款池始终固定。
为了更好地理解这一实践,可以将其类比为一座城市。在这座城市中,除了我们之前讨论的杂志出版商外,还有图书出版商、音乐工作室和表演学校等商业实体。这些企业的唯一收入来源是市政府的拨款,只要能获得拨款委员会的批准,就能持续获得资金,而不考虑其实际价值创造。对于新加入的企业,则需从政府购买土地以获得资格。随着新企业的增加,总拨款池依然固定,无论企业数量如何变化。
这种非传统系统扭曲了市场动态,导致资源分配效率低下。拨款分配者(根网络)缺乏有效手段衡量子网的贡献,而子网则没有动力与更广泛的生态系统分享其人工智能能力带来的利润。矿工倾向于以最小的努力换取最大的 TAO 分配,而非提高能力或承担更多工作量。
尽管 2024 年 1 月提出了动态 TAO(Dynamic TAO)的建议以应对部分低效问题,但该提案尚未实施,其有效性仍不确定。
TAO 的激励模型高度依赖 TAO 的强劲价格,而大多数网络参与者的主要收入为 TAO,这导致了持续的抛售压力。为平衡这一压力,质押已成为主要机制,但区块链手续费和注册费带来的代币回收量仍然有限。
质押分为两种形式:
- 验证者质押:参与者将 TAO 质押以支持网络安全并获得奖励,约占所有已发行 TAO 的 75%。验证者目前每天分配 2,952 TAO,年化回报率为 16%。然而,第一次减半后,这一分配将减少到每天 1,476 TAO,质押吸引力将下降,从而削弱质押对代币供需平衡的影响。
- 子网注册质押:子网注册费约为 3,000 TAO,新子网的加入显著影响 TAO 的供应。但这也引发了一个难题:由于 TAO 的总发行量固定,子网数量增加会稀释所有子网的奖励,使现有子网难以维持运营,可能导致部分子网退出网络。
Bittensor 当前的经济模型并不具有可持续性。其自上而下的拨款结构未能高效地在子网间分配资源。更重要的是,TAO 的需求不足以支撑其减半后的价值,这加剧了网络的脆弱性,威胁其长期生存能力。
我们的提案
我们提出一项两部分策略以增强 Bittensor 的可持续性:
- 激励子网贡献:允许子网所有者向其子网提供额外的 TAO 奖励,这些奖励将加入根网络分配给子网的总激励池,并通过现有共识机制分配给参与者。此举将激励那些从子网中获得显著价值的子网所有者向子网奖励池贡献资金,从而确保矿工和验证者的积极参与,并让子网所有者成为 TAO 代币的购买力量,有效支撑其价格。
- 优先拨款分配:根网络应优先为新建和高潜力子网分配拨款,同时逐步减少对老旧子网的支持。此举将通过自然淘汰生成价值较低的子网,确保新子网在不被总子网数量稀释的情况下获得充足的资金。此外,这种方式将减轻根网络验证者的负担,使其专注于新子网的增长,更符合自上而下的拨款模式。
通过实施这些策略,Bittensor 可以为 TAO 代币创造持续需求,帮助其维持价值,而不再仅仅依赖质押。同时,这些措施通过引入自然选择机制推动生态系统增长,集中资源孵化新子网。
结语
人工智能无疑代表着技术进步的未来。这一点从人工智能价值链中领先企业的高估值以及其在社会各领域的广泛应用潜力中得以体现。尽管中心化的人工智能开发推动了进步,但也暴露了依赖中心化数据、模型开发和利润集中的弊端。
Bittensor 提供了一种去中心化人工智能的有力替代方案。在自上而下的拨款模型和稳健的 TAO 代币价格支持下,多个子网已展示出推动人工智能能力发展的潜力。总体而言,Bittensor 可形成涵盖人工智能生态系统整个价值链的综合平台。
然而,正如其他新兴生态系统一样,Bittensor 也面临挑战,特别是在第一次减半后,其代币经济模型的可持续性和奖励分配系统的有效性方面。为解决这些问题,我们建议对奖励模型进行调整,优先支持新建和高潜力子网,使其如风险投资般运作。这将使现有子网所有者能够资助其参与者,并从去中心化人工智能的贡献中获益。
通过这一调整,我们相信 Bittensor 的激励模型能够实现可持续性,从而将注意力转向真正关键的问题:去中心化人工智能何时能够创造高价值的现实应用?