对话EpiK:知识图谱是AI理解人类知识的必经之路
知识图谱作为教育AI学习人类所理解知识的一种数据格式,正快速推动着人工智能领域的应用落地与实践,知识图谱行业发展空间也将逐步扩大。EpiK Protocol被称作全球首个 AI 数据的分布式存储项目,随着主网上线在即,引发行业内广泛关注。
本期EpiK生态大使、AI应用科技公司创始人Principles就EpiK的发展路线图、知识图谱的构建和优势、应用场景创新以及主网上线的激励计划等话题进行了细致精彩分享,相信对你更深入了解知识图谱及其前景有所帮助与启发。
链捕手:请先介绍下EpiK Protocol,以及在行业内的具体实践探索,目前开发进度怎么样?
Principles:EpiK Protocol 铭识协议是全球首个 AI 数据的分布式存储协议,通过整合 IPFS 存储技术、Token 激励机制和 DAO 治理模型,打造出具备可信存储、可信激励、可信治理和可信金融四大核心能力的全球开放自治社区,以极低的管理成本组织全球社区用户共同协作,持续产生可共建、共享、共益的高质量 AI 数据,开阔 AI 的认知,推动全面智能化时代的到来。
目前,EpiK Protocol 已经完成了为期一年的 5 轮测试网测试,正在筹备本月 8 月 15 号的主网上线。测试网阶段,不论是 EpiK Protocol 的标注系统还是存储系统,奖励都来自于基金会补贴,激励有限。
随着主网的上线后,十倍于测试网的经济模型正式启动,EpiK Protocol 采集 AI 数据的速度将会大幅度提升,社区参与 EpiK Protocol 的方式将会更多,共同为AI和区块链行业持续创造真实价值。
链捕手:在分布式存储方面,铭识协议 EpiK 具体采取了怎样的技术方案?
Principles:铭识协议的技术方案是基于Filecoin的Lotus来进行改造的,我们沿用了 Filecoin 的复制证明和时空证明方案,保障存储设备投入与产出的公平性,杜绝了同源攻击等问题。
不同点在于我们有标注和存储两套系统,大家在部署机器参与的过程中也能感受到我们和 Filecoin 的明显差异。同时我们改造了存储系统的惩罚机制和激励机制,降低了 EpiK 存储机器参与的成本,提升了全网数据的去中心化程度和安全性,并且大幅提升了网络 TPS 吞吐量和节点规模。
除此之外,我们还增加标注系统激励机制,将数据生产和数据存储一体化实现在一个协议里,保障没有中间商挣差价。另外的创新点还在于,我们从 Bitcoin 技术体系中为 EpiK 引入了 Coinbase 机制,收益可以做自动归集,代币可以进行待抵押,这也间接在 EpiK 生态中衍生出了分布式存储的第一个开放矿池技术解决方案。
最后这一点很重要,有望把poc项目的挖矿“傻瓜化”,让EpiK有更广泛的群众基础。
链捕手:EpiK Protocol被称为全球首个「AI 数据 + 分布式存储」解决方案,为什么要将两者结合在一起?具体解决哪些痛点?
Principles:
- 相比于以 Filecoin 为代表的分布式存储项目,EpiK Protocol 不仅拥有 Filecoin 的存储能力,还增加了 AI 数据处理协作网络,能够源源不断地为分布式存储生态输送高价值的 AI 有效数据。
- 针对于目前分布式存储生态的现状,EpiK Protocol 开创了分布式存储新的商业模式,从为企业提供付费存储,升级成了为企业提供更低成本的持续更新的 AI 数据。
- 相比于传统 AI 数据标注,EpiK Protocol 是全球首个 AI 数据的分布式存储协议,将数据标注产业链转变为数据共享经济模式,极大降低了数据标注成本。
在目前算法未优化状态,实测标注效率已经 10 倍于传统标注效率,目前团队做了一款游戏化的知识众包产品——知识大陆,于今年4月22上线测试版。用户可以通过游戏化答题的方式,搜集数据和分类数据。
下载贡献您的知识力量,获取EPK
链捕手:可以向读者具体解释下知识图谱是什么吗?你们的最终产品会类似于百度百科、维基百科提供的服务吗?
Principles:知识图谱与文字、视频、图片、语音一样是一种知识传递载体。我们人与人之间可以通过语言、文字、视频和图片等等手段来传授知识,就像老师上课、编书、录制视频来教育学生。
但人类没有办法通过这种方式来教育 AI 机器人,因为它缺乏认知能力,没法理解这些数据的含义,需要我们找到一种 AI 能够理解的数据格式来教育 AI 人类所理解的知识,那这种特殊的数据格式就是知识图谱,可以说知识图谱是目前 AI 理解人类知识成为通用 AI 的必经之路。
比如我们有了医疗的知识图谱,我们就可以培养出一个可以为每个人提供智能问诊服务的 AI 医疗助理;有了保险的知识图谱,我们就可以训练出一个可以为每个家庭提供智能投保和承保的 AI 保险助理;有了大学的知识图谱,我们就可以训练出一个服务于每个毕业生的大学专业智能推荐助理。
以上这些理解,我们就能回答 EpiK Protocol 最后提供的有效数据不会是百度百科和维基百科这种给人看的数据,而是一个个从人类不同知识领域标注出来的给机器人看的知识图谱数据,这些数据借助 AI 超强的算力将发挥出来巨大的价值。
链捕手:未来将如何构建知识图谱?你们的优势在哪里?
Principles:铭识协议目前已经有工具串起了知识图谱的领域专家社区(主要工作是定义不同领域的知识图谱数据格式和制定知识图谱数据验收规则)、赏金数据标注社区(主要工作是帮助领域专家完成具体的知识图谱数据采集和验收工作)和数据存储社区(主网工作是存储知识图谱数据并对外提供有偿访问)。
这些工具使得我们能够第一次在各方高度互信的前提下完成了一个数据共享经济运转系统,使得数据贡献方能够持续享受未来数据的变现收益,这套机制在我们的实测中,已经轻松完成了10倍于传统数据标注的成本优势。而成本的大幅降低将为未来AI的发展提供源源不断的动力。
就像顶级的人工智能专家所说的那样,在造AI火箭的过程中,神经网络算法是火箭引擎,数据是燃料。
从06年开始,以深度学习为代表的新一代人工智能研究兴起,到现在全球已经培养了整整 15 年的 AI 人才,相应的各种深度学习算法和框架也研究了15年,成果丰硕。火箭引擎并不存在瓶颈,真正的瓶颈可能就转变为数据了。 而铭识协议的成本优势、协作优势,将在未来的AI技术落地中发挥巨大作用。
链捕手:EpiK的Token经济模型是如何设计的?为什么要这样设计?
Principles:EpiK的Token经济模型设计的原则是,生态里面各个角色追求自身利益最大化的同时,能形成合力共同推动项目的整体壮大。在EpiK生态中有几大角色,领域专家,赏金猎人(知识大陆APP用户),存储矿工,知识网关(AI公司)。
大家各司其职,组成完整的生态闭环。其中,领域专家,赏金猎人(知识大陆APP用户)负责有效数据的生产;存储矿工负责存储数据;知识网关负责连接数据使用方和矿工。
这样能很好地保证每一份数据的有效和使用性。按照经济白皮书,主网上线后,每天会生产33.2万个EPK。其中75%给矿工,即24.8万每天,9%给领域专家团队,1%给投票用户,15%给带宽奖励或知识基金。
Token价格按0.35U(现价1美元以上)的奖励来算,矿工会在90天内回本,领域专家每年可支配500万的知识基金,投票用户可得币本位7%年化收益率。剩下的15%设定很有趣,是带宽奖励和知识基金共同去share。
这里有个类比,当你经营图书馆,人很多,证明书质量好,所以我会偏向于把更多钱投放在桌椅上让来的人体验更好。这里代表的就是当AI数据质量够高,使用的AI公司越多,就会有更大比例给带宽奖励(公网IP的矿工),让矿工把带宽保持足够稳定;相反,当图书馆,人很少,证明书不好,应该花更多钱去买书。这里代表的就是知识基金,具体是放在知识大陆APP上,吸引更多用户来参与到AI数据知识图谱的共建当中。
要了解更详细的经济模型的相关信息,大家可以参考下图:
链捕手:EpiK的主网即将上线,接下来会向社区推出怎样的激励计划?如何提升社区的共识度?
Principles:首先主网上线后,各个角色的激励都会大幅提升。测试网阶段,存储节点一天收益总和是1w EPK,主网上线后是24.8w EPK;测试网阶段,在知识大陆答题的赏金猎人一天收益总和是 500 EPK,主网上线后是 2 - 4w EPK。
另外,我们在主网上线后,我们还将启动 EpiK Protocol Grants 生态扶持计划,包括全球各个地域性的存储和知识生态大使招募,生态工具扶持和EPK DeFI应用场景扶持。我们还将为知识大陆引入更多玩法,比如 NFT Buff 加成、开放冠名知识大陆建筑物等等。
链捕手:你认为EpiK接下来的主要挑战有哪些?打算如何应对?
Principles:我认为主要挑战主要是协作工具的效率,再拆解下来主要是领域专家的使用门槛和任务生成引擎的效率,现在我们的数据采集成本已经远低于传统标注公司的成本,但是为了进一步将数据贡献者的劳动最大化地面向实体变现,我们需要不断优化数据采集效率。
领域专家的使用门槛越低,能参与进来的领域专家就会越多,知识领域的拓展会更快,为了实现这一点,早期我们会培训一些人手把手教领域专家如何使用我们的系统准确定义和验收自己想要的数据,并在他们的反馈中持续迭代产品。
任务生成引擎的目标是能更加精准地发放任务来完成领域专家对数据采集的需求,这部分我们已经和不少的实验室建立了合作关系,他们在各个细分领域都有很好的算法储备。
链捕手:EpiK接下来一年路线图是怎样的?长期愿景又是怎样的?
Principles:首先在本月会上线 EpiK Protocol Mainnet 1.0 "罗塞塔",之所以叫罗塞塔是因为罗塞塔是第一次人类理解古埃及文字,打开了古埃及文明的大门,这是个破次元壁的古迹。而 EpiK 的目标是要让 AI 理解人类文明,为 AI 打开理解人类文明的大门,也是破次元壁的里程碑。
在接下来的一年,大方向上,EpiK 团队会先聚焦于上线 EpiK Protocol Mainnet 2.0 "汉谟拉比",这个版本主要上线 EpiK DAO 治理相关的所有功能,开启社区自治,正因如此这个版本使用了人类历史上第一个成文法典的名字 "汉谟拉比“。在此之后,EpiK 团队将把精力放到知识生态上,拓展更多的知识领域,增加领域专家的数量和粒度,将各个领域的知识图谱做广做深。
对接更多的数据需求方,并整合法币合法兑换服务,帮助数据需求方以更低的法币成本获取到自己所需要的数据。
在小方向上,EpiK 团队会为 EPK 提供更多的 DeFi 或者 CeFi 服务,比如跨链、借贷和期权等等;另外,EpiK 团队还会整合更多的玩法到知识大陆,让数据标注不再枯燥。
长期看 EpiK 的目标是非常明确的,持续性地将人类各领域知识转变为 AI 能够理解的知识图谱数据,开阔 AI 的认知,推动认知智能时代早日到来。
链捕手:随着区块链行业发展愈发迅猛,你认为还有哪些应用场景创新与技术创新值得关注?
Principles:除了分布式存储赛道,我对 DeFi 和 Metaverse 也时刻保持着关注,EPK 作为资产,自然不仅仅是参与 EpiK 生态的需求,还会出现各种衍生品,比如最近大家呼声很高的借贷服务。
另外,知识大陆作为一款寓教于乐的知识众包产品,我们在最早期就将其设计成了依托于土地和建筑的游戏世界,这个与 Metaverse 和 NFT 是天然地结合,这不是生搬硬套蹭热点,而是很自然的横向扩展。
在 Metaverse 和 NFT 的赛道已经有了一些不错的经过市场验证的工具和机制,据悉,EpiK 团队也在和这些赛道的头部玩家密切沟通,将这些玩法整合到知识大陆里。