王峰再度对话Tim Gong:去中心化的AI,AI Agent 与 PoI
对话人:
王峰:蓝港互动创始人、火星财经及Elenment发起人
Tim Gong:SIG中国创始合伙人、ByteTrade董事长
编者按:2023年除夕,王峰与Tim Gong进行了一场对话,话题涉及信息排序、熵和公链以及Web3的未来(链接:王峰除夕对话Tim Gong:关于信息排序、熵及Web3的明天)。这场对话已经过去一年时间,这一年ChatGPT如日中天,LLMs 对信息的产生与分发都带来了深刻的影响,Tim Gong博士的认知有了哪些更新,其领导的ByteTrade又做了哪些工作?在圣诞前夕,王峰再次对话Tim Gong。
2022年6月,SIG宣布领投总部位于新加坡的Web3 信息应用的基础软件平台 ByteTrade 新一轮4000万美元,SIG中国创始合伙人Tim Gong出任该公司董事长。Tim Gong毕业于上海交通大学物理专业,在普林斯顿大学获电子工程学博士。 SIG是字节跳动的最早期的投资方,也一直是最大投资股东。
去年除夕夜王峰与Tim Gong探讨了“为什么需要有去中心化的信息分发”,也就是大家常讲的Web3。在此之后,OpenAI 发布了 ChatGPT。在过去的一年,LLMs 对信息的产生与分发都带来了深刻的影响。许多 SIG 投资的 Web3、云计算、或者 AI 公司在过去一年中也及时抓住机会,调整了产品方向。让我们看看Tim Gong在这一年中有了什么更新。
以下是王峰与Tim Gong的对话全文:
1、很多创业者与投资人现在都在讨论 AI native 的产品与公司。什么是您所理解的AI native?
可能一个比较常见的定义是“离开了 AI 就不工作的产品”。比如 copilot 这类产品可能就算不上是 AI native。毕竟离开了 AI 的 google search,Microsoft office 与 GitHub codespaces 仍然是挺有用的产品,而 AI 提供的价值是 incrementally 提高了体验。
而 AI agent 这样的产品,只要求用户用自然语言交互,由 AI 来理解,计划,推理,与执行整个任务,则是 AI native 的。AI agent 不是一个工具,而是一个与人协作的新物种。
从人找信息(以 Google 为代表的搜索),到信息找人(以字节为代表的推荐),再到 personal AI agent 帮助人生产与消费信息。我们一直在发明新的方法来实现熵减。
2、作为一个新物种,AI agent 是要取代人类吗?
当然不是。我想起了曾鸣教授最近提的观点:“富有创造力的人与机器的协同,是未来主流的工作状态。”
目前市场上大家对 AI agents 的定义比较广泛。任何给大模型提供了知识,记忆,感观(“眼睛与耳朵”),以及行动能力(“手”)的应用,都是 agent。当然 agent 也包括了机器对人的直接延伸,比如大模型驱动的机器人,个人 IoT 智能设备,或者数字孪生的环境。目前市场上的大模型应用创业公司,基本上 100% 是在做 agents。
3、如果 AI agent 是未来的主要产品形态,这对未来的整个软件生态会带来什么影响呢?
我想起来曾鸣教授曾说过:“Web2 的软件生态是让人更好地变成工具” ,我认为未来的软件生态会主要为 AI agent 服务。因为人只需要与 AI agents 交互了,其他的软件都与人没有直接关系了。Agents 或者“机器人”可以帮助你获得信息,帮助你挣钱(工作或者交易),帮助你学习,甚至帮助你社交。你个人的 agent 是你最信任也是最有用的陪伴,你与它交互就可以了。
举例来说,最近在大模型领域特别流行的 prompt engineering(提示词工程),包括 RAG 这种用私有知识库来补充 prompt 上下文的技术,都是以服务 AI agent 为目标的软件。这才是在基础软件层面的 AI native。
Mistral AI 的创始人最近也说,相对较小的开源 LLMs,比如 7B 参数的模型,能让开发者自己运行,同时可能涌现足够的“智能”,可能才是 agent 创新的 sweet spot。
4、说到开源的 LLMs,也有一些人仍不看好。最近的 OpenAI dev day 发布的一系列产品显示了一夜崛起的科技大公司的绝对优势。OpenAI 的先发优势如此之强,AI 的未来是中心化的吗?
开源大模型现在迭代速度越来越快,越来越有竞争力。我前几天在 Hugging Face 上搜了一下,光是基于 Llama2 架构重新训练或者微调的开源大模型就有上千个,而它们在性能榜单上与 OpenAI 的差距也在不断缩小。
而且在 OpenAI Dev Day 上发布的一系列产品,从模型微调,RAG 知识库,结构化输出,到应用编排都已经早有很好的开源方案。甚至可以说在应用这个层面上,OpenAI 在追赶模仿开源的创新。
5、但是,LLM 研发与推理需要的GPU 资源需要很大投入,所以是非常容易中心化的。有很多人说,GPU rich (富有 GPU)的大厂与 GPU poor (缺乏 GPU)的创业公司差距只会越拉越大。
我不同意这个说法。简单来说,现在最重要的开源大模型 llama2 不就是 GPU rich 的 meta 发布的?而同样 GPU rich 的 Google, 微软,亚马逊,到今天也没见发布什么有影响力的东西。GPU 显然不是创新的充分条件。创新靠的是人,不是 GPU。开源最大的优势是能把人聚在一起。而且随着 GPU 算力变得越来越便宜,模型训练的主要矛盾可能越来越会是数据,尤其是私域的数据,而不是算力。
甚至 GPU rich 也不是大模型创新的必要条件。在个人计算机与边缘机房有大量冗余的 GPU。它们也许并不适合训练模型,但是对于占 95% 应用工作量的微调与推理,这些去中心化的 GPU 资源是大有用武之地的。
但是我更期待的是进一步的科技创新,比如用 CPU 运行大模型推理。整个社会有大量闲置的 CPU 算力与内存。目前这方面前沿的工作很多。包括我们的 portfolio 公司,比如 Second State,实现了在个人笔计本电脑甚至 IoT 边缘设备上离线地运行大模型。
我很期待去中心化 AI 大模型应用的未来。
6、您讲了去中心化 AI agents 的可行性。但是它们是必要的吗?在您的设想中去中心能解决用户的什么需求呢?
同时,正因为 AI Agent 有可能全面掌握我们每个人的信息入口与出口,我们需要对它有高度的信任。我们不可能允许它被其他人控制,也很难容忍广告商的商业引导。这就决定了,agents 是私有的,是去中心化的。企业与个人需要的去中心化基础设施。
更进一步说,个人的机器人助手, IoT 智能设备,或者数字孪生,本来就是用户自己拥有的计算机,本质上就是去中心化的。在 ByteTrade,我们把这个基础设施叫做“私有的边缘云”。
但是,私有的 agents 是需要协作的。就像人一样,每个 agent 都需要与别的 agents 交换资源。这种交换可能是算力(比如你的 agent 有空闲的 GPU),可能是信息,可能是资产,也可能是现实社会的权限(比如你的 agent 有政府牌照可以交易某种受限资产)。这些都是全新的机会。
7、人与人的协同靠的是组织关系。人与机器的协同是靠什么实现的呢?
现代商业文明的基础是货币,也就是人与人之间的价值交换网络。我们的智能 agents 也需要一个价值交换网络,让 agents 之间以及 agents 与人之间能实现商业协作。
李飞飞博士在最近的一个访谈中提到,“When we think about this technology, we need to put human dignity, human well-being—human jobs—in the center of consideration.” 人与 AI agent 的交互与协作必须要维护人的尊严。
今天我们已经有了这样网络的基础技术。就是基于区块链的去中心化账本技术。整个 crypto 与 web3 社区对去中心化点对点交易系统进行了大量的尝试与创新。在 ByteTrade,我们把这种可以量化与交易的 agent 贡献叫做 Proof of Intelligence (PoI)。这个 intelligence 是广义的“智能”,是人或者机器智力劳动的结果。
8、这个世界每个人都需要接受一个 DID (去中心化的身份)吗?
Sam Altman 的 WorldCoin 讲的是 Proof of Personhood。作为 OpenAI 的 创始人,他认识到了在未来的 AI 世界里,人会是需要“自我证明”才能加入到价值网络的。DID 只是实现这个 vision 的一个具体技术手段。
ByteTrade 的 Proof of Intelligence 把人与智能 AI agent 放在同一个网络里进行价值交换。我们认为这里一开始的主要场景可能是 agent 学习人的喜好,然后代表人与别的 agent 交互。比如
- 一个 agent 可以是用户在 VR 世界里面的孪生,与其他人的 agents 在数字世界里面互动。
- 一个 agent 可以出售自己节点上闲置的 GPU 资源,换取另一个 agent 的闲置存储资源。
- 一个 agent 可能有一个在某个特定领域表现出色的微调大模型(比如这个 agent 的人类伴侣是一个行业专家)。它可以把这个模型“租”给别的 agents。
- 一个 agent 可能有私域数据能帮助别的 agents 更好地解决某一类的问题。它可以出售这些数据,或者甚至以这些数据为基础提供计算服务。
- 一个 agent 可以运行一个 DAO 或者公链的质押结点,与提高质押资金的 agent 分享收益。
这些 agents 之间的交换都是 PoI 的具体表现。这些 PoI 在区块链上可能有各种表现的形式。比如,同质化的计算资源可以是 fungible tokens ,而特殊唯一的数据或者算法则可以是 NFT。具体怎么为这个 intelligence 定价则是由去中心化的 RFQ 网络(比如 Otomic)或者 NFT 交易平台(比如 Element)来完成。
9、很明显,另一个驱动 AI 中心化的巨大力量是政府。不论是中国还是美国的人工智能产业人士都不会怀疑,中美两国政府都在试图“监管”大模型。创投圈子里面很多人说,监管会影响创新,想听听您的看法?
我认为大模型,以至 AGI,对社会产生危害的风险是确实存在的。但是解决问题的方法应该是依赖技术创新与行业自律。比如,大模型固然可以产生假新闻,但是它也能检测假新闻。我们的每个 agent 可以独立地对信息真伪进行判断,而且它们产生的结果也可以生成 NFT 记录上链。比如,A 的 agent 用 B 的模型加上 A 的数据生成了一个逼真的短视频,A 会同时发布一个 NFT 来证明这个视频的来源。这样任何看到这个视频的人都可以对其溯源。
如果不同的 agents 对信息真伪的判断有争议,PoI 还提供了一个很好的机制让社区达成共识。
Elon Musk 在 X 实现的 community notes 是让用户对内容进行投票,在很大程度上是非常成功的尝试。但是从 OpenAI 董事会的“宫斗”我们也可以看出,no skin in the game 的投票是非常危险的,很容易被人利用。
用 AI agents 可以规模化地对内容真假进行投票。而 PoI 是一个经济机制,它可以让 Agents 以及其代理的人类为投票付出成本,也就是让他们有 skin in the game。我很期待在这个方向的创业项目!
10、说起创业公司,您担任董事长的 ByteTrade 已经开始在做这些工作了吗?
是的,ByteTrade 去年成立的时候就是想要把属于每个人的计算资源连接起来,构建一个去中心化的“个人云”。这与我们今天讲的 Agent 没有什么不同。过去一年的主要变化是 AI 变得更强大了,所以 AI agent 的应用场景与需求都更上了一个台阶。对于 ByteTrade 来说,我们在明年会分步宣发几个产品模块。
- Terminus OS 是我们的个人云产品。它提供了一个去中心化的计算平台让每个人都可以运行开源的 AI 大模型以及 agents。
- Terminus 里面会预装一些核心的应用,尤其是需要高度安全的金融或者区块链应用。比如钱包,验证身份的 DID 等等。
- Terminus marketplace 是一个去中心化的应用市场。ByteTrade 与第三方开发者都可以在这里发布应用,比如 AI agents,内容推荐引擎,自动交易机器人等等。
- Otomic 是我们基于 RFQ 的交易网络。它上面主要由 Terminus 里面运行的机器人进行报价与自动执行交易。这个去中心化的 RFQ 机制可以交易几乎所有的 crypto 与传统金融的数字资产与衍生品。
ByteTrade 一方面为开源的大模型与 AI agent 提供去中心化的软件开发,发布,与运行的基础设施,另一方面通过搭建一个基于公链的 PoI 价值交换网络让 AI agents 的协作成为可能。很希望明年有机会与大家更深入地探讨这些问题!
太好了,谢谢龚博士今天的时间,我们非常期待 ByteTrade 的产品!