准备数据、训练模型和构建用户体验
- 准备数据:机器需要大量高质量的数据来学习。例如,要将文本转换为图像,ML 模型需要从数百万张带有文本标签的图像中学习。ML 工程师通常花费 80% 的时间在称为特征工程的过程中手动清理数据。
- 训练模型:接下来,ML 工程师将数据拆分为训练集和测试集。机器使用训练集来构建模型,然后使用测试集来提高模型的准确性。
- 建立用户体验:在训练模型之后,团队需要建立一个用户UX体验,人们可以在其中提供输入以获得他们想要的输出。即使对于 ML 工程师来说,模型的工作原理也是一个黑匣子,因此用户体验需要清晰、可信且可操作。
机器学习进一步分为三大类:监督学习(通过标注数据进行训练,如图像分类)、无监督学习(从未标注的数据中发现模式,如聚类)和强化学习(通过与环境互动获得奖励进行优化,如游戏AI)。这三类学习方法构成了现代AI的核心算法基础。
2.3.2 深度学习(Deep Learning)
深度学习是一种基于神经网络的机器学习技术。其中的主要特点是能够自动学习数据的特征,通过将特征学习任务交给模型进行训练来实现自动学习过程。
深度学习历史发展
通过神经网络的多层结构提取数据中的高级特征,特别适合处理非结构化数据(如图像、语音、文本),适用于图像识别、自然语言处理、医疗影像分析等场景。
2.3.3 自然语言处理(Natural Language Processing, NLP)
NLP是让计算机理解、处理和生成人类语言的技术,通过分析文本或语音进行语义理解和响应。
近年来,NLP技术取得了显著进展,特别是在生成式预训练模型(如BERT、GPT-3)推动下,AI在语言理解和生成方面表现出色。这些模型利用大量文本数据进行训练,能够生成自然的、连贯的文本,应用于聊天机器人、智能客服、语言翻译、内容生成等场景。
2.3.4 计算机视觉(Computer Vision)
计算机视觉是通过计算机算法让机器“看懂”图像或视频,自动从视觉数据中提取信息。
计算机视觉主要用于物体检测和跟踪、图像识别和处理、动作识别等,应用场景包括自动驾驶、安防监控、医疗影像分析、零售和广告等。
2.3.5 强化学习(Reinforcement Learning)
强化学习是一种通过与环境交互获得反馈(奖励或惩罚),进而优化决策的技术。通过与环境的互动来学习策略,使得AI系统通过试错法获得最大回报。在每一步操作后,系统会收到奖励或惩罚,通过长期的反馈来优化决策。
强化学习主要用于训练AI智能体在动态环境中进行最优决策,应用场景包括游戏AI(如AlphaGo)、自动驾驶、机器人控制等。
Google DeepMind在Nature发表的文章《Human-level Control through Deep Reinforcement Learning》首次实现了End-to-End的深度强化学习模型Deep Q-Networks,它的输入是游戏画面的像素值,而输出是游戏的控制命令,它的原理如下图所示。
2.3.6 生成式AI(Generative AI)
生成式AI是通过机器学习模型生成新的、与训练数据相似的内容,如图像、文本或视频。
生成式AI技术正在改变创意产业,推动艺术、娱乐、广告等领域的创新,其应用场景包括艺术创作、图像生成、游戏设计、稳步生成等。
2.3.7 大数据与数据处理
大数据技术用于处理和分析大量的数据,尤其是在AI中用于数据预处理、特征提取、模型训练等任务。
通过大数据技术,能为AI模型提供有效的训练数据,提升模型的准确性和预测能力。应用场景包括电商分析、市场预测、情感分析、趋势分析预测等。
2.3.8 AI硬件加速(GPU/TPU/NPU)
AI硬件加速技术通过使用专用硬件(如GPU、TPU、NPU)加速神经网络训练和推理过程。
其应用场景包括深度学习模型训练、智能设备AI计算、数据中心等。
3 AI的市场、应用场景和商业模式
3.1 AI行业的市场规模:
全球人工智能(AI)市场正快速扩张,尤其自ChatGPT发布后,增长势头显著。2023年全球AI市场规模估计在3000亿至4000亿美元之间。
据Precedence Research预测,2024年全球AI市场规模为6382.3亿美元,并将在2034年达到36804.7亿美元,CAGR为19.1%,凸显了该领域的巨大潜力和持续的强劲发展。
推动这一增长的因素包括企业对自动化和数据驱动决策的需求增加,政府对AI技术的投资和支持,以及AI技术的不断成熟和广泛应用(从传统的互联网行业扩展到金融、医疗、教育、制造等各个领域)。
3.2 AI的应用场景
依托于AI的几大关键能力(图像识别、语音识别、自然语言处理、具身智能),AI技术被应用于各个垂直领域,如医疗(如AI诊断工具)、金融(如风险评估与算法交易)、零售(如推荐系统)、制造(如智能工厂),解决行业特定的问题,提升运营效率,创造新的商业模式。
- 医疗领域:AI在医疗领域的应用正逐渐成熟并扩展至多个方面,包括诊断、个性化治疗、药物研发和健康管理等。AI通过分析大量的医疗数据(如病历、基因序列、影像数据),可以辅助医生进行疾病的早期诊断、精准治疗决策,并加速新药研发的过程。例如,放射学中的AI工具能够帮助医生识别早期癌症迹象,AI驱动的基因分析可以为患者提供个性化的治疗方案。AI在医疗领域的应用不仅提高了诊断的准确性和治疗的效率,还显著降低了医疗成本,特别是在资源有限的环境中,AI技术可以极大地改善医疗服务的可及性。
- 金融领域:在金融行业,AI被广泛应用于风险管理、算法交易、客户服务和欺诈检测等领域。AI通过分析海量的市场数据和历史交易记录,能够实时预测市场趋势并执行高频交易策略,提高了投资回报率和市场效率。此外,AI还被用于开发智能投顾服务,帮助个人投资者根据其财务状况和风险偏好制定投资策略。AI驱动的反欺诈系统则通过监控交易模式,及时发现异常交易行为,降低金融机构的损失。
- 教育领域:AI在教育领域的应用正在改变传统的教学模式,推动个性化学习的发展。通过分析学生的学习行为数据,AI可以为每个学生量身定制学习内容和路径,帮助学生在适合其学习速度和理解能力的节奏下学习。AI还被用于开发自动化的作业批改和考试评分系统,减轻教师的工作负担,并提供实时反馈。此外,AI驱动的教育平台可以根据学生的表现和兴趣,推荐适合的学习资源和课程,提升学习效果。
- 零售与电商领域:在零售和电商领域,AI通过个性化推荐系统、库存管理优化、客户关系管理(CRM)等方式,帮助企业提高销售额和客户满意度。AI分析客户的购物行为和偏好,能够精准推荐商品,增加销售转化率。
- 供应链管理:在供应链管理方面,AI通过预测需求波动,优化库存管理,减少商品缺货或过剩的情况。此外,AI驱动的聊天机器人和虚拟助理提升了消费者的购物体验,为他们提供24/7的个性化服务。
- 智能产品和设备:AI技术被广泛应用于智能家居设备、无人驾驶汽车、无人机、机器人等智能产品中。这些产品通过AI实现自动化、个性化的功能,显著提升了用户体验。例如,AI驱动的智能音箱(如Amazon Echo、Google Home)不仅能执行语音命令,还能学习用户的习惯,提供更贴心的服务。
- 自动驾驶:自动驾驶技术是AI在智能设备中的一大亮点。通过深度学习模型和传感器数据融合,自动驾驶系统能够在复杂的道路环境中做出实时决策,提高行车安全性和效率。
3.3 AI商业模式
AI的商业模式多种多样,主要的包括软件即服务(SaaS)、数据分析服务、AI驱动的产品(如智能设备)等。企业通过提供AI解决方案来简化流程、提高效率,从而实现盈利。
- 软件即服务(SaaS):AI SaaS平台提供基于云的AI服务,企业用户可以按需订阅这些服务,而不需要自行开发或维护AI基础设施。例如Google的AI平台、Amazon的AWS AI服务、Microsoft Azure的AI工具、OpenAI的ChatGPT等,用户可以通过API调用这些服务(包括机器学习、自然语言处理、计算机视觉),并按使用量支付费用。
- AI硬件销售:AI硬件厂商如英伟达等研发了AI专用芯片,通过为各类厂商和用户提供AI芯片算力来获得销售收入。英伟达的AI芯片客户包括CSP厂商(微软、亚马逊、谷歌等)、互联网、消费级科技公司(Meta、特斯拉等)。
- 数据分析服务:AI数据分析公司通过分析企业的数据,为其提供有价值的商业洞见,帮助优化业务流程和决策。例如Palantir等公司通过分析庞大的数据集,帮助企业识别模式、预测市场趋势,并制定更有效的战略。这类服务通常采用咨询或按项目收费的方式。
- 智能设备:AI技术被嵌入到各种硬件产品(如智能音箱、无人机、自动驾驶汽车等)中,这些设备通过AI实现关键功能并创造独特的用户体验。例如,Tesla的自动驾驶系统、Amazon的Echo智能音箱等,都是通过AI技术赋能的产品。这些智能设备不仅通过销售硬件盈利,还可能通过附加的服务或内容订阅获取持续收入。
- AI应用产品服务:基于AI大语言模型(如GPT-4、Codex等)开发典型应用场景的AI应用,企业和用户通过订阅AI服务来使用这些AI应用产品。例如OpenAI推出了ChatGPT,帮助用户生成内容、文章、问答等;MidJourney为艺术家和设计师提供生成不同风格艺术图像的能力;Runway提供AI视频编辑功能,使用户可以自动生成视频片段、应用风格转换、并进行快速的编辑。DoNotPay提供自动化法律服务,帮助用户处理诸如停车罚单上诉、申请退款等简单的法律事务,大大降低了法律服务的门槛。
4 AI的产业链图谱与典型公司
4.1 AI产业角色
推动AI发展的主要玩家包括大型硬件公司(英伟达)、大型科技公司(如Google、Microsoft、Amazon),以及一系列AI初创企业。这些公司在数据处理能力、算法开发和市场应用方面均处于领先地位,推动着整个AI生态系统的发展。
- 硬件公司:如英伟达等硬件厂商,推出了GPU和AI芯片,AI芯片可以支持深度神经网络的学习和加速计算,为AI提供算力支撑。
- 科技巨头:如Google、Microsoft、Amazon等在AI领域投入了大量资源。它们不仅开发了强大的AI平台,还积极投资于AI初创公司,并通过并购扩展其AI生态系统。这些公司拥有丰富的数据、强大的计算资源和顶尖的人才,能够引领AI技术的发展方向。
- AI初创公司:AI初创公司(如OpenAi、Nuro、Vicarious等)往往专注于特定领域的创新,如医疗AI、自动驾驶AI、金融AI等。这些公司具有灵活性和创新精神,能够快速响应市场需求,开发出具有竞争力的产品和服务。初创公司通常通过风险投资获得资金,并在短时间内实现快速增长,成为市场中的重要力量。
- 学术机构和研究组织:全球各地的大学和研究机构(如MIT、DeepMind、BAIR等)也是AI技术发展的重要力量,他们不断进行前沿研究,并通过开放源代码和学术论文推动行业进步。同时培养了大量AI领域的专业人才。通过开放源代码和学术出版物,这些机构促进了知识的传播和技术的普及。
4.2 AI产业链图谱
AI产业链从上游的硬件提供商(如芯片制造商)到中游的软件开发和平台提供,再到下游的应用场景落地,构成了一个庞大且复杂的生态系统。每一个环节都有多个关键参与者,共同推动AI技术的进步和应用的广泛化。
4.2.1 上游:基础设施层
上游部分包括硬件制造商和云服务提供商。
- 硬件制造商:提供AI计算所需的硬件支持,包括CPU、GPU、TPU和专用AI加速器等。NVIDIA、AMD、Intel,以及最近兴起的专用AI芯片制造商(如Tesla的FSD芯片)都是这一层的重要玩家。
- 云服务提供商:如Amazon Web Services (AWS)、Google Cloud、Microsoft Azure等。这些公司提供大规模的基于云的计算资源和AI开发平台,支持企业进行AI模型的开发、训练和部署。云服务的普及降低了AI开发的门槛,使得中小企业也能够利用AI技术。
4.2.2 中游:平台和工具层
中游部分包括AI模型研发公司、软件开发平台、数据服务和管理工具。这一层级为整个生态系统提供了算法、平台和数据支持,推动了AI技术的普及与实际应用。
- AI模型研发公司:专注于开发和训练大型AI模型,提供基础的算法与模型供企业和开发者使用。这些公司推动了人工智能技术的前沿研究,并通过API或平台的形式使其成果得以商用化。代表性公司如OpenAI、Google DeepMind、Anthropic和Cohere,这些公司开发了大型语言模型(LLM)如GPT、BERT等,用于自然语言处理、生成式AI等任务。
- AI软件开发平台:为开发者提供了构建、训练和部署AI模型的工具。这些平台提供了灵活的框架,让开发者可以轻松地开发并部署AI模型。这些平台不仅支持高性能的模型训练,还能与硬件加速器(如GPU、TPU)结合,提升模型的训练效率。代表性开源平台如TensorFlow、PyTorch、Keras、Hugging Face等,支持开发者创建、训练各种深度学习模型,并能够将模型应用于从学术研究到商业应用的多个场景。
- 数据服务与管理工具:数据是AI模型训练的核心,企业需要大量数据来训练AI模型。数据服务与管理工具帮助企业高效管理和处理大规模数据。数据服务公司如Snowflake和Databricks,提供了大数据处理和分析工具,帮助企业管理结构化和非结构化数据。此外,数据标注服务公司(如Scale AI)为AI模型提供高质量的训练数据,确保模型的准确性和可靠性。
4.2.3 下游:应用场景落地与服务层
下游部分包括AI在各个行业的实际应用场景,基于AI技术的智能产品和服务,以及为AI技术落地提供咨询服务和运营维护的服务公司。
- 垂直领域AI应用:AI技术被应用于各个垂直领域,如医疗、金融、零售、制造等,为不同行业带来了定制化的解决方案。例如,在医疗领域,AI诊断工具如IBM Watson Health和Zebra Medical Vision,通过分析医学影像和电子病历,帮助医生更快、更准确地诊断疾病。在金融领域,AI被应用于风险评估、欺诈检测和算法交易,典型案例包括Kensho和Darktrace,它们利用AI提高金融数据分析的效率,并增强安全性。在零售行业,AI驱动的推荐系统如Amazon的个性化推荐引擎,通过分析用户行为和偏好,提升了在线购物的体验。在制造业,AI应用于智能工厂,通过自动化设备和预测性维护优化生产流程,Siemens和GE的Predix平台是其中的代表性公司,它们通过AI技术帮助工厂提高生产效率并降低运营成本。
- 智能产品和设备:AI技术被广泛应用于各种智能产品和设备中,推动了自动化和个性化功能的发展,显著提升了用户体验。例如,在智能家居领域,AI驱动的设备如Amazon Echo和Google Home,不仅能够执行语音命令,还可以通过学习用户的日常习惯,提供个性化的服务,如自动调整家中灯光、温度等环境设置。在无人驾驶汽车领域,Tesla和Waymo等公司依靠AI技术开发自动驾驶系统,通过摄像头、传感器和深度学习算法,实现车辆的自动化驾驶和道路导航。在无人机领域,DJI等公司使用AI技术提升无人机的自主飞行和目标追踪能力,广泛应用于拍摄、物流运输和基础设施检查等领域。机器人领域的代表如Boston Dynamics,利用AI技术为机器人提供感知和决策能力,使其在复杂环境中执行任务,如仓储自动化和危险环境操作。
- AI咨询服务和运营维护公司:负责将AI技术的应用落地到企业的实际业务中,并提供长期的支持和优化。这些公司为企业提供从AI战略咨询、技术实施到模型维护的全方位服务,是推动AI技术在不同行业中应用和发展的关键环节。如IBM Watson、Accenture等提供AI咨询服务,帮助企业制定AI战略,实施AI解决方案。AI模型和系统在部署后需要不断维护和优化,这催生了AI运营服务市场(MLOps),如DataRobot、Algorithmia等公司,专注于为企业提供AI模型的监控、维护和优化服务。
4.3典型AI公司(中上游)
4.3.1 英伟达NVIDIA
NVIDIA(英伟达)成立于1993年,是一家全球领先的图形处理器(GPU)制造商,最初以开发PC游戏图形卡闻名。如今,NVIDIA不仅在图形处理方面保持行业领先地位,还在人工智能(AI)、高性能计算(HPC)、自动驾驶、数据中心和云计算等多个领域取得了重要突破。
业务领域:NVIDIA是全球领先的图形处理器(GPU)制造商,同时在AI领域发挥了重要作用。NVIDIA提供AI硬件(如GPU、CUDA并行计算架构)和软件平台(如NVIDIA AI和Deep Learning SDK),其GPU被广泛用于自动驾驶、数据中心、医疗AI、图像处理等多个领域。
- GPU(图形处理器):NVIDIA最早以其GeForce系列图形卡闻名,专注于游戏、图像处理、3D渲染等领域,广泛应用于个人电脑、游戏机和工作站。GPU现已成为AI模型训练和推理的核心硬件,尤其是在深度学习中,NVIDIA的GPU因其强大的并行计算能力而被广泛应用。
- AI与机器学习:NVIDIA的GPU和CUDA(并行计算架构)成为人工智能和深度学习领域的标准硬件,帮助大规模AI模型实现高效训练和推理。
- NVIDIA AI平台:NVIDIA提供的软件工具(如NVIDIA AI、NVIDIA TensorRT),支持开发者和企业加速AI模型的开发和部署。
- NVIDIA DRIVE:NVIDIA推出了针对自动驾驶的NVIDIA DRIVE平台,提供从感知、决策到自动驾驶系统的完整解决方案,已与多家汽车制造商合作,推动自动驾驶技术的应用。
- NVIDIA Jetson平台:Jetson是为机器人和物联网(IoT)设备设计的边缘AI平台,支持本地AI处理,应用于智能城市、工业自动化和智能设备等领域。
商业模式:NVIDIA的商业模式依赖于硬件销售、软件平台和生态系统的构建。NVIDIA通过销售GPU硬件获利,主要分为消费者级(GeForce系列)、专业级(Quadro系列)、数据中心(Tesla系列)和AI计算(A100等)四大类别。通过软件工具与平台(NVIDIA AI、TensorRT、Omniverse等)为开发者和企业提供AI开发和优化支持,同时NVIDIA通过软件订阅和开发工具获得收入。
据估计,英伟达在过去 7 年间牢牢占据数据中心 GPU 市场 90% 以上的份额。2023 年,其份额更是达到 98%,所有大型数据中心的运转和大模型训练,都需要依赖于英伟达研制的 GPU。
4.3.2 OpenAI和ChatGPT
OpenAI成立于2015年,由特斯拉(Tesla)和SpaceX创始人埃隆·马斯克(Elon Musk)创立,是美国一家人工智能研究机构,致力于开发通用人工智能(AGI),以确保其安全性并为全人类带来最大利益。OpenAI最初作为一个非营利组织,后来转变为“有限盈利”的商业模式,吸引了微软等大型科技公司的投资。其目标是通过研究和开发AI技术,推动AGI的发展,同时关注AI的安全性、伦理和可控性。
业务领域:核心业务围绕AI模型的研发,尤其是大型语言模型(LLM)和生成式AI,广泛应用于自然语言处理、生成式内容等多个领域。OpenAI还通过API服务提供商业化AI模型的访问。
- GPT:GPT(Generative Pre-trained Transformer)系列模型是其核心产品之一,GPT-3和最新的GPT-4等模型展示了强大的自然语言生成能力。
- DALL·E:OpenAI开发的生成式AI模型,能够根据文本描述生成高质量的图像。它在设计、广告、创意产业等领域具有广泛应用前景。
- Codex:基于GPT的编程语言生成器,能够理解自然语言指令并生成相应的代码,已应用于GitHub Copilot,帮助开发者进行自动代码生成和编写。
- OpenAI API:OpenAI提供商业化的API服务,允许开发者和企业基于其AI模型构建应用程序。通过API,企业可以轻松调用GPT、DALL·E、Codex等模型,应用于各种业务场景,如自然语言处理、内容生成和自动化工作流。
商业模式:围绕提供AI模型的API访问以及通过与大型科技公司合作来盈利。
- OpenAI API:OpenAI的核心商业模式是通过其API平台提供GPT、DALL·E、Codex等模型的访问权限,开发者和企业可以订阅这些服务,按需使用其AI模型进行自然语言处理、图像生成、自动化编程等任务。
- 技术许可与授权:OpenAI与其他公司合作,授权其技术和模型,用于产品集成和应用开发。通过这种授权,OpenAI能够扩展其技术影响力,并为企业提供定制化的AI解决方案。
OpenAI的技术已经在全球范围内产生了深远影响,特别是在AI内容生成和自动化领域。通过其开放的API平台,OpenAI为数以千计的公司提供AI解决方案,推动了自然语言处理、自动化创作、编程等领域的创新。
4.3.3 Tesla:
Tesla成立于2003年,是全球知名的电动车制造公司,专注于开发和生产电动汽车、能源存储系统和太阳能产品。除了电动车业务,Tesla在人工智能(AI)和自动驾驶技术方面也处于行业前沿,其AI驱动的自动驾驶系统和自主研发的AI硬件使其在汽车行业具备了独特的竞争优势。
业务领域:Tesla的业务不仅限于电动汽车,还包括自动驾驶、能源解决方案和AI硬件开发等多个领域。特斯拉在人工智能领域搭建了强大的基础设施,包括AI芯片(FSD Chip全自动驾驶芯片;Dojo Chip,Dojo训练芯片)、Dojo超级计算机和AI数据中心,为自动驾驶和机器人业务提供底层技术支撑。
- 电动汽车:Tesla的核心业务是生产和销售电动汽车,包括Model S、Model 3、Model X和Model Y等车型。它们凭借高性能、长续航和自动驾驶功能,在全球电动车市场中占据重要位置。
- 全自动驾驶技术:特斯拉的全自动驾驶技术(Full Self-Driving, FSD)是其AI战略的核心,依托于自研的运算平台和巨大的算力支持,基于大规模行驶里程所积累的数据,不断优化其AI模型。特斯拉自 2013 年开始探索自动驾驶技术,并在 2019 年推出了搭载自研 FSD 芯片的全自动驾驶计算平台。自特斯拉FSD发布以来,已经实现了超过16亿公里的行驶里程。
- AI硬件研发:Tesla自主研发了完全自动驾驶(FSD)芯片,替代了以往依赖的NVIDIA硬件。该芯片经过专门设计,提升了自动驾驶计算能力和效率,是Tesla实现全自动驾驶愿景的重要基础。Tesla正在开发名为Dojo的超级计算机,专用于训练自动驾驶系统的深度学习算法。Dojo通过处理海量的视觉和传感器数据,优化AI模型训练的速度和性能,帮助Tesla更快实现FSD的商业化。
- 能源解决方案:Tesla还提供家用和商业用能源存储系统,如Powerwall、Powerpack和Megapack,帮助用户储存太阳能并优化能源使用。通过与太阳能产品集成,Tesla推动清洁能源解决方案的普及。
- Optimus:Optimus 定位为通用型双足自主仿人机器人,能够执行不安全、重复性或乏味的任务,以解决劳动力短缺的问题。特斯拉计划将 Optimus 部署于自家的超级工厂,以执行一些重复性的工作,如搬运材料、组装零件等。未来,特斯拉致力于推动 Optimus 走进千家万户,帮普通家庭完成家务劳动,如做饭、清洁等。
- 无人驾驶出租车(Robotaxi):2024年4月,马斯克宣布特斯拉计划在Q3正式发布无人驾驶出租车(Robotaxi),这将颠覆传统的出行方式,实现车辆的高效率共享使用。
商业模式:Tesla的商业模式涵盖了电动汽车、自动驾驶和能源解决方案的多个维度,依托硬件销售和软件订阅两种模式获利。
- 硬件销售:Tesla通过直接向消费者销售电动汽车(Model S、Model X、Model 3和Model Y)获利;Tesla通过销售Powerwall、Solar Roof等产品拓展了能源市场,推动可再生能源技术的应用。
- 软件与订阅服务:Tesla的完全自动驾驶(FSD)软件以一次性购买或订阅服务的方式销售,允许车主获取更高级的自动驾驶功能。这一模式为Tesla提供了额外的持续收入来源。
- 能源服务:Tesla通过Powerpack和Megapack提供企业级能源存储解决方案,并在全球范围内与公用事业公司合作,帮助优化电网运行,推动可再生能源的应用和储存。
Tesla是全球电动汽车市场的领导者,其高性能、长续航和创新的电动车产品使其在全球电动车销量中占据了重要份额,尤其是在美国、欧洲和中国市场。Tesla不仅是全球电动汽车市场的领导者,其在自动驾驶、能源解决方案和AI技术领域的创新也产生了深远影响。
4.3.4 Anthropic
Anthropic是一家成立于2021年的人工智能(AI)研究公司,致力于开发安全且可靠的大规模人工智能系统。该公司由OpenAI的前研究人员创建,目标是通过更具可控性和可解释性的人工智能模型推动AI的安全发展。Anthropic专注于AI伦理、AI安全性、透明性和公平性,在开发强大的AI模型的同时,致力于减少模型可能带来的社会风险。
业务领域:核心业务围绕人工智能系统的安全性、可解释性和伦理性展开,特别是大规模语言模型(LLM)和生成式AI。
- 大规模语言模型(LLM):Anthropic的Claude模型系列是其代表性的大型语言模型,类似于OpenAI的GPT模型。这些模型能够进行复杂的自然语言理解和生成,广泛应用于对话系统、自动化写作、问答系统等领域。
- Claude API:Anthropic提供基于其Claude模型的API服务,允许开发者和企业集成其AI模型进行自然语言处理任务。通过API,企业能够调用Claude模型进行自动化对话、内容生成和数据分析等功能。
- 安全的AI解决方案:Anthropic向企业提供定制化的AI解决方案,特别是在对安全性要求较高的领域,如金融、医疗、法律等,通过其安全优先的AI模型,帮助企业降低AI应用的风险。
商业模式:商业模式围绕AI模型的开发与安全应用,同时通过API服务和企业解决方案为商业客户提供AI技术支持。
- API服务:通过API平台,Anthropic将其大规模语言模型Claude向开发者和企业开放,按需提供自然语言处理和生成的AI功能。开发者和企业可以通过订阅模式按使用量付费,获取Claude模型的AI能力,并应用于对话系统、自动化工作流、内容生成等业务场景。
- 定制化AI解决方案:Anthropic为需要强大AI功能的企业提供定制化的AI解决方案,特别是在对安全性要求较高的行业。公司通过提供安全可靠的AI模型,帮助企业在应用AI时避免潜在的风险,并确保AI系统的透明性和可解释性。
- 安全与伦理咨询:由于Anthropic在AI安全和伦理领域的专长,公司还为企业和政府提供AI伦理与安全咨询服务,帮助其评估和改善现有AI系统的安全性,防止AI带来的潜在风险。
Anthropic的技术和研究已经在AI社区和行业中产生了重要影响,特别是在推动AI安全和伦理问题的讨论上。通过其Claude模型和安全优先的AI系统,Anthropic正在赢得更多企业的关注和应用。
4.3.5 Cohere
Cohere成立于2019年,总部位于加拿大,是一家专注于自然语言处理(NLP)技术的人工智能(AI)公司。Cohere致力于开发强大的语言模型,帮助企业将AI技术应用于文本理解、生成、翻译和其他自然语言处理任务。与OpenAI、Anthropic等公司不同,Cohere主要侧重于企业级的NLP解决方案,特别是通过提供灵活且可定制的AI模型,帮助企业有效地利用自然语言处理技术。
业务领域:核心业务围绕自然语言处理(NLP)和生成式AI展开,提供多种语言模型和开发工具,推动AI在企业中的应用。
- 自然语言处理(NLP):Cohere专注于开发大规模语言模型,这些模型能够理解和生成自然语言。它们被广泛应用于文本分类、情感分析、自动摘要、翻译等任务,适用于各种行业的文本处理需求。
- 生成式AI:Cohere的生成式AI技术能够生成高质量的自然语言文本,用于内容创作、自动化写作、摘要生成和数据报告等任务。通过AI生成的内容能够满足媒体、市场营销等行业对高效内容生成的需求。
- API与开发工具:Cohere提供API服务和灵活的开发工具,帮助企业和开发者快速集成AI技术。Cohere的工具包支持各种编程语言和框架,便于不同规模和技术水平的开发团队采用。
- 企业解决方案:Cohere不仅提供通用的语言模型,还能够根据企业的需求进行定制化开发,使模型更加贴合特定行业的业务场景。这些定制模型广泛应用于客户支持、电子商务、法律、金融等需要高精度语言理解的领域。
商业模式:商业模式围绕API服务、定制化解决方案和企业NLP咨询服务展开,主要面向企业客户提供高级NLP工具和支持。
- API服务:Cohere通过其API平台提供自然语言处理和生成服务,开发者和企业可以按需调用这些API进行文本处理任务。Cohere采用基于订阅和按使用量计费的商业模式,灵活满足不同规模企业的需求。
- 定制化NLP解决方案:Cohere为需要个性化语言处理能力的企业提供定制化的NLP解决方案,企业可以根据行业需求定制模型,并优化AI系统的表现。特别是在金融、法律、客户服务等对文本处理精度要求较高的行业,Cohere的定制化模型具有强大的市场竞争力。
- 企业咨询与技术支持:Cohere为企业提供深入的NLP咨询服务,帮助企业优化其AI和语言处理系统,确保企业能够最大化地利用NLP技术。Cohere还为企业和开发者提供培训,帮助他们了解如何更好地使用Cohere的API和语言模型,提升内部团队的AI能力。
Cohere在企业级自然语言处理市场中的表现引人注目,通过其高效的API服务和定制化解决方案,Cohere已经赢得了多家企业的信任,并在多个行业中广泛应用。Cohere的NLP技术已经应用于金融、法律、医疗、客户服务等领域,帮助企业通过AI技术实现自动化文本处理、数据分析和客户支持等任务,提升运营效率。
4.4 AI落地应用和APP(下游)
在AI产业链的下游,AI应用主要是针对具体行业或企业需求的AI解决方案。这一类应用的核心目标是将AI技术集成到行业工作流程中,推动行业智能化转型。AI下游应用涵盖的范围较广,既包括企业级解决方案,也可能涉及消费者市场。
4.4.1 OpenAI — ChatGPT
ChatGPT是OpenAI于2022年11月推出的基于大型语言模型的人工智能聊天机器人,能够进行自然语言处理和生成,提供多种智能化服务。推出仅两个月后,ChatGPT在2023年1月末的月活用户突破1亿,成为全球用户破亿所花时间最短的平台。
- 功能:ChatGPT使用生成式预训练模型(GPT)来理解和生成自然语言文本,支持多轮对话、回答问题、提供建议和生成内容等,应用场景涵盖客户支持、写作辅助、知识问答等领域。
- AI技术:自然语言处理(NLP)、生成式预训练模型、深度学习。
- 典型应用场景:智能客服、内容生成、教育支持、写作辅助。
4.4.2. Zebra Medical Vision — 医疗影像分析
Zebra Medical Vision是一家使用AI技术进行医学影像分析的公司,帮助医生诊断疾病如癌症、心脏病、肺炎等。
- 功能:Zebra Medical Vision的AI系统通过分析X光片、CT扫描、MRI等医学影像,自动识别潜在的病理变化,并提供诊断建议,帮助医生更快、更精准地识别疾病。
- AI技术:深度学习、计算机视觉、医学影像处理。
- 典型应用场景:癌症筛查、心脏病检测、肺部疾病诊断。
4.4.3. Zoom — 智能会议功能
Zoom是一款视频会议平台,广泛用于远程工作、在线教育和社交互动。其视频会议系统通过云计算和AI功能(如实时字幕、背景虚化)提供高质量的远程协作体验。
- 功能:Zoom利用AI功能提供实时字幕、背景虚化、噪音抑制等智能会议服务,改善远程协作体验。
- AI技术:自然语言处理(NLP)、机器学习、计算机视觉。
- 典型应用场景:远程会议、在线教育、实时字幕生成。
4.4.4. Lemonade — AI驱动的保险理赔
Lemonade是一家利用AI技术优化保险服务的公司。它通过AI和聊天机器人简化保险理赔流程,提供快速、个性化的保险服务。
- 功能:Lemonade的AI系统使用自然语言处理和机器学习技术自动处理保险理赔请求,快速分析客户需求并作出理赔决策。
- AI技术:自然语言处理(NLP)、机器学习、自动化决策系统。
- 典型应用场景:自动化保险理赔、风险评估、客户服务。
4.4.5. Alibaba — 智能零售
阿里巴巴的无人超市是利用人工智能(AI)、物联网(IoT)、大数据和生物识别技术打造的全自动化零售模式。无人超市的核心是通过技术手段实现“无人化”运营,消费者可以在不依赖传统店员的情况下完成购物流程。
- 功能:阿里巴巴的智能零售系统使用AI和RFID技术,实现自动结账、库存管理、个性化推荐等功能,消费者无需人工干预即可完成购物。
- AI技术:计算机视觉、物联网(IoT)、机器学习。
- 典型应用场景:无人超市、自动化结账、个性化商品推荐。
4.4.6. Apple Siri — 智能语音助手
Siri是苹果的智能语音助手,通过自然语言处理(NLP)技术,帮助用户完成各种任务,如设置提醒、导航、发信息等。
- 功能:苹果设备中的智能语音助手,能够帮助用户通过语音指令完成操作,包括发送消息、设置提醒、导航、查询信息等。
- AI技术:NLP、语音识别、机器学习。
- 典型应用场景:语音指令执行(打电话、发短信、设置提醒)、导航、信息查询。
4.4.7. Spotify — 音乐推荐系统
Spotify使用AI和机器学习算法来分析用户的听歌习惯,提供个性化的音乐推荐。通过用户行为数据,Spotify可以预测用户可能喜欢的歌曲和艺术家。
- 功能:Spotify的AI驱动音乐推荐系统分析用户的听歌习惯和偏好,提供个性化音乐推荐和每日推荐歌单。
- AI技术:协同过滤、深度学习、机器学习。
- 典型应用场景:个性化音乐推荐、生成每日音乐推荐清单、发现新音乐。
4.4.8. Grammarly — AI写作辅助工具
Grammarly是一款基于AI的写作辅助工具,通过自然语言处理技术帮助用户检测拼写、语法和写作风格错误,并提供改进建议。
- 功能:Grammarly通过分析用户的文本,提供语法、拼写和风格改进建议,帮助提升写作质量。
- AI技术:自然语言处理、机器学习、文本分析。
- 典型应用场景:文本校对、写作建议、语法和拼写检查。
4.4.9. Replika — AI聊天机器人
Replika是一个AI聊天机器人,用户可以与它进行个性化对话并建立情感联系。Replika利用NLP和情感分析技术,模拟人类对话,帮助用户缓解压力和进行自我反思。
- 功能:Replika的聊天机器人,用户可以通过与AI进行对话来建立情感联系。它模仿人类对话风格,提供情感支持,并能帮助用户自我反思。
- AI技术:NLP、深度学习、情感分析。
- 典型应用场景:情感陪伴、对话互动、自我反思。
4.4.10. Youper — 情感健康助手
Youper是一个AI驱动的情感健康应用,帮助用户通过情感日记和对话分析管理情绪和心理健康。AI分析用户的情感状态,并提供建议和冥想练习。
- 功能:帮助用户通过情感日记、对话分析和冥想技巧来管理情绪和心理健康。
- AI技术:NLP、情感分析、机器学习。
- 典型应用场景:情感日记、冥想引导、心理健康管理。
4.5 AI Agent
AI智能体(AI Agent)是指一种能够感知其环境并根据环境中的信息进行决策和行动的自主计算系统。智能体通常具备感知、推理、学习和行动能力,并能在某种目标或任务的驱动下与环境或其他智能体交互。AI智能体可以应用于从简单的规则系统到复杂的深度学习模型,广泛应用于自动化、机器人、游戏AI等领域。
我们平常看到的各类AI消费者应用程序,比如Apple手机的Siri助手、ChatGPT聊天机器人等,其实就是AI Agent。这些AI Agent直接面向普通消费者提供AI产品和服务,通过AI技术为用户提供便利、个性化的服务和娱乐体验。
目前市场上大部分面对C端的AI应用程序,本质上都属于AI Agent的形态之一,下图是Insight Partners绘制的AI Agent市场图谱,涵盖众多公司众多行业的各类Agents。
4.5.1 AI Agent技术架构
一个典型的AI Agent技术架构由数据层、iPaaS(集成服务平台层)、自动化层和用户界面层组成。这四层架构共同支撑AI Agent的感知、决策、行动和交互能力。每一层在系统中都发挥了独特的作用,并且相互协作,确保AI Agent能够有效地处理任务和与环境交互。
- 数据层:数据层是AI Agent技术架构的基础,负责收集、存储和管理各种类型的数据。这些数据来自不同的输入源,包括传感器、用户交互、历史记录以及外部系统。AI Agent依赖这些数据进行感知、分析和学习,以便做出有效的决策。
- iPaaS层:iPaaS(Integration Platform as a Service)是一种集成服务平台,负责将内部和外部的数据源、应用程序和服务连接在一起,确保系统的各个部分能够顺畅协作。通过iPaaS平台管理和调用外部API,确保AI Agent能够访问和利用外部服务(如第三方AI模型、外部数据服务)。iPaaS是AI Agent的“神经中枢”,它使不同系统能够互操作,确保数据、功能和服务的流畅连接。
- 自动化层:自动化层是AI Agent的核心,负责执行AI模型的推理、决策和任务的自动化执行。它是使AI Agent能够感知、决策和采取行动的主要机制。该层通过机器学习、深度学习和自动化流程的管理,实现智能化操作。
- 用户界面(UI层):用户界面层是AI Agent与用户进行交互的桥梁。它通过直观的图形界面或语音交互让用户能够与AI Agent进行通信、发出指令或获取反馈。良好的用户界面可以极大提升用户体验,使AI Agent的操作更加顺畅和高效。
一个典型的AI Agent的技术架构通过数据层收集和管理数据,iPaaS层确保各系统和服务的集成,自动化层执行AI模型的推理和任务的自动化处理,而用户界面层则负责与用户进行交互。四层结构紧密协作,使AI Agent能够感知环境、做出决策并执行任务,实现了智能化操作和人机交互的高效融合。
4.5.2 Top100 AI Agent消费者应用程序
A16Z根据每月网站独立访问量,给出了Top100 AI消费者应用程序,包括移动端和Web端产品。
经过分析可以发现,这些AI应用程序大多属于创意工具类(聊天机器人、通用助手、文生图、文生视频、照片/视频AI),榜单上 52% 的公司专注于内容生成或编辑,涉及多种形式 — — 图像、视频、音乐、语音等。在 12 家新进入者中,58% 属于创意工具领域。
这反映出当前AI Agent的实际情况,偏向于创意工具类的应用,整体的功能偏初级和早期应用,对于深入人们日常生活中成为不可或缺的国民级/杀手级应用,还有较大的差距,而随着AI技术和LLM的进一步发展,AI Agent将大有可为。
5. Web3与AI的结合
5.1 Web3和AI结合的优势
AI 本质上是一种先进生产力,其快速发展依赖于三个核心要素:数据、算法和算力。
而加密货币和区块链是一种生产关系,旨在通过去中心化的方式实现数据和资产价值的流转,赋予用户更多的数据和资产控制权和隐私保护。
区块链、Web3与AI的结合将进一步推动互联网和AI应用的发展。AI与区块链的结合为数据安全、隐私保护、智能合约执行和AI去中心化应用带来了新的机会。
- AI可以增强区块链系统的效率和安全性,更好的满足用户基于意图的需求,并通过链上数据的分析和处理,识别潜在的威胁和欺诈行为。
- Web3的发展为AI提供了一个全新的应用场景和价值体系。通过区块链技术,AI可以在去中心化网络中运行,确保数据的透明性、不可篡改性和用户隐私保护。
- 区块链技术可以为AI模型的数据处理提供透明、不可篡改的记录,确保数据的真实性和完整性,数据权的归属和使用。
- Web3 Token经济激励机制可以为AI模型和应用提供低成本的启动、生态建设和用户激励,帮助AI项目更好的发展壮大。
5.2 AI概念区块链项目市值和融资:
根据CoinMarketCap数据显示,目前AI板块已经收录324个与 Web3 相关项目,整体市场规模高达$25.64B。
典型的项目包括NEAR Protocol(NEAR)、Artificial Superintelligence Alliance(FET)、Bittensor(TAO)、Render(RENDER)、Theta Network(THETA)、Akash Network(AKT)、AIOZ Network(AIOZ)、Arkham(ARKM)、io.net(IO)、Aethir(ATH)、Delysium(AGI)、Numeraire(NMR)、Sleepless AI(AI)等,主要涉及AI公链和基础设施、AI算力、AI应用等方面。
在AI融资方面,根据RootData数据,从2022年1月到2024年9月,AI赛道(包括AI、云算力、AI代理、AIGC)的总融资金额为14.87亿美元。投资机构对AI + Web3赛道的前景较为看好。
5.3 Web3 + AI赛道产业图谱
根据Foresight News的数据显示,目前行业至少有 140 多个 Web3 + AI 概念项目,覆盖了基础设施、数据、预测市场、计算与算力、教育、DeFi & 跨链、安全、NFT & 游戏 & 元宇宙、搜索引擎、社交 & 创作者经济、AI 聊天机器人、DID & 消息传递、治理、医疗、交易机器人等诸多方向。其中,基础设施类项目多达 30 个,NFT & 游戏 & 元宇宙类项目有 26 个,数据、计算、AI 聊天机器人类项目也均在 10 个以上。
综合上面这些Web3 + AI赛道的项目,可以将其按照AI上下游产业链进行分类,主要为三大类型:
5.3.1 AI基础设施:
包括基础设施和算力,为AI应用提供基础服务和资源支持。
- 公链:通过AI+区块链底层基础设施,为其他应用提供基础设施服务(算力、存储、LLM调用部署等)和LLM调用与部署。Near、Olas、Cortex、Fetch.ai属于此类项目。
- Web3 + 算力资源网络:AI模型的实现需要强大的运算能力,传统Web2领域的算力主要集中在大厂或部分计算资源提供商手中,Web3通过边缘计算和分布式技术实现算力资源(个人显卡、CPU、存储等)的网络共建、算力激励和数据治理。Filecoin、Render Network、Io.net、Ather等都是此类项目。
5.3.2 Web3 + 数据/模型 + 市场/网络/协议:
AI的发展需要大量的数据和复杂的算法模型来训练智能系统。在传统的Web2领域,大型互联网公司(如Google、Facebook、Amazon)通常掌握着算法和数据的主导权。
而Web3带来了一个新的可能性,通过去中心化的激励机制和区块链技术,构建起一个去中心化的AI数据、模型和网络市场,打破了原有的资源垄断,让更多的参与者(中小企业和个体)有机会进入并贡献于AI生态中。
通过代币化激励机制,市场参与者能够共享和贡献资源,如算法模型、数据和计算能力。这将极大促进AI的开放性和协作性,降低AI发展的门槛,使中小企业和个体开发者也能参与AI产业,进而推动AI的快速发展。
去中心化的AI数据、模型和网络市场主要包括4种类型:
- 去中心化模型网络/市场:通过区块链和代币化激励机制,形成一个开放的算法模型市场。在这个市场中,开发者和研究人员可以贡献、优化和分享AI模型,用户可以通过网络选择和使用最适合的模型来解决特定问题。模型通过共识机制进行调度和筛选,优质模型可以获得奖励,低效模型则逐渐被淘汰。例如Bittensor是一个去中心化的AI模型市场,允许开发者通过贡献和优化AI模型来获得奖励。
- 去中心化数据交易市场:去中心化数据交易市场通过区块链技术让数据的拥有者(个人或企业)能够自由分享和交易数据。通过代币化和智能合约,数据提供者能够获得公平的经济回报,同时数据消费者可以获得高质量的数据用于AI模型的训练。该模式鼓励更多人贡献数据,推动AI应用的多样化和公平性。例如Ocean是一个去中心化数据市场,通过区块链和智能合约,让数据资产可以被标记化并交易。NEAR 官方发布的NEAR Tasks是一个基于区块链的人工智能标注平台。Measurable Data(MDT) 是一个去中心化数据交换经济系统,旨在提供基于区块链的数据经济,数据提供者和数据购买者可以安全和匿名地交易数据。
- 去中心化数据模型训练市场:在去中心化的数据模型训练市场中,开发者可以利用来自全球的分布式计算资源和数据进行模型训练。数据的提供和模型的训练都可以通过区块链上的智能合约进行协调和管理,确保透明度和公平性。同时,去中心化数据训练市场降低了进入AI领域的成本,让更多的中小企业和个人开发者可以参与其中。例如Fetch.AI是一个结合AI与区块链的去中心化平台,允许开发者在去中心化网络中通过自主智能体(AI Agent)进行数据分析和模型训练。Cortex是一个去中心化的AI平台,支持AI模型的分布式训练和推理。
- 代币化AI模型与AI Agent产品市场:通过代币化机制,AI模型和AI Agent可以作为数字资产进行交易和使用。这种代币化方式可以让开发者通过贡献AI模型、算法或智能体,获得经济回报,同时用户可以通过智能合约购买或租用这些AI服务。这种去中心化的市场使AI的使用变得更加灵活和开放,用户可以根据需求选择不同的AI服务,而开发者也能够从中获利。例如SingularityNET平台用户通过代币购买不同的AI服务,开发者可以通过平台发布自己的AI Agent或模型,并通过代币交易获得收益。
5.3.3 AI+应用层:
面向终端用户的Web3 + AI应用程序,主要是依托AI技术和资源,在链上数据、链游、社交、NFT、创作者经济、DeFi等方面构建AI+ Dapp应用项目,利用AI赋能智能合约决策执行,更好的满足用户基于意图的需求,并在交易、创作、隐私保护等方面提供全新体验。
- 链上AI数据分析:通过AI技术对区块链上的海量数据进行深度挖掘和分析,帮助用户了解市场动态、投资机会和潜在风险。AI可以在链上行为中发现模式、异常活动(如洗钱、黑客攻击),并为用户提供定制化的投资建议。Dune、Nanse、Chainalysis、Arkham(Arkm)是此类项目。
- AI Agent:构建Web3 AI Agent充当用户的智能助手,可以基于链上数据、用户需求以及市场变化,自动执行决策和任务。通过深度学习和强化学习,AI Agent可以理解用户意图并优化任务执行。例如Fetch.AI开发了自主AI Agent,能够自动执行链上任务,如数据交换、市场交易等。AI聊天机器人(Myshell、CharacterX)、AI搜索引擎(Kaito、Pulsr、QnA3、Typox AI)是此类项目。
- AI 交易Bot:AI交易Bot通过数据分析、机器学习和深度学习模型,能够识别市场趋势、执行套利策略、进行量化分析等,并且可以实现自动化的交易。AI交易Bot基于链上实时数据执行智能合约,进行自动化交易,减少人为错误并提高交易效率。目前TG Bot赛道产品属于此类的初级产品,Rockefeller Bot(Rocky,链上AI交易机器人)和3Commas(AI驱动的自动化交易平台)也属于此类。
- AI创作者平台:利用AI技术帮助创作者在区块链上进行内容创作、作品发行和分发,尤其是在NFT、虚拟艺术品和创作者经济中发挥重要作用。Art Blocks(基于区块链的生成艺术平台)和Mirror.xyz(去中心化创作者平台)、Orbofi AI属于此类。
- 基于意图的需求:AI能够通过自然语言处理(NLP)和深度学习技术理解用户的意图,并将这些需求转化为链上的自动化执行。通过智能合约,AI系统可以自动识别用户的需求,如进行某种交易、购买NFT或执行DeFi操作,并根据这些需求触发相应的操作。Geno、TermiX属于此类。
从目前这些Web3应用对AI的使用程度而言,多数应用类项目并非强AI,倾向于AI辅助接入,集中于应用侧,在复杂性高的核心技术方面适用性差,深度和融合程度有待加强。
5.4 典型项目:
5.4.1 Artificial Superintelligence Alliance
人工超级智能(ASI)联盟是由Fetch.ai,SingularityNET(SNET)和Ocean Protocol组成的集体。作为人工智能研究和开发领域最大的开源独立实体,该联盟旨在加速去中心化人工通用智能(AGI)的发展,并最终实现人工超级智能(ASI)。
2024年7月1日,由SingularityNET,Fetch.ai和Ocean Protocol组成的人工级智能联盟宣布启动多币合并,形成统一的令牌。AGIX,OCEAN和FET代币的合并标志着朝着创建完全分散的AI生态系统迈出了重要一步。
- Ocean Protocol(OCEAN):该项目专注于数据市场的去中心化,使数据提供者和用户能够安全地交易数据。AI可以在这些数据上运行,提供高级分析和预测。
- SingularityNET(AGIX):这是一个分布式AI服务市场,允许AI开发者创建、分享和货币化AI服务,推动AI技术在去中心化环境中的普及。
- Fetch.ai(FET):一个基于AI的去中心化代理网络,用于优化经济活动,如运输、能源和供应链管理。AI代理在此生态系统中自主进行交易和协商,实现高效运作。
5.4.2 Agentlayer
AgentLayer 是一个基于区块链的去中心化人工智能代理平台,旨在通过智能合约和AI代理来简化和自动化复杂任务。AgentLayer 为开发者提供了创建和部署AI代理的工具,这些代理可以在不受人为干预的情况下完成特定任务,如数据分析、自动化交易等。
AgentLayer用模块化思路,将技术架构分为 AgentNetwork、AgentOS、AgentSwap 三层模块,旨在简化实施流程,增强系统功能。
- AgentNetwork 层是代理的物理执行环境,包含多个 AgentLink 合约、分布式账本基础设施。它在达成共识和验证代理行为以及建立多个代理之间的互操作性协议方面发挥着至关重要的作用。该层促进了代理之间的沟通并激励了代理之间的积极互动。
- AgentOS 层包括多个代理的开发套件、编排工具和服务。它提供了各种基础模型,例如 Mistral、Llama 和专有的 TrustLLM,用于微调功能。
- AgentSwap 是发现和投资由 AgentLayer 协议驱动的各种 AI 代理的网关。AgentLayer 协议的独特功能之一是促进代理作为资产的铸造和交易,称为 AgentFi。AgentFi 支持开发人员在 AgentSwap(代理商店)上注册和发布专有代理。
5.4.3 Mind network
Mind Network 是第一个用于 AI 和权益证明 (POS) 网络的全同态加密 (FHE) 重新质押层。该层接受来自 ETH、BTC 和 AI 蓝筹股的重新质押代币,并作为 FHE 验证网络运行,为去中心化 AI、DePIN、EigenLayer 和 Babylon AVS 以及许多关键 POS 网络带来共识、数据和加密经济安全。
Mind Network的充值呀解决方案由三层组成:重质押层、共识层、安全层。在共识层,引入了一种专为 AI 任务设计的新型智能证明 (POI)共识机制,确保 FHE 验证者之间的奖励分配公平、安全,为网络内操作的安全透明执行提供了强大的框架。
Mind Network 的解决方案已找到初步的产品市场契合点,IO.Net、MyShell、Bittensor、AIOZ、Nimble AI、ChainLink、Connext 等项目均采用了其解决方案。
5.4.4 Goplus Network
GoPlus Network 是一个开放、无需许可、用户驱动的Web3模块化用户安全层,通过其无需许可和用户驱动的用户安全网络和AI驱动的安全解决方案,为整个用户交易生命周期提供全面保护,改善 Web3 用户的安全状况。
GoPlus Network 通过其去中心化的安全数据和服务网络、开放的安全服务生态系统、高度可插拔且易于集成的 USM 以及以用户为中心的 SecWareX 安全产品,为 Web3 链上交易环境提供了全面的安全解决方案。该网络的架构不仅满足了用户的安全需求,还为安全开发人员和服务提供商提供了充足的参与机会,展现出未来增长和采用的巨大潜力。
io.net 是一个去中心化计算网络,支持在 Solana 区块链上开发、执行和扩展 ML(机器学习)应用程序,利用世界上最大的 GPU 集群,以允许机器学习工程师以相当于中心化服务成本的一小部分,来访问分布式云服务算力。
io.net 聚合来自未充分利用的资源(例如独立数据中心、加密矿工以及 Filecoin、Render 等加密项目)的 GPU 来解决这个问题,这些资源结合在去中心化物理基础设施网络(DePIN)中,使得工程师能够访问更多的 GPU 算力,支付更低的费用。
io.net 有三大产品:
- IO Cloud:是部署和管理去中心化 GPU 集群的页面,在这里用户能够访问各种功能的中心枢纽,例如部署集群、浏览 GPU Marketplace、快速监控操作和入门。IO Cloud 也是用户运行 AI/ML 应用程序的地方。它与 IO-SDK 无缝集成,为扩展 AI 和 Python 应用程序提供全面的解决方案。
- IO Worker:为用户提供对其计算的实时洞察,提供连接到网络的设备的操作和鸟瞰图,使他们能够监控这些设备并执行快速操作,例如删除和重命名设备。除此之外,IO Worker 还能监控计算活动、实时数据显示、温度和功耗跟踪、安装协助、钱包管理、安全措施和盈利计算相关的功能。
- IO Explorer:提供一个了解网络内部运作的窗口,为用户提供全面的统计数据和 GPU 云各个方面的鸟瞰图,统计数据如网络活动、重要统计数据、数据点和奖励交易的完整可见性等。
5.4.6 Aethir
Aethir 是一个去中心化的云计算基础设施平台,专为处理人工智能(AI)、机器学习和游戏等高计算需求的任务而设计。它将企业级GPU芯片聚合到一个单一的全球网络中,为AI、游戏和虚拟化计算领域增加了按需云计算资源的供应。
Aethir的云计算基础设施网络支持许多关键用例,包括AI模型训练、AI推理、云游戏、云电话和AI产品化。在每种情况下,其可扩展、经济实惠、低延迟计算的能力都可以跟上这些领域的创新需求。
Gensyn 是一个基于区块链的去中心化计算协议,专门为人工智能(AI)模型的训练和推理提供计算资源。
Gensyn通过将全球闲置的GPU资源(如小型数据中心、个人电脑等)整合到一个分布式网络中,为开发者提供大规模计算能力,同时降低计算成本。
Gensyn使用加密验证网络来确保计算任务的正确完成,并通过智能合约处理任务分配和奖励机制。其目标是通过这种去中心化方式打破大公司对高性能计算资源的垄断,让更多的中小企业和个人开发者也能负担得起AI模型训练的成本。
Gensyn 的机器学习训练工作的每小时成本约在 0.4 美元,远远低于 AWS(2 美元)和 GCP(2.5 美元)等所需成本。
5.4.8 C.INC
C.INC是一个去中心化GPUs计算平台,旨在整合分散、孤立的去中心化计算资源。其使命是让每个人都能公平获取计算能力。
C.INC的综合多层计算解决方案允许开发人员以更低的价格获得即时计算能力,同时提高可扩展性;供应商可以获得更高的资源利用率、更好的盈利能力以及更简单的接入流程。
C.INC的亮点包括:
- 更低价格:与云服务提供商相比,价格最多可降低80%。
- 即时访问:即时访问多云GPU资源供应。
- 灵活性与可扩展性:自动扩展基础设施提供弹性计算能力。
- 更高利用率:通过需求匹配提高50%的利用率。
- 更高盈利能力:通过多种收入来源增加70%的收益。
- 简便接入:为供应商提供友好的接入基础设施,使用便捷。
5.4.9 Bittensor
Bittensor是一个去中心化的AI模型市场,允许开发者通过贡献和优化AI模型来获得奖励。通过区块链激励机制,开发者可以提供自己的AI模型,网络会根据模型的表现对其进行筛选和调度。优质的模型会被广泛使用并获得代币奖励,形成一个自我优化的模型生态系统,推动AI技术的开放和创新。
Bittensor 既直接不贡献数据,也不直接贡献算力,通过区块链网络和激励机制,来对不同的算法进行调度和筛选,从而让 AI 领域形成一个自由竞争、知识共享的算法(模型)市场。
Bittensor通过一个基于区块链的去中心化网络,使用TAO代币作为激励机制。参与者包括:
- 矿工(Miners):贡献计算资源并运行机器学习模型,处理用户的AI需求。
- 用户(Users):提交AI任务需求(例如情感分析、图像识别),由矿工处理后返回结果。
- 验证者(Validators):验证矿工的工作质量,确保任务被正确完成。
Bittensor采用了“智能共识机制”(Proof of Intelligence)的共识算法,结合了传统的工作量证明(PoW)和权益证明(PoS)。矿工根据其提供的AI模型能力进行竞争,处理复杂的机器学习任务,获得代币奖励。
Bittensor的生态系统由多个子网(Subnets)组成,每个子网负责特定的AI任务,例如文本生成、语音转录、图像识别等。这些子网通过彼此协作来处理复杂的AI任务,最终将结果汇总并上链,确保整个过程的透明性和公平性。
5.4.10 Codatta(B18A)
Codatta(B18A)是一个AI驱动的区块链元数据标注和标签平台,旨在通过允许用户贡献和访问与区块链地址相关的元数据标签来提高区块链空间的数据透明度和可访问性。
Codatta 的使命是利用区块链技术降低人工智能开发团队的门槛,提供对优质数据的包容性访问,同时确保用户保留控制权并从他们的贡献中受益。
Codatta 解决了各个垂直领域的挑战,包括加密(帐户和用户注释)、医疗保健和机器人技术,其用户贡献数据在 web3 广告、反洗钱 (AML) 和医疗保健等领域得到了有效的商业化。
5.4.11 MyShell
MyShell 是一个去中心化的AI开发和应用平台,旨在为开发者和用户提供创建、共享和拥有AI应用的开放生态系统。MyShell通过去中心化技术,鼓励用户和开发者参与AI模型的构建、交互和货币化,使AI技术更加普及和民主化。
MyShell生态系统包括三个核心组件:
- 自主开发的开源AI模型:MyShell自主开发了多个开源AI模型,包括文本到语音和大型语言模型。其他现有技术将逐步开源,并可供整合。
- 一个开放的AI开发平台:MyShell使个人能够轻松构建AI应用程序。MyShell平台允许创作者利用不同的模型并集成外部API,使第三方提供商能够为开发人员提供他们的服务。借助原生开发工作流程和模块化工具包,创作者可以快速将他们的想法转化为功能性AI应用程序,从而加速创新。
- 公平价值分配生态系统:MyShell推动了一个开放的AI生态系统,用户和开发者可以在这个市场中分享和货币化他们的AI应用和模型。开发者通过代币经济体系($SHELL代币)获得回报,激励更多的参与和贡献。
5.4.12 Arkham
Arkham 是一个专注于区块链分析和去匿名化的加密情报平台。其主要目标是通过AI和区块链技术,将链上交易活动与现实世界中的个人或实体联系起来,为用户提供深度的链上分析。Arkham的核心功能包括追踪钱包地址、分析交易历史、评估链上行为模式,并通过其Intel Exchange 市场进行情报的去中心化交易。
主要功能:
- 链上行为分析:Arkham可以跟踪和分析特定实体(如加密货币交易所、钱包地址等)的链上活动,帮助用户了解特定地址的交易历史、资产持有情况、收益和损失等信息。
- 去匿名化:平台的ULTRA AI引擎可以通过AI算法,将区块链地址与现实世界的身份进行匹配,帮助用户识别特定加密活动的真实参与者。
- 情报市场(Intel Exchange):用户可以在该市场上买卖与区块链相关的情报,例如交易记录、地址标签等。用户可以通过放置悬赏或竞价购买他人提供的情报。
- AI辅助分析:Arkham还提供了类似于ChatGPT的AI助手,用于帮助用户查询特定链上数据或分析特定交易行为。
5.4.13 CharacterX
CharacterX 是一个基于Web3的AI角色扮演、聊天和创建平台,旨在建立一个去中心化的“合成社交网络”,通过AI角色与用户的交互桥接人类与AI。用户可以在CharacterX上创建虚拟AI角色,与它们进行文本、语音、图像等多模态的互动,体验沉浸式的AI角色扮演和聊天功能。
CharacterX的主要功能包括:
- 去中心化社交网络:CharacterX结合了去中心化技术(如Solana和TON区块链)和AI社交功能,用户可以与AI和其他用户互动,享受跨越时间和空间的沉浸式体验。
- AI角色创建与互动:用户可以创建和定制AI角色,设定角色的个性、形象、对话风格等,参与角色扮演、聊天或故事冒险,并获得Web3奖励。
- Web3代币激励:平台利用代币化机制,用户在与AI互动或贡献内容时可以赚取奖励(如CXC代币),并通过代币进行交易或解锁更多功能。
- 多模态互动:平台支持通过文字、语音、图片等方式与AI角色互动,还计划引入增强现实(AR)和3D角色建模等未来功能。
5.4.14 DAIN(Davin)
DAIN是一个去中心化AI智能代理网络,通过自然语言进行通信并使用NLP处理请求,以实现无缝协作、交互和交易。DAIN使开发人员和用户能够轻松设置针对任何可能的服务或需求进行业务和个人协助的智能代理。
在产品方面,DAIN推出了DAINTrader平台,将高级语言模型与区块链技术相结合,通过单一的界面和对话命令执行复杂的DeFi操作,并可创建和部署自动化交易策略Trading Bots.
Trusta.AI是一个通过人工智能数据层、模型层和分布式计算网络创建链上代理的AI OS,为Web3用户提供个性化的AI Agents网络。
其产品包括:
- Trusta Protocl:是一个用户ID和链上声誉协议,目前拥有2M+独立用户。
- TrustGo ID Wallet:一个钱包账户,提供Dashboard、链上分析、空投服务。
- 盘前去中心化交易市场: 以资本高效的方式交易空投代币和积分。
- 模块化身份与信誉应用链:基于模块化区块链技术构建行业首个Web3身份与信誉应用链,以支持各种链上身份证明,空投发射平台和空投资产交易。
除此之外,Trusta.AI还计划打造一个AI Agent交易市场,链上代理和机器人可以以分散的方式作为链上资产进行交易。
5.4.16 Quantlytica
Quantlytica是一个由AI驱动的多链流动性分配协议,可简化寻找和构建最佳流动性策略的过程。其利用机器学习和统计模型,对所有 DeFi 项目的回报、流动性风险和安全性进行横向比较,提供多种针对不同用户需求的自动化策略。另外通过 Fund SDK 工具包进一步降低了 Web3 的门槛,使 DeFi 策略的构建和测试变得快速、简单且人人可用。
Quantlytica的主要产品功能包括:
- 人工智能助手:ChatBot 是用户的人工智能财富经理,可帮助其轻松进入市场。
- 智能算法:基于 LSTM 网络的人工智能数据分析和实时推荐使用户能够完全可视化风险和回报。
- Fund SDK:Quantlytica Fund SDK 与现有工作流程无缝集成,为策略创建、测试和部署提供了强大的平台。
通过这些产品功能,Quantlytica 充当了加密用户的流动性网关,使得用户不需要深入了解市场、底层协议或 DeFi,就能快速、轻松、方便地参与 DeFi,进行复杂的 DeFi 投资,并获得收益。
6. AI的现状、问题和未来趋势
6.1 AI的现状
人工智能(AI)的发展已经进入了一个成熟的应用阶段,跨越了早期的研究和探索期,广泛渗透到多个行业,推动了各个领域的数字化转型。
以下是当前AI发展现状的几个关键方面:
- 技术进展:深度学习和大型语言模型推动了自然语言处理和生成式AI的发展,强化学习在自动驾驶、机器人等领域取得成功,边缘AI在智能家居和物联网中逐渐普及。
- 应用普及:AI技术广泛应用于自动驾驶、医疗、企业智能化等领域,生成式AI则在内容创作、广告和娱乐等行业发挥重要作用。
- 基础设施与硬件:NVIDIA等公司提供的GPU推动了AI计算的发展,Google的TPU等专用硬件加速器支持大规模AI任务,云计算平台使AI开发和部署变得更为便捷。
6.2 AI当前的问题:
尽管AI技术取得了巨大进展并广泛应用,但在数据隐私、可解释性、伦理问题、能源消耗和就业影响等方面仍面临诸多挑战。未来,解决这些问题将是推动AI技术健康发展、实现长期可持续应用的关键方向。
- 数据隐私与安全:AI模型的训练依赖大量数据,尤其是涉及个人隐私和敏感信息的数据(如医疗记录、金融数据等)。数据泄露、滥用和未经授权的访问可能对用户隐私构成严重威胁。如何在不牺牲模型性能的前提下保护数据隐私,并确保AI系统对数据的安全处理,仍然是一个关键挑战。
- AI决策的可解释性:许多AI模型,特别是深度学习模型,属于“黑箱”模型,其决策过程对用户和开发者来说难以理解。缺乏透明性可能导致在高风险领域(如医疗、金融)的不信任或错误决策。如何让AI系统的决策过程透明、可解释,并帮助用户理解AI作出的决定,特别是在涉及生命、财务等领域,仍然是AI发展的重要问题。
- AI伦理与责任归属:AI的广泛应用带来了伦理和责任归属问题。当AI系统做出错误决策或造成损害时,责任应该由谁承担?这在自动驾驶、医疗AI等高风险领域尤为重要。AI的责任归属尚不清晰,相关法律和监管框架仍在逐步发展。如何定义AI决策中的责任,并制定合适的伦理标准,是需要社会、企业和政府共同探讨的问题。
- 能源与计算资源消耗:训练大规模AI模型,尤其是深度学习和大型语言模型,需要大量的计算资源和电力消耗,增加了生态负担。AI的“碳足迹”引发了对环境影响的关注。如何优化AI的计算资源消耗,并提高能效,成为了可持续发展下的技术难题。开发更加高效的算法和硬件加速器(如低功耗芯片),以及探索绿色AI,是未来的重要方向。
- 就业与社会影响:AI的自动化能力正在改变许多行业的工作方式,并可能取代一些重复性、劳动密集型岗位。这对部分劳动力市场带来了冲击,特别是低技能工作者面临失业风险。如何平衡AI的发展与劳动力市场的稳定,推动再就业和技能提升,是社会必须面对的问题。同时,政策制定者需要考虑如何管理和分配AI带来的经济收益,以减少社会不平等。
- AI与监管的滞后性:AI技术的发展速度往往超前于现有法律和监管框架,导致在一些领域的监管真空。政府和企业如何共同制定规则,确保AI的安全、透明、合法发展,尚未形成统一的标准。如何建立适应AI技术发展的法律和监管体系,平衡创新与风险控制,是全球性挑战。特别是在自动驾驶、金融AI等高风险领域,需要更明确的监管政策。
6.3 AI 未来趋势
按照当前AI的发展和落地应用的情况,AI未来趋势将重点在AGI、AI与其他前沿技术融合、生成式AI进一步方面等方面。
- 通用人工智能(AGI):未来的研究将致力于探索能够处理多种复杂任务的AGI,其实现将带来巨大的社会和经济变革。
- AI与其他技术结合:AI与区块链、物联网和量子计算的结合将推动智能合约、智能城市、边缘计算等新应用的诞生,并提供更强的计算能力。
- 生成式AI发展:生成式AI将在创意行业中进一步发挥作用,推动内容自动化生产和人机协作,提升创作效率。
- 低代码与无代码AI开发:随着技术的普及,低代码/无代码平台将降低开发门槛,更多企业和个人能参与到AI应用的开发中。
7.总结
AI技术正在快速发展并广泛应用于各个领域,从医疗、金融、教育到零售与智能设备等领域,AI的影响无处不在。AI不仅推动了技术的进步,还在深刻改变着我们的生活方式、工作方式和社会结构。随着AI技术的不断成熟,其应用范围将进一步扩大,带来更多的机遇和挑战。
在AI赛道中,科技巨头、初创公司、研究机构以及Web3与AI的融合,共同构成了一个充满活力和创新的生态系统。AI不仅是一个独立的技术领域,它还在与其他新兴技术(如区块链、物联网、5G等)的结合中展现出更大的潜力。
然而,AI的发展也带来了诸多需要解决的问题,如数据隐私、伦理挑战、就业影响等。如何在推动AI技术进步的同时,确保其安全、透明和公平地应用,是未来社会必须面对的重要课题。
展望未来,AI将继续对我们的生活产生深远影响。对于普通用户来说,需要积极适应和拥抱这一技术变革,抓住AI时代带来的机遇,同时也要为可能的挑战做好准备。
- 通过学习来提升数字素养、学习AI相关技能、参与AI驱动的产品和服务,从而更好地应对和利用这一变革。
- 随着AI在工作场所的广泛应用,个人还需要提升职业技能,以适应AI带来的职业变革,在AI时代保持职业优势。
随着AI技术的进一步发展,我们可以期待更加智能化的服务、更高效的工作方式以及更加个性化的生活体验。
最后用一句话总结:理解AI、适应AI、利用AI,将成为未来成功的关键。
8. 参考文献
1.AI Agents are disrupting automation: Current approaches, market solutions and recommendations
https://www.insightpartners.com/ideas/ai-agents-disrupting-automation/
2.Web3+AI赛道全景盘点:130多个项目,还有哪些未被发掘的宝藏?
https://www.theblockbeats.info/news/49284
3.人工智能史
https://zh.wikipedia.org/wiki/人工智能史
4. The Top 100 GEN AI Consumer Apps
https://a16z.com/100-gen-ai-apps-3/
5.解读 bittensor (TAO) : 野心巨大的 AI 乐高,让算法变得可组合
https://www.techflowpost.com/article/detail_14586.html
6.特斯拉 Tesla AI 全景解析
https://mp.weixin.qq.com/s/B48pU5rMvIOKmIv5XH4uDw
7.ChatGPT背后的语言模型简史
https://www.bmpi.dev/dev/deep-learning/nlp-language-models/
8.AI 100: The most promising artificial intelligence startups of 2024
https://www.cbinsights.com/research/report/artificial-intelligence-top-startups-2024/
9.Foresight Ventures:AI x Crypto报告
https://mp.weixin.qq.com/s/o6k6E09xLtGZ8KVMVEVtPA
10. Generative AI towards Data Science: Navigating Opportunities and Challenges.
https://www.linkedin.com/pulse/generative-ai-towards-data-science-navigating-opportunities-challenges-ukwhf/
11. 62页PPT,初步看懂人工智能
https://mp.weixin.qq.com/s/57-rhZGSumq0JVkuJKzPq