一文解讀 Eliza 技術白皮書:一個 Web3 友好的 AI 代理操作系統
作者:深潮 TechFlow
千呼萬喚始出來,Eliza 於今日終於發布了它們的技術白皮書。
雖然我們常聽到許多 AI Agent 基於 Eliza 開源框架製作,但 Eliza 如何定義自己,在技術上一直都缺乏一個詳細且嚴肅的說明。
這份白皮書是一份很好的回答,對 Eliza 如何讓 AI 與 Web3 的深度融合、模組化的系統架構設計以及其作為 開源框架 的技術實現細節進行了描述。
白皮書由 Shaw 、多名 Eliza Labs 成員和其他相關組織的技術人員一同撰寫,但由於白皮書涉及大量技術細節和專業概念,對普通讀者可能不太友好。
深潮 TechFlow 對其進行了簡化和提煉,以求以通俗的語言,帶大家快速搞懂這份白皮書的內容。
1.為什麼要做 Eliza ?
注意,小編認為思考的前提是劃定範圍 --- 即在加密或 Web3 領域,為什麼要做 Eliza,而不是將該框架與更大範圍的類似 AI 框架做對比。
順著這個思路,在技術白皮書的簡介和背景部分,實際上對這個問題做了很好的回答:
在 AI 與 Web3 的交叉領域,一直存在著一個明顯的空白:缺乏一個能夠完美整合 Web3 應用的代理框架。
具體來說,白皮書認為 Web3 領域面臨著三個主要的挑戰:
去中心化交易的複雜性 隨著以太坊、Solana、BASE 等公鏈的蓬勃發展,在不同鏈上管理資產和執行交易變得越來越具有挑戰性。雖然市面上已有一些交易平台,但對於有定制需求的中高級用戶來說,這些平台的基礎功能往往不夠用。
鏈上數據的價值挖掘 區塊鏈上蘊含著海量的有價值信息,從基礎的持幣地址變化、代幣價格、市值等指標,到更深層的鯨魚賬戶占比、做市商風格等高級指標。如何有效地將這些複雜的數據轉化為有價值的洞察,是一個亟待解決的問題。
社交媒體信息的 碎片化 對 Web3 行業來說,Twitter、Discord、Farcaster 等社交平台是獲取信息的重要渠道。但隨著意見領袖(KOL)數量的增加,信息變得越發碎片化,如何在信息洪流中獲取有價值的洞察,成為每個交易者的普遍挑戰。
正是基於這些現實需求,Eliza 應運而生。作為首個開源的 Web3 友好型 AI 代理操作系統,Eliza 採用了模組化設計,讓開發者和用戶能夠根據自己的需求定制解決方案。
Eliza 嘗試降低普通用戶使用高級 AI 功能的門檻,無需深厚的編程經驗就能構建自己的 AI 代理。
同時,白皮書也將自己和其他的幾個常見的 AI 框架做了對比,下表可以很直觀的看出,在 Web3 支持度上,Eliza宣稱自己的是最適配的,而這也是整個白皮書所要傳達出來的關鍵點。
2.Eliza 的設計理念和技術創新
三大設計原則:簡單但不簡單
Eliza 的成功不是偶然的。在設計之初,團隊就確立了三個核心原則:
Web3 開發者優先 考慮到 Web3 主要使用 JavaScript/TypeScript 進行開發,Eliza 選擇了 TypeScript 作為開發語言。這不僅讓開發者能夠使用熟悉的工具,更讓他們能輕鬆地將區塊鏈功能整合到現有的網頁應用中。簡單來說,就是讓 Web3 開發者能夠"拿來即用"。
模組化插件設計 Eliza 將系統分解為核心運行時和四個關鍵組件:
Adapter(數據適配器)
Character(代理個性)
Client(消息交互)
Plugin(通用功能)
這種設計讓開發者可以自由添加自己的插件、客戶端、角色和適配器,而無需關心核心運行時的細節。這也使得 Eliza 能夠支持最廣泛的模型提供商(如 OpenAI、Llama、Qwen 等)、平台集成(Twitter、Discord、Telegram 等)和鏈兼容性(Solana、Ethereum、Ton 等)。
- 寧簡單勿複雜:
在有限的工程資源下,保持簡單的內部實現可以節省時間用於開發新功能,適應新場景,並跟上 AI 和 Web3 領域的快速發展步伐。
技術創新:內外兼修
在具體實現上,Eliza 的創新分為內部增強和外部擴展兩個維度。
- 內部增強 為了提升 AI 模型的思維能力,Eliza 整合了多項前沿技術:
Chain-of-Thoughts(思維鏈):
技術定義:引入步驟式解釋
通俗理解:就像解數學題要寫過程一樣,AI 也會把思考過程一步步寫出來,而不是直接給出答案。這樣不僅結果更準確,人類也能理解 AI 是如何得出結論的。
Tree-of-Thoughts(思維樹):
技術定義:允許分支探索多個解決方案
通俗理解:像下棋時要考慮多種可能的走法一樣,AI 會同時探索多個解決方案,然後選擇最優的那個。這就像在思維的樹上,選擇最好的那條分支。
Graph-of-Thoughts(思維圖):
技術定義:連接推理路徑
通俗理解:把問題看作一張網,各個想法之間互相連接。就像我們解決複雜問題時,會把各種相關的想法聯繫起來,形成思維導圖。
Layer-of-Thoughts(思維層):
技術定義:分層推理 AI
通俗理解:像過濾器一樣,把思考過程分成不同的層次。就像我們解決問題時,先考慮大方向,再細化到具體細節,層層遞進。
- 外部擴展 為了增強實際問題解決能力,Eliza 集成了多種外部能力:
RAG(檢索增強生成):
技術定義:通過檢索來增強生成能力
通俗理解:就像學生做作業時可以查閱教科書一樣,AI 在回答問題時也可以查閱它的"資料庫",確保答案更準確。
向量數據庫:
技術定義:存儲和檢索結構化數據
通俗理解:相當於 AI 的"圖書館",可以快速找到相似的內容。比如你說"我想找一首關於月亮的詩",它能快速找到所有相關的詩歌。
網絡搜索:
技術定義:實時獲取互聯網信息
通俗理解:讓 AI 像人類一樣能夠上網搜索最新信息,不被限制在固定的知識範圍內。
文本轉圖像/視頻/3D 模型:
技術定義:將文字描述轉換為多媒體內容
通俗理解:就像畫家能根據文字描述畫出畫作一樣,AI 可以根據你的描述生成圖片、視頻,甚至 3D 模型。
與其他 Web3 領域的框架的對比
在當前的 Web3 AI 代理框架中,Eliza 展現出明顯的優勢。根據來自 50 多位 AI 研究人員和高級區塊鏈開發者的反饋,Eliza 在以下關鍵指標上都優於其他框架:
模型提供者的支持度
鏈兼容性情況
功能完整性情況
社交媒體集成情況
3.Eliza OS:一個精心打造的 Web3 AI 生態系統
在了解了 Eliza 的設計理念後,讓我們來看看這個框架究竟是如何運作的。可以把 Eliza 想像成一個精心設計的樂高積木系統,每個部分都能完美配合,又保持著極強的靈活性。
核心組件:五個關鍵角色
在 Eliza 的世界裡,五個核心組件相互配合,構成了一個完整的智能系統。
- Agents(代理):系統的主角
它們就像一個個獨立的"數字助手",負責處理各種自主交互。每個代理都擁有自己的"記憶"和"性格",能通過 Discord、Twitter 等不同渠道與用戶進行連貫的對話和互動。
- Character Files(角色配置):代理的"人設"
要讓這些代理富有個性,就需要 Character Files(角色配置)的支持。這相當於代理的"個人簡歷",不僅定義了其身份和個性特徵,還規定了它能使用哪些模型(如 OpenAI、Anthropic),以及可以執行哪些操作(如區塊鏈交易、NFT 鑄造)。通過精心設計的角色配置,每個代理都能展現出獨特的專業特長和行為方式。
- Providers(提供者):代理的"感知系統"
在與外界互動時,代理需要 Providers(提供者)作為其"感知系統"。就像人類需要感官來感知世界一樣,提供者為代理提供市場數據、錢包詳情、情緒分析等實時信息,幫助它們更好地理解當前環境和上下文。
- Actions(行動):代理的"技能庫"
當需要採取具體行動時,Actions(行動)就成為代理的"技能庫"。從簡單的買賣訂單到複雜的 NFT 生成,每個操作都經過嚴格的安全驗證,確保在處理金融相關任務時萬無一失。這些技能讓代理能夠真正地在 Web3 世界中發揮作用。
- Evaluators(評估器):代理的" 決策系統 "
最後,Evaluators(評估器)則擔任代理的"決策系統",負責評估對話內容,提取重要信息,並幫助代理建立長期記憶。它不僅追蹤目標完成進度,還確保整個對話過程的連貫性。
智能交互:不只是簡單的對話
在交互方面,Eliza 採用了多層次的理解系統,就像一個經驗豐富的翻譯官,不僅要理解字面意思,還要理解說話的背景和意圖。這個系統能夠準確理解用戶的真實需求,在不同的通訊平台保持一致的體驗,並根據上下文靈活調整回應方式。
插件系統:無限擴展的可能
Eliza 的插件系統本質上是一個工具箱,為整個框架帶來了強大的擴展性,這種擴展體現在多媒體生成、Web3 集成和基礎設施三個方向上:
在多媒體生成方面,它能夠生成圖片、視頻、3D 模型,支持 NFT 系列的自動生成,還提供圖片描述和分析能力。
在 Web3 集成方面,它支持以太坊、Solana 等多鏈操作,提供完整的交易功能套件,並集成各類 DeFi 操作。
在基礎設施方面,它提供了瀏覽器服務、文檔處理、語音轉文字等基礎能力。
通過這種模組化的設計,Eliza 不僅保持了系統的穩定性,還為開發者提供了近乎無限的擴展可能。這也使得 Eliza 能夠適應 Web3 世界中不斷湧現的新需求和新場景。
4.Eliza 的實力幾何?從數據看真相
當一個新技術框架出現時,大家最關心的往往是它的實際表現。Eliza 在這方面給出了一個坦誠的答案。
在 GAIA 基準測試(這是一個專門評估 AI 代理解決現實問題能力的測試平台)中,Eliza 展現出了不俗的實力。這個測試不是在考察簡單的問答能力,而是要求 AI 代理具備邏輯推理、多模態處理、網頁瀏覽和工具使用等多項技能。
雖然在測試中,Eliza 的得分(19.42%)與當前最頂尖的方案還有一定差距,但考慮到它是一個專注於 Web3 領域的框架,這個成績已經相當亮眼。特別是在基礎任務的處理上(Level 1),Eliza 達到了 32.21% 的完成率,顯示出其扎實的基礎能力。
Web3 領域:開創性的標準制定者
更值得關注的是,Eliza 在 Web3 領域實際上扮演著"標準制定者"的角色。由於 Web3 導向的 AI 系統仍處於早期階段,Eliza 率先提出了一個完整的評估標準體系,為整個行業指明了發展方向。
這個評估體系分為三個層次,白皮書把它叫做 Web3 AI 版本的 "圖靈測試":
基礎能力:包括錢包創建、代幣交易、智能合約交互等基本操作。
進階功能:整合最新的 AI 技術,如文本轉視頻/3D、RAG 支持等。
高級特性:能夠基於用戶指令自主規劃和推理,實現真正的智能決策。
目前,Eliza 已經成功實現了基礎層次的全部功能,並正在向進階層次邁進。團隊表示,他們堅信在未來幾年內,將能夠實現完全自主的 AI 代理系統。
5.實際應用:市場用真金白銀投票
原白皮書還有一節是關於代碼展示,用來說明目前能用該框架做出來的實際應用;考慮到理解難度以及技術細節,在此略過,僅展現更加宏觀的實際應用情況。
根據白皮書描述,截至 2025 年 1 月,已經有多個重要的 Web3 項目基於 Eliza 構建了他們的 AI 代理系統,這些合作夥伴的總市值超過 200 億美元。
這個數字或許本身就是市場對 Eliza 技術實力的最好背書。
更重要的是,Eliza 團隊對未來充滿信心。他們認為,隨著這些"智能代理"的不斷進化,我們將看到一個由多個 AI 單元協同工作的新时代。正如 Anthropic 的 CEO Dario Amodei 所說的"天才數據中心"願景,Eliza 正在為這個未來鋪平道路。
6.現存限制與未來展望:誠懇的自我剖析
任何技術框架都不可能十全十美,Eliza 團隊在白皮書中也坦誠地指出了當前框架存在的局限性。
待解決的三大挑戰
工作流程系統的缺失:就像一個熟練的助手需要一套標準化的工作流程一樣,當開發者想要實現一些常規性的任務時(比如定期從多個源頭匯總數據),現有的 Eliza 框架還無法提供現成的解決方案。對於這類需求,可能還是需要借助 Dify 或 Coze 這樣帶有圖形界面的工作流系統。
多代理系統的性能問題。隨著代理數量的增加,系統需要處理的上下文和記憶內容呈指數級增長。特別是在處理大量輸入輸出任務時,如何平衡計算開銷和運行效率,仍然是一個待解決的技術難題。
多語言支持的拓展需求。目前 Eliza 主要基於 TypeScript,但要吸引更多領域的開發者加入,還需要擴展對 Python、Rust 等其他編程語言的支持。
展望:開創去中心化 AI 新紀元
儘管存在這些限制,但 Eliza 的意義已經遠遠超出了個技術框架本身。它代表了 AI 技術和 Web3 應用深度融合的一次開創性嘗試。
通過將每個功能模組都設計成標準的 TypeScript 程序,Eliza 確保了用戶對系統的完全控制權。同時,它還提供了與區塊鏈數據、智能合約的無縫集成能力。這種設計既保證了安全性,又維持了極強的擴展性。
正如白皮書結尾所說,Eliza 的可能性僅受限於使用者的想像力。隨著 AI 和 Web3 技術的持續演進,Eliza 也將不斷發展,繼續引領去中心化 AI 的發展方向。