王峰再度對話Tim Gong:去中心化的AI,AI Agent 與 PoI

火星財經
2023-12-23 10:14:17
收藏
王峰與Tim Gong博士就資訊排序、熵、公鏈和Web3的未來進行了對話,Tim Gong博士介紹了AI native的概念,認為AI agent不是一個工具,而是一個與人協作的新物種。ByteTrade提供去中心化的計算平台,讓每個人都可以運行開源的AI大模型以及agents,並且提供一個去中心化的應用市場,以及基於RFQ的交易網絡,讓AI agents的協作成為可能。

對話人:

王峰:藍港互動創始人、火星財經及Elenment發起人

Tim Gong:SIG中國創始合夥人、ByteTrade董事長

編者按:2023年除夕,王峰與Tim Gong進行了一場對話,話題涉及信息排序、熵和公鏈以及Web3的未來(鏈接:王峰除夕對話Tim Gong:關於信息排序、熵及Web3的明天)。這場對話已經過去一年時間,這一年ChatGPT如日中天,LLMs對信息的產生與分發都帶來了深刻的影響,Tim Gong博士的認知有了哪些更新,其領導的ByteTrade又做了哪些工作?在聖誕前夕,王峰再次對話Tim Gong。

2022年6月,SIG宣布領投總部位於新加坡的Web3信息應用的基礎軟件平台ByteTrade新一輪4000萬美元,SIG中國創始合夥人Tim Gong出任該公司董事長。Tim Gong畢業於上海交通大學物理專業,在普林斯頓大學獲電子工程學博士。SIG是字節跳動的最早期的投資方,也一直是最大投資股東。

去年除夕夜王峰與Tim Gong探討了"為什麼需要有去中心化的信息分發",也就是大家常講的Web3。在此之後,OpenAI發布了ChatGPT。在過去的一年,LLMs對信息的產生與分發都帶來了深刻的影響。許多SIG投資的Web3、雲計算、或者AI公司在過去一年中也及時抓住機會,調整了產品方向。讓我們看看Tim Gong在這一年中有了什麼更新。

以下是王峰與Tim Gong的對話全文:

1、很多創業者與投資人現在都在討論AI native的產品與公司。什麼是您所理解的AI native?

可能一個比較常見的定義是"離開了AI就不工作的產品"。比如copilot這類產品可能就算不上是AI native。畢竟離開了AI的google search,Microsoft office與GitHub codespaces仍然是挺有用的產品,而AI提供的價值是incrementally提高了體驗。

而AI agent這樣的產品,只要求用戶用自然語言交互,由AI來理解,計劃,推理,與執行整個任務,則是AI native的。AI agent不是一個工具,而是一個與人協作的新物種。

從人找信息(以Google為代表的搜索),到信息找人(以字節為代表的推薦),再到personal AI agent幫助人生成與消費信息。我們一直在發明新的方法來實現熵減。

2、作為一個新物種,AI agent是要取代人類嗎?

當然不是。我想起了曾鳴教授最近提的觀點:"富有創造力的人與機器的協同,是未來主流的工作狀態。"

目前市場上大家對AI agents的定義比較廣泛。任何給大模型提供了知識,記憶,感觀("眼睛與耳朵"),以及行動能力("手")的應用,都是agent。當然agent也包括了機器對人的直接延伸,比如大模型驅動的機器人,個人IoT智能設備,或者數字孿生的環境。目前市場上的大模型應用創業公司,基本上100%是在做agents。

3、如果AI agent是未來的主要產品形態,這對未來的整個軟件生態會帶來什麼影響呢?

我想起來曾鳴教授曾說過:"Web2的軟件生態是讓人更好地變成工具",我認為未來的軟件生態會主要為AI agent服務。因為人只需要與AI agents交互了,其他的軟件都與人沒有直接關係了。Agents或者"機器人"可以幫助你獲得信息,幫助你賺錢(工作或者交易),幫助你學習,甚至幫助你社交。你個人的agent是你最信任也是最有用的陪伴,你與它交互就可以了。

舉例來說,最近在大模型領域特別流行的prompt engineering(提示詞工程),包括RAG這種用私有知識庫來補充prompt上下文的技術,都是以服務AI agent為目標的軟件。這才是在基礎軟件層面的AI native。

Mistral AI的創始人最近也說,相對較小的開源LLMs,比如7B參數的模型,能讓開發者自己運行,同時可能湧現足夠的"智能",可能才是agent創新的sweet spot。

4、說到開源的LLMs,也有一些人仍不看好。最近的OpenAI dev day發布的一系列產品顯示了一夜崛起的科技大公司的絕對優勢。OpenAI的先發優勢如此之強,AI的未來是中心化的嗎?

開源大模型現在迭代速度越來越快,越來越有競爭力。我前幾天在Hugging Face上搜了一下,光是基於Llama2架構重新訓練或者微調的開源大模型就有上千個,而它們在性能榜單上與OpenAI的差距也在不斷縮小。

而且在OpenAI Dev Day上發布的一系列產品,從模型微調,RAG知識庫,結構化輸出,到應用編排都已經早有很好的開源方案。甚至可以說在應用這個層面上,OpenAI在追趕模仿開源的創新。

5、但是,LLM研發與推理需要的GPU資源需要很大投入,所以是非常容易中心化的。有很多人說,GPU rich(富有GPU)的大廠與GPU poor(缺乏GPU)的創業公司差距只會越拉越大。

我不同意這個說法。簡單來說,現在最重要的開源大模型llama2不就是GPU rich的meta發布的?而同樣GPU rich的Google,微軟,亞馬遜,到今天也沒見發布什麼有影響力的東西。GPU顯然不是創新的充分條件。創新靠的是人,不是GPU。開源最大的優勢是能把人聚在一起。而且隨著GPU算力變得越來越便宜,模型訓練的主要矛盾可能越來越會是數據,尤其是私域的數據,而不是算力。

甚至GPU rich也不是大模型創新的必要條件。在個人計算機與邊緣機房有大量冗餘的GPU。它們也許並不適合訓練模型,但是對於佔95%應用工作量的微調與推理,這些去中心化的GPU資源是大有用武之地的。

但是我更期待的是進一步的科技創新,比如用CPU運行大模型推理。整個社會有大量閒置的CPU算力與內存。目前這方面前沿的工作很多。包括我們的portfolio公司,比如Second State,實現了在個人筆記本電腦甚至IoT邊緣設備上離線地運行大模型。

我很期待去中心化AI大模型應用的未來。

6、您講了去中心化AI agents的可行性。但是它們是必要的嗎?在您的設想中去中心能解決用戶的什麼需求呢?

同時,正因為AI Agent有可能全面掌握我們每個人的信息入口與出口,我們需要對它有高度的信任。我們不可能允許它被其他人控制,也很難容忍廣告商的商業引導。這就決定了,agents是私有的,是去中心化的。企業與個人需要的去中心化基礎設施。

更進一步說,個人的機器人助手,IoT智能設備,或者數字孿生,本來就是用戶自己擁有的計算機,本質上就是去中心化的。在ByteTrade,我們把這個基礎設施叫做"私有的邊緣雲"。

但是,私有的agents是需要協作的。就像人一樣,每個agent都需要與別的agents交換資源。這種交換可能是算力(比如你的agent有空閒的GPU),可能是信息,可能是資產,也可能是現實社會的權限(比如你的agent有政府牌照可以交易某種受限資產)。這些都是全新的機會。

7、人与人的協同靠的是組織關係。人与機器的協同是靠什麼實現的呢?

現代商業文明的基礎是貨幣,也就是人与人之間的價值交換網絡。我們的智能agents也需要一個價值交換網絡,讓agents之間以及agents與人之間能實現商業協作。

李飛飛博士在最近的一個訪談中提到,"When we think about this technology, we need to put human dignity, human well-being---human jobs---in the center of consideration."人与AI agent的交互與協作必須要維護人的尊嚴。

今天我們已經有了這樣網絡的基礎技術。就是基於區塊鏈的去中心化賬本技術。整個crypto與web3社區對去中心化點對點交易系統進行了大量的嘗試與創新。在ByteTrade,我們把這種可以量化與交易的agent貢獻叫做Proof of Intelligence (PoI)。這個intelligence是廣義的"智能",是人或者機器智力勞動的結果。

8、這個世界每個人都需要接受一個DID(去中心化的身份)嗎?

Sam Altman的WorldCoin講的是Proof of Personhood。作為OpenAI的創始人,他認識到了在未來的AI世界裡,人會是需要"自我證明"才能加入到價值網絡的。DID只是實現這個vision的一個具體技術手段。

ByteTrade的Proof of Intelligence把人与智能AI agent放在同一個網絡裡進行價值交換。我們認為這裡一開始的主要場景可能是agent學習人的喜好,然後代表人与別的agent交互。比如

  • 一個agent可以是用戶在VR世界裡的孿生,與其他人的agents在數字世界裡互動。
  • 一個agent可以出售自己節點上閒置的GPU資源,換取另一個agent的閒置存儲資源。
  • 一個agent可能有一個在某個特定領域表現出色的微調大模型(比如這個agent的人類伴侶是一個行業專家)。它可以把這個模型"租"給別的agents。
  • 一個agent可能有私域數據能幫助別的agents更好地解決某一類的問題。它可以出售這些數據,或者甚至以這些數據為基礎提供計算服務。
  • 一個agent可以運行一個DAO或者公鏈的質押節點,與提高質押資金的agent分享收益。

這些agents之間的交換都是PoI的具體表現。這些PoI在區塊鏈上可能有各種表現的形式。比如,同質化的計算資源可以是fungible tokens,而特殊唯一的數據或者算法則可以是NFT。具體怎麼為這個intelligence定價則是由去中心化的RFQ網絡(比如Otomic)或者NFT交易平台(比如Element)來完成。

9、很明顯,另一個驅動AI中心化的巨大力量是政府。不論是中國還是美國的人工智能產業人士都不會懷疑,中美兩國政府都在試圖"監管"大模型。創投圈子裡很多人說,監管會影響創新,想聽聽您的看法?

我認為大模型,以至AGI,對社會產生危害的風險是確實存在的。但是解決問題的方法應該是依賴技術創新與行業自律。比如,大模型固然可以產生假新聞,但是它也能檢測假新聞。我們的每個agent可以獨立地對信息真偽進行判斷,而且它們產生的結果也可以生成NFT記錄上鏈。比如,A的agent用B的模型加上A的數據生成了一個逼真的短視頻,A會同時發布一個NFT來證明這個視頻的來源。這樣任何看到這個視頻的人都可以對其溯源。

如果不同的agents對信息真偽的判斷有爭議,PoI還提供了一個很好的機制讓社區達成共識。

Elon Musk在X實現的community notes是讓用戶對內容進行投票,在很大程度上是非常成功的嘗試。但是從OpenAI董事會的"宮鬥"我們也可以看出,no skin in the game的投票是非常危險的,很容易被人利用。

用AI agents可以規模化地對內容真假進行投票。而PoI是一個經濟機制,它可以讓Agents以及其代理的人類為投票付出成本,也就是讓他們有skin in the game。我很期待在這個方向的創業項目!

10、說起創業公司,您擔任董事長的ByteTrade已經開始在做這些工作了嗎?

是的,ByteTrade去年成立的時候就是想要把屬於每個人的計算資源連接起來,構建一個去中心化的"個人雲"。這與我們今天講的Agent沒有什麼不同。過去一年的主要變化是AI變得更強大了,所以AI agent的應用場景與需求都更上了一個台階。對於ByteTrade來說,我們在明年會分步宣發幾個產品模塊。

  • Terminus OS是我們的個人雲產品。它提供了一個去中心化的計算平台讓每個人都可以運行開源的AI大模型以及agents。
  • Terminus裡面會預裝一些核心的應用,尤其是需要高度安全的金融或者區塊鏈應用。比如錢包,驗證身份的DID等等。
  • Terminus marketplace是一個去中心化的應用市場。ByteTrade與第三方開發者都可以在這裡發布應用,比如AI agents,內容推薦引擎,自動交易機器人等等。
  • Otomic是我們基於RFQ的交易網絡。它上面主要由Terminus裡面運行的機器人進行報價與自動執行交易。這個去中心化的RFQ機制可以交易幾乎所有的crypto與傳統金融的數字資產與衍生品。

ByteTrade一方面為開源的大模型與AI agent提供去中心化的軟件開發,發布,與運行的基礎設施,另一方面通過搭建一個基於公鏈的PoI價值交換網絡讓AI agents的協作成為可能。很希望明年有機會與大家更深入地探討這些問題!

太好了,謝謝龔博士今天的時間,我們非常期待ByteTrade的產品!

鏈捕手ChainCatcher提醒,請廣大讀者理性看待區塊鏈,切實提高風險意識,警惕各類虛擬代幣發行與炒作,站內所有內容僅係市場信息或相關方觀點,不構成任何形式投資建議。如發現站內內容含敏感信息,可點擊“舉報”,我們會及時處理。
banner
ChainCatcher 與創新者共建Web3世界