對話獲 4300 萬美元融資的 Sahara 創始人:服務微軟、亞馬遜,Sahara 如何助力 AI 資產化?
訪談者:西柚, ChainCatcher
嘉賓:Sean Ren、Tyler Zhou ,Sahara 聯創
編輯:Marco,ChainCatcher
自OpenAI發布文生視頻AI大模型Sora後,AI再次成為當今市場上最大的風口賽道,投資浪潮一波接著一波,AI和Web3兩個領域的融合創新項目如雨後春筍般湧出。根據加密數據平台Rootdata顯示,"AI和Web3"板塊收錄的項目已接近240個,顯然已成為獨立賽道,去中心化AI網絡Sahara就是該板塊的明星項目之一。
Sahara由Sean Ren和Tyler Zhou於去年5月創建,是一個去中心化AI網絡基礎設施助力AI資產化,旨在幫助用戶部署或構建自定義化、個性化的AI產品等。
Sean Ren是南加州大學的計算機系終身教授,在AI領域已經有15年的行業研究經驗;Tyler Zhou曾在Binance Labs擔任投資總監,並參與了多個項目投資及孵化。
今年3月,Sahara宣布,早在去年8月就完成由Polychain Capital領投的600萬美元融資,參投方有紅杉資本、Samsung Next、Nomad Capital等投資機構。
兩位創始人對ChainCatcher表示,目前,Sahara已為30多家企業客戶提供數據服務,包括Microsoft, Amazon, MIT, Snapchat, Character AI等知名企業,已經獲得了數百萬美元的營收。
在接受ChainCatcher專訪時,Tyler Zhou透露,Sahara會在4-5月推出C端用戶產品;Q3會上線Sahara測試網Testnet,爭取在Q4上線主網等。
4月4日,針對早期用戶,Sahara在任務平台Galxe推出了首個積分活動Sahara Social,用戶可以通過連接Sahara網絡、註冊候補名單等任務賺取早期積分獎勵等。
創建Sahara的背後故事
1、ChainCatcher:請問Sean Ren個人經歷有哪些,因何契機結緣Web3的?在Sahara負責什麼工作?
Sean Ren: 我個人的學習和工作經歷都是比較偏工科背景的。
在創建Sahara前,我在南加州大學(簡稱USC)計算機系擔任終身教授已有7年,主做AI和NLP兩方面的學術研究。
我在美國伊利諾伊大學香檳分校攻讀計算機系PhD時,創建了首個創業項目StylePuzzle(時尚達人穿衣推薦電商平台),並得到了Plug \& Play Ventures的投資,一路從天使輪走到了C輪。
與Tyler已是6年的朋友,我們創業的契機應該是在2022年,那時一起討論了很多Web2 AI產品本身的弊病,尤其是經濟模型問題。
現在的AI經濟模式只有小部分專業人員獲益,數據的所有者、採集者、提供者及模型的反饋者等其它AI生態參與者,並沒有得到合理的經濟補償,用戶的數據隱私問題也沒有解決,這不利於長期發展。
Sahara產品的第一原則就是解決現在傳統AI行業的痛點,確保AI生態的所有參與者都可以根據自己的工作貢獻獲取恰當或合理的收益 ,不再局限於大模型的計算能力及落地場景上等。
目前,我在Sahara主要負責產品開發和BD等方面的工作。
ChainCatcher:Tyler Zhou此前曾在Binance Labs擔任投資總監,為何要從幣安離職,選擇投身AI賽道創業?
Tyler Zhou: 我本科從UC伯克利畢業後,做投行和PE私募股權投資,投的主要是基建、信息科技IT及地產科等。
2022年初加入Binance Labs,負責美國市場的投資工作,主要是做孵化、投資項目等,第一期MVB是由我主導推出的。
2023年初選擇離開幣安和Ren教授建立Sahara主要有幾點考慮:首先整個AI生態的經濟模式存在很多問題,區塊鏈的加密技術和代幣經濟或許能用來解決這些問題。
我個人覺得Ren教授的背景、專業知識是做相關產品的最合適人選,市場上沒有團隊能像任教授那樣懂AI系統的生態、技術和經濟等整個閉環。
此外,Ren教授不是傳統意義上只做研究的研究員,還有非常強的商業敏感度和嗅覺。
2、ChainCatcher:Sahara產品定位及目標是什麼?除了AI的商業化問題,還想要用來解決哪些問題?
Sean Ren :目前,Sahara主要產品是一個去中心化網絡基礎設施,支持任何人構建或部署其個性化AI產品。
Sahara可以視為是由Execution Layer(執行層)、Transaction Layer(交易層)和Application Layer(應用層)組成的去中心化網絡。
在應用層,Sahara提供了一個原生內置的去中心化數據市場(Decentralized Data Marketplace也稱Sahara Data),並提供處理數據相關的工具包(如收集、標註、QA等)等配套設施,以供用戶使用和訪問,幫助訓練其AI模型。
用戶來到Sahara,大多也是為了構建自己的AI產品,Sahara Data可以先幫助解決數據的收集、標註和轉化的問題。
另外,作為一個數據市場,Sahara是吸引數據供給方和需求方的一個重要鏈接平台,它不但可以為AI模型訓練提供高價值的數據服務,也能夠幫助有數據需求的用戶發現更多的數據提供者,從而更順暢地去構建自主化AI等。
Sahara Data去中心化數據市場是Sahara產品的一大優勢,也是用來區分其與市場上的Web3 AI項目不同的關鍵。 去年10月推出,截至目前已上線運行了約6個月,最初只服務一些企業客戶,如Microsoft、Snapchat、MIT、Motherson Group、Amazon等,向其提供相關數據的服務,並處理業界最難的一些數據需求問題。
Sahara執行層支持數據加密和歸因,即所有權證明,通過使用數字水印創新技術和公鑰設施來實現,它類似一個所有權證明(proof of ownership),當用戶創建出一個數據點、數據集、或模型時,可以把自己的Did植入到其數據或者模型裡面,生成一個水印,證明對其的數據所有權,這個水印會隨著用戶的數據和模型流轉一直存在,這樣就可以給數據和模型做歸因。
通過使用所有權證明機制,用戶在訓練自己的AI或做推理時,如果需要依托於某一個人或某一幫人構建的基礎模型,該AI產品以後產生的收入就可以分給底層模型的持有人。
3、ChainCatcher:3月5日,Sahara公布完成了由Polychain Capital領投的600萬美元種子輪融資,參投者還有紅杉資本等。Sahara是如何接觸這些投資人的?您認為Sahara為何會被他們看好?投資機構給予了哪些幫助?
Tyler Zhou: 其實,種子輪融資並不是近期的一個融資,早在去年8月就已完成 。與別的團隊不同,Sahara並沒有在融資完成時立刻公開,而是等待時機合適了、產品上市後再宣傳。
之所以現在公布,是因為Sahara產品發展進入了新階段,接下來會推出一系列新產品,包括生態相關的應用。
Sahara種子輪是超額認購的狀態,可選擇性非常多,但我們選擇投資人非常有戰略意義。這些投資人可以幫助Sahara看到AI全球公司的發展形勢,AI不同階段的初創企業在做什麼,全球的AI經濟趨勢,以及不同國家的AI經濟有什麼不同,頭部AI企業所做的事等。
Sahara的優勢及開發進程
4、ChainCatcher:您認為Sahara與傳統的ChatGPT等AI產品有何不同?
Sahara聯創Sean Ren: 可以從兩個層面來看。
首先,Sahara不是做應用的,最後交付的產品不是某一個GPT產品。Sahara是一個去中心化網絡基礎設施提供者,其應用層也沒定義開發者要構建的AI Agent產品樣子,而是提供相關配套的API和SDK等工具包,讓任何人都可以輕鬆構建自己的AI Agent。
第二,ChatGPT是一個一問一答形式的對話機器人,而Sahara上的Sahara Knowledge Agents(KA知識代理)是自定義人工智能程序,與傳統的對話機器人有很大不同的,它會自主分析數據,針對特定需求提出可靠決策,會根據某些指令去行動或執行任務,以達到某一個目的。
例如,某個KOL的KA目的是希望它能幫助篩選其推特DM裡面的打廣告的邀請信息,每天生成一個精簡報告,回覆別人的DM等,無論何時KA都可以自動執行這些命令。
Sahara是一個基礎設施建設者,並為構建自定義的Knowledge Agents(KA)提供了工具和平台等。
Tyler Zhou: 與ChatGPT及市面上的AI項目相比,Sahara主打的是Personalized Agent(個性化代理),是一個自定義化的人工智能程序,能力不局限於聊天,還可以幫助用戶去執行很多事情。
想要構建一個"Personalized Agent"需要兩個前提,第一個是需要有自己的數據庫,然後根據自己的數據去訓練AI Agent,才能讓其達到一些想要的能力;第二需要有去構建Agent的相關基礎設施及工具。
Sahara不但提供了數據市場等數據相關的處理工具,其執行層還可保障用戶數據能在隱私化保護的情況下訓練自己的AI,並提供相關基礎設施工具幫助用戶更好地構建KA。
Sahara網絡支持用戶在不犧牲自己數據隱私的同時定制化自己的AI Agent,還提供了構建Agent的no-code(無代碼)平台。
5、ChainCatcher:Sahara成立以來的數據如何?接下來的工作重點是什麼?
Sean Ren: 首先關於產品,Sahara一直在建設去中心化數據市場Sahara Data,去年10月推出產品。
截至目前,Sahara Data共合作了31個企業客戶,打磨技術的同時增加了營收。
截至今年Q1結束,Sahara Data已積累了20萬用戶。
接下來Sahara會著重三方面,也是短期內的重要動作:
一是向公眾開放去中心化數據市場,不管是個人還是商家都可以使用;
二是在Sahara Data基礎上,構建或推出一些和執行層相關的C端用戶產品,比如Knowledge Vault(知識庫)、Knowledge Marketplace(知識市場)等。
三是Sahara測試網Testnet會在Q3推出。
6、ChainCatcher:公司目前面臨的最大挑戰是什麼?
Sean Ren: 公司團隊擴張太快,已從最開始的十幾個人團隊擴展到40多個,在近期規劃中,團隊或會在未來的一兩個月再增加30-40位。
Tyler Zhou: 從市場和生態角度來看,我覺得比較大的挑戰就是在初期階段,Sahara定位是一個"Crypto for AI"產品( 即用Crypto去賦能整個AI),觸達的市場及生態都會比"AI for Crypto"更大。
關於"Crypto for AI"和"AI for Crypto"之間的區別,前者"Crypto for AI"是指使用Crypto和區塊鏈的技術和AI做一個更好的結合,幫助提升和改進AI產品相關的問題等,這是一個更大的全球市場;後者"AI for Crypto"是指AI被用來改進加密產品比如用到智能合約裡 、或區塊鏈的一些用途裡等,在目前階段這是一個相對比較小的市場,更多的是敘事。
但當前市場上主流炒作是"AI for Crypto"產品,忽略了整個AI生態的經濟和整個AI的體系、全球經濟的動向,導致了市場非常有噪音,尤其是過去半年,市場噪音特別大。
Sahara如何在眾多噪音的環境下,依舊堅持初心的去做想做的事情、應該做的事情和對的事情,是一個比較大的挑戰。
Sahara已服務微軟、亞馬遜等30+企業
7、ChainCatcher:自成立以來,Sahara已吸引了30多家企業客戶,包括微軟、Snapchat和麻省理工學院等。請問Sahara為他們提供了哪些服務,這些知名企業為何會選擇與公司合作?
Sean Ren: Sahara最開始推出的產品是去中心化數據市場Sahara Data,在Web2也有同類競品如Skill AI中心化數據服務商。和中心化數據服務商相比,Sahara Data更有優勢。
首先,Sahara可通過各種各樣的獎勵Reward和經濟激勵機制,接觸到大量的全球各個地區的AI數據收集和標註工作人員,現Sahara網絡上已有約20萬AI相關工作人員,且多是Web2 AI行業的原住民,之所以吸引他們,是因為Sahara能夠讓其從數據貢獻中獲得收益,比如Crypto作為Payment等。
關於合作的企業,他們有各種各樣的數據需求,如Snapchat需要收集對話數據,微軟則收集多模態數據,MIT需要各種各樣的視頻數據。
Sahara作為數據的供給方,在數據多樣化方面非常有優勢,它有一個非常多樣化的候選者數據庫可供客戶選擇,能夠去適應不同的數據需求。
通過與30多家企業合作,Sahara不斷打磨產品,讓產品越來越成熟,以更好去適配全球各種企業及商家的數據需求,形成了正向循環。
8、ChainCatcher:目前,用戶參與Sahara需要在官網候補名單,先產品開發進度進展如何讓?用戶參與Sahara的方式有哪些?對於早期參與用戶會給予哪些獎勵?
Tyler Zhou:4月至5月,Sahara會推出第一個C端產品 ,屆時C端用戶可在平台貢獻他們的知識及技能等。
對於早期用戶,Sahara也會有不同的獎勵的機制,等到4或5月公開後會釋放更多的信息,會在Q3或Q4上線Sahara Testnet測試網 ,並爭取在Q4上線主網。
9、ChainCatcher:對於市場上流行的去中心化GPU、Agent等AI加密項目的看法?如何評斷一個AI加密項目的可靠性?
Sean Ren: 目前市面上的加密AI產品按照"AI for Crypto"和"Crypto for AI"可以劃分為兩個派系。
"Crypto for AI"是一個更大的市場,對於我們這種AI行業原住民來說,更關注如何借助區塊鏈和Web3技術解決Web2 AI產品的一些詬病,尤其是經濟模式、數據所有權等問題。
當前有很多項目借用區塊鏈的經濟模型去激勵AI中的某些行為,但個人認為做的太淺,只看到了經濟模型,沒有考慮整個AI背後的生態,如訓練數據的隱私和加密。
如站在整個AI的生態系統來看,最上游應是數據及數據處理板塊,市場上也有數據相關的項目,但大多項目只有最吸引人的加密經濟模型(如Label to earn標註賺錢),並沒有去觸及數據本身的問題如所有權、模型歸因等,只是搭建了一個應用而已。
關於用分佈式GPU方式訓練大模型,個人覺得這個方向是非常有挑戰的,需要看項目的去中心化程度。如果只是象徵性地把在同一個機房或者是離得不遠的幾個機房跑綁在一起做,這是一個人工伪造的去中心化;如果想要把全世界空置的GPU捆綁在一起做去中心化訓練,但由於不同網絡之間的速度存在巨大差異,可實現難度有點遠。
還有比較火的如Machine learning機器學習、及ZK相關發展還比較長遠的。因此,在判斷一個項目時,首要看清哪些項目是短期內可實現的、能商業化的,哪些是研究性項目、需要長期探索。