一文讀懂區塊鏈數據業務現狀與未來發展方向
原文來源:sankin.eth 長推
作者:sankin.eth
行業發展 14 年, 從最初的炒作逐漸轉為實際應用。區塊鏈數據分析可以從鏈上宏觀、項目協議、地址三個層面進行。鏈上宏觀可以比較不同鏈的指標。項目協議需要深入理解業務邏輯。地址分析可以進行多維度的標籤標註。未來值得關注的幾個方向是比特幣 Layer 2 擴容方案、以太坊質押數據和賬戶抽象多簽地址。總體來說,區塊鏈數據市場發展空間巨大。
簡介
如果把 Bitcoin 的正式部署作為行業誕生的元年,隨著區塊鏈行業長達 14 年的發展歷程,從最初單純的炒作和投機買賣,逐漸演變為具有實際應用場景的技術理念,特別是 Decentralized finance (DeFi) 理念被用戶所認可和接受之後,使得價值回歸到鏈上,鏈上的數據因此也逐漸成為投資者和開發者關注的焦點。
《泰晤士報》2009 年 1 月 3 日的頭版文章標題 - 財政大臣站在第二輪救助銀行的邊緣
儘管與當前互聯網中的大數據體量相比,區塊鏈的數據規模還比較有限,從原始數據上看也較為單一,但是在實際分析和解讀過程中,由於數據輸入端相對自由且包含大量不易理解的字節碼,許多分析師和開發者往往需要花費大量時間去解析和使用。從工作經驗來看,筆者認為可以從業務層面對區塊鏈數據進行分類,以便更好地理解:
鏈上宏觀
項目協議
地址分析
區塊鏈網絡從宏觀到微觀可以分為三個層面,網絡層面由多個協議組成,每個協議又由多個地址的活動構成。目前針對消費者的區塊鏈數據分析產品,大多深耕在這三個層面的某一具體場景。接下來筆者將就每個層面所對應的業務邏輯和應用形態進行闡述。
鏈上宏觀
從網絡層級來看,可以進一步細分為:
Bitcoin (UTXO 模型)
Ethereum 為主的 Ethereum Virtual Machine (EVM)
其他非 EVM 架構的公有鏈(例如以 Rust 語言開發的 Solana、模塊化公鏈 Cosmos 生態、繼承 Libra 的 Move 語言體系等)。
通常作為對比,我們可以考察用戶數、交易數、交易價值和交易費用這四個指標,並在此基礎上進行二次分析,舉幾個簡單的例子:
根據部署合約的用戶數和交易數,評估開發者在該網絡上的活躍程度;
通過交易的時間間隔計算出每秒交易數 (TPS),以判斷網絡處理交易的性能;
計算交易金額和交易數的比值,得到平均每筆交易的金額,過多低價值交易實際上是對網絡的負擔;
觀察一段時間內的交易費用總額,評估網絡的火爆程度,與交易數不同,交易費用的低谷代表用戶交易的急迫性較低。
數據來源:Dune
對數據使用者來說,網絡層面的數據可以在眾多公鏈中進行選擇時提供輔助,根據自身情況選擇更合適的公鏈進行開發或使用,並抓住最佳時機參與其中。
項目協議
對項目協議的分類就非常廣泛,包含 DeFi、Game、Non-Fungible Token (NFT)、Decentralized Identity (DID) 等等,新的類別也在不斷出現,所以在這裡不具體展開某一類,而是談談分析項目協議數據過程中的幾點經驗:
通常一個完整的協議會由多個業務合約組成,大部分需要深入閱讀文檔(文檔清晰並及時更新很重要)並且結合自己的使用才能更好地理解項目。
同一領域的產品業務邏輯會趨同,比如所有 DEX 的業務核心都是交易和流動性,理解頭部產品後再解析整個領域的其他項目會相對容易。或從項目方自身考慮,他們對自己的數據比較熟悉,但總希望了解更多競爭對手和行業現狀,這時垂直領域的數據就很有價值。
當前大多項目包含許多鏈下數據,如團隊和融資信息、社交媒體數據、用戶網站操作數據、內部訂單信息等,有的是公開的,有的是非公開的,這在分析項目時會有局限。但隨著行業發展,更多業務數據會逐步上鏈,因為用戶使用區塊鏈的目的之一就是更加公開透明。
數據來源:Dune
一個典型例子是在 DeFi Summer 中,SushiSwap 向 UniSwap 發起挑戰,兩者的鏈上交易額和交易數曾一度相近,但深入分析可以發現,UniSwap 的獨立用戶數遠高於 SushiSwap,即 SushiSwap 的大部分交易和流動性來自較少的用戶,這裡的原因是 Sushi Token 的發行機制刺激了資金流入,但後續因為經濟模型無法持續,資金又回流到了 Uniswap。類似情況當前也反映在 OpenSea 和 Blur 的數據上,前者散戶交易居多,後者專業用戶交易居多。(注意!這裡沒有對項目進行價值判斷,而是說明從數據中可以反映出用戶行為差異。)
數據來源:Dune
地址分析
從較為流行的 EVM 架構公鏈來看,地址目前分為兩種類型,Externally Owned Accounts (EOA) 和 Contact Account (CA)。針對地址的數據產品現有的業務形態,筆者認為主要有:
資產看板(多用於錢包展示資產情況)
交易記錄(多用於顯示徽章和獎勵證明,如空投或 DID)
標籤系統(多維度標籤進行推薦或風控)
數據來源:DeBank
這裡主要談談標籤這個維度。當前在消費端數據產品中標籤非常關鍵,例如對用戶來說,0xd8dA6BF26964aF9D7eEd9e03E53415D37aA96045 一看無法理解其含義,但顯示為 vitalik.eth (Ethereum 創始人) 則可以立即識別。當然這只是眾多標籤維度中的一個。筆者歸納了地址標籤的幾個維度:
實體標籤(表示何人)
行為標籤(做過什麼)
狀態標籤(當前或過去狀態)
預測標籤(未來可能做什麼)
其他標籤(用戶定義及難分類標籤)
目前多數數據產品只是簡單展示實體標籤,然後通過行為和狀態標籤顯示資金流向,深度挖掘還不夠,比如交易發起時顯示對手方地址年齡、資產和交易對象數,提示用戶注意風險;或者根據用戶過往交易行為推薦類似的項目,比如參與多個 NFT 的鑄造的地址可以向其推薦今天最多地址正在鑄造什麼 NFT,這樣可以節省用戶搜索時間。豐富的數據支持能為產品提供更強大的算法服務。
個人觀點
最後,筆者想談談未來 1-2 年內,在業務數據方面個人比較關注的三個方向:
Bitcoin Layer 2 (包括其他擴容方案產生的數據)
Ethereum Staking (Beacon Chain 數據)
Account Abstraction (基於 ERC-4337 提案的賬戶抽象和多簽地址數據)
比特幣二層(Bitcoin Layer 2)
對於 Ordinals 這種為 Bitcoin 網絡最小單位"sat"編配編號的方案, Bitcoin 社區觀點不一,但其火熱為 Bitcoin 生態增加了想象空間和礦工收入(交易費用)。從區塊空間和交易數量來看,Ordinals 一度使交易費超過了區塊收入,但 Bitcoin 網絡顯然無法承載更多用戶完成資產交易。即使 Bitcoin 的點對點支付故事已被數字黃金共識所取代,隨著區塊獎勵減半, Bitcoin 網絡算力也將面臨巨大挑戰。收入減少且競爭加劇必然會淘汰一部分算力。當區塊獎勵幾乎可以忽略時,交易費將成為礦工的主要收入來源。如果網絡交易量和費用沒有穩步增長,投射到現實就是礦工收入不穩,這會影響網絡的多樣性和魯棒性。在這種情況下,未來的可信擴容就顯得尤為重要,目前得到社區比較多共識認可的是 Lightning Network 閃電網絡的方案。
以太坊質押(Ethereum Staking)
作為整個 Ethereum 生態最底層的價值存儲,Beacon Chain 的數據可謂是承載了最多資金的數據業務之一,但由於共識層和執行層結構不同,現有數據平台尚未很好呈現兩者的資金流動關係,當前 Ethereum 的質押率在 20% 左右,這在 POS 共識機制中是一個相對較低的比率,特別是自從上海升級開放質押提款之後,質押的淨流入量是在緩步提升的,所以筆者認為這部分的市場有望長期吸納沉澱資金,且發展空間巨大。
賬戶抽象 (Account Abstraction)
在當前數據分析視角下,大多數項目協議只把 EOA 地址作為用戶賬戶,但隨著資產安全和使用門檻,可編程賬戶被提出進行抽象,從業務角度來看,CA 作為用戶賬戶後分析的邏輯產生了一些變化,CA 在 EVM 中無法主動發起交易,那麼就需要有一個 EOA 作為發起地址調用 CA 再去調用別的 CA,這個 EOA 可以是不同的地址,也可以不是 CA 的多簽地址之一,對於這些交易,分析的邏輯就會發生變化。當然目前 ERC-4337 還在草稿之中,所以大部分開發者僅僅是在文章中和會議中聽過,並沒有真正開始使用它,在鏈上數據業務中這也是一個頗為早期的垂直賽道。
最後,我想打一個不是很嚴謹的比喻,如果一個行業的數據市場最終會占到這個行業總規模的 8%,那麼當前 1 trillion 市值(我們在 2020 年年初到 2021 年年末兩年整的時間經歷了從低谷 200 billion 到 2 trillion 的 10 倍增幅)的加密行業大約可以容納 80 billion,這在未來還有非常大的用戶和資金增長空間,數據賽道目前僅完成了數據存儲的去中心化,數據計算和數據驗證還有數據處理等等很多階段需要更多的創意。