AI時代初のデータDAOの裏方、Vana:ユーザーデータ権を守る小さなBittensor
著者:思考怪怪、BlockBeats
最初のデータDAO、最初のユーザー所有データネットワーク
Redditは今年の2月にIPOの目論見書で明らかにした:AI企業とのデータライセンス契約を通じて、合計2.03億ドルの収益を上げた。AI企業が多額の投資をする理由は、データと計算能力がAIモデルを開発するために不可欠な重要資源だからである。
悲しいことに、これらの収益は一切Redditのユーザーに流れず、彼らこそがプラットフォーム上の10億件以上の投稿と160億件以上のコメントの実際の創作者であるにもかかわらず。
このような巨大な不公平の中で、最初のデータDAO「r/datadao」が4月4日に誕生した。これはユーザーにRedditプラットフォーム上のデータをエクスポートし、コミュニティデータベースにアップロードすることを奨励し、データをAI企業に貸し出して利益を共有するための投票を行うことを目的としている。ユーザーは自分のデータの貢献に応じてガバナンストークンRDATを得ることもできる。
その後、メディアはr/datadaoの背後に、ParadigmやPolychain CapitalなどのVCから2000万ドルを調達したスタートアップVanaがいることを暴露した。このニュースに勇気づけられ、RDATは5日間で開盤の0.011ドルから50倍の0.67ドルに急騰した。しかし、その後、固定総量のない随時増発のモードが始まり、RDATの価格は再び初期の水準に戻り、再び上昇することはなかった。
一般的に、ここで物語は終わりだ。暗号通貨プロジェクトがこのような状況になると、基本的にゲームオーバーを宣言したも同然である。
私たちはr/datadaoに注目していたが、その背後にある巨大な存在Vanaが何をしようとしているのかを見落としていた。r/datadaoはVanaが巨人からユーザーデータの権利を取り戻すための試みであり、彼らが本当にやりたいのは、最初のユーザー所有データのブロックチェーンネットワークを構築することである。このオープンなインターネットでは、ユーザーは自分のデータを所有し管理し、これらのデータから生み出されるスマート製品を持つ。ユーザーはデータを提供することでAIモデルの所有権を得て、その価値は中央集権的なプラットフォームではなく、ユーザーと独立したモデル開発者に流れる。
そう、Vanaは他とは異なる全く新しいパブリックチェーンを作りたいと考えている。6月11日、このパブリックチェーンは最初のテストネット「Satori Testnet」を迎えた。実は、巨人の食い扶持を奪う壮大なショーはまだ始まったばかりである。
全く新しいパブリックチェーンは小さなBittensor?
実際、Vanaのこのパブリックチェーンは新しいと言っても新しくはない。なぜなら、多くの点でBittensorに非常に似ているからである。
Bittensorが最も称賛されるのは、人工知能開発のために「複数のサブネットが競争してデジタル商品生産の質を向上させる」市場メカニズムを構築したことである。
言い換えれば、VanaはBittensorの全体的なメカニズムを模倣し、「効率的なデータ流動性ネットワークを構築する」という自らのニーズに応えている。
そこで、VanaはBittensorにおけるサブネットのようなDLPという概念を提唱した。Bittensorを理解するためには、「サブネット」を理解することが最も重要である。同様に、Vanaを理解するためには「DLP」を理解しなければならない。
DLP
DLPは「Data Liquidity Pool」の略で、日本語に訳すと「データ流動性プール」となる。
Vanaはブロックチェーンのレベルで、プルーフ・オブ・ステークコンセンサスに基づくEVM互換チェーンであり、DLPは実際にはVanaネットワーク上のスマートコントラクトである。
r/datadaoのようなデータDAOはDLPの具体的な表現形式である。Satoriテストネット上の構築者たちは現在、ChatGPT Data DAO、LinkedIn Data DAO、Twitter Data DAO、Github Data DAOなど、さまざまなデータDAOを開発中である。
将来的にVanaのメインネットでは16のDLPスロットが起動され、総取引数、取引手数料、検証済みデータのアップロード量、独立したウォレットの相互作用回数などの指標に基づいて、Vanaネットワークのネイティブガス代トークンDATの保有者が投票によってすべてのテストネットのDLPから選定される。
サブネットがBittensorのTAO排出報酬を得ることができるのと同様に、DLPもVanaのDAT排出報酬を得ることができる。もちろん選ばれなかったDLPも排出報酬を得ることができるが、上記の16のトップDLPほど多くはない。新しいDLPは、排出報酬なしで一定期間運営して自らを証明する必要がある。
DLPにデータを提出するユーザーは「データ貢献者」と呼ばれ、貢献したデータの質に応じてDLPの特定のトークン報酬を得る。これはBittensorのサブネットでさまざまなタスクを完了してTAOトークン報酬を得るマイナーに似ている。各DLPはその特定のデータセットに基づいて独自の貢献証明関数を実施する。たとえば、r/datadaoはユーザーのカルマ(Karma)値を測定して貢献データの価値を決定し、ユーザーにRedditのプロフィールにコードを投稿して所有権を確認することを要求する。
ここに平凡だが重要な詳細がある。読者は気づいただろうか?それは、DLPがユーザーに送る報酬はVanaネットワークのネイティブガス代トークンDATではなく、独自に発行された特定のガバナンストークンであるということだ!つまり、Vanaは各DLPが独自のデータセット特定トークンを作成することを許可し、DLPはそのプールのトークン経済を完全に制御できる。r/datadaoがユーザーに送るのは自分自身のガバナンストークンRDATであり、完全に自分のトークン供給量を制御できる。これらはVanaとBittensorの現在の最も異なる点であり、私がこの記事の結論で重点的に探討する問題でもある。
名古屋コンセンサス
ユーザーが提出したデータはまず検証ノードによってスコアリングされ、検証ノードはDLP作成者が設定した基準に基づいて検証を行う。このプロセスで、VanaはBittensorのユーマコンセンサス(Yuma consensus)に似た曖昧なコンセンサスメカニズム、すなわち名古屋コンセンサス(Nagoya consensus)を採用している。これは、一群の検証ノードが共同でユーザーが提出したデータの質を評価し、加重平均の方法で最終的なスコアを決定するものである。
さらに、検証ノードは他の検証ノードのスコアリング行為に対してもスコアを付ける。もしある検証ノードが質の悪いファイルに高いスコアを付けた場合、他の検証ノードはそのノードに低いスコアを付ける。
1800ブロック(約3時間)ごとに1つの周期(epoch)が設けられる。各周期の終了後、DLPコントラクトは最終的なスコアに基づいて検証ノードに排出報酬を配分する。このメカニズムは、コンセンサスの多数から逸脱する行動を抑制し、検証ノードにデータ貢献を誠実に評価するインセンティブを与える。
以上のすべての業務は、伝播ノードによって取引の有効性が検証され、Vanaネットワークのブロックに追加されて確認される。伝播ノードはこれにより取引手数料と排出報酬を得ることができ、これは他のプルーフ・オブ・ステークコンセンサスに基づくEVM互換チェーンと何ら変わりはない。
ユーザー自主管理データ
注目すべきは、ユーザーがデータDAOに個人データを提出したとしても、これらのデータは実際にはブロックチェーンに上がっていないということである。
データはトークンとは異なり、排他的ではなく、一度ブロックチェーンに公開されると自由にコピーできることを理解しておく必要がある。データに流動性を持たせるためには、まずユーザーが自分のプライベートデータを制御できることを保証し、データが所有者の同意なしに何度も使用されないようにする必要がある。つまり、データの「二重使用問題」を解決しなければならない。
これに対して、Vanaは巧妙かつ厳密な設計を通じて、ユーザーデータの流通プロセスを精巧に編成されたダンスのように見せている。
まず、データ貢献者はデータを対称鍵で暗号化し、暗号化されたデータをGoogle Driveなどの個人クラウドストレージアカウントに保存する。データのURLとユニーク識別子(ETAG)を取得した後、これらの情報と暗号鍵をVanaブロックチェーンに記録する。次に、選定された検証ノードをルート検証ノードとして指定し、他の検証ノードがデータファイルをダウンロード、復号化、検証するのを調整する。曖昧なコンセンサスメカニズムを通じて、検証ノードはデータの有効性を確認し、その結果をブロックチェーンに記録して有効なファイルのインデックスを形成する。
データクエリ者がアクセスリクエストを発起すると、ルート検証ノードは再び検証ノードを組織してデータをダウンロード、復号化し、最終的に安全に検証されたデータをクエリ者に渡す。プロセス全体を通じて、合法的な検証ノードのみがブロックチェーンの権限管理を通じてデータを復号化しアクセスでき、不正なダウンロードや復号化操作を防ぐ。
堅固なデータ流動性層とブロックチェーン層の基盤の上に、Vanaはデータ貢献者と開発者が協力できるオープンなアプリケーション層を創造した。開発者はDLPに蓄積されたデータ流動性を利用してアプリケーションを構築し、貢献者コミュニティは彼らのデータから実際の経済的価値を生み出すことができる。
dTAOメカニズムの先行実現?
前述のように、VanaとBittensorの最大の違いは、DLPが独自のトークン経済を持つことを許可している点である。
私は大多数の人が最初に私と同じ疑問を抱くと思う:なぜ各DLPに独自のトークンを作成させる必要があるのか?もし彼らが失敗したらどうするのか(r/datadaoのガバナンストークンRDATは暴騰と暴落を経験した)、こうする必要性が見えない。
Vanaチームに相談した後、VanaはBittensorのこのメカニズムをそのまま持ち込むだけでなく、Bittensorが現在直面している課題に対してより積極的に対応したいと考えていることに気づいた。各DLPが独自のトークン経済を持つことは、Bittensorが進めているが進展が遅れているDynamic TAO(BIT001)ネットワークのアップグレードの核心である。
BittensorのDynamic TAOアップグレードは、元々根ネットワーク内の少数の検証ノードが決定したTAO排出配分権を、市場化された動的価格メカニズムによってすべてのTAO保有者に委譲することを目的としている。このメカニズムを機能させるためには、まず各サブネットが独自のトークン(dTAOトークン)を発行し、サブネットトークンとTAOからなる流動性プールを構築する必要がある。TAO保有者は、異なるサブネットに対応する流動性プールにTAOをステーキングすることで、そのサブネットの特定のdTAOトークンを得ることができる。
各サブネットのdTAOトークンは独自の供給を持ち、サブネットの検証ノードはdTAOを使用してコンセンサスに参加し報酬を得る。各プールの価格はその中のTAOとdTAOの準備の比率によって決まり、そのサブネットに対する市場の需要を反映する。Bittensorは新たに発行されたTAOをdTAOプールの価格比率に従って各プールに注入する。
これにより、元々根ネットワークの投票に基づいていたTAO配分方式が、各動的TAOプールの価格比率に基づいて配分されるようになり、すべてのTAO保有者がステーキング行動を通じて「足で投票」し、どのサブネットがより多くのTAO報酬を得るべきかを決定できるようになる。
Vanaの公式文書には依然として「根ネットワーク」というモジュールがDLPとトークン報酬の配分を管理すると記載されているが、Vanaがメインネットを立ち上げる前にこの中央集権的なガバナンスメカニズムから脱却しようとしていることは明らかであり、Bittensorよりも一歩前に進んでいる。
なぜ「Bittensorよりも一歩前に進んでいる」と言えるのか?それは、元々根ネットワークの検証ノードが投票して配分を決定する方式は、相対的に中央集権的であるが、検証ノードには評判を維持する動機があり、比較的慎重であるからである。すべての保有者に参加を開放すると、投機者が殺到し、エコシステムの安定性に影響を与える可能性がある。dTAOプールの価格は完全に市場の需給によって決まるため、大口が突然大量にステーキングまたは撤回する場合、激しい価格変動を引き起こし、元々その価格比率に基づいていたTAO配分が大幅に変動し、システムリスクを引き起こす可能性がある。
もしVanaが本当にメインネット立ち上げ後にBittensorのdTAOメカニズムに似た方法を採用するつもりなら、上記の問題に対して事前に準備を整える必要があるだろう。かつての師匠であるBittensorはまだ後ろでゆっくりと進んでおり、前方には試行錯誤を行う人はいない。