AIはなぜブロックチェーンを必要とするのか、DePINが人工知能をどのように支援するのかを見てみましょう。

Filecoinネットワーク

2023-06-16 18:12:33

コレクション

なぜブロックチェーン技術が必要なのか？それは人工知能とどのように交差するのか？すべての問題を一度に解決することはできませんが、Web3における分散型物理インフラネットワーク（DePIN）は、上記の問題を解決するための条件を整えています。

共有する

WeChatでQRコードをスキャン

この記事の著者はFilecoinの洞察特約寄稿者であり、Portal Venturesの投資パートナーCatrinaです。

過去、スタートアップ企業はそのスピード、柔軟性、起業文化を活かし、組織の慣性から脱却して長期にわたり技術革新をリードしてきました。しかし、すべてが人工知能の時代に書き換えられました。これまでのところ、画期的なAI製品の創造者は、MicrosoftのOpenAI、Nvidia、Google、さらにはMetaのような伝統的なテクノロジー大手です。

何が起こったのでしょうか？なぜ今回は大手がスタートアップに勝ったのでしょうか？スタートアップ企業は優れたコードを書くことができますが、テクノロジー大手と比較すると、さまざまな障害に直面しています：

計算コストが高止まりしている
AIの発展には逆凸角が存在する：必要な方針が欠如しているため、AIの社会的影響に関する懸念と不確実性が革新を妨げている
AIのブラックボックス問題
大手テクノロジー企業が構築した「データの堀」が参入障壁を形成している

では、なぜブロックチェーン技術が必要なのでしょうか？それは人工知能とどのように交差しているのでしょうか？すべての問題を一度に解決することはできませんが、Web3における分散型物理インフラネットワーク（DePIN）は、上記の問題を解決するための条件を整えています。以下では、DePINの背後にある技術がどのように人工知能を支援するかを、主に4つの次元から説明します：

インフラコストの削減
クリエイターと人格の検証
AIの民主化と透明性の向上
データ貢献の報酬メカニズムの設定

以下の文中では：

「web3」は次世代のインターネットを指し、ブロックチェーン技術と他の既存技術が有機的に組み合わさっています。
「ブロックチェーン」は、非中央集権的で分散型の台帳技術を指します。
「暗号」は、トークンメカニズムを利用したインセンティブと非中央集権的なアプローチを指します。

一、インフラコストの削減（計算とストレージ）

あらゆる技術革新の引き金は、何らかの高価なものが安価になり、無駄に使えるようになることです。

------社会の技術的負債とソフトウェアのグーテンベルクの瞬間（https://skventures.substack.com/p/societys-technical-debt-and-softwares）、SK Venturesより

インフラの手頃さはどれほど重要か（人工知能のインフラは、計算、データの伝送とストレージのハードウェアコストを指します）、Carlota Perezの技術革命理論（https://stratechery.com/2021/the-death-and-birth-of-technological-revolutions/）は、技術的突破が2つの段階を含むことを示しています：

インストール段階は、大量のリスク投資、インフラ 構築、および「プッシュ型」マーケティング戦略が特徴であり、顧客は新技術の価値提案を理解していません。
展開段階は、インフラ供給の大幅な増加が特徴で、新規顧客の獲得のハードルを下げ、「プル型」マーケティング戦略を採用し、製品市場の適合度が高く、顧客はまだ形成されていない製品を期待しています。

ChatGPTなどの試みが市場の適合度と顧客の需要を証明したので、人々はAIが展開段階に入ったと感じるかもしれません。しかし、AIには重要な要素が欠けています：価格に敏感なスタートアップ企業が構築し、試すための過剰なインフラ供給です。

問題

現在、物理インフラの分野は主に垂直統合された寡占によって支配されており、AWS、GCP、Azure、Nvidia、Cloudflare、Akamaiなどが含まれます。業界の利益率は高く、AWSの商業用計算ハードウェアの粗利益率は61%と推定されています（https://www.cnbc.com/2021/09/05/how-amazon-web-services-makes-money-estimated-margins-by-service.html）。したがって、AI分野、特にLLM分野の新規参入者は非常に高い計算コストに直面しています。

ChatGPTの1回のトレーニングコストは約400万ドルと推定され、ハードウェア推論の運用コストは約70万ドル/日です。
Bloomの第2版は、トレーニングと再トレーニングに1000万ドルかかる可能性があります。
ChatGPTがGoogle検索に入ると、Googleの収益は360億ドル減少し、巨額の利益がソフトウェアプラットフォーム（Google）からハードウェアプロバイダー（Nvidia）に移転します。

解決策

DePINネットワークは、Filecoin（2014年に起源を持つDePINの先駆者で、インターネット規模のハードウェアを集め、分散型データストレージにサービスを提供）、Bacalhau（https://www.bacalhau.org/）、Gensyn.ai（http://gensyn.ai/）、Render Network（https://rendertoken.com/）、ExaBits（CPU/GPUの供給と需要をマッチングする調整層：https://www.exabits.xyz/）を通じて、以下の3つの側面で75%から90%+のインフラコストを節約できます：

1. 供給曲線を押し上げ、市場競争を促進する

DePINはハードウェアプロバイダーがサービスプロバイダーになるための平等な機会を提供します。誰もが「マイナー」として参加でき、CPU/GPUまたはストレージ能力を経済的報酬と交換できる市場を創出し、既存のプロバイダーに競争をもたらします。

AWSのような企業は、ユーザーインターフェース、運用、垂直統合において17年の先行優位性を持っていますが、DePINは中央集権的なプロバイダーの客定価を受け入れられない新しい顧客層を引き付けています。 EbayがBloomingdaleと直接競争せず、より経済的な代替品を提供して類似のニーズを満たすように、分散型ストレージネットワークは中央集権的なプロバイダーを置き換えるのではなく、価格に敏感なユーザー層にサービスを提供することを目的としています。

2. 暗号経済設計を通じて市場経済のバランスを促進する

DePINが創出する補助金メカニズムは、ハードウェアプロバイダーをネットワークに参加させることができ、最終ユーザーのコストを削減します。その原理を探るために、AWSとFilecoinのWeb2とWeb3におけるストレージプロバイダーのコストと収益を見てみましょう。

顧客は値下げを得る： DePINネットワークは競争市場を形成し、ベルタント型競争（https://en.wikipedia.org/wiki/Bertrand_competition）を導入することで、顧客が支払う費用を削減します。対照的に、AWS EC2は運営を維持するために約55%の利益率と31%の総利益率を必要とします。DePINネットワークが提供するトークンインセンティブ/ブロック報酬も新しい収入源です。Filecoinの文脈では、ストレージプロバイダーがより多くの実データをホスティングするほど、ブロック報酬（トークン）を得ることができます。したがって、ストレージプロバイダーはより多くの顧客を引き付け、取引を増やして収入を増やす動機があります。いくつかの新興計算DePINネットワークのトークン構造はまだ公開されていませんが、類似のモデルに従う可能性が高いです。類似のネットワークには以下が含まれます：

Bacalhau：データストレージ位置に計算を持ち込む調整層で、大量のデータを移動することを避けます。
exaBITS：AIおよび計算集約型アプリケーション向けの分散型計算ネットワーク。
Gensyn.ai：深層学習モデル計算プロトコル。

3. 間接コストの削減： Bacalhau、exaBITSなどのDePINネットワークおよびIPFS/コンテンツアドレッシングストレージの利点には以下が含まれます：

潜在データの可用性を解放する： 大規模データセットの伝送にかかる帯域幅コストが高いため、現在大量のデータが未開発です。DePINプロジェクトは現場でデータを処理し、意味のある出力のみを伝送することで、潜在データの可用性を発掘します。
運営コストを削減する： ローカルでデータを取得することで、データの入力、伝送、インポート/エクスポートコストを削減します。
センシティブデータ共有における人的作業を最小化する： 病院AとBがそれぞれの患者のセンシティブデータを組み合わせて分析する必要がある場合、Bacalhauを利用してGPU計算能力を調整し、センシティブデータを直接ローカルで処理することができ、煩雑な行政手続きを経て個人情報（PII）を交換する必要がありません。
基礎データセットを再計算する必要がない： IPFS/コンテンツアドレッシングストレージは、重複排除、トレーサビリティ、データの検証機能を備えています。IPFSの機能とコストパフォーマンスについては、この記事（https://curiouscat178.substack.com/p/the-non-philosophical-business-case）を参照してください。

AI生成の要約： AIはDePINが提供する経済的なインフラを必要としており、現在のインフラ市場は垂直統合された寡占によって支配されています。Filecoin、Bacalhau、Render Network、ExaBitsのようなDePINネットワークは、ハードウェアプロバイダーになる機会を民主化し、競争を導入し、暗号経済設計によって市場経済のバランスを維持し、コストを75%-90%以上削減し、間接コストも削減します。

二、クリエイターと人格の検証

問題

最近の調査によると、50%のAI研究者がAIが人類に壊滅的な害をもたらす可能性が10%を超えると考えています。

人々は警戒する必要があります。AIは社会的混乱を引き起こしており、依然として規制や技術基準が不足している状況は「逆凸角」と呼ばれています。

例えば、このTwitter動画では、ポッドキャストのホストであるJoe Roganと保守的なコメンテーターBen Shapiroが映画『レミーのおいしいレストラン』について議論していますが、この動画はAIによって生成されたものです。

注目すべきは、AIの社会的影響力は虚偽のブログ、対話、画像の問題にとどまらないことです：

2024年のアメリカ大統領選挙では、AI生成のディープフェイク選挙コンテンツが初めて真実を見分けることができるレベルに達しました。
上院議員Elizabeth Warrenの編集された動画では、彼女が「共和党員は投票するべきではない」と「発言」したように見えます（これは誤報です）。
音声合成されたバイデンの声がトランスジェンダー女性を批判しています。
一群のアーティストがMidjourneyとStability AIに対して集団訴訟を起こし、アーティストの作品を無断で使用してAIを訓練したとして著作権侵害とアーティストの生計を脅かすと主張しています。
AI生成のThe WeekndとDrakeのデュエット曲「Heart on My Sleeve」がストリーミングプラットフォームで人気を博しましたが、その後削除されました。新技術が規制なしに主流に入ると、多くの問題が発生します。著作権侵害は「逆凸角」の問題に該当します。

では、Web3にAIに関する規範を追加できるのでしょうか？

解決策

暗号チェーン上の出所証明を利用した人格証明とクリエイター証明

ブロックチェーン技術を真に活用するためには、不可逆的なチェーン上の履歴を含む分散型台帳として、デジタルコンテンツの真実性をコンテンツ暗号証明によって検証できます。

デジタル署名はクリエイター証明と人格証明として機能します

ディープフェイクを識別するためには、元のコンテンツクリエイターに固有のデジタル署名を使用して暗号証明を生成できます。この署名は、クリエイターだけが知っている秘密鍵を使用して作成され、全員に公開されている公開鍵によって検証できます。署名があれば、コンテンツが元のクリエイターによって作成されたことを証明でき、クリエイターが人間であろうとAIであろうと、コンテンツの変更が許可されているかどうかを検証できます。

IPFSとマークルツリーを利用した真実性証明

IPFSは、コンテンツアドレッシングとマークルツリーを使用して大規模データセットを参照する分散型プロトコルです。ファイルの内容が受信されたり変更されたりしたことを証明するために、マークル証明が生成されます。これは特定のデータブロックがマークルツリー内のどの位置にあるかを示すハッシュの列です。変更があるたびに、マークルツリーにハッシュが追加され、ファイルの変更の証明が提供されます。

暗号ソリューションの痛点はインセンティブメカニズムです。 結局のところ、ディープフェイク製作者を特定することは、負の社会的影響を減少させることができるものの、同等の経済的利益をもたらすわけではありません。この責任は、Twitter、Meta、Googleなどの主流メディア配信プラットフォームにかかる可能性が高いです。では、なぜブロックチェーンが必要なのでしょうか？

答えは、ブロックチェーンの暗号署名と真実性証明がより効果的で、検証可能で、確実だからです。 現在、ディープフェイクを検出するプロセスは、主に機械学習アルゴリズム（Metaの「Deepfake Detection Challenge」、Googleの「Asymmetric Numeral Systems」(ANS)およびc2pa：https://c2pa.org/）を通じて視覚コンテンツ内のパターンや異常を識別することによって行われていますが、しばしば正確さに欠け、ディープフェイクの進化の速度に遅れをとっています。 一般的には、真実性を確認するために人間の審査が必要であり、非効率的で高価です。

もしすべてのコンテンツに暗号署名があれば、誰もが創作の出所を検証でき、改ざんや偽造行為をマークできる世界が訪れるでしょう。

三、AIの民主化

問題

今日のAIは、専有データと専有アルゴリズムで構成されたブラックボックスです。大手テクノロジー企業のLLMの閉鎖性は、私の目には「AIの民主化」を抑圧しています。すなわち、すべての開発者やユーザーがLLMモデルにアルゴリズムやデータを貢献し、モデルが利益を上げたときに一部の利益を得ることができるということです（関連記事：https://curiouscat178.substack.com/p/four-foundational-pillars-to-usher）。

AIの民主化=可視性（モデルに入力されるデータとアルゴリズムを見ることができる）+貢献（モデルにデータやアルゴリズムを貢献できる）。

解決策

AIの民主化の目的は、生成型AIモデルを一般に開放し、一般に関連し、一般の所有物とすることです。以下の表は、AIの現状とWeb3ブロックチェーン技術によって実現可能な未来を比較しています。

現在------

顧客にとって：

LLMの出力を一方的に受け取る
個人データがどのように使用されるかを制御できない

開発者にとって：

組み合わせの低さ
ETLデータ処理が追跡できず、再現が難しい
データ貢献の出所はデータ所有機関に限られる
クローズドソースモデルはAPIを通じてのみ有料でアクセス可能
データ出力の共有には検証可能性が欠けており、データサイエンティストの80%の時間が低レベルのデータクレンジングに費やされる

ブロックチェーンを組み合わせた後------

顧客にとって：

ユーザーはフィードバック（例えば、偏見、コンテンツの審査、出力に対する粒度のフィードバック）を提供し、微調整の根拠とすることができます。

ユーザーはデータを貢献し、モデルが利益を上げた後の利益を得ることを選択できます。

開発者にとって：

分散型データ管理層：クラウドソーシングによる時間のかかるデータラベリングなどのデータ準備作業
可視性&組み合わせ&微調整アルゴリズムの能力、検証可能なソース（すべての変更の防改ざん履歴を確認できる）
データ主権（コンテンツアドレッシング/IPFSを通じて実現）とアルゴリズム主権（例えば、Urbitはデータとアルゴリズムのピアツーピアの組み合わせと移植性を実現）
LLMの革新を加速し、基礎的なオープンソースモデルのさまざまなバリエーションからLLMの革新を加速します。
トレーニングデータ出力の再現性を確保し、過去のETL操作とクエリの不変記録（Kamuなど）を通じて実現します。

Web2のオープンプラットフォームも妥協案を提供していると言われていますが、その効果はあまり良くありません。関連する議論はexaBITSのブログ記事で見ることができます。

AI生成の要約： 大手テクノロジー企業の閉鎖的なLLMは「AIの民主化」を抑圧し、すべての開発者やユーザーがLLMモデルにアルゴリズムやデータを貢献し、モデルが利益を上げたときに一部の利益を得ることができるべきです。AIは一般に開放され、一般に関連し、一般の所有物であるべきです。ブロックチェーンネットワークを活用することで、ユーザーはフィードバックを提供し、モデルにデータを貢献して利益を得ることができ、開発者も可視性と検証可能なソースを得て、アルゴリズムを組み合わせたり微調整したりできます。コンテンツアドレッシング/IPFSやUrbitなどのWeb3の革新は、データとアルゴリズムの主権を実現します。過去のETL操作とクエリの不変記録を通じて、トレーニングデータ出力の再現性も可能になります。

四、データ貢献の報酬メカニズムの設定

問題

今日、最も価値のある消費者データは大手テクノロジー企業の専有資産であり、彼らのコアビジネスの壁を形成しています。テクノロジー大手は、これらのデータを外部と共有するインセンティブがありません。

では、なぜデータの創造者やユーザーから直接データを取得できないのでしょうか？なぜデータを公共資源に変え、データを貢献してデータサイエンティストが使用できるようにしないのでしょうか？

簡単に言えば、インセンティブメカニズムと調整メカニズムが欠如しているからです。 データを維持し、ETL（抽出、変換、ロード）を実行することは、大きな間接コストを伴います。実際、データストレージだけで2030年には7770億ドルの価値を持つ業界になると予測されていますが、計算コストは含まれていません。誰も無償でデータ処理の作業とコストを負担することはありません。

OpenAIを見てみましょう。最初はオープンソースの非営利を設定しましたが、収益化が困難でコストをカバーできませんでした。2019年、OpenAIはMicrosoftの出資を受け入れ、アルゴリズムはもはや一般に開放されませんでした。2024年までに、OpenAIの利益は10億ドルに達すると予測されています。

解決策

Web3は、AIモデルの所有者とデータ貢献者の間の収入再分配を促進する「dataDAO」という新しいメカニズムを導入しました。データ貢献のクラウドソーシングを作成するためのインセンティブ層を提供します。ここでは詳細には触れませんが、以下の2つの記事を読むことで理解できます：

How DataDAO works/DataDAO原理、著者はProtocol LabsのHQ Han
How data contribution and monetization works in web3/web3データ貢献と変現の運用方法、私はこの中でdataDAOのメカニズム、欠点、機会について詳しく議論しました。

総じて、DePINは新たな道を切り開き、Web3とAIの革新を推進するための新しいハードウェアエネルギーを提供します。テクノロジー大手がAI業界を支配しているにもかかわらず、新興の参加者はブロックチェーン技術を活用して競争に参加できます：DePINネットワークは、計算コストを削減することで参入障壁を下げ、ブロックチェーンの検証可能で分散型の特性が真のオープンAIを可能にし、dataDAOなどの革新的なメカニズムがデータ貢献を促進し、ブロックチェーンの不変性と防改ざん特性がクリエイターの証明を提供し、AIの負の社会的影響に対する懸念を払拭します。

ストレージトラックの動態と研究

分散ストレージ分野の動向と研究を追跡する。

トピック