算力風雲:未来の計算の大潮を解読する
作者:Iris Chen, Dr. Nick
一、需要と挑戦が共存する
『2022-2023年グローバル計算力指数評価報告書』は、世界のGDP成長率が鈍化する中で、デジタル経済が依然として強い成長を維持していることを指摘しています。主要国のデジタル経済のGDPに占める割合は年々上昇しており、サンプル国全体の割合は2022年の50.2%から2026年には54.0%に上昇すると予測されています。計算力は経済成長を推進する主要な力となりつつあります。計算力指数が1ポイント上昇するごとに、国のデジタル経済とGDPはそれぞれ3.6‰と1.7‰成長します。さらに重要なのは、計算力指数が40点を超えると、1ポイントの上昇がGDP成長を40点未満の1.3倍に押し上げ、60点を超えると3倍に達することです。計算力の先行地域の優位性は、計算力投資比率の増加に伴い強化され、後発地域との格差がさらに広がることが見込まれます。
1、AIGCの波が押し寄せ、計算力業界の需要が巨大
人工知能、ブロックチェーン、IoT、AR/VRなどの重要技術の応用と発展に伴い、今後の計算力需要は増加すると予測されています。2030年までに:
人工知能: すべての業界に深く浸透し、16000 EFLOPSの計算力が必要(スマートフォンに1600億個のQualcomm Snapdragon 855 NPU2を埋め込むのに相当)
ブロックチェーン: 暗号デジタル通貨などの分野を支えるために、5500 EFLOPSの計算力が必要(13億個のAntMiner V9に相当)
IoT: 工場と家庭のすべてのデバイスを接続するために、8500 EFLOPSの計算力が必要(高性能IoTエッジデバイスで79億個のチップを使用するのに相当)
宇宙計算/AR/VR/メタバース: 潜在能力を十分に発揮した場合、3900 EFLOPSの計算力が必要(21億個のSONY PS4コンソールに相当)
同時に、2022年にChatGPTが爆発的に流行し、AIGCの波が押し寄せ、計算力の需要がさらに増加しました。Open AIが発表したGPTシリーズの中で、GPT3は1750億のパラメータからなる言語モデルであり、GPT4のパラメータはさらに1兆レベルに達しています。大規模モデルのパラメータ量が増加するにつれて、AIモデルを訓練するために必要な計算力は2年ごとに275倍増加します。これにより、世界のAI計算市場の規模が新たな高みに押し上げられ、IDCは2026年までに世界のAI計算市場の規模が346.6億ドルに達すると予測しています。その中で、生成型AI計算市場は2022年の8.2億ドルから2026年には109.9億ドルに成長し、AI計算市場のシェアは4.2%から31.7%に増加します。この発展のトレンドの中で、今後の計算力の需要は巨大です。
2、安全脅威コストの軽減が難しく、計算力業界は挑戦に直面
(1)安全:計算力ネットワークは柔軟に接続され、分散型リソースノードが多い
計算力ネットワークは、計算サービス層、計算調整層、計算センター、エッジ計算/ユーザーセンター、計算キャリアネットワークの5つの主要部分で構成されています。しかし、このアーキテクチャは効率的で柔軟な計算サービスを提供する一方で、一連の安全上の課題も引き起こします:
計算力ネットワークは計算力の普遍性や柔軟な接続などの特徴を持ち、頻繁なリソース接続はリソースの攻撃露出面を増加させます。
計算力ネットワーク内には大量の機密データが流通しており、伝送中に改ざんまたは漏洩されると深刻な結果を引き起こします。
計算力サービスはエンドツーエンドのサービスであり、ユーザー群が広範で、分散型リソースノードの数が多く、データ情報管理が複雑で、証拠の追跡が困難です。
計算ネットワークの新しいアーキテクチャには、計算ネットワークの感知ユニットや制御ユニットなどのネットワーク要素が追加され、管理の複雑さが増しています。
(2)コスト:GPUの供給不足、計算力の無駄が深刻
AIの繁栄に伴い、GPUの需要が急増しています。現在、ほとんどのGPU市場はNVIDIAが占めていますが、NVIDIAのチップ供給は厳しく、価格も高騰しています。A100 GPUの市場単価は15万元に達し、2ヶ月で50%以上の値上がりをしています。同時に、大規模モデルの応用は計算力コストをさらに引き上げます。試算によると、1万枚のNVIDIA A100チップがAI大モデルを構築するための計算力のハードルとなり、GPT3の単回訓練コストは1200万ドルを超えています。
また、GPUには計算力の無駄が存在します。GPT3が1750億のパラメータを持つモデルを訓練するには、メモリに1TBを超えるデータを保存する必要があり、これは現在のどのGPUよりも多く、メモリの制約により、並列計算とストレージのためにより多くのGPUが必要となり、GPUの利用率が低下し、計算力が無駄になります。同様に、メモリの制約により、モデルの複雑さと必要なGPUの数は線形の増加関係ではなく、これがGPUの利用率低下の問題を悪化させます。GPT4は約25000のA100 GPUで90から100日の訓練を行い、その計算力利用率はわずか32%から36%です。また、多くの計算力は独立したデータセンター、暗号マイナー、MacBook、ゲーミングPCなどのユーザーの消費デバイスに存在しており、これらのリソースを集約して利用することは非常に困難です。
計算力の急成長に伴い、電力需要も急速に増加します。2023-2027年の世界データセンターの電力需要は430-748テラワット時と予測されており、2024-2027年の世界電力需要の2-4%に相当します。これは電力インフラに挑戦をもたらします。モルガン・スタンレーは、GPUの利用率が60%から70%に向上する基準シナリオの下で、2023-2027年の世界データセンターの総電力容量が70-122ギガワットに達すると予測しています。具体的には:
ブルマーケットシナリオ(90%のチップ利用率):2023-2027年の世界データセンターの電力需要は446-820テラワット時と予測されています。
ベアマーケットシナリオ(50%のチップ利用率):2023-2027年の世界データセンターの電力需要は415-677テラワット時と予測されています。
したがって、計算力の急成長に対応できる電力需要を満たす企業は、このトレンドから利益を得ることができ、特にデータセンターの電力供給遅延を減少させることができる電力ソリューションプロバイダーが注目されます。
二、発展のトレンドとプロジェクト紹介
1、分散型計算がWeb 3に安全で低コストな計算力ソリューションを提供
Web 1の本質は結合であり、ウェブページは「読み取り専用」で、ユーザーは情報を検索し、閲覧することしかできませんでした。Web 2の本質はインタラクションであり、ウェブサイトは「書き込み可能で読み取り可能」で、ユーザーはコンテンツの受け手だけでなく、コンテンツの創作にも参加できます。一方、Web 3は万物が相互接続される時代であり、ウェブサイトは「読み取り、書き込み、所有可能」で、ユーザーが創造したデジタルコンテンツの所有権と管理権は自分に帰属し、他者と契約を結んで配分することができます。Web 3は次世代インターネットの代表であり、分散型、オープン性、ユーザー主権を強調しています。分散型計算は従来のクラウド計算とは異なり、現代の技術駆動の計算需要を効果的に満たし、Web 3の基盤インフラの核心となります。インターネットの新技術の発展とデータ量のさらなる拡大に伴い、分散型アプリケーション市場の発展の見通しは明るく、智研コンサルティングは2025年までに世界の分散型アプリケーション市場規模が11855.4億ドルに達すると予測しています。
計算力業界の安全性、コスト、電力の課題に直面し、分散型の分散計算ネットワークを構築することはAI基盤インフラの発展において重要な方向性です。分散型計算は、計算力のレンタル、共有、調整などを通じて、既存の計算リソースを総合的に活用し、Web 3エコシステム内のさまざまなアプリケーションに安全で低コスト、無停止のサービスを提供します。従来の集中型システムと比較して、分散型計算の具体的な利点は以下の通りです:
》安全性
参加者全員が処理能力を持つ。 もし一人の参加者が脅威にさらされても、他の参加者が反応できます。
分散型の制御と意思決定を許可。 これにより、単一のエンティティがインターネットやそのユーザーに対して完全な制御を行うことができないことが保証され、ユーザーは監視や検閲を受ける可能性が低く、オンラインプライバシーと言論の自由がより大きくなります。
》低コスト: 分散型計算はコストと責任を複数のエンティティに分散させ、長期的にはより手頃で持続可能です。現在市場にあるWeb 3の分散型計算プラットフォームは、集中型計算プラットフォームよりも一般的に80-90%低い価格を提供できます。
より安価な計算能力。 従来のデータセンターでは、コスト構成はサーバー(30%)、住宅(12%)、ネットワーク(15%)、AC(21%)、電源(17%)、人件費(5%)であり、分散型計算はユーザーが相互利益のためにリソースを共有し、計算能力を提供することに依存しており、理論的には70%のコストを節約できます。
より安価な訓練コスト。 分散型計算は、数千のサーバーレス技術の並列スレッドを活用することを許可し、GNNの訓練を10億のエッジモデルに拡張できます。UCLAの研究によれば、大規模モデルに対して、分散型計算は従来のシステムよりも1ドルあたり2.75倍の性能を提供し、スパースモデルに対しては1.22倍の速さで、4.83倍の安さを実現します。
より安価な展開コスト。 従来のAIソリューションは、ソフトウェア開発、インフラ、人的資源に多大な投資を必要としますが、分散型計算は開発者が既存のリソースとインフラを活用できるようにし、AIアプリケーションの構築と展開を容易にします。また、AI開発の民主化を促進し、ユーザーが計算リソースを共有し、AIソリューションを共同開発できるようにします。
AIにより適したインフラ。 訓練と計算のコストを削減することで、分散型計算はより多くの組織や個人がAIを利用できるようにし、多くの業界の成長と革新を促進する可能性があります。
》無停止サービス: 分散型ネットワークノードは分散しており、理論的には決してダウンしないため、単一障害点が存在しません。
プロジェクト紹介
Akash Network: 分散型クラウドコンピューティング市場で、ユーザーが安全かつ効率的に計算リソースを売買できるようにします。他の分散型プラットフォームとは異なり、ユーザーはAkashでコンテナをホストし、任意のクラウドネイティブアプリケーションを実行でき、新しい専用言語でインターネット全体を再構築する必要はなく、クラウドプロバイダーの切り替えを妨げるロックインもありません。
io.net: 分散型計算ネットワークで、機械学習エンジニアが集中型サービスよりも低コストで分散型クラウドクラスターにアクセスできるようにします。IOワーカー、IOクラウド、IOブラウザなどの特徴的な製品があり、Solana上での評価は10億ドルを超えています。
2、AIが高性能計算を推進し、高性能計算がAIを強化
高性能計算とは、スーパーコンピュータや並列計算機クラスターを使用して高度な計算問題を解決する計算システムを指します。この種のシステムは、通常、最も速いデスクトップコンピュータ、ノートパソコン、またはサーバーシステムよりも100万倍以上速く、自動運転車、IoT、精密農業などの確立された分野や新興分野で広く応用されています。
高性能計算はデータセンターの総可用市場の中で約5%のシェアを占めていますが、AIの急速な発展と大規模モデルの利用に伴い、AIと高性能データ分析のワークロードの増加がHPCシステム設計の変化を促進し、HPCもAIを強化し、両者は相互に発展しています。2022年の世界HPC支出は約370億ドルで、Hyperionは2026年には520億ドルに達すると予測しています。同時に、HPCが強化するAI市場は2020-2026年の間に22.7%の複合成長率を達成すると予測されています。
プロジェクト紹介
Arweave: 最新のAOプロトコルを提案し、非イーサリアムのモジュラーソリューションのアーキテクチャを使用して、ストレージパブリックチェーン上で超高性能計算を実現し、準Web2の体験を達成します。Web3 x AIにとって非常に良い新しい基盤を提供します。
iExec: 高性能計算サービスを提供する分散型クラウドコンピューティングプラットフォームで、ユーザーが計算集約型タスクを実行するために計算リソースをレンタルできるようにします。データ分析、シミュレーション、レンダリングなどに利用されます。
CETI :crypto.comの前CEOが設立し、企業向けの高性能計算センターをターゲットにしています。
3、人間と機械のインタラクションの転換点:空間計算
空間計算とは、AR/VR技術を使用して、ユーザーのグラフィカルインターフェースを実際の物理世界に統合し、人間と機械のインタラクションを変える計算を指します。2015年にMicrosoftが発表したMRヘッドセットHololensは、現代の空間計算のマイルストーンであり、普及はしていないものの、空間計算の可能性を証明しました。今年、Appleが発表したVision Proは、より正確な空間認識技術とより深いユーザーインタラクション体験をもたらし、空間計算を注目の分野に押し上げました。
実際、私たちは人間と機械のインタラクションの転換点に達しています :従来のキーボードとマウスの構成から、タッチジェスチャー、対話型AI、拡張視覚計算インタラクションのエッジへと移行しています。IDCの予測によれば、2023年の世界VRデバイスの出荷台数は917万台に達し、前年比7%の成長が見込まれ、ARデバイスの出荷台数は44万台に達し、前年比57%の成長が見込まれています。今後4年間、VR市場は毎年20%以上の成長を遂げ、AR市場は70%以上に達すると予測されています。AR/VR技術の発展は、空間計算の重要性を大いに高めるでしょう。PCやスマートフォンに続いて、空間計算は次の波の破壊的変革を推進する可能性があります------技術を私たちの日常行動の一部にし、リアルタイムデータと通信で私たちの物理的およびデジタル生活をつなげます。
プロジェクト紹介
Clore.ai: テナントとGPUを必要とするユーザーをつなぐプラットフォームで、ユーザーが競争力のある価格と柔軟な条件で強力な計算リソースにアクセスできるようにします。その強力なGPUは、ユーザーがプロフェッショナルレベルで映画をレンダリングできるようにし、必要な時間を大幅に短縮し、さまざまなレンダリングエンジンと互換性があり、AI訓練やマイニングにも使用できます。
Render Network: 分散型のGPUレンダリングプラットフォームで、次世代のレンダリングとAI技術を推進することを目的としています。ユーザーは、必要に応じてGPUレンダリング作業を世界中の高性能GPUノードに拡張できます。
4、エッジコンピューティングがクラウドコンピューティングの重要な補完となる
エッジコンピューティングとは、物理的にエンドデバイスに近い場所でデータを処理することを指し、「エッジ」は最終ユーザーとの往復時間が最大20ミリ秒の位置にあります。エッジコンピューティングは、計算リソースをエンドデバイスに近い場所に展開し、データをローカルで処理できるようにすることで、データをクラウドに送信して処理する際の遅延とネットワーク帯域幅の圧力を軽減します。したがって、遅延、帯域幅、自主性、プライバシーの面で優位性があります。
Facebook、Amazon、Microsoft、Google、Appleなどのテクノロジー大手は、最終ユーザーやデータ生成の場所に近づくために、エッジコンピューティングとエッジロケーションに投資しています。バンク・オブ・アメリカは、2025年までに75%の企業が生成するデータがエッジで作成され、処理されると予測しており、2028年にはエッジコンピューティングの市場規模が4040億ドルに達し、2022-28年の複合年成長率は15%になると予測しています。
プロジェクト紹介
Aethir: クラウドコンピューティング基盤プラットフォームで、2024年4月にAethir Edgeを発表し、Aethir唯一の認可を受けたマイニングデバイスとして、分散型エッジコンピューティングの発展をリードし、エッジコンピューティングの未来を民主化に導きます。
Theta Network: 分散型ビデオ配信サービスプラットフォームで、既存のビデオ配信システムの高コストと低効率などのボトルネック問題を解決することを目的としています。2024年第2四半期に完全にエッジアーキテクチャを跨いだハイブリッドクラウドコンピューティングプラットフォームTheta EdgeCloudを発表する予定です。
5、AI訓練はAI推論に全面的に移行する見込み
分散型のトレンドの中で、AI訓練は現在のDePINにおいて最良の実用シーンではありません。AI生産は、AI推論とAI訓練の2つの側面において計算力の要求が主に集中しています。AI訓練は、大量のデータを供給して複雑な神経ネットワークモデルを訓練することを指し、AI推論は訓練されたモデルを利用して、大量のデータからさまざまな結論を推論することを指します。したがって、分散型と計算力の結合において、訓練から微調整訓練、推論への難易度は段階的に減少します。もしイーサリアム上に分散型計算アプリケーションを構築し、GPTに供給する場合、単一の行列乗算運算のGas費用は100億ドルに達し、1ヶ月以上の時間がかかります。各トークン(1000トークンは約750単語に相当)の訓練コストは通常約6N(Nは大規模言語モデルのパラメータ数)ですが、推論コストは約2Nに過ぎず、つまり推論コストは訓練コストの約3分の1に相当します。
また、AI訓練と比較して、AI推論は消費電子機器などの大規模アプリケーション端末の需要とより密接に関連しています。Counterpoint Researchは、2024年までに世界のPC市場の出荷台数がパンデミック前の水準に戻ると予測しており、2020年からAI PCは50%の複合成長率で成長し、2026年以降はPC市場を主導すると予測しています。2024年にはAI PC、AIスマートフォンなどの新たにAIを融合した消費電子製品が登場し、エッジ側のAI大モデルおよびAIソフトウェアの大規模な応用トレンドがますます顕著になるでしょう。これにより、AI推論の重要性が高まり、エッジ側の大モデルおよびAIソフトウェアの効率的な運用の背後にある核心技術となり、AI業界の発展の重心が訓練から推論に全面的に移行することが期待されます。
プロジェクト紹介
Nosana: ブロックチェーンに基づく分散型GPUリソース共有プラットフォームで、市場におけるGPU不足の問題を解決することを目的としています。2023年にはAI推論に移行し、AI推論用の大規模GPU計算グリッドを先駆けて導入しました。これは、AIの厳しい計算要求を処理するための理想的なツールとして、ブロックチェーン技術をAIに統合することを目的とした取り組みです。
Exabits: 分散型AIおよび高性能計算サービスプラットフォームで、公平で使いやすく、包摂的なAIエコシステムを構築し、AIモデルの訓練と推論に手頃な加速計算を提供することを目指しています。