腾讯のマ・シャオイ:メタバースは私たちからどれくらい遠いのか?
講演:シャオイ、テンセント上級副社長
整理:ゲームグレープ
出典:テンセント文化
4月24日、テンセント上級副社長マ・シャオイは復旦大学管理学院の同窓会で、メタバース、VR/ARなどの内容についての見解を共有しました。
メタバースの熱潮の中で、マ・シャオイはメタバースの短期的な2-3年内の変化については保守的な見方を示しました。現在、多くの専門技術が突破を遂げていますが、メタバース時代に必要な汎用デバイス(かつてコンピュータ革命をもたらした家庭用PCや、モバイルインターネットを推進したスマートフォンに類似するもの)はまだ登場していません。技術的にも商業的にも、その発明と普及には距離があります。
しかし、10年という長期的な発展の見通しについては、非常に強い自信を持っています。一方で、メタバースの概念はここ2年でより多くの技術的支援を受けており、自身のボトルネック問題を多方面から解決しつつあります。もう一方で、社会の認識も突破しつつあり、ゲームやソフトウェアに限られた概念から、複数のシーンを横断する方向に発展しています。メタバースの質的変化のタイミングは、2030年だと考えています。
メタバースの技術は今どのような状態にあるのか?メタバースにはどのようなデバイスとコンテンツが必要なのか?なぜ質的変化が2030年に起こるのか?マ・シャオイの共有の中で、答えを見つけられるかもしれません。
メタバースは最近非常に注目されていますが、振り返ってみると、これは新しい話題ではありません。
1997年、あるゲーム『Ultima Online』が当時の概念を提唱しました:これは持続的に運営される世界です。この理念の下、ゲームに人がオンラインで参加していなくても、その世界は持続的に存在し、発展し続けます。この理念は現在のメタバースの理念と完全に一致しています。
ほぼ1995年から1998年の数年間、各インターネット企業が起業を始め、生活の中のシーンや関係をオンラインにどう持ち込むかを考え始めました。
Metaverseという言葉は、1992年の小説から来ています。最近、ビジネス界で言及されたのは、2018年にアメリカのアナリストが書いた記事で、タイトルは「テンセントの夢とは何か」です。
この記事では、テンセントがなぜEpic Games、Roblox、Reddit、Snapchat、そしてさまざまなコンテンツやプラットフォーム型の企業に投資したのかを分析しています。彼が投資の配置を組み立てたとき、Metaverseという言葉が最適だと感じました。
Robloxの上場、FacebookのMetaへの改名に伴い、メタバースはますます熱い概念になりました。なぜこんなに早く提唱された概念が、今日突然注目されるようになったのでしょうか?私は、過去に比べてこの数年で多くの変化があったからだと思います。
まず、全体の計算能力が臨界点に達しました。2016年にはVRの波があり、その時私は比較的保守的で悲観的でした。多くの業界の人々と話し合った結果、VRデバイスで良い体験をサポートし、大規模に応用するために必要な技術はまだ成熟していないと感じました。
例えば、当時のモバイル計算チップは高解像度の表示を全くサポートできず、バッテリーや表示デバイス自体の制限も相まって、体験は非常に悪いものでした。
次に、いくつかの重要な新技術が整っていませんでした。私は多くの上流の重要技術や部品生産の進展に常に関心を持っています。私たちはすでにいくつかのロードマップが徐々に明確になってきているのを見ており、今後数年でこれらの重要技術が突破的な発展を遂げるでしょう。
第三に、私が重要だと思うのは、インターネットの浸透率も臨界点に達したことです。特にこの2年間の世界的なパンデミックを経て、在宅勤務が主流になっていることがわかります。もしあなたがテクノロジー企業で、従業員に在宅勤務の選択肢を提供しなければ、魅力を失ってしまいます。人々は生活の大部分をネットワークを通じて実現することに慣れています。
最後に、ユーザーの視点から需要を考えます。人間という種の最大の特徴は「協調」です。社会がますます複雑になるにつれて、私たちが必要とする技術も複雑になってきます。社会がある技術がこれらのニーズを満たす機会があると認識すると、それを実現するための大きな突破を促進します。
以上の点を考慮すると、2006年の『Second Life』の初回の試みは明らかに早すぎました。2015年、2016年の最初のVRの時代も早すぎたと思います。
今日、もしかしたら適切なタイミングかもしれません。
したがって、この会議を借りて、未来のメタバースについての想像を話すことができます。正直に言うと、私個人の見解は外部の多くのメディアの報道とは少し異なります。たとえば、私は現在メタバースの詳細について議論するのはまだ早すぎると感じています。
結局のところ、メタバースはどのような形をしているべきか、どのような部分で構成されるべきか…… まだ明確で正確に定義するのは難しい作業です。
しかし、私たちは今、メタバースを未来の新技術、新アプリケーションの可能な統合方法として捉えることができます。これは未来の人間と機械のインタラクション、そして人と人のインタラクションの想像の集大成です。
私は主に没入感の体験とコンテンツの発展について、メタバースの未来の想像を語ります。
没入感:2030年以降、メタバースが普及し始める
まず、没入感について、私は主に2つの方向性があると思います:
- 人間と機械のインターフェースとインタラクション方式;
- VRなどのデバイスの体験問題。
現在、私たちがメタバースについて言及すると、誰もが自然にそれをVRと結びつけます。もちろん、これは2つの理由に基づいています。一つは、最近FacebookがVRの方向に非常に大きな賭けをしたからです。もう一つは、メタバースの概念を達成するためには、VRのような全く新しいデバイスが不可欠だからです。
なぜでしょうか?普通の人はキーボード、マウス、タッチなどのデバイスを使ってコンピュータに情報を入力しますが、コンピュータの技術的な観点から見ると、それらの帯域幅は実際には非常に狭く、入力できる情報は限られています。コンピュータはこれらの情報に基づいてフィードバックを行いますが、より多くの情報を直接入力することはできません。
しかし、入力の帯域幅が増加すれば、実際に私たちはより多くの次元を追加できます。
例えば、VRデバイスにより多くのカメラやセンサーを追加し、環境情報をコンピュータに入力することができます。人体の状態を追跡することができ、最新の技術では6つの次元(前後左右上下)の3D追跡が可能で、頭の位置や目の向きを含め、周囲の環境とインタラクションを取りやすくします。
その中で最も注目すべきは、手の操作です。現在の最新のOculus Quest 2では、まだコントローラーを使って情報を入力する必要がありますが、業界内ではより自然なインタラクションは手を使って行うべきだという合意があります。
この進歩は、スマートフォンでも見られました。初期のスマートフォンはタッチペンで書くものでしたが、Appleはこれが直感に反すると主張しました。人の直感は指で画面を触れるべきだという理屈は、VRデバイスにも当てはまります。したがって、現在の多くの進展は、指の動きをキャッチすることに焦点を当てています。
さらに、最新の技術が顔認識に特化し、表情をキャッチすることにも注目しています。人と人がコミュニケーションを取る際、相手の反応は非常に重要なフィードバックです。
例えば、現在のオンライン会議では、私の体験は実際にはあまり良くありません。なぜなら、皆の表情を見ることができず、私の講演が速すぎるのか遅すぎるのか分からないからです。しかし、オフラインであれば、観客の反応をすぐに見ることができます。したがって、未来には顔認識を利用して人のリアルタイムの表情を追跡し、それを仮想のシーンに投影する必要があります……
これらの新しい入力方式が統合されることで、情報の帯域幅が広がり、コンピュータへの情報入力が大きく変わる可能性があります。
また、非常に興奮させる技術の進展もあります。
例えば、最近私たちがVRヘッドセットの表示ユニットを見たとき、Oculus Quest 2を試したことがある方は、そこにFast-LCD技術が使用されていることを知っています。しかし、この技術には一つの問題があります。それは、スクリーン効果です。デバイスが目に近すぎると、ピクセルが目の前に見え、まるでスクリーン越しに見ているかのようです。これは実際には、かつての低解像度の携帯電話のディスプレイと同じです。
その後のストーリーは皆さんもご存知でしょう。iPhoneが成功した大きな理由の一つは、iPhone 4でレティナディスプレイの概念を提唱し、皆の携帯電話の画面体験を大きく改善したからです。
VRは今日まで進化してきましたが、これらの問題に対しても新しい技術が誕生しています。例えば、すでに生産ラインにある4K解像度のシリコン基板OLEDディスプレイは、VRヘッドセットに十分な高解像度を提供できるようになっています。
VRヘッドセットでレティナディスプレイの効果を達成するには、現在の基準として、人の視野の各度にどれだけのピクセルが必要かということがあります。大体30個のピクセルがあれば、ピクセルの境界を感じ始め、60個/度に達すると、完全にピクセルを見分けることができなくなります。したがって、4Kシリコン基板OLEDディスプレイは、皆に非常に良い体験を提供するのに十分です。
明るさも、VRヘッドセットの変化のポイントです。
現在のシリコン基板OLEDディスプレイから、未来のMicroOLEDディスプレイまで、より高い明るさを提供できます。以前はLCDは約400-500nitの明るさでしたが、今では2000nitを見ることができ、未来の開発ロードマップからは10000nitの研究中のデバイスも見えてきています。
これにより、表示ユニットの技術を向上させ、ユーザーの没入感を高めるという非常に大きなボトルネックの問題が解決されました。市場にはすでにいくつかの完成した製品があります。
しかし、未来にはもう一つ重要な発展方向があります。それは折りたたみ光路の技術です。
以前のVRデバイスは通常、厚くて重く、大きく、頭に装着するのが非常に不快でした。未来には、折りたたみ光路のデバイスが登場し、VRヘッドセットユニットを非常に薄くし、普通の眼鏡をかける感覚に近づけることができるでしょう。
もう一つの突破口は、VR/ARの議論です。VRはすべてのコンテンツが表示ユニットから来ると言いますが、ARはコンテンツと現実環境を重ね合わせる必要があると言います。
現在、業界では皆が折りたたみ光路のソリューションを採用しています。依然としてすべてのコンテンツを表示画面で呈示しますが、外部により多くのセンサーを追加してユーザーの周囲の状況をキャッチし、最終的にそれを表示画面に重ね合わせます。業界内では、来年初めにAppleがこのようなデバイスを発表するという噂もあります。折りたたみ光路のソリューションを利用してVR/ARの効果を実現するというものです。
以上のように、人間と機械のインターフェースに関する技術のロードマップは非常に明確に発展しています。バッテリーに多くの制限がある以外は、他の面ではほぼすべてに解決策があり、進展しています。
これも私たちがメタバース、VR/ARの発展に自信を持つ理由です。
もう一つのポイントは、技術体験を十分に良くするためには、デバイス内部にハードウェアのサポートがあるだけでは不十分で、ソフトウェアの発展も必要です。
ここで指摘したいのは、ここでのソフトウェアは技術を指し、コンテンツではないということです。私たちはこれを3つの次元にまとめます:
信頼できる環境:メタバースのシーンはますますリアルになり、ユーザーがこれが本物の世界であると信じられるようにします。
信頼できるキャラクター:人は社交的な属性が強い生物であり、私は集団とインタラクションし、交流し、協力する必要があります。その中で最も必要なのは信頼できるキャラクターです。皆さんもこの点については多少なりとも体験があると思います。
信頼できるインタラクション:オンライン会議について再度話しますが、この形式は演説に近く、議論ではありません。オフラインでは誰かが議論に参加し、衝突が起こりますが、現在のオンラインにはそのようなものがありません。
よりリアルなインタラクションを実現するためには、十分に信頼できる詳細が必要です。例えば、私があなたに水のボトルを渡し、握手をし、温度や重さを感じることができるということです。これらは従来のコンピュータやタブレットでは完全に実現できないインタラクションです。しかし、現在すでにこの分野で多くの技術が進展しています。
要約すると、技術の発展に伴い、私たちはメタバース、VR/ARの企業に多くのツールを提供し、皆がより信頼できる世界や人間関係を構築できるように支援する必要があります。
コンテンツ量:誰が十分なコンテンツを提供するのか?
これはかなり大きな話題です。なぜなら、私たちはまだメタバースにどのようなコンテンツが含まれるべきかを知らないからです。しかし、現在のところ、専門コンテンツと汎用コンテンツのいくつかの次元に分けられると考えています。
この部分については、私は比較的悲観的です。なぜなら、技術がロードマップ上で発展しているにもかかわらず、準備にはもっと時間がかかるからです。専門から汎用に移行するには、さらに多くの時間が必要です。
ある技術がまだ重要な地位に達していないとき、それは往々にして比較的専門的で特定のアプリケーション、例えばゲームや映画などの分野に限られます。一方、汎用的なものは、皆が使用している携帯電話のように、すでに何千もの使用方法があります。
大まかに言えば、私が内部チームと交流する際、一般的に2030年を基準線として考えています。それ以前はメタバースは専門的な段階にあり、その後、より汎用的な状態に向かう機会が出てくると考えています。現在は新しい補完的なシーンの位置付けに過ぎません。
ここで、専門と汎用の違いについてもう少し詳しく説明する必要があります。
約1ヶ月半前、私はEpic GamesのCEOティム・スウィーニーと会議を行い、この問題について議論しました。私のまとめは、現在のゲームは「ゲーム」であり、あなたが見る動画も「動画」に過ぎませんが、メタバースは違います。あなたはメタバースの中で「生活」すべきです。この間には本質的な違いがあります。
例えば、あなたがオンラインの映画館に行くと、それは特別な世界であり、現実から切り離されています。しかし、メタは皆の生活をこの仮想世界に統合するものです。したがって、その中で生活したいと思わせるためには、十分なコンテンツが必要です。
これらの十分なコンテンツは、いくつかのルートに分けることができます:
PGCの専門制作、例えばテンセントのような会社が制作する映画、ゲーム、テレビドラマなど、これは専門的な制作です。PGCは依然としてメタバースの非常に重要な部分です。
UGC。つまり、ユーザー生成コンテンツです。
現実と仮想の融合。私たちは多くの技術について話しましたが、それは現実世界を仮想世界に統合することを目指しています。
これらの3つの部分は、非常に重要なコンテンツの構成要素です。
では、どのように実現するのでしょうか?
まず、大規模なPGCコンテンツについては、最近いくつかの突破口があります。新しいゲームに関心がある方は知っていると思いますが、Epic Gamesは最近非常に衝撃的なデモを発表しました。彼らは『マトリックス』の上映と同時に、約10-20平方キロメートルの規模の仮想都市を作成しました。その中には3万人の市民がいて、大量の交通や建物があります。
重要なのは、その中の車両が自分の動作を持っていることです。信号で止まり、人を見かけると止まります。そして、この3万人の市民はそれぞれ異なる服装、行動、外見を持っています。過去にこのような大規模な仮想世界の創造を達成することはほぼ不可能なタスクでした。
しかし、今日では技術の発展により、これらの不可能なタスクが徐々に実現しています。なぜなら、一方で技術能力が向上し、もう一方でこれらの問題を解決するための良い方法が増えているからです。
例えば、私たちはEpic Gamesと2つのプロジェクトで協力しています。一つは、AIを通じて現実世界を導入するプロジェクトです。以前、私たちはニュージーランドのある谷に行きました。それは約10平方キロメートルの谷で、7000-8000枚の写真を撮影し、それをエンジンに取り込むと、そのエンジンは谷を約90%再現します。その後、私たちが手動で微調整を行うことで、非常に大きな世界を短時間で生成し、その世界が非常にリアルに見えるようにします。
もう一つのプロジェクトは、仮想人間のプロジェクトです。国内では「サイレン」と呼ばれています。その後、Epic GamesもMeta Humanプロジェクトを発表しました。これは高度にリアルな人間です。これは実際に、先ほど私たちが言及した概念に戻ります。信頼できるキャラクターは、仮想世界の重要な構成要素です。
同様に、以前は仮想人物を作成するには相当な時間がかかりました。
皆さんもこの話を聞いたことがあるかもしれません。ハリウッドの多くの映画では、仮想人間を作成するために、オンラインで10秒の映像をレンダリングするのに数ヶ月かかります。しかし、現在の技術では、ハリウッドが4ヶ月かけて作成したコンテンツを、私たちは0.01秒でレンダリングし、前者の95%の品質を達成できます。
これらはすべて、大規模な制作をより良い方法で実現することを可能にしています。モーションキャプチャなどのコンテンツも、AIの助けを借りて、コンテンツの作成をより容易にします。
次にUGC部分についてですが、私は外部の見解とは多少異なります。
例えば、外部がUGCについて話すとき、最も重要なのは去中心化ですが、この点について私はRobloxのCEOデビッドと多くの交流を持っています。私たちは早くからRobloxの構築に参加し、2015年頃から関与し、多くの投資を行ってきました。UGCコンテンツの成功の鍵について話すとき、私たちはコミュニティの原則や透明性を挙げます。特に秩序や状態を維持する部分は、強い中心化の実行が必要です。
しかし、これは私が外部の意見と対立しているわけではありません。私は去中心化は能力の去中心化を指すべきだと考えています。つまり、ツール、能力、リソースをユーザーに提供し、皆が中心化されたプラットフォームなしで自分のコンテンツを作成できるようにすることです。そして、これらのコンテンツを支えるのは、先ほど述べたような持続的で原則に基づいた長期的に安定したプラットフォームです。私はこれがUGCを作成する上で最も重要なポイントだと考えています。
第三のポイント、現実と仮想の融合は、先ほど私たちが言ったメタバース、VR/ARの新技術に大きく戻ります。実際、私たちが達成したい目標は、インターネットや人類社会の過去の努力と一致しています。人類は常に物理的制約を打破したいと考えてきました。例えば、飛行機や自動車は物理的制約を取り除き、物理的損失を短縮し、大規模な協調の効率を高めるためのものです。
したがって、長期的には、メタバースはより多くの外部、現実世界のサービスやコンテンツを導入し、物理的な境界を打破することを考慮する必要があります。
より現実的な問題
最後に、メタバース、VR/ARが存在する問題について話したいと思います。
私が先ほど述べた内容は楽観的に聞こえるかもしれませんが、私の心の奥底では、やや悲観的です。
普段、皆と話すとき、私はこう言います。短期的には1-3年で、私は大多数の人よりも悲観的です。しかし、長期的には10年後、私は大多数の人よりも楽観的であり、これらの新技術のシーンが人類社会に大きな変化をもたらすと考えています。
私の見解では、現在のこれらの技術は2025-2027年の間に大規模に登場しますが、広く展開するには2030年まで待つ必要があります。これが私の心の中のタイムテーブルです。
簡単な例を挙げると、価格は重要な参考です。例えば、先ほど述べた4Kシリコン基板OLEDディスプレイは非常に良い体験を提供しますが、価格が高すぎます。表示ユニットの価格だけで、Oculus Quest 2全体の価格と同じです。したがって、価格が下がるにはまだ長い時間がかかります。
次に、ビジネスモデル自体にもいくつかの問題があります。先ほど述べたように、今はまだ早すぎます。
私たちの現在の段階を過去の歴史に対応させると、次の2つのタイミングがあります:
1. 汎用デバイスの普及。
多くの若者は知らないかもしれませんが、最初の家庭用専用デバイスは実はゲーム機です。------ アタリ2600は1977年に発売され、現在のOculus Quest 2の状況に対応します。
そして、皆が知っているIBM PCは1981年に市場に登場し、家庭用PCが本当に普及したのはWindowsが登場した後です。85年が最初のバージョンで、大規模に普及した3.0バージョンは92年に登場し、さらに広く知られているWindows95は95年のことです。
このプロセスは少なくとも6-10年の発展を要します。
2. ビジネスモデルの確立。
実際、90年にはインターネットが登場しましたが、皆が知っているインターネット企業、例えばテンセントやGoogleなどは98年に設立されました。そして、これらの企業が本当に彼らを支えるビジネスモデルを見つけたのは、だいたい2004年頃です。このプロセスも同様に多くの年数を要しました。
したがって、短期的にはメタバースの発展にはまだ数年の育成が必要ですが、育成の方向性は明確であり、潜在能力も非常に明確です。
過去20年間、インターネットが人類社会、経済、技術に貢献したことは皆が目に見えるものであり、私は未来の20-30年間にメタバースを中心とした統合的なインターネット体験が社会全体に大きな衝撃をもたらすと信じています。
その中には、皆が議論し、協力し、推進するに値する多くのポイントがあるでしょう。