洞見 Web3 遊戲:AI 如何創造新《原神》
作者:GalaxyBlitz
現象級《原神》帶來的深思
很多人都發現,面對《原神》,遊戲圈傳統的套路"失效"了。過去的手遊行業,卡牌、APRG、MMO、SLG、MOBA和吃雞品類誕生的"爆款"會讓業界迅速找到"方向",然後不少廠商賺的盆滿钵滿。
面對《原神》,絕大多數人又感受到了一種巨大的無力感。大部分人想抄作業,才發現自己只是小學學歷,而《原神》已經是兩院院士了。米哈遊的開放世界、內容包裝、大投入、工業化、多平台、全球發行、IP與品牌……讓遊戲圈絕大多數人已經陷入了給答案都沒能力看懂的境地了。
投資人的焦慮更大,米哈遊從上交的宿舍企業到現在遊戲界巨頭僅拿了斯凱網絡的CEO宋濤的100萬元投資,如今這筆投資的估值是3400億,傳奇性堪比孫正義投資阿里巴巴,那麼下一個米哈遊在哪裡?
那麼《原神》的神話在Web3可以複製嗎? GalaxyBlitz團隊認為在SLG+AI+Web3的加持,可以另闢蹊徑的低成本實現原神的神話。
我們首先來觀察原神的付費邏輯,角色是《原神》的核心付費點,《原神》是一款內容極度圍繞角色為核心的遊戲,遊戲內所有的內容包括但不限於劇情,大世界,動畫,最終都是要為了角色服務。每個角色會有專屬的劇情和故事,甚至單獨製作的大世界提升的遊戲體驗(比如層岩巨淵)都是會分攤到每一個角色身上,因為你最終還是要用他們去進行探索。
那麼玩家為什麼會為角色付費呢?因為玩家對角色產生了感情,提瓦特大陸的確是一個絕美的舞台,米哈遊塑造的大世界,伴隨之的回響音樂,形形色色的人物和故事,無不讓人被深深吸引。行走於這片大地,就好像行走於一個真正的異世界------而不局限於小說,動畫,真切地感受到一場來自陌生土地的田園詩歌。美麗的事物天然充滿誘惑,我們趨之若鶩。
在這片風光綺麗的大陸上,玩家與角色一起無論是探索、戰鬥、通關深淵,還是養成,在某種程度上讓你以為自己真的置身荒野或培養子嗣,大腦便會產生某種愉悅的感覺,這種愉悅的感覺來自與玩家與二次元角色在次次歷險中培養的深厚的感情,為角色經歷和性格所折服。
例如胡桃是一個經典的"矛盾"人設,既活潑又深沉,既明白生死教條又過的自由瀟灑。表面上大大咧咧什麼都無所謂,但其實內心對於死亡又非常敬畏認真。這種複雜矛盾的立體性格,反而更加讓人體會到了胡桃這個角色的魅力。
胡桃表面生性貪玩、瀟灑,但是深入了解她的經歷才知道她有肅穆和凝重的另外一面
米哈遊給每個角色製作了高度立體和複雜多面的性格,在一起經歷和探險之後,玩家逐漸了解和挖掘到每個角色的故事,被角色的性格和魅力所折服,產生了收藏的欲望,於是產生付費衝動。
這也是《原神》要不停進行高強度更新的原因,因為只有大量圍繞角色為核心的高質量內容更新,才能吸引玩家與角色在探險中產生共情和親近感,從而吸引玩家進入付費循環。
W eb 3 領域 SLG 將通過 AI 技術創造新的《原神》
那麼這樣的付費邏輯是否可以在SLG類型中複刻呢?顯而易見AI技術的發展使這個邏輯成為了可能。GalaxyBlitz將在下一個版本使用AI技術,使GalaxyBlitz裡面每一個角色都成為可以吸收主角性格的AI Being,無監督的強化學習技術可以讓AI Being具備類似人類認知意識,角色所有的動作例如揮劍、躲避、防禦、走路、衝刺、彎腰、射擊等等,都是由玩家親手訓練產生,帶上主角的印記,做出與玩家及其相似的決策,每個角色本質上都是與玩家共同成長、共同經歷的AI親人,打上玩家的標籤,極易與玩家產生共情。
如何實現這些AI技術呢?GalaxyBlitz與知名AI公司Phantom AI一起研發了適用SLG手遊的神經網絡訓練系統GalaxyBlitz Mobile Net,GalaxyBlitz Mobile Net是一種可擴展的數據驅動方法,在低功耗的玩家手機設備和GalaxyBlitz的深度強化數據中心共同搭配下,學習有可重複使用的運動技能的AI Being。
我們的框架概述如下圖:
GalaxyBlitz Mobile Net 框架
GalaxyBlitz Mobile Net框架由兩個階段組成:預訓練,目標訓練。
在預訓練期間:low-level policy π(a|s,z)被定義為以動作空間數據集s裡面用為基礎動作a作為變量實現目標z的一個映射,使用獎勵函數r對各種動作進行建模。經過預訓練之後,可以通過使用特定任務轉移到目標任務。
我們特意準備了一段預訓練到多特定目標任務的Demo。
視頻包含了AI being完成了3個獎勵函數r確定的目標:高空翻滾穿越障礙物、連續射擊靶心、成功設計靶心之後給自己豎大拇指。
low-level policy可以為各種通用動作建模,根據Environment0定義的玩家習慣狀態集可以實現揮劍、走路、衝刺、彎腰、射擊等通用動作的訓練。
Low-level policy的動作組合-涉水走
Low-level policy的動作組合-翻滾跳躍
Low-level policy的動作組合-持槍姿勢跑
Low-level policy的動作組合-跪姿射擊
在目標訓練期間: High-level policy w(a|s,z)被定義為以動作空間數據集裡面用為動作組合z作為變量實現目標g的一個映射,其中z=array(a)。
如下圖所示,通過High-level policy,已經學會Low-level policy的AI Being可以被指示執行各種特定任務,這些特定任務由Low-level policy裡面的一組動作拼接連成。
High-level policy的動作任務組合-跪姿射擊靶心
High-level policy的動作任務組合-繞旗走
在High-level policy中,一開始Environment1的隨機樣本生成的模擬角色表演技能組合,隨著玩家操作的頻繁,discriminator會分離出讓玩家習慣的動作產生,AI Being的動作將越來越符合玩家的習慣。
如下圖所示,我們的動作不包含"趴地"和"站起來",但是AI Being會自主學習"趴地"和"站起來"。如果玩家喜歡AI Being膽小的性格,那麼AI Being會在遇到危險進行"臥倒",在關鍵時刻"勇敢站起來",從而發掘玩家內心的閃光點。
High-level policy讓AI Being擁有了玩家"平時膽小但在關鍵時刻擁有勇氣"的性格
Web 3.0 新式 SLG 的崛起
如果說目前的GalaxyBlitz 1.0的版本最終實現2億美元的年流水,達到目前Web2領域的SLG的較高水平。但GalaxyBlitz將在下一個AI版本中實現:投資需求+娛樂需求+情感消費需求,預計達到類似《原神》級別的50億美元級別的年流水。
GalaxyBlitz團隊預想的Gamefi演進路線
以GalaxyBlitz的AI技術為代表新式的SLG將擁有千人千面的角色NFT,在下一代SLG裡面,每一個角色都擁有玩家獨特的喜好和數據,他們不再是傳統遊戲裡面千篇一律的數值工具人,而是寄託玩家的情感,可玩性,延展性等等可以得到極大的提高。
因此,充滿個性的AI Being將會帶來下一個Web3遊戲的敘事的高潮。