大規模言語モデルにゲームマスターをさせる
ゲームマスター(MG)と呼ばれる進行役と、プレイヤーたちが鉛筆やキャラクターシート、ダイスを使いながら会話で進行するテーブルトークRPG(TRPG)。今日のビデオゲームにおけるRPGは、「ゲームマスターをCPUに担当させれば1人でもRPGが遊べる」という発想で生まれました。
海外ではそんなTRPGのゲームマスターを大規模言語モデルにやらせる試みがあり、プレイヤーたちが訪れたのはどのようなダンジョンで、そこにはどのようなモンスターが生息していてどのように登場するのか……などを実践させる研究が複数あるとのことです。
倉林TRPGのゲームマスターはマルチロール性が要求されます。たとえば、GMが想定していない出来事が起きたときは裁定者としての振る舞いが要求されますし、プレイヤーたちが会うNPCを演じるのもGMの役割のひとつです。技術的には非常にチャレンジングで、おもしろい試みだと思います。

『マインクラフト』における大規模言語モデルによる学習
ゲーム内のキャラクターは、内部的にはコマンド(命令)を実行して動いています。コマンドは当然言語によって構成されるものなので、大規模言語モデルが学習を積み重ねて最適なコマンドを生み出せるようになれば、言語モデルにゲームのキャラクターを操作させられるのではないか……というアプローチの研究です。
伊藤大規模言語モデルを用いた試みは、スクウェア・エニックスさんも『ポートピア』でご苦労されたのではと思います。AIの生成結果を直接出力すると会社として受け入れがたいものになってしまうことがあるので、一段階内側に押し込めてゲームをプレイさせようという試みですね。リスクマネジメントをしながら、可能性をさらに広げるアプローチだと思います。

GPTを使用したテキストからのモーション生成
こちらも言語をそのまま言語としては扱わず、キャラのモーション生成に活かせないかという研究。モーションの動きをインプット~エンコーディングすることで表現を作り上げ、どの順番でどのモーションが再生されているかのシーケンスを学習させることで、さまざまな動きを無理のない順番で再生できるようになるのではないかという研究です。
長谷この論文で用いられているVQ-VAEは最近のものではありませんが、それとGPTをかけ合わせることで最新の技術によるものより高いクオリティの成果物を実現できています。「既存の技術を組み合わせて最新技術を超えるものを生み出せている」のが注目すべき点ですね。

ChatGPTを活用したレベル生成
ここでいう「レベル」は、地形やステージなどを指す言葉です。ChatGPTにプロンプトを仕込んで『アングリーバード』のフォロワーゲーム『Science Birds』の2Dステージを生成させる研究があり、いかにうまくステージを作らせるかというコンペティションも行われました。
長谷コンペということで審査には明確な基準がないといけないので「アルファベットをかたどったステージを作らせる」というルールが採用されました。開発者が自分の意図を正確にAIに伝えるメソッドが確立されれば、今後のゲーム開発でも役立つのではと思います。

人間とGPTによるコンテンツ生成
生成を完全にAI任せにするのではなく、臼と杵で餅をつくかのようにAIと人間が交互に手を入れ合う生成方式の研究。人間参加型のAIシステム「Human-in-the-Loop」とも呼称される、AI活用法のひとつです。
長谷こちらも、テキストからレベルを作る試みのひとつです。人が適宜手を加え、AIがそれを学習してより優れたコンテンツを作れるようになれば、人は他のクリエイティブに一層集中できるようになるのではと期待しています。

エージェントの社会的活動を創発する
人間がするような行動・慣習などを言語でのみ理解しているAIキャラが、仮想空間上の集落で生活しながら同じことをできるかという研究。通常はエージェント・ベース・モデルと呼ばれる自律的なモデルを用いて行われるシミュレーションですが、言語モデルで同じことができると実証されました。
長谷限られた枠の中で生きるキャラに行動のバリエーションを持たせるのに有効な方法だと思います。AIの行動や欲求を見て実装した方がよさそうなシステムを絞り込むなど、ゲームをより豊かなものにするテストプレイにつながっていくかもしれません。

2Dアニメーション自動生成
連続的に再生するとアニメーションしているように見える一連の画像を生成させる試み。トレーニングデータとして動いている絵を学ばせることで、まったく異なるイラストを見せてもそれをアニメーションさせるような絵を生成できるようにします。
倉林Stable Diffusionのプラグインとして制作されたAnimateDiffという動画作成機能が基になっています。まだ1~2秒あるかないかという程度のフレームしか生成できませんが、画像生成AIが時間軸という概念を獲得しつつある第一歩として非常に重要だと思っています。

セミナーの最後はフリートーク形式で進行。モデレーターを務める日経BP 野々村洸氏の問いかけをまじえながら、「生成AIはゲーム開発の助けとなるのか」というテーマへの答えが語られました。
三宅今までは人間がコンテンツを作ってそれを組み合わせるのがゲーム開発だったが、これからは生成AIに何かをずっと作らせて、優れた部分を人間が切り出して形にするような、AIを中心にすえたゲーム開発の形があってもいいかもしれない。AIは開発の在り方を変えるかもしれないと思います。
倉林私もその通りだと思っています。AIを用いた何らかのシステムを実用化する時に陥りがちなのが、「AIは文脈が読めない/細かいところまで手が届かない/精度がよくない」というようにできない方にばかり注目してしまうことです。
そうではなく、AIの何がすばらしいのかというと24時間365日、10万回100万回とダメ出ししてもメンタルが折れないところです。「何かをひたすら作り続けなさい、いいものができたら採用してあげるかもしれないよ」という命令を人に下すことはできません。でもAIにさせるのは問題ありません。そこが第一歩でもいいと思います。AIは“割と雑なシステム”なんです。
伊藤人間側も、そういう指示の出し方にいかに慣れていくかが重要になるかもしれません。生成AIにただ1万枚描かせて人が良し悪しを判断するのではなく「1万枚描いたら最良の3枚まで絞ってみましょう」というところまでAIにさせることができるか。実際に、そういう取り組みをしているところはあるでしょうか?
倉林弊社がAIを最初にデバッグで活用した理由は、バグは評価が簡単だからというのがあります。たとえば、セグメンテーションフォルトを起こしたら間違いなくバグですよね。そのように評価関数が明確な局面で用いるのは、機械の使い方として悪くないと思います。
野々村これまでにも人狼ゲームにAIが用いられたりした例がありました。今日のセッションで言及されたような「大規模言語モデルによるゲームマスター」というのは具体的にどう変わってくるのでしょうか?
倉林大規模言語モデルの最大の特徴は「自然言語でしか表現されていなかった知識を持っている」ことです。「ゴブリンは弱いけど、オーガは強い」。言葉で表すのは簡単ですが、エンジニアがプログラムで再現するのは大変です。HPや攻撃力を高くしたりなど、パラメーターで表現しなければならない。
しかし、大規模言語モデルならその概念を言語で持っています。つまり「ここはプレイヤーを怖がらせたいからオーガを出そう。ゴブリンでは役者不足だ」という判断をできるんです。
野々村倉林さんからは「人はリリースされているゲームをすべてはチェックできない」という議題が上がりました。やはり、ゲームを開発する際はできるかぎり多くのゲームを知っておきたいと感じるものですか?
伊藤アイディアは既存のゲームと被っていないに越したことはないので、多くの人がプレイしているゲームに関する知識は持っておきたいです。AIによってその知識を補えるなら魅力的ですが、実際にプレイすることなく(プレイしたような)知見が得られるかというと疑問も残ります。
長谷ゲームを開発している時によく考えるのは、プレイヤーにストレスをかけないルールや作法は(先行してリリースされている)他のゲームを見習いたい、ということです。また、オリジナルの要素を入れる時も、独自性があることを確認できれば安心して開発を進められます。
伊藤アナログスティックを上に倒した時にカメラは上と下のどちらに動くようにするべきか、メニューを開くのはどのボタンがいいかなどは、自分がプレイしたタイトルに依存しがちですしね。すべてのゲームに関する知識を持つAIが「メニューを開く時に押すボタンはこれが多い」と教えてくれたら、その情報はすごく貴重だと思います。
倉林「ここのステージで行き詰まってしまう」、「メニューのここで引っかかってしまう」などの情報が分かれば、やっぱり作り方が変わってくるのではないでしょうか。
野々村それでは最後のまとめとして、結局のところ生成AIはゲーム開発に活かせるのでしょうか?
三宅小規模な現場やアーティストがいない現場であればコンフリクトがなくていいかもしれません。生成AIでどこまでクオリティを上げられるかという疑問は残りますが、2、3人のチームでも結構大きな規模のゲームを作れるのではと思います。
今はまだ変化の対応に備える猶予期間という感じですが、今のうちに大手企業も生成AIにどう取り組むかを真剣に考えていく必要があると思います。
長谷生成AIは将来的にゲーム開発を大きく変えると思いますが、ユーザーがそれに価値を見出してくれるとはかぎりません。もしかしたら、まったく同じ絵でも人が生み出したかAIが生成したかで価値が変わることもあるかもしれません。
伊藤現時点では法的リスクや社会的リスクを払拭しきれるものではないと思っていますが、今後はそうした考え方も変わっていくのではないでしょうか。
倉林生成AIは、ゲーム開発の現場というより社会全体を変えていくと思います。年長者が持つノウハウを若者がすべて継承するのは難しいですが、生成AIであれば30年後、40年後でもノウハウの損失を防いでくれると思います。