
2021年もオンライン開催となったゲーム開発者向けカンファレンスCEDEC2021、「ゲーム産業における対話キャラクター人工知能技術の発展」レポートをお届けします。
登壇者はスクウェア・エニックスのリードAIリサーチャーである三宅陽一郎氏。『ファイナルファンタジーXV』ではリードAIアーキテクトを担当した経験を持つAI関係に造詣が深い人物です。本セッションはゲーム産業における対話エージェントの歴史解説。スクエニの『ワンダープロジェクト』シリーズや、最終的に対話エージェント技術のロードマップを示します。
対話エージェントの一般論
ゲームの面白さについてAIが果たす役割は大きなものがあり、図で現すとキャラクターなどのビジュアルやインタラクションの面白さ、そして第3の軸として人工知能がもたらす深みがあると説明します。人間と人工知能の関係性を現すと、人間だけでなく人工知能にも意識/無意識が存在し、単に言葉や身体を通じたものだけでなく相手を実在的に思う「知的な実在性」に始まり、無意識的なものや身体的なもの、環境的な様々な実在性による複数のレイヤーで結ぶことでリアリティを増しています。


対話エージェントは、学術的に現すとテキスト会話を行うだけのエージェントですが、スライドの真ん中より下の身体を持って身振りと会話を、さらに自分自身で行動する自律型が該当します。

ゲームには、ゲームプレイに関わる「ゲームAI」と開発に関わる「ゲームの外のAI」があります。ゲームAIはメタAI(ゲーム全体を俯瞰的にコントロールする)やキャラクターAI(キャラクターの行動判断)、スパーシャルAI(空間的認識を行う)などが実装されていますが、ゲームの外になると自動バランスAIやQA-AIなど数多くの物が存在します。

物語的ゲームとアクションゲームにおいてそれぞれ必要とされるAIは異なります。物語的ゲームならレベルスクリプトが、アクションゲームならナビゲーションAIと完全に異なっていますが、キャラクターAIの行動判断も少し違います。


近年では両者が融合しており、メタAIとキャラクターAI、そしてスパーシャルAIの3つが存在し、俯瞰的に見ると様々な系譜を辿りながらMCS-AI動的連携モデルへ繋がっています(MCSは、それぞれメタAI、キャラクターAI、スパーシャルAIの頭文字)。「全てのAIが自律型となり連携する」ものはハイエンドのゲームにおいて全てにありますが、ローエンドでは限定的です。


エージェントは自律/対話型とり、対話型は選択肢に反応するものからコマンドを解釈出来るなどなど、細かな部分になればなるほど難易度が上がります。


人と人工知能の対話で難しいのは雑談です。それらに会話ジャンルに対してのアプローチも存在しており、大/中/小のディープラーニングやニューラルネットワークでのコネクショニズムがあります。


オントロジーは概念体系となるもので、例えばRPGで魔法の体系を作り「良い感じに魔法で攻撃して」と指示すれば、そこからAIが自身のステータスや相手の状況を理解し最適に近い行動が理解できるようになります(これを活用すれば簡単にAIを組めるとのこと)。またフレームベースの考え型では、プロファイルデータを作り今までやってきた情報を貯めることで、特殊な会話も作り出す事が出来ます。


歴史的に見ると対話エージェントは、1966年にはメインフレームで動くEliza(イライザ)が登場し、以降様々な形で移植を繰り返しテキストベースのRPGである『Dungeon』に合流しています。これら対話エージェントが主流だった時代においてのゲームでプレイヤーは、キャラクターと話し合うのでなく語りの主体であるゲームシステム(インタラクティブストーリー)そのものと対話します。


ゲームにおける対話エージェントの歴史ーAIから生まれるナラティブ
70年代初頭は一般の人がコンピューターを気軽に触れられる環境がまだできておらず、人が進行を司るゲームマスターを主に据えて、紙などテキストを用いて遊ぶテーブルトークRPGが主流でした。後に人間のゲームマスターをコンピューターにすげ替えたデジタルゲームの誕生などを考慮すると、ゲームは対話エージェントから発展している側面もあります。


過去からみればキャラクターはテキストで反応を返すだけの存在でしたが、それ以降身体を持ったことで物理的なインタラクションを持てるようになり、現在において物理・身体・会話の3軸を手に入れたことで深みが生まれます。また通常のキャラクターが迅速な身体運動によって表現されるなら、対話エージェント側は「変化に富む会話」によって楽しみを与える存在です。


ゲームの語り方もキャラクターが間を挟むことで変化します。かつては「語りの主体(ゲームシステム)」が直接プレイヤーに応答していましたが、途中にキャラクターが加わることで語り手(ゲームシステム)との分離が起こり、キャラクターの行動が間接的に物語を描く(直接的でない行動で物語を語る)ナラティブがシステムとして発生します。





AIの思考チャートー『ワンダープロジェクトJ』と『J2』の場合

コミュニケーションアドベンチャー『ワンダープロジェクトJ』は、1994年のSFC向けにエニックスより発売されたタイトルです。過去の資料をサルベージするSAVEプロジェクトにおいて、AIについての仕様書が完全な形で現存しています(CEDEC2021におけるSAVEプロジェクトの講演レポ記事はこちらから)。『ワンダープロジェクトJ』のAI仕様書は開発時期においていくつかバージョンが存在し、スライド左が初期の物で右が最終的なものです。


開発の初期段階はAIを自発的に行動をさせて、ユーザーが褒めたり止めて欲しいなど行動を促していましたが、中期ではよりシンプルなフロートなり、後期には刺激物から様々な行動を行うと教育となるという行動が無駄にならないパターンへと変化しています。これをゲーム内エージェントとの会話に置き換えてみると、AIキャラクターとゲームシステムの2つと対話する2重構造になっています。


このN64で発売された続編の『ワンダープロジェクトJ2』のAIプランは、前作よりあまり変わっていませんが開発が進むにつれて精密化されています。この仕様書では誘導/保留の分岐後に、アイテムやイベント、アイドリングの結果からプレイヤーが評価(褒める、叱るなど)することで一巡。他にも、理解/記憶情報が変化することで頭脳が発達していきます。それらのことから、『ワンダープロジェクト』は、『The Sims』に先駆けて極めて早い時期にキャラクターの内面/学習モデルを打ち立てたはじまりの一つです。










90年代にニューラルネットワークや遺伝的アルゴリズムを使用したタイトルたち
1996年に発売されたMillennium開発の『Creatures』はキャラクターを学習させるだけのゲームです。先の『ワンダープロジェクトJ』と同じように物の使い方を学習させるだけですが、8000ノードのニューラルネットワーク(ディープラーニングでない)を持っています。


1998年にエニックスより発売された『アストロノーカ』は究極の野菜作りを目指すゲームです。プレイヤーの畑を襲いに来るバブーは遺伝的アルゴリズムによって発展する特徴を持っています。このバブーは単体が発展するのでなく集団が成長し、パラメーターを遺伝子として持ち、それらが掛け合わせることで新世代が生まれます(前の世代で優秀だった単体が比較的高い確率で親になるルーレット方式)。またスライドの解説は森川幸人氏の論文がベースです。

このバブーは初期状態において農場でプレイヤーが設置したトラップに多く引っかかりますが、遺伝的アルゴリズムによって優秀なパラメーターを持つ因子が生き残ります。ゲームに登場するバブーは1体ですが、裏で20体ものバブーが同じトラップバトルを行い、プレイヤーが体感できる進化を裏で演算しています。『アストロノーカ』も遺伝的アルゴリズムを使用したタイトルとしては極めて完成された例と評価します。

次は1999年にDCでセガより発売された『シーマン』です。会話型エージェントは人工知能学会での注目や社会的な需要でも求められていますが、現時点のエージェントでも自然な会話するまでに至っていません(ディープラーニングで学習させても上手く自然な形にならないとのこと)。その点『シーマン』は20年も前の作品にも関わらず自然な会話が出来ていた事に言及があり、三宅氏は開発者である齋藤由多加氏へのインタビューを行っています。

インタビューの結果によれば、齋藤氏からみると最近の会話エージェントは正確な情報を常に返そうするための検索エンジンのように感じており、知らなかったら「知らない」や「マジか…」と言えばより自然では?と答えたことで新たな知見が得られたと語ります。

続いては前述で言及された2000年にEAから発売されたMaxis開発の『The Sims』です。『The Sims』ではUtilityベースのAIが設けられており、ゲーム全体のMeta、キャラクターのPeer、シミュレーションのSubと3つに別れています。また『The Sims』においてパラメーターはオブジェクトに仕込まれており、キャラクターはモチーフエンジンから精神パラメーター行動することで変化します。また、ゲームシステムとAIキャラクターがより緊密にあることからナラティブの発生源はより直接的なものです。






『ファイナルファンタジーXV』はMCS-AI動的連携モデルを実装しており、メタAIが無ければ一直線にプレイヤーに集まりますが、メタAIが調整していると様々なプロセスから自然に見えるよう手順を踏んでいます。


会話は台本システムを用いており、台本を候補からそれぞれのキャラクター向けにアサインを実行。他にも、Face-to-Face対話システムやメタAIによる移動会話など、会話の位置取りについても同様のプロセスで進行しています。本作におけるナラティブの発生は敵や味方のキャラクター達による間接的なものです。


これらの系譜をまとめると対話エージェントは「Eliza」を発祥とし、テキストアドベンチャーから『ワンダープロジェクトJ』などの「箱庭・シム系」、『シーマン』などの「対話・キャラクター育成系」、そして『L4D』や『FFXV』などの「ゲーム内会話系」の3つに別けられます。

近年盛り上がりを見せるゲーム分野以外のエージェント研究
ゲーム分野以外の対話エージェントは近年盛り上がっており、Twitter上で会話を学習する「KELDIC」がその筆頭です。また直近だと2019年にゲームを題材としたエージェントが多数登場しています。

Microsoftならテキストアドベンチャーゲームを題材に言語学習するエージェント「TextWorld」や、Facebookによる『Minecraft』でAIアシスタントする「CraftAssist」などがあります。他にもカーネギーメロン大学で『Minecraft』の教科学習コンテストを実施しています。

対話エージェントの「これから」
ゲームにおけるエージェントは独自の進化を遂げる一方で、学術分野は対話エージェントが中心です。その中の、第3の流れとしてゲーム産業以外の対話エージェントも台頭しつつあります。それら3つの流れにおける相互作用を働かせるのが今後のゲーム産業として重要です。



対話エージェントは引き続き学術分野側が上手く掘り下げていくことが予想できますが、ゲーム側では見えない語り手であるゲームシステムとプレイヤーの触れあい(インタラクション)であるため、ゲームシステムと一緒にエージェント(AI)を研究しなければ本質を見失ってしまうと語ります。

そのため対話の意味は「言葉」だけに限定するもので無く、見えない形の物語的語りかけ(ナラティブ)を考えなくてはなりません。そして現時点でのロードマップは、スライド中央に位置しており、20年代後半にはキャラクターとユーザーが自律的にインタラクションすると考えていることを語りセッションを終えました。
以上がゲームと対話エージェント(AI)の関係と発展の過程が語れた本セッションの内容です。ゲームの構造をある程度抽象化しつつ分解し、ゲームシステムとプレイヤー、そしてキャラクターの関係を浮き彫りにし、各タイトルがもつAIとプレイヤーの関係性や、ゲームにおけるナラティブの発生源の位置もタイトルやコンセプトによって異なりますが具体的に語られたことが印象に残ります。
特に詳しく語られたのは『ワンダープロジェクトJ』と『J2』の仕様書。これらは過去作のサルベージプロジェクトで発掘されたものであり、過去作の資産を活かすことが過去に行われた施策の評価を可能にしていることにも気付きます。また『ファイナルファンタジーXV』への言及もみると、過去のスタッフインタビューで語れているようにスクエニのマイルストーンであり、新たなスタート地点である事が解る内容でした。