画像認識は実際のゲームにどのように活かされているのでしょうか。CEDEC2010では「画像認識技術とゲーム・インターフェイス」と題した講演が行われました。昨年度のCEDECで行われた同名の講演をステップアップさせた内容で、前回と同様のわかりやすい解説に会場の満足度も高かったようです。株式会社ソニー・コンピュータエンタテインメント JAPANスタジオ テクノロジー部の掛 智一氏は昨年度の講演を「画像認識とは引き算である」と要約します。現在の画像から過去の画像を引くことで、差分(この場合はどこが動いたか)を求めることができます。これはプレイステーション2の「EyeToy」で使われる「動き差分」と呼ばれ、低負荷と高い安定性でゲームに向いた処理となっています。プレイステーション3の「EyePet」(日本版は「Me&My Pet」)はカメラで写した現実の風景にAR(仮想現実)のペットを合成、ペットに触ったりするコミュニケーションが楽しめます。当初は動きを検知するのに「背景差分」と呼ばれる方法が使われたものの、カメラからの情報はゆらぎだらけであり、たとえば絨毯の毛先がずれようものなら、それをすべて検知してしまう・・・という具合で数分も経つとノイズでいっぱいになったそうです。ここで「EyeToy」と同様の「動き差分」に回帰し、「スイッチが画面に敷き詰められている」というイメージの元で「動いているものに興味を示し、視線を動かしたり飛びついたりする」バーチャルペットの世界が作り出されました。バーチャルペットをなでるというと繊細な処理を連想しますが、実は大きな領域へ「非常に粗い処理を行っている」のだそうです。ペットの位置に応じてスイッチ(触れると変化をもたらす部分)が変化しているのですが、スイッチを細かくしても心地よさは出てこず、粗い方が人間にはユーザーフレンドリー。人間はいつなでるのをやめるか、いつ強くなでるかが分からないため、バーチャルペットの動きにはいつでも止められるアニメーションが採用されているそうです。「EyePet」ではカメラにかざすと画面内にバーチャルなアイテムが出現する「マジックカード」が使われています。カメラはカードがどこにあるかという情報を奥行きまで検知できるのですが、「EyePet」ではあえて用いられていません。たとえばバーチャルなボールを「マジックカード」の上にのせるという遊びがあったとして、「マジックカード」の奥行きまでチェックしていたのではゲームとして面白いものにはならないという判断なのだそうです。逆に、「マジックカード」の位置は問うが、奥行きは関係ないというゲームデザインならきちんと遊べるものになるそうで、奥行きは検知できるものの、あえて平面世界にとどめるということも重要だと掛氏は締めくくりました。ソニー株式会社 システム技術研究所 リサーチャーである横野 順氏は「物体認識」という技術に関して解説します。「マジックカード」をカメラで認識するには、前述の引き算方式だと困難です。角度が変わったり、時に一部が隠れたり、照明の具合によってカードの見え方が変化するからです。そこで使われるのが「物体認識」。たとえば駐車場に停められたたくさんの車を見て特定の一台を認識する、逆に異なる車種のいろいろな車を見て「これは車である」と認識するといった技術のことです。「物体認識」のトレンドは輪郭を見る線画マッチング、画像全体を見るグローバルマッチング・・・と時代と共に移り変わりましたが、2000年代のトレンドは画像の一部の特徴を見る「ローカルマッチ」。認識のために、ほかにない特徴が現れるであろう場所「特徴点」が使われます。「特徴点」は物体や図形のコーナーが用いられ、さらにコーナー周辺の画像パターン(局所特徴量)をあわせることでより正確な認識が可能となります。たくさんのポイントの「局所特徴量」を保存することで、物体の一部が隠れていたりしても認識することができるのです。どんな車種の車を見ても「車」と認識するような認識は「物体カテゴリー認識」とも呼ばれ、大量のデータを与える統計学習によって精度が高められるのだそうです。「物体認識」のトレンドは年と共に変化しており、今後は「関節を持つ動物の全身を認識する」「空は上にある・車は道路にあるといったコンテキスト(文脈)を使った認識」「奥行きを認識する」「一つの認識エンジンで車や人間の顔、ビルなど多くの物体を認識」することなどがトレンドとなっていくそうです。
「高くても売れる」PS5 Pro効果でハード販売23%増―新CEOが描くソニーの"脱コングロマリット"戦略【ゲーム企業の決算を読む】 2025.2.21 Fri ソニーのゲーム&ネットワークサービス分野(以下ゲーム事業…