Build a Real-time AI Model to Detect Toxic Behavior in Gaming - The Databricks Blogの翻訳です。
ソリューションアクセラレータとは、Databricksがお客様との協働を通じて生み出したソリューションをベースにしたサンプルノートブックです。
マッシブリー・マルチプレイヤー・オンライン・ビデオゲーム(MMO)、マルチプレーヤー・オンライン・バトルアリーナゲーム(MOBA)などオンラインゲームにおいては、プレーヤーは共通のゴール、勝利に向けて協働あるいは競争するために、リアルタイムでやりとりをします。この相互コミュニケーションは、ゲームプレイのダイナミクスの根幹となるものですが、これは同時に有害行為の主要なきっかけとなっています。これはオンラインゲームの世界で広く知られる問題となっています。
マルチプレーヤーゲームのDead by Daylightで確認されたやり取りのタイプを列挙したBehaviour Interactiveから提供された以下のマトリクスのように、いじめ、セクシャルハラスメントなど、有害行為は様々な形で行われます。
図1:プレーヤーが経験した有害行為のマトリクス
ゲーマー、コミュニティに対する有害行為が見過ごせない問題となるという警鐘に加え、多くのゲームスタジオに求められるボトムラインとなっています。例えば、Michigan State Universityによる研究では、プレーヤーの80%は有害行為を体験しており、彼らの20%はこのことによってゲームをやめたと報告しています。同様に、Tilburg Universityの研究においても、最初のプレイで有害行為に遭遇した場合においては、三倍以上のプレーヤーがゲームをやめて戻ってこないとのことです。特にゲームの提供形態が物理的なメディアの提供から長期にわたるサービスへと変化したことで、多くのスタジオにとってプレーヤーの維持が最重要事項になっており、このような有害行為が抑制されるべきであることは明らかです。
この問題が解約に関係することに加えて、いくつかの企業においては、ローンチ前の開発初期段階での有害行為の問題にも直面しています。例えば、AmazonのCrucibleにおいては、有害なゲーマー、やりとりをモニターし、管理するシステムがなかったため、テキストやボイスチャットなしでテストを行いました。このことは、多くのチームがレポートや、有害行為への介入を行う能力を、デーム空間の規模が遥かに上回っていることを意味しています。このため、開発ライフサイクルの初期段階から分析機能をインテグレートし、有害行為に対する継続的管理の設計を行うことが、多くのスタジオにとって重要なことになっています。
ゲームにおける有害行為はビデオゲーム文化の一部となっており、様々な側面を持っているため、単一の方法で対応することはできません。しかしながら、有害行為の頻度と自然言語処理(NLP)による自動検知の機能を考慮すると、ゲーム内チャットにおける有害行為が大きなインパクトがあると考えられます。
Databricksによるゲーム有害行為検知ソリューションアクセラレータのご紹介
Google Jigsawの有害なコメントデータとDota 2のゲームマッチデータを用いて、このソリューションアクセラレータでは、NLPとお使いのレイクハウスを用いて、リアルタイムでの有害コメントの検知に必要なステップをウォークスルーします。NLPに関しては、このソリューションアクセラレータは、John Snow Labsによって提供されるApache Spark™上で動作するエンタープライズレベルのオープンソースSpark NLPを活用します。
ソリューションアクセラレータでウォークスルーするステップは以下の通りです。
- Delta Lakeを用いてJigsawとDota 2のデータをロード
- マルチラベル分類を用いた有害コメントの分類(Spark NLP)
- MLflowを用いたエクスペリメントのトラッキングとモデルの登録
- バッチ、ストリーミングデータに対する推論
- ゲームマッチデータに対する有害行為のインパクトの検証
ゲーム内チャットにおける有害行為の検知
このソリューションアクセラレータを用いることで、ご自身のゲームに簡単に有害行為検知を組み込むことができます。例えば、以下に示しているリファレンスアーキテクチャは、どのように、ストリーム、ファイル、音声、オペレーショナルデータベースなどの多彩なデータソースからゲームで板やチャットを取得し、Databricksを活用して、データの取り込み、蓄積、整形を行い、機械学習(ML)パイプライン、ゲーム内MLで用いる特徴量テーブル、分析に用いるBIテーブルに変換し、さらには、コミュニティのモデレーションに用いられるツールと直接統合されているのかを示しています。
図2:有害行為検知リファレンスアーキテクチャ
コミュニティにおける有害行為を検知するためのリアルタイム、スケーラブルなアーキテクチャを手にすることで、コミュニティリレーションシップマネージャーのワークフローをシンプルなものにし、数百万のやりとりを管理可能なレベルにフィルタリングする能力を手に入れることができます。同様に、深刻度の高い有害なイベントに対するリアルタイムアラート、プレーヤーのミュートのような対応の自動化、問題に迅速に対応できるようにCRMに警告といった取り組みによって、プレーヤーの維持に直接的なインパクトをもたらします。また、様々なソースから得られる大規模データセットを処理できるプラットフォームを持つことで、レポートやダッシュボードを通じてブランドの受容度モニタリングに活用することもできます。
ソリューションアクセラレータを使ってみる
このソリューションアクセラレータのゴールは、ゲーム内チャットの有害なコメントをリアルタイムで検知できるようにすることで、オンラインゲームでの有害なやりとりに対する継続的管理をサポートすることです。お使いのDatabricksワークスペースに、ソリューションアクセラレータをインポートして使い始めてみませんか。
インポートを完了すると、実運用で活用できる二つのパイプラインのノートブックを利用できるようになります。
- Google Jigsawから得られたリアルワールドの英語データセットに対してマルチラベル分類を行うMLパイプライン。
- 有害行為検知モデルを活用したリアルタイムストリーミング推論パイプライン。このパイプラインのソースは、あらゆるデータソースから得られるチャットデータを取り込むように容易に変更できます。
これらのパイプラインによって、最小限の労力で有害行為を理解し、分析する取り組みをスタートすることができます。このソリューションアクセラレータは、モデルを構築し、ゲームの構造やコミュニティに適したデータでモデルを改善、カスタマイズするための基礎も提供しています。