1. はじめに
みなさま、こんにちは。「Customer & Product Satisfaction部(CPS部)」です。
我々の部署はゲーム事業からVtuber事業まで、グリーグループ全体の多岐にわたるプロダクトの品質を担保しております。開発と近い距離で対応することで品質に貢献し、お客さまに安心安全なサービスを提供することを目指しております。組織はQAグループ、CSグループ、RQC(Regulation & Quality Control)グループの3つのグループで構成されており、3つのQAチーム、2つのCSチーム、審査チーム、監査チームから成り立っております。それぞれの役割は以下になります。
本記事は、2025年を締めくくるにあたり、QA3名(@bug-taro、@QA_nomo、@QA_Koo)、CS2名(@CS_YO、@ryusei55)、審査1名(@sanshi)、監査1名(@vampire_0305)の7名のMgrと部長(@shumai-hime)が集まり行った「2025年のAIの進化に対して、各部門の活用事例および課題」に関する対談内容です。
※2章の対談内ではQAMgr、CSMgrが複数いるため、QAMgr①〜③、CSMg①〜②と表記しております。

※Google Meetのキャラクターエフェクトを使用しております。
■背景
生成AIは私たちの業務を効率化するだけに留まらず、従来の「人間の手による」品質保証以外の可能性があります。この技術的転換点において、私たちは単にAIを導入するだけでなく、「AIの判断をどう担保するか」という、課題感をもって未来に挑んでいます。その取り組みの成功、失敗を共有することで、業界発展に貢献したいと思い本テーマに決めました。
2. AIの進化に対応したこと
議題:この一年で各チームはAIをどのように受け入れて、次のステップへ向けてどんな戦略的視点を持つ必要に迫られたか、皆さんの本音を聞かせてもらえますか?
審査Mgr:審査チームでやろうとしたことはサービスの企画内容に対する法令判断なんですが、チームメンバーのリテラシーや使い方によって精度が変わってしまい、試してはみたもののあまりうまくはいかなかったっていうところがありますね。AI活用って、判断させるっていう部分が、1番難しそうですよね。
監査Mgr:やっぱりコンテキストを考慮した判断をさせるとなると学習っていうのがまず入ってくるから、より時間もかかるし難しいなって感じています。
QAMgr①:ゲームタイトル固有の判断になると、そもそも開発部署の仕様を細かくデータとして上げないと正しい回答、求めている回答はでないですよね。
審査Mgr:プロンプトを考えるのに時間がかかるので、結局効率化につながらなかったところがありました。だったら自分で判断しちゃった方が早いという。特にゲームの仕様をプロンプトで理解させるのがハードルが高かったです。事前に仕様をちゃんとAIにインプットすれば精度は上がるかもしれないんですが、情報を断片的に入れるだけだと、AIもなかなか理解してくれないと思っていて。
ゲームサイクルをきちんと整理してから読み込ませれば、AIの理解度も上がりそうな気はするんですが、そこはまだ試せていないです。ゲームサイクルや仕様書を作ってもライブサービスゲームって機能もどんどん追加されていきますし、実装工数と天秤にかける必要があるのかなと思っています。
QAMgr②:私のチームでは、AIを使った自動化をエンジニアと連携してある程度実用するところまでは進めています。繰り返し行うテストを自動化することで効率化に繋げていますね。あとは外部協力会社と連携して不具合チケットの起票の AIによる効率化を試しています。
QAMgr③:私のチームでは、自動化やAIの新たな活用方法を模索してはいるものの実務に導入するまでには至っていない状態で、まずはチームメンバーが新しい技術に対するインプットを補完する目的でAIを使用しています。つまり今はAIを自由に使ってもらってリテラシーを上げていこうという段階です。今後AI活用における効率化をしていこうという時に、自身が使い方が分からないとできないみたいな状態になってしまうので、それを防止するために教育してるっていうのが今期の取り組みでした。ですがAIに頼りすぎてしまうことで、自身が思考しなくなる懸念もあり、どうやってAIと付き合っていくのかを考えることも必要と感じています。
QAMgr①:テストの自動化と AI 活用とどっちを選択すべきだったのか。AIが「絶対に良かったね」と言える状況かというと、まだそこまではいってない状況だと思ってます。
テストプロセスで一番工数がかかっているのは、やっぱりテスト実施かなとは思っているんですが、そこに対してはまだ十分にメスを入れ切れていない、というのが本音ですね。ただ、AIを取り入れていきたいとは思いつつ、正しく見極めてAIを導入しないとかえって品質を下げてしまうことにつながると思っています。なので、「これはAIの判断には任せられる」と判断するのであれば、品質面で影響がないと考えられる根拠を合わせて示す必要があると考えています。
CSMgr①:CSチームとしては、まず海外からの問い合わせ内容に対する翻訳および要約の活用に着手しました。あわせて、カスタマーサポートに必要なプロダクトの仕様情報やオペレーションルールをAIに読み込ませ、Slack上で質問すると回答が返ってくる仕組みについても検証を進めています。
前者については、各ゲームごとに異なる専門用語に加え、お客さまが略語や独自表現を用いるケースも多く、内容の正確な把握や関係部署への共有にあたって一定の時間を要していた、という背景があります。
後者についても、CS対応者が細かな運用ルールやゲーム仕様を確認する際、必要な情報にたどり着くまでの検索、確認作業に多くの工数がかかっており、こうした負荷を軽減できないかと考えたことが取り組みのきっかけでした。
また、AIを活用すれば、コード生成など比較的簡単にアプリを作ることもできるので、CSオペレーションの効率化を目的としたアプリ作成などの取り組みもテスト的に始めています。例えば、AIを利用して自作したアプリの例でいうとこの記事でご紹介したようなアプリがありますね。
CSMgr②:その他にも、個別の業務としてレポートをまとめる際にAIを活用し、要点整理や文章化を行うこともあります。具体的には、お問い合わせのデータをAIに読み込ませ、お問い合わせの多いものをピックアップしてもらったり、内訳を分析してもらったりしています。もちろん分析のクオリティに課題はあるものの、プロンプトである程度の前提情報を充実させたり、何をアウトプットしてほしいかを明確にすることで、おおよその傾向をつかむくらいの分析は一瞬でできるようになりました。障害発生で大量のお問い合わせを受信したときなど、実際に役立つ場面もありました。現時点では組織として取り組んでいるものと、個人で活用しているものがそれぞれありますが、現在進行形で活用の幅を広げている状況だと思います。
監査Mgr:各グループ AI を積極的に使おうとはしているけど、効果が出始めるのはこれからなのかなと思っていますし、今は AI をどんどん活用していきましょうっていうチャレンジしやすい環境を提供していくのがよいかもですね。
部長:何のために AI を使いたいのか、目的には都度立ち返ったほうが良いのではないかなという気がしますね。『AIを使うこと』が目的ではなくて、 プロダクトの品質をあげたいとか CS のオペレーション工数を減らしたいとか、さらに言えば工数を減らした結果、本当は顧客満足度を上げるために時間を使いたいとか。AIに翻弄されないよう、そこは気をつけるポイントかと思ってます。とはいえ、まずはAIで何ができるか触ってみないとあたりもつかないので、そことのバランスでしょうか。
3. 対談でみえた各部門の活用事例と課題
CSグループ
- 翻訳:海外言語の問い合わせ内容の翻訳とその要約にAIを活用
- ナレッジ検索:プロダクト情報や運用ルールを学習させたAIをSlack上で運用。担当者が質問を投げかけると回答が返ってくる仕組みを試行中
- 業務効率化アプリ作成:コード生成AIを活用し、CSオペレーションを効率化するためのアプリ作成をテスト的に開始
QAグループ
- AIによる自動化:AIエンジニアと連携し、プロンプトベースでのテスト自動化を試行
- 外部連携と効率化:外部協力会社と連携し、AIによるレビューや効率化
- テスト活動の効率化:静的テストに対してテスト観点抽出、不具合起票や再発防止策の検討
RQC(審査/監査)グループ
- 不当表示チェック:スキル表記文の不当表示リスク抽出をAI化。判断は人の目を入れるが、各資料の確認などリスク抽出をAIが行うことで効率化を実現。生放送台本等他の媒体への横展開を検討
-
人間の判断の代替困難:審査Mgr、監査Mgr、QAMgrが共通して指摘している点はAIに人間の判断を代替させるには、まず「学習」が必要であり、非常に時間とコストがかかることです。特に、文脈や背景を理解した上での判断はAIにとって最も難しい領域です。
-
データ入力とプロンプトの複雑さ:審査Mgrが指摘するように、AIが正しい回答を出すためには、前提となる仕様やデータを細かく、かつ構造化してインプットする必要があります。特に、仕様が頻繁に変わるライブサービスゲームでは、この作業自体が大きな負担となり、効率化という本来の目的を損なう可能性があります。
-
リテラシーと教育の必要性:審査チームの失敗事例が示すように、AIの性能を最大限に引き出すには、ツールを操作する人間のリテラシーが不可欠です。QAMgrのチームのように、組織としてリテラシー向上に取り組むことが、将来の成功の鍵となりそうです。
-
思考停止への懸念:QAMgrが懸念するように、AIの利便性は、従業員が自ら考えることを放棄するリスクと表裏一体です。効率化を追求する一方で、人間の思考力や判断力をいかに維持・向上させるかという新たな課題も生まれていると感じます。
4. 今回の対談のまとめと今後の展望
CSグループ
CSでは現行のAI活用の経験を下地とし、オペレーションの効率化にとどまらず、従来の枠にとらわれないCSの領域拡大につながる価値創出にも取り組みを広げていきたいと考えています。
また、若手人材の採用が難しくなる市場環境を踏まえ、限られたリソースの中でも成果を出し続けられる体制づくりが重要であると捉えています。そのため、これまで培ってきた現場の経験や勘所を大切にしながら、議論や改善、意思決定の起点を、よりデータやAIを活用した形へと徐々にシフトしていくことが望ましいと考えています。
一方で、AIのアウトプットは人の判断やフィルタを前提とし、一定のルールを設けながら安全かつ有効に活用できる形を模索しつつ、AI活用によって生まれた工数を、新たな挑戦や前例のない取り組みに充てられる状態を目指していきたいと考えています。
QAグループ
QAでは現在のAI活用が仕様整理のフォローなどといったテスト周辺業務中心であり、テスト業務への活用は一部進んでいるものの、やはり将来的にはテスト業務に踏み込んだ改善を行いたいと考えています。テストケース作成における活用や、不具合情報/障害情報を学習させた上でのテスト観点抽出、マルチモーダルAIを活用した音声/画像/動画などのチェックサポートが例として挙げられます。
また、各テストドキュメントの生成だけではなく、レビューなどの正誤判定をAIに移したいと考えております。今のAI活用の主流は「AIにアウトプットさせ人間が判断する」かなと思いつつ、まずは静的な確認作業の一部をAIに移管することを目指します。
そして先の展望として、ユーザーテストにおいてもAI活用を進めたいと考えております。例えばSNS情報を分析させて市場の流行を察知し、ユーザーテストの結果と掛け合わせて、新しい軸の面白さの見せ方ができないかなどを検討していきたいです。
RQC(審査/監査)グループ
監査チームにおいては、音声・画像・コメントなど多角的なデータからAIが違反を精度高く検知する仕組みを構築し、より安心・安全なプラットフォームの実現を目指します。
また、審査チームでは、広告や情報発信における不当表示リスクの低減にAIを役立てます。具体的には、SNSや生放送の台本、スキルチェックの外部発信情報の精査にAIを適用するほか、企画段階での法令判断や、画像の文字検知による表示検証にもAI導入を目指します。
両チームに共通する最大の目標は、これまで「すべてを人が判断していた業務」を、「AIが懸念点やアラートを提示し、人が最終的な取捨選択を行う業務」へと進化させることです。
5.あとがき
最後までお読みいただきありがとうございます。部長の@shumai-himeです
グリーグループの品管組織でQiitaさんのアドベントカレンダーを書くようになって8年目となりますが、今回は初めて対談形式での記事に挑戦しました。オンライン対談で議事録をAIでとって、記事にして…と進めていたのですが、蓋をあけてみたら初稿はなんだこれ?という仕上がり!結局8割は自分たちで書き直す結果となりました。本題では各チームのAI活用の成功と失敗事例について話をしていますが、実はこの記事自体が盛大なる?挑戦事例であり失敗事例、いえ、次への学びとなる事例であったというオチでした。
今回は8名での対談だったため、一つ一つの事例の深堀ができたわけではないのですが、グリーの品管部門が「何に課題感をもって」「どう取り組んでいるか」が少しでも伝われば幸いです。そして、各社AIと向き合わなければならないこの時代において、自分たちと同じ失敗をする人が減るといいな、そのうえで前に向かって各自挑戦できるといいなという想いでまとめています。
最後の『今後の展望』については、これはAIではなく100%自分たちの言葉でまとめました。未来を作るのはやっぱり人間だー!という夢と希望と良い意味でのプレッシャーを持ちながら締めくくりたいと思います。
2026年も前に進んでいけますように!メリークリスマス!
