アンケートデータは、最も身近に存在するデータの一つです。
しかし、いざ活用しようとすると、なかなか分析が進まない状況に直面することが少なくありません。特に、自由記述のテキストデータは、回答者の生の声が詰まった貴重な情報源である一方で、その分析には大きな壁がありました。
テキストを一つずつ読んで、そこからカテゴリーに分類をしたり、スコアを付けたりする作業は膨大な時間を要します。例えば、数百件のアンケートの自由記述テキストを手作業で分類すると数時間以上かかることも珍しくありません。多くの現場担当者にとって、この時間的コストは現実的ではありませんでした。
しかし、近年の生成AIの発達により、状況は大きく変わりつつあります。それまで人がマニュアルで行っていた分類や判断をAIが代行できるようになり、従来は実行困難と考えられていた分析が、統計やプログラミングの知識がなくても、誰でも簡単に、しかも数分で実施できる時代になりました。
そこでこちらの記事では、AIを活用してアンケートのテキストデータ分析が劇的に変わる、2つの実践的な事例を紹介します。
テキストの自動分類
例えば、オンライン会議ツールの顧客満足度調査で「サービスの推奨度」と「推奨度のスコアを付けた理由」という質問を設け、数百件の回答が集まったとします。
仮にあなたがこの製品の担当者で、この貴重な声を活かして製品改善につなげたいと考えています。しかし、実際に回答を見てみると、「サポート」「価格」「導入」「競合」など、さまざまなトピックが混在しており、どういった話題が最も多いのかなどは、すぐには把握できません。
一方で、手作業で分類しようとした場合、以下のような問題に直面します。
- 膨大な時間がかかる: 数百件の回答を一つずつ読んで分類するのには膨大な時間がかかります
- 継続が困難: 分類に時間がかかってしまうと、継続して分析することが難しくなります
- 分類基準がブレる: 作業を進めるうちに「製品の品質」や「音質」など、粒度は異なるものの同じ内容を表すようなカテゴリーを別の名称で設定してしまうことがあります
また、このような分類を統計や機械学習のモデルを使って行うこともできなくありませんが、そういったモデルを利用するためには、プログラミングのスキルが求められるだけでなく、モデルを構築したとしても、以下のような問題がつきまといます。
- 統計や機械学習のモデルは「トピック1」「トピック2」のように機械的な分類しかできず、後から意味付けが必要です
- データが変わる度に分類結果が変わるため前回との比較が困難です
- 自分が期待していたカテゴリ(例:「価格」「サポート」など)があったとしても、そちらに沿った分類を行うことはできません
結果として、「アンケートは取ったものの、自由記述は眺めるだけで終わり」という状況に陥りがちで、定量的な分析が求められているにも関わらず、「音質の改善要望が多いような気がします」といった曖昧な答えしかできず、データに基づいた意思決定ができません。
このような問題は、AIを利用することで簡単に解決が可能です。しかも、従来のアプローチと比べて圧倒的にシンプルで強力です。
例えば、データの加工、可視化、分析、レポーティングのためのUIツールのExploratoryの「AI 関数」を使うと、「提供された文章に対して適切なラベルをつけて文章をグループ分けしてください」と自然言語で指示するだけです。
すると、AIが各行のデータをもとに最適なグループを生成し、テキストを自動で分類してくれます。
一方で、あらかじめ期待しているカテゴリがある場合は、指定したカテゴリへの分類を以下のように指示するだけです。
すると、AIがあなたの代わりに、各文章を最適なグループに分けてくれます。
このような作業が一瞬で完了するため、これまで5時間かかっていた作業が数分で終わります。どのトピックの話が多いのかを可視化することも、時系列ごとにトピック数がどのように遷移しているかを分析することも、簡単に実現できます。
この手法を使えば、アンケート回収の翌日には顧客の声を分析し、具体的な改善提案を経営層に提出することも可能になります。
センチメントスコアの計算
テキストの分類以外にも、自由記述がどの程度ポジティブあるいはネガティブな内容なのかを数値化したいというニーズもよくあります。
こうした指標は「センチメント(感情)スコア」と呼ばれ、自社製品への平均的な感情スコアを計算したり、どのような回答者がポジティブ・ネガティブなスコアをつけているのか、そういった人たちがどの程度いるのかを分析したりするのに役立ちます。継続的にモニタリングすれば、製品改善施策の効果測定や、顧客満足度の変化をリアルタイムで把握することもできます。
一方でセンチメントスコアを人力で計算しようとすると、テキストのカテゴリーの分類と同じように、膨大な時間がかかってしまいます。さらに、同じ文章であっても、人によってスコアの付け方が変わってしまう問題もあります。
プログラミングを駆使してセンチメントスコアを計算することも可能ですが、以下のような課題にも直面します。
-
二重否定に対応しづらい: 「使いにくいわけではない」のような二重否定を否定的な表現として捉えることがあります
-
ニュアンスを読み取れない: 例えば「やばい」という言葉は、文脈次第で最高の賛辞にも強い批判にもなり、そういった文脈を考慮することにハードルがあります
その結果、せっかく集めた自由記述データも、「ざっと読んで、なんとなくの感触を掴む」程度の活用に留まってしまいます。
このような課題もAIを利用することで解決が可能です。
先程と同じように「AI関数」を使って極性(感情)スコアの計算を指示するだけです。
すると、AIが二重否定や前後の文脈を考慮した上で、適切なスコアを計算してくれます。
さらに以下のように、スコアリングの基準となるガイドを、自社のビジネスや環境に合わせて定義することも可能です。
提供された各文章に対して、-1.0から+1.0の範囲で極性スコアを算出してください。
スコアの基準:
極めてポジティブ(+0.8 ~ +1.0)
- 強い満足や称賛を表す表現
- 問題が完全に解決された状況
- 卓越した性能や品質の言及
ポジティブ(+0.4 ~ +0.7)
- 明確な利点や長所の言及
- 良好な体験や結果の報告
- 期待以上の成果
…
より具体的なガイドを提供することで、よりイメージに近い、精度の高いスコアを得ることができます。
センチメントスコアを計算できれば、先ほどのテキスト分類と組み合わせて、カテゴリーごとのセンチメントスコアを算出することも可能です。
これにより、「機能、導入、サポートなどについてはポジティブだが、価格にはネガティブな反応が多い」といった具体的なインサイトが得られ、優先的に改善すべき領域が明確になり、ビジネスや業務の改善に直接役立てることができます。
また、センチメントスコアの平均値を継続的にモニタリングすれば、顧客の感情が時系列でどのように変化しているかも簡単に分析できるようになります。
まとめ:今日から始められるテキストデータの活用
AIの発達により、アンケートのテキストデータ分析は新しい時代を迎えています。従来は膨大な時間と専門スキルが必要だった「テキストの分類」と「センチメントスコアの計算」が、自然言語での指示だけで実現できるようになりました。
これまで膨大な時間をかけていた作業が数分で完了し、圧倒的な時間の削減が可能になります。これにより、データはあるけれど活用できていなかったという状況から脱却し、アンケートの自由記述から具体的な気付きを引き出せるようになります。
さらに重要なのは、この手法は一度習得すれば何度でも使える「時短資産」になることです。毎月のアンケート分析、顧客の声の可視化、製品改善の効果測定など、様々な場面で繰り返し活用でき、データに基づいた意思決定のスピードと質を劇的に向上させることができます。
本格的に学びたい方へ:アンケートデータ分析トレーニング
この記事でご紹介したAIを活用したテキスト分析手法を含む、アンケートデータ分析に必要なスキルを体系的に学べるオンライントレーニングを開催します。
データの集計・可視化から、相関分析、因子分析、クラスタリング、AIを使ったテキスト分析まで、現場ですぐに活用できる分析手法を1日で習得いただけます。
統計やプログラミングの事前知識は不要で、ゼロベースから手を動かしながら学べるハンズオン形式です。
全ての授業は録画されますので、トレーニング後の復習も可能です。ぜひご参加をご検討ください。
自分のデータで試してみたい!
記事内の全てのデータ加工や分析は、データの加工、可視化、分析、レポーティングのためのUIツールのExploratoryを利用して作成しています。
ご自身のデータを使って、AIによるテキスト分析を試してみたい方は、下記のリンクより無料トライアルが可能ですので、ぜひお試しください!









