現在、Qiita Advent Calendar 2025を完走するため猪突猛進しております![]()
12月25日まで、エッホエッホ ![]()
はじめに
みなさん、IBM Videoというサイトをご存知でしょうか?
IBMが提供する製品をショート動画でわかりやすくご紹介している動画サイトです。
- スキルアップしたくてもなかなか時間が取れない
- 気になる製品があるけど、マニュアルを読んで理解するのはきつい
- 製品の特徴やメリットをクイックに知りたい
という方には、うってつけの動画を提供するサイトです。
興味のある方はぜひご覧いただければと思います。
今回ご紹介する動画へのリンク
SPSS Modeler 新バージョンで「日本語テキストマイニング機能」をサクッと触ってみる
概要
デモでは、Cloud Pak for Data 上のSPSS Modeler に新たに追加された日本語テキストアナリティクス機能 を紹介しています。
2024年10月9日にリリースされたこの新機能により、これまで外部ツールや Python コードを用いて行う必要があった日本語テキストの形態素解析が SPSS Modeler 内だけで完結 できるようになりました。
英語では一般的だったテキスト分解・可視化処理(例:ワードクラウドなど)が、日本語でも簡単に実行できるようになり、データ分析の効率が大きく向上します。
デモの流れと特徴
1. SPSS Modeler プロジェクトの準備
Cloud Pak for Data のトップページから既存プロジェクトを開き、SPSS Modeler のフローを利用して分析環境を構築します。
2. 新機能:日本語テキスト分析ノードの紹介
今回追加されたのは以下の2つのコンポーネントです。
- テキストリンク分析
- テキストマイニング
これらをフローに配置することで、日本語テキストの分解と可視化が SPSS 内で完結します。
3. 日本語テキストの読み込みと分解
デモでは、コメント列に日本語レビューが記載された Excel ファイルを読み込み、
テキストリンク分析 ノードにて以下のように自動でコンセプト(語句)が抽出されます。
例:
- 部屋
- 清潔
- コストパフォーマンス
- 快適
- 優れ、など
従来は MeCab などの外部形態素解析ツールを Python 経経由で呼び出す必要がありましたが、今回は SPSS だけで分解が完了 しています。
4. 可視化(グラフ・ワードクラウド)
分解された語句を SPSS のグラフノードで可視化すると、以下のような分析結果を得られます:
- 出現回数の棒グラフ(例:部屋 51件、ホテル 27件 など)
- ワードクラウドによる視覚的表現
これにより、テキストデータの特徴や傾向を直感的に把握することができます。
5. watsonx.ai との比較紹介
デモ後半では、watsonx.ai でも同様に日本語の形態素解析が可能であることに触れ、
SPSS Modeler との使い分け例を紹介しています。
まとめ
本デモでは、SPSS Modeler 18.6 における日本語テキストアナリティクス機能の強化 により、形態素解析から可視化までの一連の処理が SPSS 内でシームレスに実行できることが示されました。
外部ツール不要で日本語テキストの分析が完結するため、データサイエンス業務の効率化や迅速なインサイト発見に大きく貢献します。
