3
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

IBMが提供する製品に関する情報やナレッジを共有するAdvent Calendar 2024

Day 19

フリーコメントから頻出ワードを機械的にフラグ化する(SPSS Modeler データ加工逆引き13-1)

Posted at

フリーコメントから頻出ワードを機械的にフラグ化する

スクリーンショット 2024-12-13 10.29.45.png

この記事はSPSS Modeler Premium Ver18.6から追加された日本語テキスト機能を利用して書いています。SPSS Modeler Professionalをお使いの方はアップグレードするかPython連携を用いて実現します。

Python連携を紹介する記事はこちら

1.想定される利用目的

・コンタクトセンターの応答ログから解約に影響する単語の探索
・営業日報のコメントから成約予測モデルの説明変数を作成
・アンケート自由回答データからブランドと評価のポジショニングマップを作成

2.ストリームとデータのダウンロード

ストリーム

データ

3.サンプルストリームの説明

スクリーンショット 2024-12-13 10.30.03.png

a.入力データは以下の通りです。[comment]列の文章から頻出ワードを列に展開します。

スクリーンショット 2024-12-13 10.41.09.png

b.[テキストマイニング]ノードを編集します。[ビルドモード]を[直接生成]に変更します。[モデルが含む最大コンセプト数]を[50]に変更します。

スクリーンショット 2024-12-13 10.41.39.png

[テキストマイニング]ノードを実行します。cが生成されます。

c.[テキストマイニング]ナゲットを編集します。[真/偽の値]を[1/0]に変更します。

スクリーンショット 2024-12-13 10.42.12.png

[テーブル]を実行します。

スクリーンショット 2024-12-13 10.43.11.png

注意事項

今回は頻出ワード上位50に接頭辞コンセプトをつけて列に展開しましたが、後続処理でフィールド名(変数名)が不要になる場合に以下のように省略します。

スクリーンショット 2024-12-13 10.45.44.png

抽出されたワード(コンセプト)がそのままフィールド名になります。

スクリーンショット 2024-12-13 10.46.12.png

4.参考情報

Python連携によるテキストマイニング

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

3
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
3
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?