カテゴリ(類似ワード群)作成定義をTAPとして保存し再利用する
この記事はSPSS Modeler Premium Ver18.6から追加された日本語テキスト機能を利用して書いています。SPSS Modeler Professionalをお使いの方はアップグレードするかPython連携を用いて実現します。
Python連携を紹介する記事はこちら
1.想定される利用目的
・抽出されたコンセプトを統合したカテゴリの定義を再利用する
2.ストリームとデータのダウンロード
ストリーム
データ
TAP
3.サンプルストリームの説明
この記事は データ加工逆引き13-3で扱った内容の後続プロセスです。
インタラクティブワークベンチの定義をTAPとして保存する
画面左上のファイルメニューからテキスト分析パッケージ(TAP)を作成
任意の名前をつけてTAPとして保存します。
保存済みのTAPを呼び出して利用する
a.入力データは以下の通りです。
b.[テキストマイニング]ノードを編集します。[IDフィールド]と[テキストフィールド]を以下の通り選択します。
[モデル]タブを編集します。テキスト分析パッケージを保存先から[読み込み]ます。
[実行]します。定義済みのカテゴリに分類されています。
注意事項
テキスト処理の度に全く同じカテゴリ定義でフラグ化する場合には、作成済みのナゲットを保存してスコアリングに利用します。
4.参考情報
Python連携によるテキストマイニング
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)