TAPで係り受けのあるポジ/ネガカテゴリを作成する
(TAP=Text Analytics Package/テキスト分析パッケージ)
この記事はSPSS Modeler Premium Ver18.6から追加された日本語テキスト機能を利用して書かれています。SPSS Modeler Professionalをお使いの方はアップグレードするかPython連携を用いて実現します。
Python連携を紹介する記事はこちら
1.想定される利用目的
・典型的なポジティブ/ネガティブカテゴリの作成方法を知るために製品同梱のTAPを利用します。
2.ストリームとデータのダウンロード
ストリーム
3.サンプルストリームの説明
a.入力データは以下の通りです。
b.[テキストマイニング]ノードを編集します。[IDフィールド]と[テキストフィールド]を以下の通り選択します。
[モデル]タブを編集します。[テキストリンク分析...]を選択します。[テキスト分析パッケージ]の[読み込み]ボタンを押して[Hotel Satisfaction(Japanese)]を選択します。
[実行]します。テキスト分析パッケージに定義済みのカテゴリ(辞書とテキストリンクを考慮)がすでに生成されています。右上のドロップダウンリストから[カテゴリーとコンセプト]を選択します。
左上の[モデル生成]ボタンを押してモデルを生成します。マネージャーウィンドウにcが生成されます。
c.[テキストマイニング]ナゲットを編集します。[設定タブ]で真偽をT/Fから1/0へ[フィールド名拡張子]をブランクにします。
d.[フィルター]ノードで表示するフィールドを絞り込みます。
[テーブル]ノードを編集します。
注意事項
テキスト分析パッケージは、ご自身で辞書を整えて試行錯誤したカテゴリ作成を保存/共有/再利用するものです。
4.参考情報
Python連携によるテキストマイニング
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)