ユーザー辞書で不要語を登録する(SPSS Modeler データ加工逆引き13-9)

Posted at 2025-02-26

ユーザー辞書で不要語を登録する

この記事はSPSS Modeler Premium Ver18.6から追加された日本語テキスト機能を利用して書いています。SPSS Modeler Professionalをお使いの方はアップグレードするかPython連携を用いて実現します。

Python連携を紹介する記事はこちら

・抽出されるコンセプトとして不要な業務定型句を辞書に登録する。

ストリーム

a.入力データは以下の通りです。

b.[テキストマイニング]ノードを編集します。[IDフィールド]と[テキストフィールド]を以下の通り選択します。

[モデル]タブを編集します。[抽出結果を利用して...]を選択します。

[実行]します。「かしこまりました」などの音声ログ特有定型句が抽出されており、不要語登録します。画面右上のドロップダウンリストから辞書[リソースエディター]を呼び出します。

ユーザー辞書[ローカルライブラリー]のみを表示させます。

[不用語リスト]に３つの表現を記述します。

以下のように３つ登録して、元の[カテゴリーとコンセプト]画面に戻ります。

辞書が更新されたのでコンセプトが黄色くハイライト（辞書が未適用）になっています。

[抽出]ボタンを押します。不要語が除かれています。

ローカル辞書を保存するにはインタラクティブセッション終了時に以下の[更新]を選択します。
チームメンバーと辞書を共有するにはライブラリに任意の名前をつけて公開/管理します。