0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ユーザー辞書で不要語を登録する(SPSS Modeler データ加工逆引き13-9)

Posted at

ユーザー辞書で不要語を登録する

スクリーンショット 2025-02-17 17.40.39.png

この記事はSPSS Modeler Premium Ver18.6から追加された日本語テキスト機能を利用して書いています。SPSS Modeler Professionalをお使いの方はアップグレードするかPython連携を用いて実現します。

Python連携を紹介する記事はこちら

1.想定される利用目的

・抽出されるコンセプトとして不要な業務定型句を辞書に登録する。

2.ストリームとデータのダウンロード

ストリーム

3.サンプルストリームの説明

スクリーンショット 2025-02-17 17.14.02.png

a.入力データは以下の通りです。

スクリーンショット 2025-02-17 17.15.05.png

b.[テキストマイニング]ノードを編集します。[IDフィールド]と[テキストフィールド]を以下の通り選択します。

スクリーンショット 2025-02-17 17.15.22.png

[モデル]タブを編集します。[抽出結果を利用して...]を選択します。

スクリーンショット 2025-02-04 11.40.04.png

[実行]します。「かしこまりました」などの音声ログ特有定型句が抽出されており、不要語登録します。画面右上のドロップダウンリストから辞書[リソースエディター]を呼び出します。

スクリーンショット 2025-02-17 17.15.54.png

ユーザー辞書[ローカルライブラリー]のみを表示させます。

スクリーンショット 2025-02-17 17.16.20.png

[不用語リスト]に3つの表現を記述します。

スクリーンショット 2025-02-17 17.17.57.png

以下のように3つ登録して、元の[カテゴリーとコンセプト]画面に戻ります。

スクリーンショット 2025-02-17 17.18.17.png

辞書が更新されたのでコンセプトが黄色くハイライト(辞書が未適用)になっています。

スクリーンショット 2025-02-17 17.18.29.png

[抽出]ボタンを押します。不要語が除かれています。

スクリーンショット 2025-02-17 17.18.45.png

注意事項

ローカル辞書を保存するにはインタラクティブセッション終了時に以下の[更新]を選択します。
チームメンバーと辞書を共有するにはライブラリに任意の名前をつけて公開/管理します。

スクリーンショット 2025-02-12 11.45.57.png

4.参考情報

Python連携によるテキストマイニング

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?