1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

ユーザー辞書で類義語を登録する(SPSS Modeler データ加工逆引き13-7)

Last updated at Posted at 2025-02-12

ユーザー辞書で類義語を登録する

スクリーンショット 2025-02-04 13.26.24.png

この記事はSPSS Modeler Premium Ver18.6から追加された日本語テキスト機能を利用して書いています。SPSS Modeler Professionalをお使いの方はアップグレードするかPython連携を用いて実現します。

Python連携を紹介する記事はこちら

1.想定される利用目的

・抽出されたコンセプトの時点で表記の揺れを正規化する

2.ストリームとデータのダウンロード

ストリーム

3.サンプルストリームの説明

スクリーンショット 2025-02-04 11.38.18.png

a.入力データは以下の通りです。

スクリーンショット 2025-02-04 11.51.41.png

b.[テキストマイニング]ノードを編集します。[IDフィールド]と[テキストフィールド]を以下の通り選択します。

スクリーンショット 2025-02-04 11.39.53.png

[モデル]タブを編集します。[抽出結果を利用して...]を選択します。

スクリーンショット 2025-02-04 11.40.04.png

[実行]します。画面右上のドロップダウンリストから辞書[リソースエディター]を呼び出します。

スクリーンショット 2025-02-04 11.41.15.png

左上の辞書が3つアクティブになっていることを確認します。

スクリーンショット 2025-02-04 11.41.48.png

ユーザー辞書[ローカルライブラリー]のみを表示させます。

スクリーンショット 2025-02-04 11.42.06.png

画面下部の類義語エリアで以下のように[代表語]を[プリンター]として[類義語]に[printer,プリンタ,印刷機,複合機]を登録します。

スクリーンショット 2025-02-04 11.48.40.png

[リソースエディター]から[カテゴリーとコンセプト]に戻します。辞書が更新されたのでコンセプトが黄色く反転しています。
スクリーンショット 2025-02-04 11.50.00.png

[抽出]ボタンを押します。表記揺れが正規化され、原文では異なっていてもコンセプトは[プリンター]で認識されます。

スクリーンショット 2025-02-04 11.50.48.png

注意事項

表記揺れは必ずしも辞書で整えず、カテゴリに編成する際まとめたり、ストリーム上で処理することも可能です。目的と効率を考えて方法を選択します。

ローカル辞書を保存するにはインタラクティブセッション終了時に以下の[更新]を選択します。
チームメンバーと辞書を共有するにはライブラリに任意の名前をつけて公開/管理します。
スクリーンショット 2025-02-12 11.45.57.png

4.参考情報

Python連携によるテキストマイニング

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

1
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?