0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Excelで類義語辞書を作成してユーザー辞書にインポートする(SPSS Modeler データ加工逆引き13-13)

Posted at

Excelで類義語辞書を作成してユーザー辞書にインポートする

スクリーンショット 2025-04-03 14.35.15.png

この記事はSPSS Modeler Premium Ver18.6から追加された日本語テキスト機能を利用して書いています。SPSS Modeler Professionalをお使いの方はアップグレードするかPython連携を用いて実現します。

リソースエディタ上で類義語を追加する方法

1.想定される利用目的

・抽出されたコンセプトの時点で表記の揺れを正規化する

2.ストリームとデータのダウンロード

ストリーム

3.Excelでの類義語の定義とサンプルストリームの説明

類義語と代表語のリストを作成

A列に類義語をB列に代表語をリストします。出来上がったファイルはタブ区切りのtxt形式で保存します。

スクリーンショット 2025-04-03 14.50.06.png

文字コードをUTF8にする必要があるのでエディタで文字コードを変更して保存します。

スクリーンショット 2025-04-03 14.19.06.png

リソースエディタからテキストファイルをインポート

スクリーンショット 2025-02-04 11.38.18.png

a.入力データは以下の通りです。

スクリーンショット 2025-02-04 11.51.41.png

b.[テキストマイニング]ノードを編集します。[IDフィールド]と[テキストフィールド]を以下の通り選択します。

スクリーンショット 2025-02-04 11.39.53.png

[モデル]タブを編集します。[抽出結果を利用して...]を選択します。

スクリーンショット 2025-02-04 11.40.04.png

[実行]します。画面右上のドロップダウンリストから辞書[リソースエディター]を呼び出します。

スクリーンショット 2025-02-04 11.41.15.png

ファイルをインポート>単一ファイルをインポートを選択します。

スクリーンショット 2025-04-03 14.20.37.png

類義語定義済みのテキストファイルを選択します。

スクリーンショット 2025-04-03 14.21.16.png

IBMは既存の定義に追加される形で有効になりました。

スクリーンショット 2025-04-03 14.22.47.png

SPSS Modelerは新規で追加されました。

スクリーンショット 2025-04-03 14.22.59.png

注意事項

インポート後はTAP(テキスト分析パッケージ)として保存することで次回以降同じ辞書を使うことができます。

4.参考情報

Python連携によるテキストマイニング

SPSS Modeler ノードリファレンス目次

SPSS Modeler 逆引きストリーム集(データ加工)

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?