法人等略語マスタで組織名を名寄せする
*(株)を「株式会社」に置換する場合には逆引き2−10(文字列の置換)を参照ください。
1.想定される利用目的
・顧客マスタや取引先マスタデータのクレンジング
・対象データの精査
2.サンプルストリームのダウンロード
3.サンプルストリームの説明
a.入力するデータひとつ目は以下の通りです。法人名略称との併用で表記揺れが起きています。
b.入力するマスタは以下の通りです。括弧が全角と半角の2種類それぞれに用意しています。
c.[レコード結合]ノードを編集します。[レコード結合方法]は[条件]を選択しaを主テーブルに[部分外部結合]します。issubstring(略称, 会社名)はaの会社名列にbの略称を見つけた場合その位置を整数で返します。以下の式で、見つけた場合に限り該当レコードと結合します。
[プレビュー]します。該当する略称を持つレコードに正式名称の列が追加されました。
d.[フィールド作成]ノードを編集します。略称がNullの場合には[会社名2]にはオリジナルの列を入れ、そうでない場合にはreplace関数で略称の文字列を正式名称で置き換えます。
注意事項
医療法人系の略称と正式名称が1対1でないためマスタから除きました。必要に応じてエクセルなどで適切なマスタを作成して利用ください。
4.参考情報
名寄せとデータクレンジングを解説した記事
SPSS Modeler ノードリファレンス目次
SPSS Modeler 逆引きストリーム集(データ加工)