6
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

SPSS Modeler ノードリファレンス 1-1 可変長ファイル(テキストファイル)

Last updated at Posted at 2022-02-16

1-1 可変長ファイルノード[入力タブ]

スクリーンショット 2022-01-12 10.02.12.png

1.ノードの目的

CSVやタブ区切りなどのテキストファイル形式のデータを読み込みます。

2.解説動画(60秒)

3.クイックスタート

①ファイルタブの[ファイル:]の[...]ボタンから読み込むファイルパスを指定します。
(またはエクスプローラからCSVファイルをストリーム領域にドロップ)
*サンプルのCSVデータは[5.参考情報]からダウンロードできます。

② [OK]ボタンで完了です。画面上のプレビューでデータが表示されます。
スクリーンショット 2022-01-12 10.12.33.png

スクリーンショット 2022-01-12 10.19.38.png

うまく読めない場合のヒント

Mac版ではデータの文字コードがUTF-8である必要があります。Shift-JISでは文字化けします。予めテキストエディタで変換しておいてください。

スクリーンショット 2022-01-12 10.23.56.png

先頭レコード(先頭行)がフィールド名でない場合には以下のチェックを外します。
スクリーンショット 2022-01-12 10.25.15.png

桁ずれしている場合には区切り文字や引用符を確認して適宜設定します。
スクリーンショット 2022-01-12 10.29.37.png
*金額に含まれるカンマは桁ずれの原因になりますので、予め処理するかタブ区切りなどを使います。

[商品名]などの文字列の前後に空白が入っていて、後続処理(結合)などでトラブルになることを防ぐため以下の設定が重宝します。業務的な特殊(不正)文字の処理も役に立ちます。
前後.png

4.Tips

文字列や日付などのデータタイプの確定

例えば顧客番号や商品番号を文字列で扱うか整数で扱うかを曖昧にすると後続のテーブル結合で思いがけない不一致が起きます。[データタブ]で読み込み時点で強制的に文字列に上書きすることをお勧めします。その際前後の空白文字の有無にも注意してください。

スクリーンショット 2022-01-12 10.33.45.png

商品コードや電話番号は文字列に

[03********]のようなゼロから始まるコードや番号は整数で読み込むと先頭のゼロが欠落するために[文字列]として扱います。

不要なフィールドの除外

不要なフィールドは[フィルタ-タブ]で除外することが可能です。
スクリーンショット 2022-01-12 10.38.52.png

値の読み込み

[データ型タブ]で[値の読み込み]ボタンを押して値を確定をしておくと、後続の[再構成]や[行列変換]、[データの分類]の直前に[データ型ノード]を配置する必要がなくなります。
スクリーンショット 2022-01-12 10.43.26.png

5.参考情報

利用データ

右クリックでリンク先を保存してください。

ノードのヘルプ

SPSS Modeler 逆引きストリーム集(データ加工)

SPSS Modeler ノードリファレンス目次

6
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
6
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?