SPSS Modeler ノードリファレンス 1-1 可変長ファイル（テキストファイル）

Last updated at 2025-04-30Posted at 2022-02-16

1-1 可変長ファイルノード[入力タブ]

CSVやタブ区切りなどのテキストファイル形式のデータを読み込みます。

①ファイルタブの[ファイル：]の[...]ボタンから読み込むファイルパスを指定します。
（またはエクスプローラからCSVファイルをストリーム領域にドロップ）
＊サンプルのCSVデータは[5.参考情報]からダウンロードできます。

② [OK]ボタンで完了です。画面上のプレビューでデータが表示されます。

Mac版ではデータの文字コードがUTF-8である必要があります。Shift-JISでは文字化けします。予めテキストエディタで変換しておいてください。

先頭レコード(先頭行)がフィールド名でない場合には以下のチェックを外します。

桁ずれしている場合には区切り文字や引用符を確認して適宜設定します。

＊金額に含まれるカンマは桁ずれの原因になりますので、予め処理するかタブ区切りなどを使います。

[商品名]などの文字列の前後に空白が入っていて、後続処理（結合）などでトラブルになることを防ぐため以下の設定が重宝します。業務的な特殊（不正）文字の処理も役に立ちます。

例えば顧客番号や商品番号を文字列で扱うか整数で扱うかを曖昧にすると後続のテーブル結合で思いがけない不一致が起きます。[データタブ]で読み込み時点で強制的に文字列に上書きすることをお勧めします。その際前後の空白文字の有無にも注意してください。

[03********]のようなゼロから始まるコードや番号は整数で読み込むと先頭のゼロが欠落するために[文字列]として扱います。

不要なフィールドは[フィルタ-タブ]で除外することが可能です。

[データ型タブ]で[値の読み込み]ボタンを押して値を確定をしておくと、後続の[再構成]や[行列変換]、[データの分類]の直前に[データ型ノード]を配置する必要がなくなります。