More than 1 year has passed since last update.

SPSS Modeler ノードリファレンス 1-9 固定長ファイル（テキストファイル）

Last updated at 2023-07-11Posted at 2023-07-11

1-1 固定長ファイルノード[入力タブ]

固定長のテキストファイル形式のデータを読み込みます。

TBD

ファイルタブの[ファイル：]の[...]ボタンから読み込むファイルパスを指定します。
＊サンプルのtxtファイルは[5.参考情報]からダウンロードできます。

[レコード長]に1レコードの長さを設定します。
各フィールド名と開始位置、長さを指定します。
画面上のプレビューでデータが表示されます。

IDは自動的に「整数型」で読み込まれましたが、「文字列型」で読みたい場合は、[データ]タブで[上書き]にチェックをつけて、[ストレージ]に[文字列]を選びます。

固定長データは改行でレコードが区切られていなくても読むことができます。
[改行文字のスキップ]のチェックを外すと[レコード長]で指定した長さでレコードを区切ります。

以下の2行目のデータはのデータを持っていませんが、正しく読むことができます。

半角カナや全角の日本語データも読むことはできます。
ただし、バイト数ではなく、文字数で指定を行ないます。プレビューはずれて見えますが、正しく読めます。

「鈴木一郎　」もShiftJISでは10バイトですが、ここでは文字数の5文字で指定します。

上記の通り文字数で長さを指定しますので、一つの列内に半角文字2文字と全角文字1文字を同じ長さとして扱っているデータが混在している場合、長さで途中で切られてしまいます。

こういうデータは文字数をそろえないと読み込むことができません。もしくはPythonなどで加工することになると思います。

列がたくさんある場合はスクリプトで定義したくなることがありませす。以下の記事で紹介しています。

SPSS固定長ファイルノードの定義をmodelerスクリプトで自動化 - Qiita

固定長データ出力は専用のノードは用意されていませんが、以下のように[フラットファイル・エクスポート]をつかって出力することができます。