2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

SPSS Modeler ノードリファレンス 1-9 固定長ファイル(テキストファイル)

Last updated at Posted at 2023-07-11

1-1 固定長ファイルノード[入力タブ]

スクリーンショット 2022-01-12 10.02.12.png

1.ノードの目的

固定長のテキストファイル形式のデータを読み込みます。

2.解説動画(60秒)

TBD

3.クイックスタート

ファイルタブの[ファイル:]の[...]ボタンから読み込むファイルパスを指定します。
*サンプルのtxtファイルは[5.参考情報]からダウンロードできます。

[レコード長]に1レコードの長さを設定します。
各フィールド名と開始位置、長さを指定します。
画面上のプレビューでデータが表示されます。
image.png

image.png

4.Tips

データ型の上書き

IDは自動的に「整数型」で読み込まれましたが、「文字列型」で読みたい場合は、[データ]タブで[上書き]にチェックをつけて、[ストレージ]に[文字列]を選びます。
image.png

image.png

改行なしデータ

固定長データは改行でレコードが区切られていなくても読むことができます。
[改行文字のスキップ]のチェックを外すと[レコード長]で指定した長さでレコードを区切ります。
image.png

image.png

欠損値のあるデータ

以下の2行目のデータはのデータを持っていませんが、正しく読むことができます。

image.png

image.png

半角カナや全角の日本語データ

半角カナや全角の日本語データも読むことはできます。
ただし、バイト数ではなく、文字数で指定を行ないます。プレビューはずれて見えますが、正しく読めます。

image.png

image.png

「鈴木一郎 」もShiftJISでは10バイトですが、ここでは文字数の5文字で指定します。
image.png

image.png

半角と全角のデータの混在

上記の通り文字数で長さを指定しますので、一つの列内に半角文字2文字と全角文字1文字を同じ長さとして扱っているデータが混在している場合、長さで途中で切られてしまいます。
image.png

image.png

こういうデータは文字数をそろえないと読み込むことができません。もしくはPythonなどで加工することになると思います。

列定義のスクリプト化

列がたくさんある場合はスクリプトで定義したくなることがありませす。以下の記事で紹介しています。

SPSS固定長ファイルノードの定義をmodelerスクリプトで自動化 - Qiita

固定長データ出力

固定長データ出力は専用のノードは用意されていませんが、以下のように[フラットファイル・エクスポート]をつかって出力することができます。

SPSS Modelerで固定長データ出力 - Qiita

5.参考情報

サンプルストリームとデータ

ノードのヘルプ

SPSS Modeler 逆引きストリーム集(データ加工)

SPSS Modeler ノードリファレンス目次

2
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
2
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?