kaggleで使う場面だけでなく、実務でも以外とTSVファイルのSASにインポートして、データセットとして使うことはよくある。
一度、マクロ化すればそうそう直接書くことは少ないので忘れやすい。
マクロ化も含めて備忘録を取っておきたい。
proc import
%macro importTSV(inTsv, outDS);
proc import datafile= &inTSV
out=&outDS dbms=dlm replace;
delimiter='09'x;
getnames=yes;
datarow=2;
run;
%mend;
%let train = '/tsvファイルのパス/test01.tsv';
%importTSV(&train, '出力先データセット名');
quit;
- 上記の
delimiter='09'x
でimportするファイルの区切り位置を指定する。 -
getnames=yes
で変数名も取り込む。 -
datarow=2
つまり、データセットにする値は2行目からを指定する。
終わりに
日本語のファイルを取り込む時ちょいちょい死ねるのはやめてください、、、。
SASェ、、、。
質問、間違いなどがあればコメントください。