SASファイルとStataファイル
SAS (Statistical Analysis System)ファイルはビジネスアナリティクスや生物統計学で多く使われています。
Stata (Statistics + Data)ファイルは経済学や疫学などの学術的な社会科学研究で使われています。
SASファイルの読込み
一般的なSASファイルの拡張子は.sas7bdatになります。読込みはsas7bdatパッケージのSAS7BDAT関数で行います。
from sas7bdat import SAS7BDAT
with SAS7BDAT('test.sas7bdat') as file:
df = file.to_data_frame()
Stataファイルの読込み
Stataファイルの拡張子は.dtaになります。pandasを使って読み込めます。
import pandas as pd
df = pd.read_stata('test.dta')