Python
JSON
pandas

pandasでjsonlを扱いたい時

More than 1 year has passed since last update.

jsonlとは

jsonlとは、1レコードがjsonになっているファイルです。

フォーマットの例

 {"title": "學問のすゝめ", "author": "福澤諭吉", "content": "天は人の上に人を造らず人の下に人を造らずと云へり。"}
 {"title": "人間失格", "author": "太宰治", "content": "私は、その男の写真を三葉、見たことがある。"}
 {"title": "銀河鉄道の夜", "author": "宮沢賢治", "content":"ではみなさんは、そういうふうに川だと言われたり、乳の流れたあとだと言われたりしていた、このぼんやりと白いものがほんとうは何かご承知ですか"}

jsonlでの読み込み方法

pandasを使用して、jsonlを読み込みたい時は以下のようにします。

df = pd.read_json('hogehoge.jsonl', orient='records', lines=True)

jsonlでの出力方法

DataFrameから、jsonlで出力する時は、以下のようにします。

df.to_json('hogehoge.jsonl', orient='records', force_ascii=False, lines=True)