JSONデータをPandas Dataframeで処理する際の方法をまとめました。
目的
JSON形式で株価のデータを提供してもらったので、分析時にdataframeに入れて処理するために使用
例で用いるデータは加工済み
prices = [{'Date' : '2019/04/08', 'Open':1081.0, 'High': 1013.0, 'Low': 1071.0, 'Close': 1007.0},
{'Date': '2019/04/09', 'Open': 1000.0, 'High': 1000.0, 'Low': 1033.0, 'Close': 1076.0}]
pricesに上記のように株価のデータ入れる。
上記データを一瞬でデータフレームに入れたいと思ったので、ちょっと調べてみたところ、
pd.io.json.json_normalize()で処理できることが判明。
df = pd.io.json.json_normalize(prices)
これで処理すると、Date〜Closeをカラム名として、インデックスがついたデータが出力される。
JSONの処理をする際には使ってみたい。
JSONのデータ加工はTableauに入れて処理したりしているが、やはりPythonでやってしまった方が圧倒的に早い。