はじめに
古都ことさん(@kfurumiya)が公開しているpokemon_data.jsonをちょっとのぞいてみる。
データはこちら
環境
- Jupyter notebook : 5.7.4
- python : 3.6.5
- Mac OS : 10.14.2
JSONの読み込み
元ファイルはJSONのリストかつ、改行込みなのでちょっと前処理
前処理
% sed -i -e '1d' pokemon_data.json //先頭行削除
% sed -i -e '$d' pokemon_data.json //最終行削除
% cat pokemon_data.json | tr -d '\r' | tr -d '\n' > tmp.json //改行削除して別ファイルに保存
- dataframeにする。
import pandas as pd
file_path = "./tmp.json"
all_data = pd.read_json(file_path)
データチェック
- 軽く中身を確認
all_data.describe()
- 個人的に気になるのは、ステータスなので、ここだけ抜き出してみる。
- statsは種族値のことらしいです。
all_stats_data_list = all_data['stats']
stats_df = pd.io.json.json_normalize(all_stats_data_list)
stats_df.head()
- 統計情報をみてみる。
stats_df.describe()
- まずポケモン918種もいたのか???251種で止まってるんだが・・・
- HPのmin,maxの差がひどい。HP1って何???
やりたいこと
- 最近仕事でdjango,JavaScriptなどやりはじめたので、chart.js使って各ポケモンのステータスのレーダーチャート表示するページとかつくりたい。
- 種族値の合計のリストとかもみたい