今回は自分用のメモとしてpandasを用いてcsvファイルを読み込み,読み込んだデータをグラフ表示することをまとめる.
#pandasによるcsvファイルの読み込み
今回は相対パスでプログラムとcsvファイルが同じディレクトリ内にある場合で示す.csvファイルについては気象庁のデータから月の日照時間データを使うことにした.
pandasは日本語をうまく読み込めないので,csvファイルの日本語データを英語に直す必要がある.とりあえず今回はデータのうち日付と日照時間の合計のみを用いることにする.またデータを折れ線グラフでグラフ表示してみる.
read_csv.py
import pandas as pd
data1 = pd.read_csv('data.csv')
#データの確認
print(data1)
#折れ線グラフで表示
data1.plot()
データの確認をすると一応の表の値は以下のように得られる.
さらに得られた折れ線グラフは以下のようになる.
これ以外にもプロット方法については以下のようなことがコマンドがある.
pandas_graph_command
data.plot() #折れ線グラフ
data.plot.bar(stacked=True) # 積み上げ棒グラフ
data.plot.scatter('date','time(hour)') # 列を指定して散布図
data['time(hour)'].plot.hist() # 列を指定してヒストグラム
とりあえずは以上です.
後は時間があれば内容を充実していこうと思います.