本記事ついて
本記事は プログラミング初学者の私が学習していく中でわからない単語や概要をなるべくわかりやすい様にまとめたものです。
もし誤りなどありましたらコメントにてお知らせいただけるとありがたいです。
参考資料
https://www.udemy.com/course/python-kaizen/learn/lecture/26849736#overview
環境
以前はCloud9を使用していましたが
Windows 10
Jupyter Notebook
そのため構文に少し違いがあります。
気を付けてください
目的
Excelのデータを活用してみる
Excelのデータを活用してみる
pcr_tested_daily.csv(厚生労働省からダウンロードしました)
これを使ってデータを分析したいと思います。
pandasのインストール
pandasとは
データの統計量を表示したり、グラフ化するなど、データ分析(データサイエンス)や機械学習で必要となる作業を簡単に行うことができるようになります
自分のはまだ入れていなかったので入れて見ます
!pip install pandas
上記はJupyter上でインストールしているので、コンソール上で行う場合は!は取り除いてください。
pandasのインポート
import pandas as pd
別名としてpdとして扱われることが多いみたいです
csvを読み込む
df=pd.read_csv("C:\\Users\\toaik\\OneDrive\\デスクトップ\\python\\6章\\pcr_tested_daily.csv")
dfの中身を見ますと
df
データが出たと思いますが、これをデータフレームと言うみたいです
合計を取ってみる
データフレームから項目欄を取ってきてこのように記述
df["PCR 検査実施人数(単日)"].sum()
結果が返ってきました
ちなみに3/3現在で37629310.0でした…
これなら保健所パンクするわ~~
各パラメータの取り方
平均値
df["PCR 検査実施人数(単日)"].mean()
最大値
df["PCR 検査実施人数(単日)"].max()
最大値の行数
df["PCR 検査実施人数(単日)"].idxmax()
行、列からの値を取る
df.iloc[733,0]
ちなみに自分は最大値の行数、0を入れて見ました。
*1行目は0
データをグラフ化
*Jupyterを使っているため簡単にできましたが、使うものによっては色々な設定が必要かも
matplotlibインストール
!pip install matplotlib
matplotlib.pyplotインポート
import matplotlib.pyplot as plt
%matplotlib inlineが必要になるかも
%matplotlib inlineを指定したときの挙動:
グラフがアウトプット行に出力される
plt.show()を省略してもグラフが出力される
plt.show()でアウトプット行に2つ以上のグラフ表示可能
グラフを表示
plt.bar(df.index,df["PCR 検査実施人数(単日)"])
グラフが出ました~
すごいな!