0
0

More than 1 year has passed since last update.

40 代おっさんPythonでExcelのデータを活用してみる

Posted at

本記事ついて

本記事は プログラミング初学者の私が学習していく中でわからない単語や概要をなるべくわかりやすい様にまとめたものです。
もし誤りなどありましたらコメントにてお知らせいただけるとありがたいです。

参考資料

https://www.udemy.com/course/python-kaizen/learn/lecture/26849736#overview

環境

以前はCloud9を使用していましたが
Windows 10
Jupyter Notebook
そのため構文に少し違いがあります。
気を付けてください

目的

Excelのデータを活用してみる

Excelのデータを活用してみる

pcr_tested_daily.csv(厚生労働省からダウンロードしました)
これを使ってデータを分析したいと思います。

pandasのインストール

pandasとは
データの統計量を表示したり、グラフ化するなど、データ分析(データサイエンス)や機械学習で必要となる作業を簡単に行うことができるようになります

自分のはまだ入れていなかったので入れて見ます

!pip install pandas

上記はJupyter上でインストールしているので、コンソール上で行う場合は!は取り除いてください。

pandasのインポート

import pandas as pd

別名としてpdとして扱われることが多いみたいです

csvを読み込む

df=pd.read_csv("C:\\Users\\toaik\\OneDrive\\デスクトップ\\python\\6章\\pcr_tested_daily.csv")

dfの中身を見ますと

df

データが出たと思いますが、これをデータフレームと言うみたいです

合計を取ってみる

データフレームから項目欄を取ってきてこのように記述

df["PCR 検査実施人数(単日)"].sum()

結果が返ってきました
ちなみに3/3現在で37629310.0でした…
これなら保健所パンクするわ~~

各パラメータの取り方

平均値

df["PCR 検査実施人数(単日)"].mean()

最大値

df["PCR 検査実施人数(単日)"].max()

最大値の行数

df["PCR 検査実施人数(単日)"].idxmax()

行、列からの値を取る

df.iloc[733,0]

ちなみに自分は最大値の行数、0を入れて見ました。
*1行目は0

データをグラフ化

*Jupyterを使っているため簡単にできましたが、使うものによっては色々な設定が必要かも

matplotlibインストール

!pip install matplotlib

matplotlib.pyplotインポート

import matplotlib.pyplot as plt

%matplotlib inlineが必要になるかも

%matplotlib inlineを指定したときの挙動:

グラフがアウトプット行に出力される
plt.show()を省略してもグラフが出力される
plt.show()でアウトプット行に2つ以上のグラフ表示可能

グラフを表示

plt.bar(df.index,df["PCR 検査実施人数(単日)"])

グラフが出ました~
すごいな!

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0