csvデータを取り扱う
データ分析をするとき、cvsデータの扱い方を毎回忘れてしまうので、メモとしてまとめておきたいと思います。
csvを読み込む
import pandas as pd
pd.read_csv('data.csv')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8e in position 0: invalid start byte
とエラーが出てきてしまいました。
pd.read_csv('data.csv' , encoding='cp932')
encoding='cp932'
を後ろに付けたらちゃんと表示されました。
csvデータから列・行を取り出す
csvから1行または1列だけデータを取得
df = pd.read_csv('data.csv' , encoding='cp932')
df.iloc[0,:] #1行目すべてのデータを取り出す
df.iloc[:,2] #3列目すべてのデータを取り出す
pandas.DataFrameの行を取得
[行名・行番号のスライス]: 複数行を取り出す
df[1:4] #1行目から3行目まで取り出す
列ごとに合計を計算する
1列のデータをすべて足して合計を出す
df.iloc[:,3].sum() #4列目のデータの合計を出す
csvデータをfor文で計算
csvデータの列データを一定の数で割りたいとき
#csvデータの3列目の数値をそれぞれ2で割る
w = df.iloc[:,2]
for i in w:
d = i / 2
print(d)