この記事について
PythonのPandasでデータを扱っている中で、少しの事なんだけど自分の思った通りにデータ操作できず、
小さな事で可読性の低い大量のコードを書いたり、考えこんでしまう時間を必要以上にかけてしまうことってありますよね。
(SQL だったらこんな風にすれば良いのになあ~みたいな)
ネットで検索したいと思っても「何てキーワード検索していけばよいのかわからない・・・」と言語化できない
そんな もどかしい ときに使える、小技集をまとめようと思って記事にしてみました。
もどかしい瞬間に遭遇し、スマートに解決できた、そんなアハ体験をどんどん備忘録的に追記していける記事に出来ればと思ってます。
データ変換編
① 型変換したいけど例外エラーが出て”もどかしい”
例えば、Object型の日付型をdatetime型に変換したいけど、日付型に変換できない文字列が混在しているときpd.to_datetime()
のerrors="coerce"
オプションを上手く使えば良い!
数値型の場合は、pd.to_numeric()
でも同様
import pandas as pd
data = {
"date" : ["2021-01-01", "2021-02-01", "2021-03-01", "不明", "2021-05-01"],
"sales": [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)
df[~pd.to_datetime(df["date"], errors="coerce").isna()]
>
date sales
0 2021-01-01 10
1 2021-02-01 20
2 2021-03-01 30
4 2021-05-01 50
募集中
Pandasを使っている最中に感じた もどかしい経験 募集中です