日記をはじめたきっかけ
最近出た本の影響でどうやらアクティブリコールが流行ってるらしいのでさっそく自分も実践してみる的な流れ
データ分析系を選んだ動機
ちょっとクロスワード解くくらいの趣味の領域
Kaggleのコンペ出るのってなんか楽しそうやん、、、
学習ソース
内容
Kaggleのタイタニックネタを教材にして前処理をやる感じ
今日やったこと
- Google Colabのインストール
- Google Driveのマウント
- Numpy, Pandas, Matplotlib, Seaboarnのライブラリインポート
- データの確認
- 学習データとテストデータの結合 (concat使うやつ
- 欠損値の確認 (isnullとかsumとか
- データの可視化
- Pandas, Matplotlib, Seabornそれぞれの方法で
- PandasとMatlotlibは集計の手順挟むけどSeabornはその手順なしでできちゃうってよ
- Pandas, Matplotlib, Seabornそれぞれの方法で
- 欠損値の補完 (fillna使うやつ
- 欠損値の補完の中身は慎重に
- 代表値(max, min, mean, median)の取得
感想
- 無料でここまでできちゃうんや...
- Pythonの基本的なことは入門書とかで理解しといてよかった
次回はカテゴリカル変数の数値変換をやる予定