「東京大学のデータサイエンティスト育成講座」について紹介していこうと思います。
言いたいこと
・データサイエンス入門書籍として、お勧めです。
・見やすい、わかりやすい、続きやすい。(筆者はオライリーが読みにくいと感じます)
・データの前処理から機械学習までと幅広い知識を得られる。(→専門性には欠ける)
・演習問題が付いているので、何が分かっていないかが分かる。
・「この本を修めたら、次に何をすべき」かがあちこちに書かれている。
・手元に置いときたい一冊
対象読者
・python初心者(未経験でも行ける)
・データサイエンス未経験者
・統計学基礎知識を習得済みの者(高校数学は必修)
ゴリゴリ、データサイエンスを学んでいる方は不必要
なにを、どこまで学べるのか。
・データの前処理、加工←わかりやすく、実務ですぐ使えるように書かれている
・描画(棒グラフをはじめヒートマップなどもかく)
・記述統計(広く浅く)
・時系列データ(深くはやらない)
・教師あり、なし学習(ロジスティック回帰、正則化、決定木、K近傍法、SVM、クラスタリング、主成分分析、マーケット分析)
・モデルの検証方法とチューニング(ホールドアウト法、交差検証法、アンサンブル学習)
最後に
私は、先輩プログラマーから紹介されて、この本をやりました。データサイエンス入門書が沢山ありすぎて、この本が若干埋もれてしまっているのが残念です。と思っていたのですが、メルカリで調べると全て売り切れてました。人気っぽいです。