#この時期だからこそ自学しよう
海外って太っ腹な組織が多いのか、無料で読める専門書がすごく多い。
これ系のまとめ記事は他にもありますが、
翻訳済の日本の本と、原著を並べて表示していきたいと思います。
特にデータサイエンス分野に限って紹介。
お高いあの名著も実は原著なら無料かも?
(2020年5月時点)
続編、データサイエンスの名大学講座 を書きました
(2020年8月)
#1冊目
##邦題 : 統計的学習の基礎(1万5千円)
俗に言う「カステラ本」です。
- 日本では2014年に翻訳されましたが、原著は2001年と今から約20年前に出版されました。
内容からしても、当時は体系的に理論学習ができる刷新的な一冊だったのでしょう。
まさに「アルゴリズム・理論の辞書」。
年代的に古い感じはしますが、基礎はいつだって大切です。
数字に強くないと絶対読み切れない。。。
##原著 : The Elements of Statistical Learning
略名:ELS
本の分厚さ、表紙の色合い、まさにカステラ、長崎行きたい。
内容は胃がもたれそうなほど重いです。
#2冊目
##邦題 : パターン認識と機械学習(上・下)(1万6千円)
通称「PRML」
-
機械学習を始めると、「はじパタ(はじめてのパターン認識)」と同じくらい勧められるこの本。
私の周りでは「ビショップ本」とか呼ばれているのを聞きます。- 1冊目のようにアルゴリズムまんべんなく学習する本ではなく、パターン認識とその周辺のアルゴリズムを理論的に紹介しています。
-
ctgkさんがnotebook形式で問題解説してくれていたり、暗黒通信団さんが補助資料作ってくれていたり、と皆が補助していることからも名著ぶりがうかがえます。
(「はじパタ」も「ビショップ本」も初心者殺しなので、教えてくれる人がいないとキツい。)
##原著 : Pattern recognition and machine learning
#3冊目
##邦題 : Rによる統計的学習入門(7千円)
通称「ISL」
- 上記2冊に比べると知名度はそこまでな気がしますが、十分に名著です。
- コンセプトとしては、「統計的学習の基礎:ESL」が数学を理解した人向けに書かれた体系的な本であるのならば、この本はそれよりも初学者のために書かれた本、ということ。
- 確かに内容はデータサイエンスの重要な考え方の基礎から入ってくれています。
しかし何も知らない人からすると難しいかと。
確率分布や回帰分析についての知識は事前にあったほうが心折れずに済むと思います。
文章が長い。わかりやすくするため丁寧にしているのだと思いますが、たまに話が入ってこなくなる。
##原著 : An Introduction to Statistical Learning with Applications in R
#4冊目
##邦題 : 深層学習(5千円)
最近話題のdeep learning。
特にhotな生成モデル「GAN」の開発者ian大先生の本。
「ゼロからつくるdeep learning」を読んで理解できた人なら、次の一冊はこの本をオススメしたい。
deep learningに必要な解析の知識・線形代数学を順番に学習しながら進める本。
たとえ読み切れなくても表紙が綺麗なのでインテリアにできるかも?
##原著 : Deep learning
#5冊目
##邦題 : 統計的因果推論 -モデル・推論・推測-(1万円)
まだほとんど読めていないのですが、因果推論を発展させチューリング賞を受賞した著者の本。
因果推論ってどんなもんかな?とおもって本を買ってみようと調べると、この本と岩波データサイエンスがあがってきました。
統計モデルをつくるにあたって、本当にモデルにふくめるべき変数なのか?本当に予測対象にとって影響があるのか?を考える際に読みたい一冊。
モデル選択や線形回帰についての一般的な注意点などは3冊目「Rによる統計的学習入門」で学んで、変数の関係性などはこの本で理解していきたい。
##原著 : causality models reasoning and inference
日本訳は第一版、これの原著画像は第二版
#今回は以上、適宜更新
他にもデータサイエンス系の無料本は多くあります(英語なら)。
データサイエンスの前に英語を勉強しよ
(探すと公式が出しているのか怪しいものもちらほら・・・)
youtube版、MOOC版、洋書限定版なども紹介できたらまとめたい
続編書きました。よければこちらもどうぞ。
データサイエンスの名大学講座 cousera版