ヴァル研究所 Advent Calendar 2017 の17日目は機械学習に関する記事です。
機械学習の技術って色々できそうでワクワクしますね。
しかし、いざ使ってみようと調べてみると、知識や課題設定に色々な前提があることに気付きます。
この記事では、機械学習の活用を始める際に私が読んでいる本について簡単に紹介します。
きちんと通読していないので、内容は一部不正確かもしれません。
この記事の想定読者(調査開始時点の私)の認識や状況はこんな感じです。
- 機械学習は何かの推測結果を出してくれるもの。機械学習には学習させるためのデータがある程度必要。
- 推測したい事柄(データ)は明確に決まっている。推測に使う予定のデータや推測対象は画像ではない。
- Rubyは書いたことあるけどPythonはほぼ初めて。スクリプトを書くことに抵抗は無い。
- 統計学の知識はほぼ無し。
Machine Learning 実践の極意
良いところ
学習や推測の根拠となるデータを準備する工程を前処理と呼びます。前処理で必要なことを説明している本は貴重だと感じています。
機械学習をこれから調査し活用する状況において、実務寄りとビジネス寄り、どちらの人にも有益な範囲で説明されています。機械学習活用の全体感を掴むのに良いです。
Pythonのサンプルコードも記載されていますが、コードを動かさずとも分かるように解説されている印象です。必ずしもパソコンの前で読む必要がないのは嬉しいです。
各章の章末にあるまとめが秀逸です。先に章末のまとめを見て気になる内容があれば本文に目を通す、という使い方もいけそうです。
ケーススタディとして以下の内容が取り上げられており、種類が豊富です。
- タクシーのチップ料金予測
- 映画レビューの感情分析(自然言語を扱う)
- 広告のクリック率予測
惜しいところ
実務の入門書ではありません。実務を始めるなら他の情報源も必要です。
高円寺にあるヴァル研究所を会場として読書会が開催されていません。
ゼロから作るDeep Learning
良いところ
機械学習の用語と基本的な仕組みをPythonスクリプトを読んで動かしながら学べます。
機械学習を活用した画像識別などの既成サービスではなく、機械学習によるモデル構築から始める実務者向けです。
高円寺にあるヴァル研究所を会場にして読書会が開催されています!
惜しいところ
MNIST(手書きの数字画像と正解の数字がセットになったデータ集)を用いたNクラス分類(これはどの数字か)のみを扱っています。画像以外のデータや異なる種類の推測を行いたい場合は、別に調査する必要があります。
良いところの裏返しですが、付属のサンプルコードを読み解いて得られる情報がないと途中から説明が乏しく感じます。パソコンの前で読まないとつらい本です。