7
Help us understand the problem. What are the problem?

More than 5 years have passed since last update.

posted at

「データサイエンティスト養成読本 機械学習入門編」(技術評論社, 2015)

データサイエンティスト養成読本 機械学習入門編」を、著者の福島真太朗さんからいただきました。ありがとうございます!

表紙

福島さんとはプログラミング言語Juliaの集い「JuliaTokyo」などで交流があり、彼の記事「機械学習ソフトウェアの概観」にてJuliaも紹介されていることから、今回書籍をいただけることになりました。

この記事では、昨今の機械学習を取り巻くソフトウェアの紹介で、R、Python、MLlibと並んで、Juliaでの予測モデルの構築・評価の実行例が述べられています。

出版前、福島さんが「Juliaを軽くdisってあるんで」と仰っていたので、どのような内容なのかビビっていたのですが(笑)、説明も非常に丁寧で、結論も至極納得のいくものでした。

いまだ情報が少なく、「検索してもヒントとなるページが見当たらず、ソースコードに立ち戻らないとならないことも往々にして発生」(p.85)というのは、まさにその通りだと思います(そこが面白いところでもある、とも私は思っていますが)。

第3章で述べられているように、プログラミングの経験があまりない場合はKNIMEやWeka、はたまた昨今台頭してきている各種クラウドサービスが良いでしょうし、プログラミングに抵抗がない場合でも、よく知られた手法をパッケージから使うのであれば、RやPythonをまず検討するべきでしょう。少なくとも現時点では、フルスクラッチで機械学習アルゴリズムを実装するのであったり、高負荷の処理が必要であれば、その時に、Juliaを検討するべきだと思います。

まだ書籍全部を読んではいないのですが、この記事以外も豪華な執筆陣で、どれも面白く、簡潔で、かなり新しい話題までカバーされていているように思えます。かつ、煙に巻くこともなく理論に寄り過ぎることもなく、ビジネス的観点の情報や、実際に手を動かしてみる記事もあり、バランスがとれていて、参考文献などその先へのポインターも多く、「機械学習入門編」の名に偽りがない、良い書籍だと思いました。

言語処理のための機械学習入門」という、比戸さんの記事でも紹介されている名著について、自然言語処理の先人たちが「我々が始めた時に、この書籍があればなあ」と言っているのを見聞きしたことがあります。今回の養成読本も同じように、後続へ向けて"知の高速道路"を提供するものではないでしょうか。機械学習にある程度以上興味がある方にとって、買って損することはないと思います。

ちょうど1年前に「Machine Learning Casual Talks #2」というイベントで、この書籍の著者でもある比戸さんが「機械学習は苦しい」という名言を残されていました。その苦しみは当分なくらないでしょうが、この本でそれが少しは和らぐことがあるかもしれません。

参考

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
Sign upLogin
7
Help us understand the problem. What are the problem?