「データサイエンティスト養成読本 機械学習入門編」を、著者の福島真太朗さんからいただきました。ありがとうございます!
福島さんとはプログラミング言語Juliaの集い「JuliaTokyo」などで交流があり、彼の記事「機械学習ソフトウェアの概観」にてJuliaも紹介されていることから、今回書籍をいただけることになりました。
この記事では、昨今の機械学習を取り巻くソフトウェアの紹介で、R、Python、MLlibと並んで、Juliaでの予測モデルの構築・評価の実行例が述べられています。
出版前、福島さんが「Juliaを軽くdisってあるんで」と仰っていたので、どのような内容なのかビビっていたのですが(笑)、説明も非常に丁寧で、結論も至極納得のいくものでした。
いまだ情報が少なく、「検索してもヒントとなるページが見当たらず、ソースコードに立ち戻らないとならないことも往々にして発生」(p.85)というのは、まさにその通りだと思います(そこが面白いところでもある、とも私は思っていますが)。
第3章で述べられているように、プログラミングの経験があまりない場合はKNIMEやWeka、はたまた昨今台頭してきている各種クラウドサービスが良いでしょうし、プログラミングに抵抗がない場合でも、よく知られた手法をパッケージから使うのであれば、RやPythonをまず検討するべきでしょう。少なくとも現時点では、フルスクラッチで機械学習アルゴリズムを実装するのであったり、高負荷の処理が必要であれば、その時に、Juliaを検討するべきだと思います。
まだ書籍全部を読んではいないのですが、この記事以外も豪華な執筆陣で、どれも面白く、簡潔で、かなり新しい話題までカバーされていているように思えます。かつ、煙に巻くこともなく理論に寄り過ぎることもなく、ビジネス的観点の情報や、実際に手を動かしてみる記事もあり、バランスがとれていて、参考文献などその先へのポインターも多く、「機械学習入門編」の名に偽りがない、良い書籍だと思いました。
「言語処理のための機械学習入門」という、比戸さんの記事でも紹介されている名著について、自然言語処理の先人たちが「我々が始めた時に、この書籍があればなあ」と言っているのを見聞きしたことがあります。今回の養成読本も同じように、後続へ向けて"知の高速道路"を提供するものではないでしょうか。機械学習にある程度以上興味がある方にとって、買って損することはないと思います。
ちょうど1年前に「Machine Learning Casual Talks #2」というイベントで、この書籍の著者でもある比戸さんが「機械学習は苦しい」という名言を残されていました。その苦しみは当分なくらないでしょうが、この本でそれが少しは和らぐことがあるかもしれません。