データサイエンス、データ分析、機械学習周りでおすすめ図書10選のような記事は良く見ますが、網羅的な紹介記事はあまり見かけないので自分が欲しいと思い書きました。私よりたくさん読んでいる方は多々いらっしゃると思いますが、記事を書いてくださいな。

  • ざっくりとした難易度
    • 初級:前提知識ほぼなし。数式不要。プログラミング不要。
    • 中級:初級を前提知識とする。理論の本の場合は微積・線型代数程度の数学の知識があれば理解に役立つ。ツールを扱う本の場合はRかPythonを書くと理解に役立つ。
    • 上級:中級を前提知識とする。微積・線型代数程度の数学の知識が十分ないと理解は難しい。中級程度の本でRかPythonを書いた経験を前提とする。
  • 定番としてよく紹介されている本は太字

データサイエンス・機械学習のための​数学

微分積分、線型代数

  • 初級:入門的な本
    • ​類書が多すぎてどれが良いのかは、、、
    • このレベルで何かを読み、後に下記を学ぶと分かりやすいと思わ​れます。
  • 中級『プログラミングのための線形代数』堀玄、平岡和幸著
    • 線形代数の「意味」が分かる。「行列は写像だ!」
    • 題名の「プログラミング」はほぼ関係ない。
  • 中級『統計学のための数学入門30講 (科学のことばとしての数学)』永田靖著

    • 統計学でどのように使われているかを念頭に置いた、微分積分、線型代数の紹介。1冊で紹介しているので各内容の説明は薄め。
    • 一通り勉強した後の確認や、過去に勉強したが錆び付いている人の再起動、今学んでいることを統計学と結び付けたい人向け。
    • 今、講談社機械学習プロフェッショナルシリーズ『深層学習』の読み解きをしているが、数学でわからないところは、ほぼ本書に出ている。
  • 中級『これなら分かる最適化数学―基礎原理から計算手法まで』金谷健一著​

    • 機械学習でも用いられる最適化に必要な(もののみの)微分積分、線形代数の解説。
    • コンセプトは上記書「統計学の~」に似ているが本書は、より目的の最適化に特化しており、例題を解いていくと定着するようになっている。
  • 推奨

    • 「わかる○○」的な本で微積・線型代数を一通り→「統計学のための数学入門30講」で復習。
    • 機械学習の中級的な本に挫折してから!→「これなら分かる最適化数学」で機械学習の数学が身につくと思う。
    • 『統計学のための数学入門30講』『これなら分かる最適化数学』に関する詳しい詳解の記事を書きました データサイエンス、データ分析、機械学習に必要な数学
    • 「プログラミングのための線形代数」に適宜寄り道すると得る所多し。

数学余談

統計学

統計学余談

多変量解析

統計モデリング

時系列分析

時系列分析は「統計モデリングの一種」でよいのだろうか。時系列データは独特の特徴があるので、時系列分析が不要な方はスルーでよいと思います。

​​

状態空間モデル

因果推論

ベイズ統計

データサイエンス

機械学習

シリーズ

​​​​

深層学習

深層学習のフレームワーク

研究者なら0から深層学習を実装する必要があるかもしれませんが、それを使う技術者&ユーザーはフレームワークを用いることになると思います。フレームワークはたくさんあります。ちょっと古いですが深層学習フレームワークヒッチハイクガイドVer2.0参照。

TensorFlow

Chainer

  • 『Chainerで作るコンテンツ自動生成AIプログラミング入門』
      • 理論の解説はほんの少しだけ。
      • 自動生成に的を絞って実装例を紹介している。
        • 超解像画像の生成、画像の自動生成、画像のスタイル変換、文章の自動生成、意味のある文章の自動生成、機械翻訳、画像のキャプションの生成
  • 『Chainer v2による実践深層学習』
    • 『自動生成本』よりも理論解説が多め。
    • 私は自動生成に興味があるので『自動生成本』を主に実施していますが、理論を一つずつ実装して試してみたいのならば本書の方がよいかも。

強化学習

  • ​『強化学習』森北出版
    • 2000年と古いが定番書

テキストマイニング

  • Rによるテキストマイニング入門
    • Rの基礎説明、RMecabによる分かち書き(文章から単語に切り分ける)、ウェブからのテキスト収集、テキスト分類、Twitterタイムラインの分析など。話題のトピックモデルについても数ページながら言及あり。
    • word2vecなど深層学習絡みはないのが残念だがテキストマイニングの基礎的なことは一通り試せる。

データサイエンス言語

​R

Pyth​​on


マーケティング

ビジネス向けのデータ分析ではマーケティング関連で用いられる事が多いと思う。それらの入門的な本を。

  • 初級『改訂3版 グロービスMBAマーケティング
    • バイブル本としては『コトラー&ケラーのマーケティング・マネジメント 第12版』などが有名なのだが入門では本書が評判がよいようだ。ビジネスマンなら仕事上でマーケティング関連の用語や概念に多かれ少なかれ振れているはずだが、その整理によいと思う。もちろんマーケティングを本職としていない方(私も)には知らないこともたくさん書かれている。まず、データ分析対象の担当者と最低限話が通じるための一冊といったところ。
  • 初級・中級『マーケティング・エンジニアリング入門 (有斐閣アルマ)
    • マーケティング・エンジニアリングとはマーケティングとエンジニアリングが融合したもの、ということで、要はマーケティングにデータ分析を持ち込んだ、ということらしい。別途、マーケティング・サイエンスという分野もあり、となるとマーケティング・サイエンスとの違いがわかりにくいが
      • マーケティング・エンジニアリング
        • マーケティング担当者の意思決定に関心がある
      • マーケティング・サイエンス
        • 消費者の意思決定に関心がある
    • まー同じなのではないか?まぁマーケティング・エンジニアリングの鳥瞰的な全体像が得られるのだろう、所見なのでこれが全体像か確信がないけど。同じく有斐閣アルマに『マーケティング・サイエンス入門 -- 市場対応の科学的マネジメント 新版 (有斐閣アルマ)』があり、それもおいおい読んで紹介します。
    • 本書の後半はほぼ、データ分析の概説書となっている。ただ、データ分析の箇所の記述に難あり。「因果関係を表現する代表的な数理モデルである回帰分析」「回帰分析のように因子間の因果関係も同時に評価」とあるのはいただけない。相関と因果は違うという記述もない。ランダムフォレストの解説で「森に見立てた大量データから」とあるが、たくさんの木の事を森と見立てているはず。ニューラルネットワークを「非線形予測モデル」、サポートベクターマシンを「非線形クラス判別」としているが、予測もクラス判別も行える。本文ではサラッとしか振れてないのに、参考文献にいきなり講談社機械学習プロフェッショナルシリーズの『深層学習』もあるが、機械学習の項目はちょっととってつけた感がある。
  • データ・ドリブン・マーケティング―――最低限知っておくべき15の指標
    • データ分析というよりは、データを用いたマーケティングにどういった指標が必要かという解説の本。Amazon社員の必須テキストらしい。

需要予測

  • 在庫管理のための需要予測入門』キャノンシステムソリューションズ株式会社数理技術部編
    • 需要予測の本があまりないようです。理論的な詳しい本ではありませんが概要を見るにはよい本と思います。

番外
時系列データで経済・金融データを扱い需要予測周りも少し扱ったので関連書を

経済学

​​計量経済学

  • 中級・上級​​『計量経済学 (y21)』浅野哲、中村二朗著 有斐閣
    • 計量経済学の中級書の定番。重回帰、経済データの取り扱いなどが参考になると思う。

経済指​​標

その他

人工知能

データサイエンスや機械学習を行うにあたって直接的には人工知能の知識は必要ないと思います。ただ、人工知能のニュースが連日流れており、上司から「人工知能でなんかやれ」と言われてお困りの方もいらっしゃるのではないでしょうか。事例記事に流されていると何が人工知能なのかわからなくなってくるので一度、引きの立場で眺めてみるのも良いかと思います。

  • 初級『マッチ箱の脳(AI)―使える人工知能のお話』森川幸人著
    • ニューロン1つをマッチ箱に見立てて、マッチで重みを表現するという面白い絵本仕立ての本。遺伝的アルゴリズム、ニューラルネットワークに加えてエキスパートシステムは強化学習法の解説まである。Amazon中古はあるみたいなので、人工知能や機械学習のイメージをつかみたい初心者によいのではないか。
  • 初級『人工知能はどのようにして 「名人」を超えたのか?―――最強の将棋AIポナンザの開発者が教える機械学習・深層学習・強化学習の本質
    • コンピュータ将棋第一人者で名人を倒したポナンザの開発者山本さんの本。人工知能がいくつかのハードルを乗り越えたのを「卒業」と表現しているのが興味深い。理論的な解説はないが、ボナンザ、アルファ碁、機械学習、深層学習、強化学習、モンテカルロ探索などについて平易な解説がある。
  • 初級『人工知能はいかにして強くなるのか? 対戦型AIで学ぶ基本のしくみ (ブルーバックス)

    • 人工知能というよりコンピューターチェス、コンピューター碁についての入門書です。AlphaGOについても言及がありますが深層学習より手の探索のアルゴリズムの説明。人工知能を知る入門としては弱いと思うけど、新書なので軽く読むのにはいいのではないでしょうか。
    • 初級『最強囲碁AI アルファ碁 解体新書 深層学習、モンテカルロ木探索、強化学習から見たその仕組み
    • アルファ碁の解説を通して、深層学習、強化学習、モンテカルロ法などの触りですが、分かりやすいと思います。
  • 初級・中級『人工知能入門』小高知宏著

    • 大学の半期の講義用の教科書らしい。人工知能の概要をコンパクトにまとめている。数式はほとんどなく、章末問題に少し出てくる。本来は1章が分厚い1冊になる内容をまとめているので物足りなさは残るが「人工知能」についての概要を知るのにはよいと思う。人工知能≠機械学習であり、人工知能⊃機械学習(人工知能は機械学習とイコールではなく、人工知能を目指す技術の一部が機械学習)ってことがよく分かります。

データサイエンティストによる推薦リスト

っーかaokikenichiって誰やねん、自分なんか信じらんねーという方向けに信頼と実績の著名データサイエンティストによる推薦リストを

うーん、難しそうだ無理というなら、 データ分析の数学学習に疲れ「数学大嫌い」というあなたを癒やすお友達あるいは悪魔

最新の情報や、スクリプト例を無料で知りたいというなら、 データサイエンス領域の役立つブログをまとめる(日本のみ)

Sign up for free and join this conversation.
Sign Up
If you already have a Qiita account log in.