本記事のめあて
- データサイエンティストのロードマップに悩んできる方が多いようなので、私のような守備範囲が浅く広い系も参考になるかなと思って書きました。
本記事の背景
- 主にどんな本を読んできたかを書きます。
- おすすめブックリストを出しているけれどお前読んでいないだろとか、
- 100冊読んですごいですねと言われますが3倍は読んでそこから選書しているので
- 「なんだよこんな記事」という人もいるだろうけれど私なら他の方のこういう記事が読みたいでもないなので書いてます
何を捨てるか
- 「なんかしなきゃとは思うけれど何をどうしていいかわからない」という人がかなりいるけれど私は逆にこの手順できっちりやれの方が苦手。元々1995年当時のバイオインフォマティクスという何をどうしていいかわからない状況で社会人になったので何をどういていいかわからない方が仕事として当たり前なので。前述の通り「何を捨てるか」なのですがそのためにも次の2点だと思う。
- (新しい)分野の俯瞰の地図を作る
- 自分が目指す方向を見つける
- 自分のキャリア遍歴についての記事バイオインフォマティクス→データサイエンス。聞こえはいいけれどかなり泥仕事。そのなかで大切にしてきたことを以前書きました。そこにも書いてありますが、データサイエンティストとして何を目指すか現状の自分がどうなのかをまず知ることが大切です。
- 私の場合2015年に部署異動し途中からデータ分析担当となりました。
- 当時は深層学習の猛威が押し寄せていた。猫も杓子も。でも私の担当は時系列分析だった。時系列分析に深層学習を使わないことはないけれどARIMAなどの伝統的なものをしっかりと学必要に迫られた。
- 客先などでも常に深層学習の話題が出て入り口までは学ばなければならなくて学び出したが
- 研究から実践までの時間が短すぎる(論文が出たらそのコードが公開され誰でもすぐ試せる状況)こんなの若い人しか無理だなと思い優先度低とした
- 逆に幅広い分野を知ろうと思った
- つまり、何でもかんでもではなく、
- ToBeとして何を目指したいのか何を求められているのか
- AsIsとして現状の自分やおかれている環境がなんなのか
- そのGapを埋めるのに何をしたら良いのか逆にいうと何を捨てるのか
- 私の場合はお客様からどんなお題を出されても「知らない」と言わないよう分からないことは持ち帰って調べるか別の人に依頼するなどのために浅くとも広くで
メンターを持つ
- ということなのですが、自分一人では辛いですよね。
- 社内や近い場所にメンターがいればこの記事を読む必要はないでしょう。でもデータサイエンティストのメンターなんてごく限られた企業にしかいないですよね。でもWeb上にいるじゃないですか。
- 私が参考にしたのは
-
渋谷駅前で働くデータサイエンティストのブログ
- ご存知TJOさん。一番参考にさせていただいております。
-
Logics of Blue
- 時系列とベイズに強いですね。私は最初に時系列分析から始めたので大変参考にさせていただいてました。
-
株式会社ホクソエムのブログ
- こちらはブログというよりもその書籍を大変参考にさせていただいております。
-
渋谷駅前で働くデータサイエンティストのブログ
学習履歴
元々乱読派なので冊数は多いが分野に偏りがあります
-
元々ゲノム系バイオインフォマティクスの仕事だった
- 医療・生物系データのデータ分析
-
元々経済学に関心があった & 早い時点でディープラーニングの速さについていくのは無理と諦め守備範囲の広さに舵をとった
- ディープラーニングの知識量が少ない
- 経済学特に計量経済学系は多い
-
異動後最初に携わったのが時系列予測
- 時系列分析
-
次に携わったのがデジタルマーケティング系
- マーケティング分析とマーケティング自体の本
-
1つの分析を深くよりもデータ分析支援コンサル的立ち位置だったので業界知識やどんな分析手法でも対応できるよう広げた
- 業界知識系、マニアックな分析手法系の知識が多め
-
スポーツアナリティクス系は完全に趣味
- いつかやりたいな
-
その他
- 2015年は何をしていいか分からずとにかく色々知ろうと勉強会の類を週1-2回巡っていた
- 動画講義やe-Learningはほとんどやってない(Python講座を少し)
- 会社で有償講座をOKしてもらっていくつか機械学習とデジタルマーケティングの講座を受講
- スクールは通ってない
- あとは本と一部はサイトの記事でひたすら独学
- 資格は日本ディープラーニング協会の「G検定」と「Generative AI test」を2024年にとったのみ
2015年からの学習履歴(主に学んだ本)
凡例
-
- 自分の血肉になっているなという書籍
-
- 特に良かった書籍
-
- その時期、その書籍の関連Qiita記事
- /図書館
- 図書館で借りた本
- /KindleUnlimited
- Unlimitedで借りた本
2015
TJOさんのブログの影響まる受けの選書から始めた。週1-2はあちこちの機械学習系勉強会に参加してた
- Rによるデータサイエンス
-
- 後になってからR/caretという機械学習の統合パッケージがあるのを知り、アルゴリズムの復習とcaretに慣れるためにとのことで書いた記事。別ライブラリで書き直すってのも理解が深まるよ
- この本に限らず自分で「これは」と思う本が出たら難しくても時間をかけてoutputを意識した勉強を絶対にした方がいいよ
- 違う言語やライブラリでコードを書き直す記事
- 章末問題を解く記事
- 式展開の解読などの記事
-
- 経済・ファイナンスデータの計量時系列分析 :
-
『経済・ファイナンスデータの計量時系列分析』章末問題をRで解く-第1章時系列分析の基礎概念-
- 理解を深める別の方法として当たり前だけれど章末問題を地道に解く
- Rでこの問題を解けってのを全部地道にやってみた
- 解析的に解くのも全部やったけれどQiita化途中までだな、、、
-
- データ解析のための統計モデリング入門
- 統計 クイックリファレンス 第2版
- はじめてのパターン認識
- データ活用実践教室/図書館
- Rによる時系列分析入門
-
- 本書、時系列分析の難しくも必須な概念を一つずつRで解説してくれている「これで分かった」という名著なのですが推している人がほとんどおらず品切れ中。
- 世の中の人は「数式たくさんの理論書をそのまま理解できる人」「バズワードをそのままCopy&Pasteで仕事が完結する人」の2種類しかいないのだと疑う
- 私は両方とも違い「数式で分かればベターだがわからない場合はコーディングで試す」というエンジニアとしては妥当だが実は希少な生き方をしているので、もしそういう希少な生き方をしている方には超絶お役立ち本
- これ社内の自分用Wikiに超絶まとめしていんだよなQiitaに起こすかな需要があれば
- 本書、時系列分析の難しくも必須な概念を一つずつRで解説してくれている「これで分かった」という名著なのですが推している人がほとんどおらず品切れ中。
-
- ビッグデータ活用の常識は今すぐ捨てなさい/図書館
- データサイエンティスト養成読本 機械学習編
- 統計学の王国を歩いてみよう/図書館
- 岩波データサイエンスVol1
- 統計学をまる裸にする/図書館
- みんなのビッグデータ/図書館
- 実験で使うとこだけ生物統計1/図書館
- Rによる計量経済分析
2016
ディープラーニングは避けていたがここにきて少しはやらないとまずいなと。岩波データサイエンスとデータサイエンティスト養成読本には助けられたな。
ある程度学んだけれど全然分からないところもあり、悩んでいたがQiitaを書き出した。
- 統計学のための数学入門30講
-
『深層学習』(青本)の式展開を追う時など何度も繰り返し読んだ。
-
- 岩波データサイエンスVol.2
-
ここら辺でOutputを意識しようとQiitaをはじめた
-
機械学習
- 上記の記事はこの後に「そうだ読んで勉強したことを書こう」と書き出したものです
-
機械学習
- イラストで学ぶディープラーニング
- 予測にいかす統計モデリングの基本
- ナンバーセンス-ビッグデータの噓を見抜く「統計リテラシー」の身につけ方/図書館
-
深層学習(KMP青本)
-
講談社機械学習プロフェッショナルシリーズ『深層学習』の学習 第1章 はじめに、第2章 順伝播型ネットワークの学習
- 数式が難しいけどこれがっつりやった方がいいなと自分なりに読む解く記事を一応全章分書いた
-
講談社機械学習プロフェッショナルシリーズ『深層学習』の学習 第1章 はじめに、第2章 順伝播型ネットワークの学習
- 道具としてのベイズ統計/図書館
- クックパッドのデータ分析力/図書館
- 道具としてのビッグデータ/図書館
- 基礎からのベイズ統計学
- 人工知能 人類最悪にして最後の発明/図書館
- 在庫管理のための需要予測入門
- 原因をさぐる統計学 共分散構造分析入門
- 岩波データサイエンスVol.3
- ロジカルデータ分析/図書館
-
【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本
- ここら辺で世の中のデータ分析系の本のリストは10冊くらいを紹介するものしかなくもの足りなかったので書いた
氷解!データ分析、機械学習手法ってたくさんあるけどいつどれを使えばよいのか
- 学習アルゴリズムがなぜたくさんあってどう使い分けるのかなどを調べまくってだいたい自分なりに整理がついたので書いてみた
- これ重要。「わかった気になる」のと「人に伝える」のは大きく違う
- ビッグデータと人工知能/図書館
- データサイエンティスト養成読本第2版
- 人工知能入門
- これなら分かる最適化数学―基礎原理から計算手法まで
-
『深層学習』(青本)の式展開を追う時など何度も繰り返し読んだ。この本で「最適化」にどう微積と線形代数が役に立つのかがわかり出した。
-
- データサイエンティストが創る未来/図書館
- グロービスMBAマーケティング第3版
- 岩波データサイエンス Vol.4
- ゼロから作るDeep Learning
- 統計学が最強の学問である実践編/図書館
- アルファ碁はなぜ人間に勝てたのか/図書館
- シンギュラリティは近い [エッセンス版]―人類が生命を超越するとき/図書館
2017
ここら辺でいろいろ悩み出したと思う。分野を広くといっても限界はある。工学部出身だけれど微積・線形代数の知識は錆び付いていて使えない。数学のまとめ記事を書いたり、数学本を繰り返したり。
- 「超」入門ベイズ統計/図書館
- 量子コンピュータが人工知能を加速する/図書館
- 経済数学の直観的方法 確率・統計編
- 「原因と結果」の経済学
- 岩波データサイエンスvol.5
-
- 地味な記事だがいいね200超。みなさんやはり数学がネックなのかな
- 経済数学の直感的方法 マクロ経済編
- 人工知能はいかにして強くなるのか? 対戦型AIで学ぶ基本のしくみ
- Web分析の教科書
- 人工知能の核心/図書館
- 岩波データサイエンスVol.6
- そろそろ、人工知能の真実を話そう/図書館
- 最強囲碁AI アルファ碁 解体新書
- データ分析の力 因果関係に迫る思考法
- 棋士とAIはどう戦ってきたか~人間vs.人工知能の激闘の歴史/図書館
- データ分析プロジェクトの手引
- 人工知能はどのようにして 「名人」を超えたのか?/図書館
- 群論入門
- タンパク質構造のトポロジー
- カルチャロミクス 文化をビッグデータで計測する/図書館
- 統計学One Point カルマンフィルタ
2018
やっぱりたくさん読もう広げようとアクセルを踏み出した。
- Rによるテキストマイニング入門
- 曲がった空間の幾何学
- ベイズモデリングの世界
- Chainer v2による実践深層学習
- 人工知能の「最適解」と人間の選択/図書館
- 時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装
- 棋士とAI アルファ碁から始まった未来/図書館
- 人文・社会科学の統計学
- スパース推定法による統計モデリング
- 予測の達人が教える経済指標の読み方
- 人間の未来 AIの未来/図書館
- 基礎からわかる時系列分析 ―Rで実践するカルマンフィルタ・MCMC・粒子フィルター
- 統計的因果探索
- ウェブデータの機械学習
- 実践 Deep Learning ―PythonとTensorFlowで学ぶ次世代の機械学習アルゴリズム
- 「イノベーターのジレンマ」の経済学的解明
- AIに心は宿るのか/図書館
- AI vs. 教科書が読めない子どもたち/図書館
- ディープラーニング入門: Pythonではじめる金融データ解析
- Rによるテキストマイニング ―tidytextを活用したデータ分析と可視化の基礎
- ファジィ時系列解析
- 実証分析のための計量経済学
- AI時代の子育て戦略/図書館
- eスポーツ論 ゲームが体育競技になる日/図書館
- 統計学OnePoint テキストアナリティクス
- 自然言語処理 (放送大学教材)
- 言語処理のための機械学習入門
- なぜ人工知能は人と会話ができるのか/図書館
- データサイエンス入門/図書館
- ビッグデータ・ベースボール/図書館
- 確率思考の戦略論
- Head First データ解析
- 統計思考の世界
- CRMの実際
- 誤解だらけの人工知能~ディープラーニングの限界と可能性~/図書館
- 欠測データ処理: Rによる単一代入法と多重代入法 (統計学One Point)
- 機械学習エンジニアになりたい人のための本/図書館
- ゼロから作るDeep Learning ❷ ―自然言語処理編
- 調査観察データの統計科学
2019
マーケティング系のデータ分析の支援をすることになり強化
- 犯罪捜査のためのテキストマイニング
- 「集合と位相」をなぜ学ぶのか
- 影響力の武器 第三版
- コトラーのマーケティング4.0
- ホテル・マーケティング・ブック
- この1冊ですべてがわかるCRMの基本
- 最新マーケティングの教科書2019
- シャノンの情報理論/図書館
- マーケティング・リサーチ入門 (有斐閣アルマSpecialized)
- ポジショニング戦略[新版]
- 機械学習のための特徴量エンジニアリング
- 経済・ファイナンスのための カルマンフィルター入門
- 見て試してわかる機械学習アルゴリズムのしくみ 機械学習図鑑
- マーケティング・サイエンス入門
- 実証分析入門
- ブスのマーケティング戦略/図書館
- 武器としての世論調査
- Hacking Growth グロースハック完全読本
- ブランディングの科学
- 前処理大全
- Who Gets What(フー・ゲッツ・ホワット) マッチメイキングとマーケットデザインの経済学
- ジョブ理論
- デジタルマーケティングの教科書
- メッシュ統計
- 「家族の幸せ」の経済学
- 政策評価のための因果関係の見つけ方 ランダム化比較試験入門
- 高次元の統計学
- コトラー&ケラーのマーケティング・マネジメント基本編 第3版
- RとStanではじめる ベイズ統計モデリングによるデータ分析入門
- 自然言語処理のための深層学習
- ビッグデータ探偵団
- 行動経済学の使い方
- ブランド論
- 新装版 幾何学は微分しないと 〜微分幾何学入門〜
- いちばんやさしいGoogleアナリティクス入門教室
- 統計分布を知れば世界が分かる
- 統合デジタルマーケティングの実践
- Kaggleで勝つデータ分析の技術
- ソロモン 消費者行動論 [上]
- 未来予測入門 元防衛省情報分析官が編み出した技法
- マーケティング・サイエンスのトップランナーたち
- なぜ「戦略」で差がつくのか。
- ネット・プロモーター経営
- ソロモン 消費者行動論 [中]
2020
この年の4月にデータ分析が主の部署に異動し、Pythonを学び出す。また「機械学習」を中心に強化。
- 自然科学の統計学
- データサイエンスの森 Kaggleの歩き方
- アフターデジタル
- 人工知能 Vol.34 No.4 (2019年7月号)
- 効果検証入門〜正しい比較のための因果推論/計量経済学の基礎
- Rではじめるソーシャルメディア分析
- ベーシック・マーケティング(第2版)
- ソロモン 消費者行動論 [下]
- マーケティング効果の測定と実践 -- 計量経済モデリング・アプローチ
-
note 「秋野つゆ」はペルソナじゃない
- マーケティング系の本も色々読み、ネットの記事も沢山読んだら「嘘が多い」「単にCopy&Pasteの記事で溢れている」ということを知った。
- 「秋野つゆ」についてきちんと原典、専門書を読む多くの記事が嘘だとわかります
- コトラーのマーケティング3.0 ソーシャル・メディア時代の新法則
- 情報理論 (ちくま学芸文庫)
- AIアルゴリズムマーケティング
-
データサイエンティスト協会スキルチェックリストver.3.00「データサイエンティスト」に必要な本
- みんな「データサイエンティスト協会スキルチェックリスト」って使ってる?引用している人多いけれど、「じゃその項目を身につけるのにどうしたらいいの」に答える記事ってないでしょう。何十万も掛けて教育ベンダーに発注している?違うんだなー
- その項目はそもそも何を問うているのかどうしたら身につくのかって考えること自体が学びになるんだ。だから自分のために書いた(もうver.5.0出ているのに3で止まってる、だってこれガチで大変なんだよその割にいいね少ないし
- データ・リテラシーの鍛え方/図書館
- デジタルマーケティングの実務ガイド
- 実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
- 機械学習・深層学習による自然言語処理入門
- Rによる実践的マーケティングリサーチと分析
- データで見る行動経済学
- 新版 統計学のセンス ―デザインする視点・データを見る目― (医学統計学シリーズ1)
- 実践GAN ~敵対的生成ネットワークによる深層学習~
- コトラーのリテール4.0
- Pythonによるファイナンス 第2版
- データ視覚化のデザイン
- Pythonではじめる教師なし学習
- つくりながら学ぶ! Pythonによる因果分析 ~因果推論・因果探索の実践入門~
- 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 入門から実践まで
- 時系列解析―自己回帰型モデル・状態空間モデル・異常検知―
- 進化するビジネスの実証分析
- データ分析ライブラリーを用いた 最適化モデルの作り方 (Pythonによる 問題解決シリーズ)
- データ分析者のためのPythonデータビジュアライゼーション入門 コードと連動してわかる可視化手法
- AlphaZero 深層学習・強化学習・探索 人工知能プログラミング実践入門
- 入門 機械学習による異常検知―Rによる実践ガイド
- Rで学ぶ空間計量経済学入門
- 現代経済学の直観的方法
- [新版]進化する経済学の実証分析
- 点過程の時系列解析
- 現場で使える!Python深層強化学習入門 強化学習と深層学習による探索と制御
- Rによるベイジアン動的線型モデル
- Rによる極値統計学
- Pythonで学ぶアルゴリズムとデータ構造
- 計量経済学 (y21)
- Python言語によるプログラミングイントロダクション
- Approaching (Almost) Any Machine Learning Problem
- PyTorchによる物体検出
- マーケットデザイン
- 空間統計学: 自然科学から人文・社会科学まで
- Python機械学習プログラミング
- ブランディングの科学2
- メカニズムデザインで勝つ/図書館
- 強化学習アルゴリズム入門: 「平均」からはじめる基礎と応用
- マンスキー データ分析と意思決定理論
- Chainerで作るコンテンツ自動生成AI
- 瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ―
- データ農業が日本を救う/図書館
- 直感 Deep Learning
- ディジタル画像処理[改訂第二版]
- 生成 Deep Learning
- 不動産テック
- ディープラーニング活用の教科書/図書館
- ウェブ最適化ではじめる機械学習
- 多モデル思考
- RCT大全
- セイバーメトリクスの落とし穴/図書館
- 物流アルゴで世が変わる
- Data Visualization: A Practical Introduction
2021
医療データ系も入ってきたのでそれらと、浅くても良いから「広く、広く」で生きていこうと圧倒的強化。専門の人以外あまりやらないであろう、オペレーションズリサーチ、ネットワーク科学、キッチンインフォマティクス、地理空間のクリギング、など直接案件がないのに手をだす。
- 人工知能 グラフィックヒストリー
- 分析者のためのデータ解釈学入門 データの本質をとらえる技術
- テキストマイニングの基礎技術と応用 (テキストアナリティクス)
- 深層学習 Goodfellow
- 医者のためのロジスチック・Cox回帰入門
- はじめてのオペレーションズ・リサーチ
- 異常検知と変化検知
- AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]
- 金融・経済分析のためのテキストマイニング
- Pythonによる医療データ分析入門――pandas+擬似レセプト編
- Pythonインタラクティブ・データビジュアライゼーション
- 2020-2021年版 はじめての医用画像ディープラーニング -基礎・応用・事例
- この1冊ですべてわかる 需要予測の基本 SCMとマーケティングを劇的に変える
- サンプルサイズの決め方
- 2020-2021年度版 イラスト図解 医療費のしくみ
- 強化学習(Sutton)
- 臨床研究の教科書 第2版
- 超入門! スラスラわかるリアルワールドデータで臨床研究
- 複雑な世界、単純な法則 ネットワーク科学の最前線
- データ分析のための数理モデル入門
- 人工知能のアーキテクトたち/図書館
- Pythonによる異常検知
- デジノグラフィ インサイト発見のためのビッグデータ分析
- カーネル多変量解析
- 意思決定分析と予測の活用
- キッチン・インフォマティクス
- PyTorch自然言語処理プログラミング
- Newton大図鑑シリーズ AI大図鑑
- クリギング入門
-
- こんな地味な本(でも地理空間データを扱い人には好著だよ)も良いと思えば記事かするといいよ
- 本書ではExcel例(後からMatlabのコード例)だったのでPythonでのコード例を作成した
- 行動を変えるデザイン
- 月刊/保険医療2021年3月号
-
- 医療データを扱うときに調べていたらこの雑誌で特集をやっていたので読んだ
- その業界の専門誌もデータ活用はAI活用についての特集を組むことがあり、ドメイン側からAIについてどう考えているか、どういう状況かなどがわかってためになるよ
- 脳の大統一理論
- 日本統計学会公式認定 統計検定準1級対応 統計学実践ワークブック
-
- 『統計検定準1級対応統計学実践ワークブック』をR, Pythonで解く~第16章重回帰分析~
- 『統計検定準1級対応統計学実践ワークブック』をR, Pythonで解く~第17章回帰診断法~
-
『統計検定準1級対応統計学実践ワークブック』をR, Pythonで解く~第18章質的回帰~
- まだ受けてないけれど準1級は欲しいよね。ワークブックの章末問題を3周くらいしたんだけれどまだしっくりきてなくて実装してみようと試しているもの(あれ3章で投げ出してるや、でもこれ大変なんだよ)
- 今日から使える!組合せ最適化 離散問題ガイドブック
- 建設DX デジタルがもたらす建設産業のニューノーマル/図書館
- ロスマンの疫学 第2版
- 量子コンピュータ入門(第2版)
- 予測する心
- テキストアナリティクスの基礎と実践
- パターン認識と機械学習 上
- 実証のための計量時系列分析
- 仕事ではじめる機械学習 第2版
- ダークデータ: 隠れたデータこそが最強の武器になる
- A/Bテスト実践ガイド
- 作って動かすALife
- IPythonデータサイエンスクックブック
- マスターアルゴリズム
- データ立国論/図書館
- メカ屋のための脳科学入門 正/図書館
- Pythonコンピュータシミュレーション入門 人文・自然・社会科学の数理モデル
- 最新《業界の常識》よくわかる医薬品業界
- 基礎日本語文法・改訂版
- Rによる地理空間データ解析入門
- 部分識別入門
- PyTorch実践入門
- 医療の経済学[第4版]
- 「スパコン富岳」後の日本-科学技術立国は復活できるか/図書館
- Kaggleコンペティション チャレンジブック
- 深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第2版
- 健康政策の経済分析: レセプトデータによる評価と提言
- カプラン・マイヤー法: 生存時間解析の基本手法
- 医療AIの知識と技術がわかる本
- 位相への30講
- TensorFlow活用ガイド
- 深層学習の原理に迫る: 数学の挑戦/図書館
- Pythonで学ぶ音声認識 機械学習実践シリーズ
- アナリティックマインド
- 文学と言語コーパスのマイニング
- これからの薬剤疫学
- 僕らはまだ、臨床研究論文の本当の読み方を知らない。
- 社会調査のための計量テキスト分析―内容分析の継承と発展を目指して【第2版】
- StanとRでベイズ統計モデリング (Wonderful R)
- DXとは何か 意識改革からニューノーマルへ
- 集合への30講
- AIエンジニアのための機械学習システムデザインパターン
- ローゼンバウム 統計的因果推論入門: 観察研究とランダム化実験
- Rによるセイバーメトリクス入門
- 離散数学「数え上げ理論」―「おみやげの配り方」から「Nクイーン問題」まで
- 人工知能が俳句を詠む: AI一茶くんの挑戦
- XAI(説明可能なAI)--そのとき人工知能はどう考えたのか?
- 入門 統計的因果推論
- 計算社会科学入門
- Pythonで学ぶ音源分離
- 情報可視化入門:人の視覚とデータの表現手法
- ゼロから作るDeep Learning ❸ ―フレームワーク編
- レベニューマネジメント: 収益管理の基礎からダイナミックプライシングまで
- 対応分析の理論と実践: 基礎・応用・展開
- 多様体とは何か 空間と次元から学ぶ現代科学の基礎概念
- デジタルマーケティングの定石
- スポーツを10倍楽しむ統計学/図書館
- BERTによる自然言語処理入門
- 機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック
- マルチエージェントのための行動科学
- アナリシス・アイ
- Magentaで開発 AI作曲
- Numbers Don't Lie/図書館
- Pythonで動かして学ぶ! あたらしいベイズ統計の教科書
- エシェロン解析-階層化して視る時空間データ
- 施策デザインのための機械学習入門
- マルチエージェントのためのデータ解析
- プロ野球を統計学と客観分析で考える デルタ・ベースボール・リポート4
- DataRobotではじめるビジネスAI入門
- IGPI流 DXのリアル・ノウハウ/図書館
- Pythonで学ぶ音声合成 機械学習実践シリーズ
- 知を再構築する 異分野融合研究のためのテキストマイニング
- 最適化手法入門
- ランキング――私たちはなぜ順位が気になるのか?/図書館
- マーケティングデータ分析 (Pythonによるビジネスデータサイエンス 3)
- アカン! DX/図書館
- 人狼知能で学ぶAIプログラミング ~ 欺瞞・推理・会話で不完全情報ゲームを戦う人工知能の作り方~
- 需要予測の戦略的活用
- オードリー・タン デジタルとAIの未来を語る/図書館
- GIS: 地理情報システム/図書館
-
- ご存知!「多重共線性」なのですがネット上の記事の多くが適当に書いていてよくわからないので自分なりにまとめた。専門分野や分析の目的についても対応が違うようですよ。浅いけれど広いデータサイエンティストを標榜しているのでこういうの書かないとな。こういう記事他では見ないでしょう?
- ボイステック革命 GAFAも狙う新市場争奪戦/図書館
- 仮説のつくりかた: 多様なデータから新たな発想をつかめ
- 実践 時系列解析 ―統計と機械学習による予測
- 動かして学ぶ量子コンピュータプログラミング ―シミュレータとサンプルコードで理解する基本アルゴリズム
- 詳解 マテリアルズインフォマティクス 有機・無機化学のための深層学習
- 戦略ゲームAI 解体新書 ストラテジー&シミュレーションゲームから学ぶ最先端アルゴリズム
- 感染症疫学のためのデータ分析入門
- Pythonではじめる数理最適化: ケーススタディでモデリングのスキルを身につけよう
- クラスター分析入門 POD版:ファジィクラスタリングの理論と応用
- 実践 マテリアルズインフォマティクス
- AIの心理学
- BAD DATA 統計データの落とし穴~その数字は真実を語るのか?/図書館
- 新版 この1冊ですべてわかる 需要予測の基本
- データ視覚化の人類史 グラフの発明から時間と空間の可視化まで
- 「誤差」「大間違い」「ウソ」を見分ける統計学/図書館
- 政治学と因果推論
- イベント・ヒストリー分析
- レコメンデーション・エンジン
- AI技術を活かすためのスキル
- 創るためのAI 機械と創造性のはてしない物語
-
- 「この記述違うなあ」という需要予測本の紹介リストを見つけてしまって自分なりに書いてみた。こっちの方が絶対いいと思うけれどいいね1/10。こういうのでめげてはいけない。
2022
オシムさんの原色本など分かりやすい痒い所に手が届く(逆にいうと「俺が悩んで学んでいたこと全部書いてあるじゃん、なんだったんだよあの苦労」)本が増えて嬉しい。Qiita記事も増やし出した。
- データ分析に必須の知識・考え方 統計学入門
- データサイエンスが解く邪馬台国/図書館
- ネットワーク分析 第2版
- 「ほとんど無害」な計量経済学―応用経済学のための実証分析ガイド
- ITエンジニアのためのスパースモデリング入門
- コンピュータビジョン最前線 (Winter 2021)
- Pythonで学ぶ実験計画法入門
- 自由エネルギー原理入門
- ディープラーニング 学習する機械/図書館
- 実践 AWSデータサイエンス
- 天然知能
- 地域データ分析入門 すぐに役立つEBPM実践ガイドブック
- 連帯のための実験社会科学: 共感・分配・秩序
- 実践的データ基盤への処方箋
- Python 実践AIモデル構築 100本ノック
-
『スタンフォード ベクトル・行列からはじめる最適化数学』1章章末問題の解答
- 数学の底上げとしてこの分厚い本(Kindle版にしたけど)の章末問題をやっている(あっれ12章で止まってるな) - 図解入門よくわかる最新実験計画法の基本と仕組み(第2版)
- セルオートマトンによる知能シミュレーション: 天然知能を実装する
- コトラーのH2Hマーケティング 「人間中心マーケティング」の理論と実践
- ディープラーニングを支える技術
- Interface(インターフェース)2022年 3月号
- ガウス過程と機械学習
- 地域政策の経済学
- Python対応 ディジタル信号処理
- そろそろ医療の費用対効果を考えてみませんか? 医療関係者のための医療経済評価入門
- 固定効果モデル (計量分析One Point)
- 分散分析を超えて: 実データに挑む (統計学One Point 20)
- データサイエンスの無駄遣い/図書館
- 最後通牒ゲームの謎 ◇進化心理学からみた行動ゲーム理論入門
- 深層学習 改訂第2版
- 実践 自然言語処理 ―実世界NLPアプリケーション開発のベストプラクティス
- 統計的因果推論の理論と実装
- プログラミング言語大全/図書館
- 基礎から学ぶマーケット・デザイン
- すごい需要予測 不確実な時代にモノを売り切る13の手法
- 入門オルタナティブデータ──経済の今を読み解く
- 統計的データクリーニングの理論と実践: Rによるデータ編集/欠測補完システム
- オークション・デザイン: ものの値段はこう決める
- 打ち切り・標本選択・切断データの回帰モデル (計量分析One Point)
- Interface 2022年 5月号
- 統計学で解明! 野球のギモン/図書館
- スポーツデータサイエンス
- 選挙・投票・公共選択の数理
- 実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門
- 実践Data Scienceシリーズ Rではじめる地理空間データの統計解析入門
- Rと事例で学ぶベイジアンネットワーク〔原著第2版〕
- 電子カルテデータ解析: 医療支援のためのエビデンス・ベースド・アプローチ
- ゼロから作るDeep Learning ❹ ―強化学習編
- 社会ネットワーク分析:「つながり」を研究する方法と応用
- たった一人の分析から事業は成長する 実践 顧客起点マーケティング
- 脳と情報: 神経回路と記憶のメカニズム/KindleUnlimited
- 白と黒のとびら: オートマトンと形式言語をめぐる冒険/図書館
- コトラーのマーケティング5.0 デジタル・テクノロジー時代の革新戦略
- [改訂第8版]LaTeX2ε美文書作成入門
- コトラーのマーケティング入門 〔原書14版〕
- 社会システムモデリング
- ハーバード・ビジネス・レビュー流 データビジュアライゼーション
- ディープラーニングを支える技術〈2〉
- DXの思考法 日本経済復活への最強戦略/図書館
- 推薦システム実践入門 ―仕事で使える導入ガイド
- Transformerによる自然言語処理
- データ分析読解の技術/図書館
- 群論への30講
- 統計学が見つけた野球の真理/図書館
- 藤井聡太はAIに勝てるか?/KindleUnlimited
- ファイナンスデータ分析 (Pythonによるビジネスデータサイエンス 4)
- Pythonではじめるベイズ機械学習入門
- 政策リサーチ入門 増補版: 仮説検証による問題解決の技法
- サッカーアナリストのすゝめ 「テクノロジー」と「分析」で支える新時代の専門職
- プロ野球を統計学と客観分析で考える デルタ・ベースボール・リポート:5
- 数理社会学の理論と方法
- 意思決定のための「分析の技術」
- データとモデルの実践ミクロ経済学:ジェンダー・プラットフォーム・自民党
- 使える! 経済学 データ駆動社会で始まった大変革
- Pythonによる金融テキストマイニング
- グラフニューラルネットワーク: PyTorchによる実装
- 問題解決のための「アルゴリズム×数学」が基礎からしっかり身につく本
- 感染症流行を読み解く数理
- 例題で学ぶグラフ理論
- 実証会計・ファイナンス: Rによる財務・株式データの分析
- 本質を捉えたデータ分析のための分析モデル入門 統計モデル、深層学習、強化学習等 用途・特徴から原理まで一気通貫!
- フリースタイル言語学/図書館
- NHKスペシャル取材班、「デジタルハンター」になる/図書館
- ゲームから学ぶAI ——環境シミュレータ×深層強化学習で広がる世界
- ゼロからわかる量子コンピュータ
- ファイナンス機械学習―金融市場分析を変える機械学習アルゴリズムの理論と実践
- イラストで学ぶ 離散数学
- 機械学習エンジニアのためのTransformers
- マテリアルズインフォマティクス
- Pythonで実践する 強化学習と転移学習
- 世界標準のデータ戦略完全ガイド
- 計量経済学 (New Liberal Arts Selection)
- AIファースト・ヘルスケア ―医療現場におけるAIアプリケーションの利用
- Python意思決定の数理入門
- DataStory: 人を動かすストーリーテリング
- 因果推論の科学 「なぜ?」の問いにどう答えるか
- 経済分析のための構造推定アルゴリズム
- ネットワーク科学: ひと・もの・ことの関係性をデータから解き明かす新しいアプローチ
- 医学のための因果推論I ―一般化線型モデル―
- アメリカン・ベースボール革命: データ・テクノロジーが野球の常識を変える/図書館
- AI技術の最前線 これからのAIを読み解く先端技術73
- 1からのデジタル・マーケティング
- 数理社会学入門
- サッカーマティクス
- 数理モデル思考で紐解く RULE DESIGN -組織と人の行動を科学する-
- Pythonによるマクロ経済予測入門
- カスタマーデータプラットフォーム デジタルビジネスを加速する顧客データ管理/図書館
- デジタルトランスフォーメーション・ジャーニー
- 医学のための因果推論II ―Rubin因果モデル―
- 推薦システム: マトリクス分解の多彩なすがた (統計学One Point 22)
2023
学んだことのOutputが足りてないと反省。前年からQiita記事を増やし出していたが、古い記事のUpdateやnoteにも書くなどInput/Outputサイクルを加速。
生成AIの大波に乗り遅れていたけれどおっかなびっくり船出。
- テキストデータマネジメント: 前処理から分析へ
- 地理学で読み解く流通と消費
- 傾向スコア (計量分析One Point)
- 評価指標入門〜データサイエンスとビジネスをつなぐ架け橋
- ベイズ分析の理論と応用: R言語による経済データの分析 (ライブラリ データ分析への招待 3)
- 評価指標入門〜データサイエンスとビジネスをつなぐ架け橋
- たのしいベイズモデリング: 事例で拓く研究のフロンティア
- Rユーザのためのtidymodels[実践]入門〜モダンな統計・機械学習モデリングの世界
- 専門家の政治予測
- ALIFE | 人工生命 ―より生命的なAIへ/図書館
- 金融AI成功パターン
- 統計で読み解く日本経済 最強の成長戦略/KindleUnlimited
- 米国防総省・人口統計コンサルタントの 人類超長期予測/図書館
- 現代マーケティング・リサーチ〔新版〕: 市場を読み解くデータ分析
-
- ドメイン知識が必要とは言われます。ただ、当然それぞれの分野で王道はあるでしょうがデータ分析の観点で短期間でどう学ぶかのようなところはまだ整備されていないと思います。まず手始めとして書いてみました。これも「浅く広く」の観点で
- Kaggleに挑む深層学習プログラミングの極意
- 経済指標のウソ 世界を動かす数字のデタラメな真実/図書館
- フィナンシャル・タイムズ式 図解の技術 世界最高峰の経済紙はどのようにデータを見せているのか
- スパコン富岳の挑戦 GAFAなき日本の戦い方/図書館
- SQLではじめるデータ分析 ―クエリで行う前処理、時系列解析、コホート分析、テキスト分析、異常検知
- Optunaによるブラックボックス最適化
- Pythonで学ぶ衛星データ解析基礎
- 多数派の専横を防ぐ 意思決定理論とEBPM
- データ思考入門/図書館
- いちばんやさしいGit&GitHubの教本 第2版 人気講師が教えるバージョン管理&共有入門
- 活かすゲーム理論
- データ分析・AIを実務に活かす データドリブン思考
- Pythonではじめる異常検知入門
- グラフのウソを見破る技術 マイアミ大学ビジュアル・ジャーナリズム講座/図書館
- ディープラーニングによる自然言語処理 (Advanced Python 2)
- 驚異の量子コンピュータ 宇宙最強マシンへの挑戦/KindleUnlimited
- イベント時系列解析入門
- 因果推論入門〜ミックステープ:基礎から現代的アプローチまで
- 地域活性マーケティング/図書館
- マイノリティ・マーケティング/図書館
- 計量文献学の世界 シェークスピアは誰ですか?
- DX時代のデータマネジメント大全
- 図解ポケット 画像生成AIがよくわかる本/図書館
- 実践XAI[説明可能なAI] 機械学習の予測を説明するためのPythonコーディング
- 大規模言語モデルは新たな知能か
- 最強のデータ分析組織/KindleUnlimited
- ビジネスダッシュボード 設計・実装ガイドブック 成果を生み出すデータと分析のデザイン
- THE MODEL
- IT Text 自然言語処理の基礎
- 新時代の野球データ論 フライボール革命のメカニズム/KindleUnlimited
- 先読み!IT×ビジネス講座 ChatGPT 対話型AIが生み出す未来/図書館
- 空間回帰モデル (計量分析One Point)
- データ分析失敗事例集: 失敗から学び、成功を手にする
-
- 2016年に書いた「【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本」は少しずつUpdateしていたのだけれどごちゃごちゃし出したのであらためて書き直した
- Pythonによる時系列分析: 予測モデル構築と企業事例
- OpenAI GPT-4/ChatGPT/LangChain 人工知能プログラミング実践入門
- DXの第一人者が教える DX超入門/図書館
- サンプリングって何だろう/KindleUnlimited
- インベンス・ルービン 統計的因果推論 (上)
- データ分析に必須の知識・考え方 認知バイアス入門
- 実験計画法: 過飽和計画の構成とデータ解析 (統計学One Point 23)
- 基礎から学ぶ統計学
- データにのまれる経済学 薄れゆく理論信仰/図書館
- 生成文法がわかる本/図書館
- 医療費統計の基本分析: 電子レセプトの5要素分析とその活用
- 社会と経済:枠組みと原則
-
グラノヴェッターがノーベル経済学賞を取ると思っている。ネットワーク科学の重要性が増しているので
- 「複雑ネットワーク」とは何か 複雑な関係を読み解く新しいアプローチ/図書館
- AI海戦 ー人工知能は海戦の意思決定をどう変えるのか?
-
ヤバいデータ分析(書籍・記事であまり扱われてないが重要なこと)
- 2017年くらいからちまちま書いていて「薄い本」にしようかと思っていたけど進まないので思い切ってQiitaに書いた。データ分析の本を沢山読んだけど意外と書いてないことって結構ある
- リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック
- Pythonによる地理空間データ分析 ―例題で学ぶロケーションインテリジェンス
- 機械学習のための確率過程入門: 確率微分方程式からベイズモデル,拡散モデルまで
- The Kaggle Workbook 著名コンテストに学ぶ!競技トップレベルの思考と技術
- 次世代の実証経済学
- Python時系列分析クックブック I: 前処理
- 生成AIの核心: 「新しい知」といかに向き合うか/図書館
- パターン認識と機械学習 下
- ディープラーニング実践ガイド
- データサイエンスの経済学
- アナロジア AIの次に来るもの/図書館
- 人工知能 人類最悪にして最後の発明/図書館
- ビジネスエリートの「これはすごい!」を集めた 外資系投資銀行のエクセル仕事術
- 戦略ごっこ―マーケティング以前の問題
- エンジニアが学ぶ金融システムの「知識」と「技術」 第2版
2024
4月から異動。因果推論・因果探索についての調査(なので本が偏ります)。
ChatGPTも手放せなくなる。
- Rで学ぶ マルチレベルモデル[入門編]: 基本モデルの考え方と分析/図書館
- 指標・特徴量の設計から始める データ可視化学入門 データを洞察につなげる技術
- 事例で学ぶ特徴量エンジニアリング
- MBA定量分析と意思決定
- ジェンダー格差-実証経済学は何を語るか/図書館
- 解釈可能なAI 機械学習モデルの解釈手法を実践的に理解する
- Pythonではじめるオープンエンドな進化的アルゴリズム ―発散型の機械学習による多様な解の探索
- 面倒なことはChatGPTにやらせよう
-
- データサイエンス系の人でも(だからこそ?)生成AIに逡巡してあまり触ってない人多いんじゃない私はそうだった。でもやってみるしかないんだよ。
-
- Python時系列分析クックブック II: モデル・機械学習
- データ と デザイン 人とデータのつなぎかた
- 機械学習による検索ランキング改善ガイド
- 脳の意識 機械の意識 - 脳神経科学の挑戦
- 科学で迫る勝敗の法則
- Pythonでスラスラわかる ベイズ推論「超」入門
- 教養としての生成AI/図書館
- Federated Learning: プライバシー保護下における機械学習
- “未”顧客理解 なぜ、「買ってくれる人=顧客」しか見ないのか?/KindleUnlimited
- 超デジタル世界 DX,メタバースのゆくえ/図書館
- 生成AIプロンプトエンジニアリング入門 ChatGPTとMidjourneyで学ぶ基本的な手法
- 実践 生成AIの教科書
- ゲーム理論からの社会ネットワーク分析
-
ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた
- IT系のスキルロードマップのサイトroadmap.shを見つけ、AI and Data Scientistというカテゴリがあったので各項目で何を学べば良いかを書いた
- こういう記事はハネる(いいねで終わってはダメなんだこの情報で学んで次はあなたが記事を書くんだ)
- インフォグラフィック制作ガイド 「関係」を可視化する情報デザインの手引き
- 生成AIで世界はこう変わる/図書館
- ネットワーク科学入門: Pythonで学ぶデータ分析とモデリング
- ChatGPTと語る未来/図書館
- 未来を読む AIと格差は世界を滅ぼす/図書館
- 因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ
-
因果推論・因果探索をアカデミアではないデータサイエンティストの立場で学なら必読。ここら辺の記事も書きます。
-
- ChatGPT 大規模言語モデルの進化と応用
- 企業価値向上のための 経営指標大全
- Pythonによる気象・気候データ解析I
- Excel 最強の教科書[完全版] 【2nd Edition】
- BayoLinkSで実践するベイジアンネットワーク
- 因果過程追跡の基礎: 経営革新事例の即応研究法
- GitLabに学ぶ 世界最先端のリモート組織のつくりかた
- ベイジアンネットワーク(植野)
- Pythonで学ぶ効果検証入門/図書館
- 「複雑系」入門 カオス、フラクタルから生命の謎まで/図書館
- PyCaretで学ぶ 機械学習入門
- はじめての統計的因果推論
- 確率的グラフィカルモデル
- データ駆動型回帰分析 計量経済学と機械学習の融合
- 入門 共分散構造分析の実際
- 構造的因果モデルの基礎
- ベイジアンネットワーク技術 ユーザ・顧客のモデル化と不確実性推論
- リサーチ・デザイン: 経営知識創造の基本技術
- 「行為の経営学」の新展開: 因果メカニズムの解明がひらく研究の可能性
- 日本の人事を科学する: 因果推論に基づくデータ活用
- DMM.comを支えるデータ駆動戦略
- Pythonによる経済・経営分析のためのデータサイエンス~分析の基礎から因果推論まで
- 質的比較分析(QCA) : リサーチ・デザインと実践
- 深層学習教科書 ディープラーニング G検定(ジェネラリスト)公式テキスト 第3版
- LeanとDevOpsの科学
- 反実仮想機械学習〜機械学習と因果推論の融合技術の理論と実践
- 強化学習から信頼できる意思決定へ
- グラフィカルモデル(講談社KMP)
- その決定に根拠はありますか? 確率思考でビジネスの成果を確実化するエビデンス・ベースド・マーケティング
- 統計的因果推論 -モデル・推論・推測-
- 経営事例の物語分析: 企業盛衰のダイナミクスをつかむ
- 医学研究のための 因果推論レクチャー
- 統計学を哲学する
- DATA is BOSS 収益が上がり続けるデータドリブン経営入門
- ヤバい統計 政府、政治家、世論はなぜ数字に騙されるのか
- AIは短歌をどう詠むか
- 反事実と因果推論
- AI時代の質問力 プロンプトリテラシー 「問い」と「指示」が生成AIの可能性を最大限に引き出す
- ChatGPTの全貌 何がすごくて、何が危険なのか?/図書館
- 能動的推論:心、脳、行動の自由エネルギー原理
- 自然言語処理の教科書
- 社会科学と因果分析: ウェーバーの方法論から知の現在へ
-
-
2024年版機械学習・データ分析の必須10冊+ガチ90冊+Next5冊=105冊
- 2023年記事のUpdate
-
2024年版機械学習・データ分析の必須10冊+ガチ67冊+Next5冊=82冊(Rユーザー向け)
- R版も書きました
-
2024年版機械学習・データ分析の必須10冊+ガチ90冊+Next5冊=105冊
-
- 生成AIがバズりすぎで間違いを含む適当な記事が増えているので、結構力を入れて書いたのだけれどこういうのはいいねがつかないな、、、
- 入門 サンプルサイズ設計―基本理論から計算方法まで
- Pythonライブラリによる因果推論・因果探索[概念と実践]
- 経営事例の質的比較分析
- (2024-09-16時点)