あるデータサイエンティストの勉強履歴（守備範囲が浅く広い系のために）

Posted at 2024-09-16

本記事のめあて

データサイエンティストのロードマップに悩んできる方が多いようなので、私のような守備範囲が浅く広い系も参考になるかなと思って書きました。

本記事の背景

主にどんな本を読んできたかを書きます。
- おすすめブックリストを出しているけれどお前読んでいないだろとか、
- 100冊読んですごいですねと言われますが3倍は読んでそこから選書しているので
「なんだよこんな記事」という人もいるだろうけれど私なら他の方のこういう記事が読みたいでもないなので書いてます

何を捨てるか

「なんかしなきゃとは思うけれど何をどうしていいかわからない」という人がかなりいるけれど私は逆にこの手順できっちりやれの方が苦手。元々1995年当時のバイオインフォマティクスという何をどうしていいかわからない状況で社会人になったので何をどういていいかわからない方が仕事として当たり前なので。前述の通り「何を捨てるか」なのですがそのためにも次の2点だと思う。
- （新しい）分野の俯瞰の地図を作る
- 自分が目指す方向を見つける
自分のキャリア遍歴についての記事バイオインフォマティクス→データサイエンス。聞こえはいいけれどかなり泥仕事。そのなかで大切にしてきたことを以前書きました。そこにも書いてありますが、データサイエンティストとして何を目指すか現状の自分がどうなのかをまず知ることが大切です。
- 私の場合2015年に部署異動し途中からデータ分析担当となりました。
- 当時は深層学習の猛威が押し寄せていた。猫も杓子も。でも私の担当は時系列分析だった。時系列分析に深層学習を使わないことはないけれどARIMAなどの伝統的なものをしっかりと学必要に迫られた。
- 客先などでも常に深層学習の話題が出て入り口までは学ばなければならなくて学び出したが
  - 研究から実践までの時間が短すぎる（論文が出たらそのコードが公開され誰でもすぐ試せる状況）こんなの若い人しか無理だなと思い優先度低とした
  - 逆に幅広い分野を知ろうと思った
つまり、何でもかんでもではなく、
- ToBeとして何を目指したいのか何を求められているのか
- AsIsとして現状の自分やおかれている環境がなんなのか
- そのGapを埋めるのに何をしたら良いのか逆にいうと何を捨てるのか
  - 私の場合はお客様からどんなお題を出されても「知らない」と言わないよう分からないことは持ち帰って調べるか別の人に依頼するなどのために浅くとも広くで

メンターを持つ

ということなのですが、自分一人では辛いですよね。
社内や近い場所にメンターがいればこの記事を読む必要はないでしょう。でもデータサイエンティストのメンターなんてごく限られた企業にしかいないですよね。でもWeb上にいるじゃないですか。
私が参考にしたのは
- 渋谷駅前で働くデータサイエンティストのブログ
  - ご存知TJOさん。一番参考にさせていただいております。
- Logics of Blue
  - 時系列とベイズに強いですね。私は最初に時系列分析から始めたので大変参考にさせていただいてました。
- 株式会社ホクソエムのブログ
  - こちらはブログというよりもその書籍を大変参考にさせていただいております。

学習履歴

元々乱読派なので冊数は多いが分野に偏りがあります

元々ゲノム系バイオインフォマティクスの仕事だった
- 医療・生物系データのデータ分析
元々経済学に関心があった & 早い時点でディープラーニングの速さについていくのは無理と諦め守備範囲の広さに舵をとった
- ディープラーニングの知識量が少ない
- 経済学特に計量経済学系は多い
異動後最初に携わったのが時系列予測
- 時系列分析
次に携わったのがデジタルマーケティング系
- マーケティング分析とマーケティング自体の本
1つの分析を深くよりもデータ分析支援コンサル的立ち位置だったので業界知識やどんな分析手法でも対応できるよう広げた
- 業界知識系、マニアックな分析手法系の知識が多め
スポーツアナリティクス系は完全に趣味
- いつかやりたいな
その他
- 2015年は何をしていいか分からずとにかく色々知ろうと勉強会の類を週1-2回巡っていた
- 動画講義やe-Learningはほとんどやってない（Python講座を少し）
- 会社で有償講座をOKしてもらっていくつか機械学習とデジタルマーケティングの講座を受講
- スクールは通ってない
- あとは本と一部はサイトの記事でひたすら独学
- 資格は日本ディープラーニング協会の「G検定」と「Generative AI test」を2024年にとったのみ

2015年からの学習履歴（主に学んだ本）

凡例

- 自分の血肉になっているなという書籍
- 特に良かった書籍
- その時期、その書籍の関連Qiita記事
/図書館
- 図書館で借りた本
/KindleUnlimited
- Unlimitedで借りた本

2015

TJOさんのブログの影響まる受けの選書から始めた。週1-2はあちこちの機械学習系勉強会に参加してた

Rによるデータサイエンス
- 『Rによるデータサイエンス』をcaretで再現する
  - 後になってからR/caretという機械学習の統合パッケージがあるのを知り、アルゴリズムの復習とcaretに慣れるためにとのことで書いた記事。別ライブラリで書き直すってのも理解が深まるよ
  - この本に限らず自分で「これは」と思う本が出たら難しくても時間をかけてoutputを意識した勉強を絶対にした方がいいよ
    
    違う言語やライブラリでコードを書き直す記事
    
    章末問題を解く記事
    
    式展開の解読などの記事
経済・ファイナンスデータの計量時系列分析 :
- 『経済・ファイナンスデータの計量時系列分析』章末問題をRで解く－第1章時系列分析の基礎概念－
  - 理解を深める別の方法として当たり前だけれど章末問題を地道に解く
  - Rでこの問題を解けってのを全部地道にやってみた
  - 解析的に解くのも全部やったけれどQiita化途中までだな、、、
データ解析のための統計モデリング入門
統計　クイックリファレンス　第２版
はじめてのパターン認識
データ活用実践教室/図書館
Rによる時系列分析入門
- - 本書、時系列分析の難しくも必須な概念を一つずつRで解説してくれている「これで分かった」という名著なのですが推している人がほとんどおらず品切れ中。
    
    世の中の人は「数式たくさんの理論書をそのまま理解できる人」「バズワードをそのままCopy&Pasteで仕事が完結する人」の2種類しかいないのだと疑う
    
    私は両方とも違い「数式で分かればベターだがわからない場合はコーディングで試す」というエンジニアとしては妥当だが実は希少な生き方をしているので、もしそういう希少な生き方をしている方には超絶お役立ち本
    
    これ社内の自分用Wikiに超絶まとめしていんだよなQiitaに起こすかな需要があれば
ビッグデータ活用の常識は今すぐ捨てなさい/図書館
データサイエンティスト養成読本　機械学習編
統計学の王国を歩いてみよう/図書館
岩波データサイエンスVol1
統計学をまる裸にする/図書館
みんなのビッグデータ/図書館
実験で使うとこだけ生物統計１/図書館
Rによる計量経済分析

2016

ディープラーニングは避けていたがここにきて少しはやらないとまずいなと。岩波データサイエンスとデータサイエンティスト養成読本には助けられたな。
ある程度学んだけれど全然分からないところもあり、悩んでいたがQiitaを書き出した。

統計学のための数学入門30講
- 『深層学習』（青本）の式展開を追う時など何度も繰り返し読んだ。
岩波データサイエンスVol.2
ここら辺でOutputを意識しようとQiitaをはじめた
- 機械学習
  - 上記の記事はこの後に「そうだ読んで勉強したことを書こう」と書き出したものです
イラストで学ぶディープラーニング
予測にいかす統計モデリングの基本
ナンバーセンス－ビッグデータの噓を見抜く「統計リテラシー」の身につけ方/図書館
深層学習（KMP青本）
- 講談社機械学習プロフェッショナルシリーズ『深層学習』の学習第1章はじめに、第2章順伝播型ネットワークの学習
  - 数式が難しいけどこれがっつりやった方がいいなと自分なりに読む解く記事を一応全章分書いた
道具としてのベイズ統計/図書館
クックパッドのデータ分析力/図書館
道具としてのビッグデータ/図書館
基礎からのベイズ統計学
人工知能人類最悪にして最後の発明/図書館
在庫管理のための需要予測入門
原因をさぐる統計学　共分散構造分析入門
岩波データサイエンスVol.3
ロジカルデータ分析/図書館
【データ分析の必読10冊+差をつける10冊＋100冊超】データサイエンス、データ分析、機械学習関連の本
- ここら辺で世の中のデータ分析系の本のリストは10冊くらいを紹介するものしかなくもの足りなかったので書いた
氷解！データ分析、機械学習手法ってたくさんあるけどいつどれを使えばよいのか
- 学習アルゴリズムがなぜたくさんあってどう使い分けるのかなどを調べまくってだいたい自分なりに整理がついたので書いてみた
  - これ重要。「わかった気になる」のと「人に伝える」のは大きく違う
ビッグデータと人工知能/図書館
データサイエンティスト養成読本第２版
人工知能入門
これなら分かる最適化数学―基礎原理から計算手法まで
- 『深層学習』（青本）の式展開を追う時など何度も繰り返し読んだ。この本で「最適化」にどう微積と線形代数が役に立つのかがわかり出した。
データサイエンティストが創る未来/図書館
グロービスMBAマーケティング第3版
岩波データサイエンス Vol.4
ゼロから作るDeep Learning
統計学が最強の学問である実践編/図書館
アルファ碁はなぜ人間に勝てたのか/図書館
シンギュラリティは近い [エッセンス版]―人類が生命を超越するとき/図書館

2017

ここら辺でいろいろ悩み出したと思う。分野を広くといっても限界はある。工学部出身だけれど微積・線形代数の知識は錆び付いていて使えない。数学のまとめ記事を書いたり、数学本を繰り返したり。

「超」入門ベイズ統計/図書館
量子コンピュータが人工知能を加速する/図書館
経済数学の直観的方法確率・統計編
「原因と結果」の経済学
岩波データサイエンスvol.5
データサイエンス、データ分析、機械学習に必要な数学
- 地味な記事だがいいね200超。みなさんやはり数学がネックなのかな
経済数学の直感的方法　マクロ経済編
人工知能はいかにして強くなるのか? 対戦型AIで学ぶ基本のしくみ
Web分析の教科書
人工知能の核心/図書館
岩波データサイエンスVol.6
そろそろ、人工知能の真実を話そう/図書館
最強囲碁AI アルファ碁解体新書
データ分析の力因果関係に迫る思考法
棋士とAIはどう戦ってきたか~人間vs.人工知能の激闘の歴史/図書館
データ分析プロジェクトの手引
人工知能はどのようにして「名人」を超えたのか?/図書館
群論入門
タンパク質構造のトポロジー
カルチャロミクス　文化をビッグデータで計測する/図書館
統計学One Point カルマンフィルタ

2018

やっぱりたくさん読もう広げようとアクセルを踏み出した。

Rによるテキストマイニング入門
曲がった空間の幾何学
ベイズモデリングの世界
Chainer v2による実践深層学習
人工知能の「最適解」と人間の選択/図書館
時系列分析と状態空間モデルの基礎: RとStanで学ぶ理論と実装
棋士とＡＩアルファ碁から始まった未来/図書館
人文・社会科学の統計学
スパース推定法による統計モデリング
予測の達人が教える経済指標の読み方
人間の未来 AIの未来/図書館
基礎からわかる時系列分析 ―Rで実践するカルマンフィルタ・MCMC・粒子フィルター
統計的因果探索
ウェブデータの機械学習
実践 Deep Learning ―PythonとTensorFlowで学ぶ次世代の機械学習アルゴリズム
「イノベーターのジレンマ」の経済学的解明
AIに心は宿るのか/図書館
AI vs. 教科書が読めない子どもたち/図書館
ディープラーニング入門: Pythonではじめる金融データ解析
Rによるテキストマイニング ―tidytextを活用したデータ分析と可視化の基礎
ファジィ時系列解析
実証分析のための計量経済学
AI時代の子育て戦略/図書館
eスポーツ論ゲームが体育競技になる日/図書館
統計学OnePoint テキストアナリティクス
自然言語処理 (放送大学教材)
言語処理のための機械学習入門
なぜ人工知能は人と会話ができるのか/図書館
データサイエンス入門/図書館
ビッグデータ・ベースボール/図書館
確率思考の戦略論
Head First データ解析
統計思考の世界
CRMの実際
誤解だらけの人工知能～ディープラーニングの限界と可能性～/図書館
欠測データ処理: Rによる単一代入法と多重代入法 (統計学One Point)
機械学習エンジニアになりたい人のための本/図書館
ゼロから作るDeep Learning ❷ ―自然言語処理編
調査観察データの統計科学

2019

マーケティング系のデータ分析の支援をすることになり強化

犯罪捜査のためのテキストマイニング
「集合と位相」をなぜ学ぶのか
影響力の武器　第三版
コトラーのマーケティング4.0
ホテル・マーケティング・ブック
この1冊ですべてがわかるCRMの基本
最新マーケティングの教科書2019
シャノンの情報理論/図書館
マーケティング・リサーチ入門 (有斐閣アルマSpecialized)
ポジショニング戦略［新版］
機械学習のための特徴量エンジニアリング
経済・ファイナンスのためのカルマンフィルター入門
見て試してわかる機械学習アルゴリズムのしくみ機械学習図鑑
マーケティング・サイエンス入門
実証分析入門
ブスのマーケティング戦略/図書館
武器としての世論調査
Hacking Growth グロースハック完全読本
ブランディングの科学
前処理大全
Who Gets What(フー・ゲッツ・ホワット) マッチメイキングとマーケットデザインの経済学
ジョブ理論
デジタルマーケティングの教科書
メッシュ統計
「家族の幸せ」の経済学
政策評価のための因果関係の見つけ方ランダム化比較試験入門
高次元の統計学
コトラー&ケラーのマーケティング・マネジメント基本編第3版
RとStanではじめる　ベイズ統計モデリングによるデータ分析入門
自然言語処理のための深層学習
ビッグデータ探偵団
行動経済学の使い方
ブランド論
新装版　幾何学は微分しないと　〜微分幾何学入門〜
いちばんやさしいGoogleアナリティクス入門教室
統計分布を知れば世界が分かる
統合デジタルマーケティングの実践
Kaggleで勝つデータ分析の技術
ソロモン消費者行動論 [上]
未来予測入門元防衛省情報分析官が編み出した技法
マーケティング・サイエンスのトップランナーたち
なぜ「戦略」で差がつくのか。
ネット・プロモーター経営
ソロモン消費者行動論 [中]

2020

この年の4月にデータ分析が主の部署に異動し、Pythonを学び出す。また「機械学習」を中心に強化。

自然科学の統計学
データサイエンスの森　Kaggleの歩き方
アフターデジタル
人工知能 Vol.34 No.4 (2019年7月号)
効果検証入門〜正しい比較のための因果推論/計量経済学の基礎
Rではじめるソーシャルメディア分析
ベーシック・マーケティング(第2版)
ソロモン消費者行動論 [下]
マーケティング効果の測定と実践 -- 計量経済モデリング・アプローチ
note 「秋野つゆ」はペルソナじゃない
- マーケティング系の本も色々読み、ネットの記事も沢山読んだら「嘘が多い」「単にCopy＆Pasteの記事で溢れている」ということを知った。
- 「秋野つゆ」についてきちんと原典、専門書を読む多くの記事が嘘だとわかります
コトラーのマーケティング3.0　ソーシャル・メディア時代の新法則
情報理論 (ちくま学芸文庫)
AIアルゴリズムマーケティング
データサイエンティスト協会スキルチェックリストver.3.00「データサイエンティスト」に必要な本
- みんな「データサイエンティスト協会スキルチェックリスト」って使ってる？引用している人多いけれど、「じゃその項目を身につけるのにどうしたらいいの」に答える記事ってないでしょう。何十万も掛けて教育ベンダーに発注している？違うんだなー
- その項目はそもそも何を問うているのかどうしたら身につくのかって考えること自体が学びになるんだ。だから自分のために書いた（もうver.5.0出ているのに3で止まってる、だってこれガチで大変なんだよその割にいいね少ないし
データ・リテラシーの鍛え方/図書館
デジタルマーケティングの実務ガイド
実践Data Scienceシリーズ PythonではじめるKaggleスタートブック
機械学習・深層学習による自然言語処理入門
Rによる実践的マーケティングリサーチと分析
データで見る行動経済学
新版統計学のセンス ―デザインする視点・データを見る目― (医学統計学シリーズ1)
実践GAN ~敵対的生成ネットワークによる深層学習~
コトラーのリテール4.0
Pythonによるファイナンス第2版
データ視覚化のデザイン
Pythonではじめる教師なし学習
つくりながら学ぶ! Pythonによる因果分析 ~因果推論・因果探索の実践入門~
機械学習スタートアップシリーズ Pythonで学ぶ強化学習入門から実践まで
時系列解析―自己回帰型モデル・状態空間モデル・異常検知―
進化するビジネスの実証分析
データ分析ライブラリーを用いた最適化モデルの作り方 (Pythonによる問題解決シリーズ)
データ分析者のためのPythonデータビジュアライゼーション入門コードと連動してわかる可視化手法
AlphaZero 深層学習・強化学習・探索人工知能プログラミング実践入門
入門機械学習による異常検知―Rによる実践ガイド
Rで学ぶ空間計量経済学入門
現代経済学の直観的方法
[新版]進化する経済学の実証分析
点過程の時系列解析
現場で使える！Python深層強化学習入門強化学習と深層学習による探索と制御
Rによるベイジアン動的線型モデル
Rによる極値統計学
Pythonで学ぶアルゴリズムとデータ構造
計量経済学 (y21)
Python言語によるプログラミングイントロダクション
Approaching (Almost) Any Machine Learning Problem
PyTorchによる物体検出
マーケットデザイン
空間統計学: 自然科学から人文・社会科学まで
Python機械学習プログラミング
ブランディングの科学2
メカニズムデザインで勝つ/図書館
強化学習アルゴリズム入門: 「平均」からはじめる基礎と応用
マンスキー　データ分析と意思決定理論
Chainerで作るコンテンツ自動生成AI
瀕死の統計学を救え! ―有意性検定から「仮説が正しい確率」へ―
データ農業が日本を救う/図書館
直感 Deep Learning
ディジタル画像処理[改訂第二版]
生成 Deep Learning
不動産テック
ディープラーニング活用の教科書/図書館
ウェブ最適化ではじめる機械学習
多モデル思考
RCT大全
セイバーメトリクスの落とし穴/図書館
物流アルゴで世が変わる
Data Visualization: A Practical Introduction

2021

医療データ系も入ってきたのでそれらと、浅くても良いから「広く、広く」で生きていこうと圧倒的強化。専門の人以外あまりやらないであろう、オペレーションズリサーチ、ネットワーク科学、キッチンインフォマティクス、地理空間のクリギング、など直接案件がないのに手をだす。

人工知能グラフィックヒストリー
分析者のためのデータ解釈学入門データの本質をとらえる技術
テキストマイニングの基礎技術と応用 (テキストアナリティクス)
深層学習 Goodfellow
医者のためのロジスチック・Cox回帰入門
はじめてのオペレーションズ・リサーチ
異常検知と変化検知
AI・データ分析プロジェクトのすべて[ビジネス力×技術力=価値創出]
金融・経済分析のためのテキストマイニング
Pythonによる医療データ分析入門――pandas＋擬似レセプト編
Pythonインタラクティブ・データビジュアライゼーション
2020-2021年版はじめての医用画像ディープラーニング -基礎・応用・事例
この1冊ですべてわかる需要予測の基本 SCMとマーケティングを劇的に変える
サンプルサイズの決め方
2020-2021年度版イラスト図解医療費のしくみ
強化学習(Sutton)
臨床研究の教科書第2版
超入門! スラスラわかるリアルワールドデータで臨床研究
複雑な世界、単純な法則ネットワーク科学の最前線
データ分析のための数理モデル入門
人工知能のアーキテクトたち/図書館
Pythonによる異常検知
デジノグラフィインサイト発見のためのビッグデータ分析
カーネル多変量解析
意思決定分析と予測の活用
キッチン・インフォマティクス
PyTorch自然言語処理プログラミング
Newton大図鑑シリーズ AI大図鑑
クリギング入門
『クリギング入門』のPython実装
- こんな地味な本（でも地理空間データを扱い人には好著だよ）も良いと思えば記事かするといいよ
- 本書ではExcel例（後からMatlabのコード例）だったのでPythonでのコード例を作成した
行動を変えるデザイン
月刊／保険医療2021年3月号
- 医療データを扱うときに調べていたらこの雑誌で特集をやっていたので読んだ
- その業界の専門誌もデータ活用はAI活用についての特集を組むことがあり、ドメイン側からAIについてどう考えているか、どういう状況かなどがわかってためになるよ
脳の大統一理論
日本統計学会公式認定統計検定準1級対応統計学実践ワークブック
- 『統計検定準1級対応統計学実践ワークブック』をR, Pythonで解く～第16章重回帰分析～
- 『統計検定準1級対応統計学実践ワークブック』をR, Pythonで解く～第17章回帰診断法～
- 『統計検定準1級対応統計学実践ワークブック』をR, Pythonで解く～第18章質的回帰～
  - まだ受けてないけれど準1級は欲しいよね。ワークブックの章末問題を3周くらいしたんだけれどまだしっくりきてなくて実装してみようと試しているもの（あれ3章で投げ出してるや、でもこれ大変なんだよ）
今日から使える!組合せ最適化離散問題ガイドブック
建設DX デジタルがもたらす建設産業のニューノーマル/図書館
ロスマンの疫学第2版
量子コンピュータ入門(第2版)
予測する心
テキストアナリティクスの基礎と実践
パターン認識と機械学習上
実証のための計量時系列分析
仕事ではじめる機械学習第2版
ダークデータ: 隠れたデータこそが最強の武器になる
A/Bテスト実践ガイド
作って動かすALife
IPythonデータサイエンスクックブック
マスターアルゴリズム
データ立国論/図書館
メカ屋のための脳科学入門正/図書館
Pythonコンピュータシミュレーション入門人文・自然・社会科学の数理モデル
最新《業界の常識》よくわかる医薬品業界
基礎日本語文法・改訂版
Rによる地理空間データ解析入門
部分識別入門
PyTorch実践入門
医療の経済学[第4版]
「スパコン富岳」後の日本-科学技術立国は復活できるか/図書館
Kaggleコンペティションチャレンジブック
深層学習教科書ディープラーニング G検定(ジェネラリスト)公式テキスト第2版
健康政策の経済分析: レセプトデータによる評価と提言
カプラン・マイヤー法: 生存時間解析の基本手法
医療AIの知識と技術がわかる本
位相への30講
TensorFlow活用ガイド
深層学習の原理に迫る: 数学の挑戦/図書館
Pythonで学ぶ音声認識機械学習実践シリーズ
アナリティックマインド
文学と言語コーパスのマイニング
これからの薬剤疫学
僕らはまだ、臨床研究論文の本当の読み方を知らない。
社会調査のための計量テキスト分析―内容分析の継承と発展を目指して【第2版】
StanとRでベイズ統計モデリング (Wonderful R)
DXとは何か意識改革からニューノーマルへ
集合への30講
AIエンジニアのための機械学習システムデザインパターン
ローゼンバウム統計的因果推論入門: 観察研究とランダム化実験
Rによるセイバーメトリクス入門
離散数学「数え上げ理論」―「おみやげの配り方」から「Nクイーン問題」まで
人工知能が俳句を詠む: AI一茶くんの挑戦
XAI(説明可能なAI)--そのとき人工知能はどう考えたのか?
入門統計的因果推論
計算社会科学入門
Pythonで学ぶ音源分離
情報可視化入門:人の視覚とデータの表現手法
ゼロから作るDeep Learning ❸ ―フレームワーク編
レベニューマネジメント: 収益管理の基礎からダイナミックプライシングまで
対応分析の理論と実践: 基礎・応用・展開
多様体とは何か空間と次元から学ぶ現代科学の基礎概念
デジタルマーケティングの定石
スポーツを10倍楽しむ統計学/図書館
BERTによる自然言語処理入門
機械学習を解釈する技術〜予測力と説明力を両立する実践テクニック
マルチエージェントのための行動科学
アナリシス・アイ
Magentaで開発 AI作曲
Numbers Don't Lie/図書館
Pythonで動かして学ぶ! あたらしいベイズ統計の教科書
エシェロン解析－階層化して視る時空間データ
施策デザインのための機械学習入門
マルチエージェントのためのデータ解析
プロ野球を統計学と客観分析で考えるデルタ・ベースボール・リポート4
DataRobotではじめるビジネスAI入門
IGPI流 DXのリアル・ノウハウ/図書館
Pythonで学ぶ音声合成機械学習実践シリーズ
知を再構築する異分野融合研究のためのテキストマイニング
最適化手法入門
ランキング――私たちはなぜ順位が気になるのか?/図書館
マーケティングデータ分析 (Pythonによるビジネスデータサイエンス 3)
アカン! DX/図書館
人狼知能で学ぶAIプログラミング ~ 欺瞞・推理・会話で不完全情報ゲームを戦う人工知能の作り方~
需要予測の戦略的活用
オードリー・タンデジタルとAIの未来を語る/図書館
GIS: 地理情報システム/図書館
多重共線性について難しいので専門書の記述をまとめた
- ご存知！「多重共線性」なのですがネット上の記事の多くが適当に書いていてよくわからないので自分なりにまとめた。専門分野や分析の目的についても対応が違うようですよ。浅いけれど広いデータサイエンティストを標榜しているのでこういうの書かないとな。こういう記事他では見ないでしょう？
ボイステック革命 GAFAも狙う新市場争奪戦/図書館
仮説のつくりかた: 多様なデータから新たな発想をつかめ
実践時系列解析 ―統計と機械学習による予測
動かして学ぶ量子コンピュータプログラミング ―シミュレータとサンプルコードで理解する基本アルゴリズム
詳解マテリアルズインフォマティクス　有機・無機化学のための深層学習
戦略ゲームAI 解体新書ストラテジー&シミュレーションゲームから学ぶ最先端アルゴリズム
感染症疫学のためのデータ分析入門
Pythonではじめる数理最適化: ケーススタディでモデリングのスキルを身につけよう
クラスター分析入門 POD版:ファジィクラスタリングの理論と応用
実践マテリアルズインフォマティクス
AIの心理学
BAD DATA 統計データの落とし穴~その数字は真実を語るのか?/図書館
新版この1冊ですべてわかる需要予測の基本
データ視覚化の人類史グラフの発明から時間と空間の可視化まで
「誤差」「大間違い」「ウソ」を見分ける統計学/図書館
政治学と因果推論
イベント・ヒストリー分析
レコメンデーション・エンジン
AI技術を活かすためのスキル
創るためのAI　機械と創造性のはてしない物語
【決定版】需要予測・市況予測のための時系列分析の本リスト
- 「この記述違うなあ」という需要予測本の紹介リストを見つけてしまって自分なりに書いてみた。こっちの方が絶対いいと思うけれどいいね1/10。こういうのでめげてはいけない。

2022

オシムさんの原色本など分かりやすい痒い所に手が届く（逆にいうと「俺が悩んで学んでいたこと全部書いてあるじゃん、なんだったんだよあの苦労」）本が増えて嬉しい。Qiita記事も増やし出した。

データ分析に必須の知識・考え方統計学入門
データサイエンスが解く邪馬台国/図書館
ネットワーク分析第2版
「ほとんど無害」な計量経済学―応用経済学のための実証分析ガイド
ITエンジニアのためのスパースモデリング入門
コンピュータビジョン最前線 (Winter 2021)
Pythonで学ぶ実験計画法入門
自由エネルギー原理入門
ディープラーニング学習する機械/図書館
実践 AWSデータサイエンス
天然知能
地域データ分析入門すぐに役立つEBPM実践ガイドブック
連帯のための実験社会科学: 共感・分配・秩序
実践的データ基盤への処方箋
Python 実践AIモデル構築 100本ノック
『スタンフォードベクトル・行列からはじめる最適化数学』1章章末問題の解答
- 数学の底上げとしてこの分厚い本(Kindle版にしたけど）の章末問題をやっている（あっれ12章で止まってるな）
図解入門よくわかる最新実験計画法の基本と仕組み（第2版）
セルオートマトンによる知能シミュレーション: 天然知能を実装する
コトラーのH2Hマーケティング　「人間中心マーケティング」の理論と実践
ディープラーニングを支える技術
Interface(インターフェース)2022年 3月号
ガウス過程と機械学習
地域政策の経済学
Python対応ディジタル信号処理
そろそろ医療の費用対効果を考えてみませんか? 医療関係者のための医療経済評価入門
固定効果モデル (計量分析One Point)
分散分析を超えて: 実データに挑む (統計学One Point 20)
データサイエンスの無駄遣い/図書館
最後通牒ゲームの謎 ◇進化心理学からみた行動ゲーム理論入門
深層学習改訂第2版
実践自然言語処理 ―実世界NLPアプリケーション開発のベストプラクティス
統計的因果推論の理論と実装
プログラミング言語大全/図書館
基礎から学ぶマーケット・デザイン
すごい需要予測不確実な時代にモノを売り切る13の手法
入門オルタナティブデータ──経済の今を読み解く
統計的データクリーニングの理論と実践: Rによるデータ編集/欠測補完システム
オークション・デザイン: ものの値段はこう決める
打ち切り・標本選択・切断データの回帰モデル (計量分析One Point)
Interface 2022年 5月号
統計学で解明! 野球のギモン/図書館
スポーツデータサイエンス
選挙・投票・公共選択の数理
実践Data Scienceシリーズ Pythonではじめるテキストアナリティクス入門
実践Data Scienceシリーズ Rではじめる地理空間データの統計解析入門
Rと事例で学ぶベイジアンネットワーク〔原著第2版〕
電子カルテデータ解析: 医療支援のためのエビデンス・ベースド・アプローチ
ゼロから作るDeep Learning ❹ ―強化学習編
社会ネットワーク分析:「つながり」を研究する方法と応用
たった一人の分析から事業は成長する実践顧客起点マーケティング
脳と情報: 神経回路と記憶のメカニズム/KindleUnlimited
白と黒のとびら: オートマトンと形式言語をめぐる冒険/図書館
コトラーのマーケティング5.0 デジタル・テクノロジー時代の革新戦略
[改訂第8版]LaTeX2ε美文書作成入門
コトラーのマーケティング入門〔原書14版〕
社会システムモデリング
ハーバード・ビジネス・レビュー流データビジュアライゼーション
ディープラーニングを支える技術〈2〉
DXの思考法日本経済復活への最強戦略/図書館
推薦システム実践入門 ―仕事で使える導入ガイド
Transformerによる自然言語処理
データ分析読解の技術/図書館
群論への30講
統計学が見つけた野球の真理/図書館
藤井聡太はＡＩに勝てるか？/KindleUnlimited
ファイナンスデータ分析 (Pythonによるビジネスデータサイエンス 4)
Pythonではじめるベイズ機械学習入門
政策リサーチ入門増補版: 仮説検証による問題解決の技法
サッカーアナリストのすゝめ「テクノロジー」と「分析」で支える新時代の専門職
プロ野球を統計学と客観分析で考えるデルタ・ベースボール・リポート:5
数理社会学の理論と方法
意思決定のための「分析の技術」
データとモデルの実践ミクロ経済学:ジェンダー・プラットフォーム・自民党
使える! 経済学データ駆動社会で始まった大変革
Pythonによる金融テキストマイニング
グラフニューラルネットワーク: PyTorchによる実装
問題解決のための「アルゴリズム×数学」が基礎からしっかり身につく本
感染症流行を読み解く数理
例題で学ぶグラフ理論
実証会計・ファイナンス: Rによる財務・株式データの分析
本質を捉えたデータ分析のための分析モデル入門統計モデル、深層学習、強化学習等用途・特徴から原理まで一気通貫!
フリースタイル言語学/図書館
NHKスペシャル取材班、「デジタルハンター」になる/図書館
ゲームから学ぶAI ——環境シミュレータ×深層強化学習で広がる世界
ゼロからわかる量子コンピュータ
ファイナンス機械学習―金融市場分析を変える機械学習アルゴリズムの理論と実践
イラストで学ぶ離散数学
機械学習エンジニアのためのTransformers
マテリアルズインフォマティクス
Pythonで実践する強化学習と転移学習
世界標準のデータ戦略完全ガイド
計量経済学 (New Liberal Arts Selection)
AIファースト・ヘルスケア ―医療現場におけるAIアプリケーションの利用
Python意思決定の数理入門
DataStory: 人を動かすストーリーテリング
因果推論の科学「なぜ?」の問いにどう答えるか
経済分析のための構造推定アルゴリズム
ネットワーク科学: ひと・もの・ことの関係性をデータから解き明かす新しいアプローチ
医学のための因果推論I ―一般化線型モデル―
アメリカン・ベースボール革命: データ・テクノロジーが野球の常識を変える/図書館
AI技術の最前線これからのAIを読み解く先端技術73
1からのデジタル・マーケティング
数理社会学入門
サッカーマティクス
数理モデル思考で紐解く RULE DESIGN -組織と人の行動を科学する-
Pythonによるマクロ経済予測入門
カスタマーデータプラットフォームデジタルビジネスを加速する顧客データ管理/図書館
デジタルトランスフォーメーション・ジャーニー
医学のための因果推論II ―Rubin因果モデル―
推薦システム: マトリクス分解の多彩なすがた (統計学One Point 22)

2023

学んだことのOutputが足りてないと反省。前年からQiita記事を増やし出していたが、古い記事のUpdateやnoteにも書くなどInput/Outputサイクルを加速。
生成AIの大波に乗り遅れていたけれどおっかなびっくり船出。

テキストデータマネジメント: 前処理から分析へ
地理学で読み解く流通と消費
傾向スコア (計量分析One Point)
評価指標入門〜データサイエンスとビジネスをつなぐ架け橋
ベイズ分析の理論と応用: R言語による経済データの分析 (ライブラリデータ分析への招待 3)
評価指標入門〜データサイエンスとビジネスをつなぐ架け橋
たのしいベイズモデリング: 事例で拓く研究のフロンティア
Rユーザのためのtidymodels[実践]入門〜モダンな統計・機械学習モデリングの世界
専門家の政治予測
ALIFE | 人工生命 ―より生命的なAIへ/図書館
金融AI成功パターン
統計で読み解く日本経済最強の成長戦略/KindleUnlimited
米国防総省・人口統計コンサルタントの人類超長期予測/図書館
現代マーケティング・リサーチ〔新版〕: 市場を読み解くデータ分析
業界ごとのAI・データ分析参考書籍
- ドメイン知識が必要とは言われます。ただ、当然それぞれの分野で王道はあるでしょうがデータ分析の観点で短期間でどう学ぶかのようなところはまだ整備されていないと思います。まず手始めとして書いてみました。これも「浅く広く」の観点で
Kaggleに挑む深層学習プログラミングの極意
経済指標のウソ世界を動かす数字のデタラメな真実/図書館
フィナンシャル・タイムズ式図解の技術世界最高峰の経済紙はどのようにデータを見せているのか
スパコン富岳の挑戦 GAFAなき日本の戦い方/図書館
SQLではじめるデータ分析 ―クエリで行う前処理、時系列解析、コホート分析、テキスト分析、異常検知
Optunaによるブラックボックス最適化
Pythonで学ぶ衛星データ解析基礎
多数派の専横を防ぐ　意思決定理論とEBPM
データ思考入門/図書館
いちばんやさしいGit&GitHubの教本第2版人気講師が教えるバージョン管理&共有入門
活かすゲーム理論
データ分析・AIを実務に活かすデータドリブン思考
Pythonではじめる異常検知入門
グラフのウソを見破る技術マイアミ大学ビジュアル・ジャーナリズム講座/図書館
ディープラーニングによる自然言語処理 (Advanced Python 2)
驚異の量子コンピュータ　宇宙最強マシンへの挑戦/KindleUnlimited
イベント時系列解析入門
因果推論入門〜ミックステープ：基礎から現代的アプローチまで
地域活性マーケティング/図書館
マイノリティ・マーケティング/図書館
計量文献学の世界シェークスピアは誰ですか?
DX時代のデータマネジメント大全
図解ポケット画像生成AIがよくわかる本/図書館
実践XAI［説明可能なAI］機械学習の予測を説明するためのPythonコーディング
大規模言語モデルは新たな知能か
最強のデータ分析組織/KindleUnlimited
ビジネスダッシュボード設計・実装ガイドブック成果を生み出すデータと分析のデザイン
THE MODEL
IT Text 自然言語処理の基礎
新時代の野球データ論フライボール革命のメカニズム/KindleUnlimited
先読み！IT×ビジネス講座 ChatGPT 対話型AIが生み出す未来/図書館
空間回帰モデル (計量分析One Point)
データ分析失敗事例集: 失敗から学び、成功を手にする
2023年版データ分析の100冊
- 2016年に書いた「【データ分析の必読10冊+差をつける10冊＋100冊超】データサイエンス、データ分析、機械学習関連の本」は少しずつUpdateしていたのだけれどごちゃごちゃし出したのであらためて書き直した
Pythonによる時系列分析: 予測モデル構築と企業事例
OpenAI GPT-4/ChatGPT/LangChain 人工知能プログラミング実践入門
DXの第一人者が教える DX超入門/図書館
サンプリングって何だろう/KindleUnlimited
インベンス・ルービン統計的因果推論 (上)
データ分析に必須の知識・考え方認知バイアス入門
実験計画法: 過飽和計画の構成とデータ解析 (統計学One Point 23)
基礎から学ぶ統計学
データにのまれる経済学薄れゆく理論信仰/図書館
生成文法がわかる本/図書館
医療費統計の基本分析: 電子レセプトの5要素分析とその活用
社会と経済:枠組みと原則
グラノヴェッターがノーベル経済学賞を取ると思っている。ネットワーク科学の重要性が増しているので
「複雑ネットワーク」とは何か　複雑な関係を読み解く新しいアプローチ/図書館
AI海戦ー人工知能は海戦の意思決定をどう変えるのか？
ヤバいデータ分析（書籍・記事であまり扱われてないが重要なこと）
- 2017年くらいからちまちま書いていて「薄い本」にしようかと思っていたけど進まないので思い切ってQiitaに書いた。データ分析の本を沢山読んだけど意外と書いてないことって結構ある
リーダブルコード ―より良いコードを書くためのシンプルで実践的なテクニック
Pythonによる地理空間データ分析 ―例題で学ぶロケーションインテリジェンス
機械学習のための確率過程入門: 確率微分方程式からベイズモデル,拡散モデルまで
The Kaggle Workbook 著名コンテストに学ぶ！競技トップレベルの思考と技術
次世代の実証経済学
Python時系列分析クックブック I: 前処理
生成AIの核心: 「新しい知」といかに向き合うか/図書館
パターン認識と機械学習下
ディープラーニング実践ガイド
データサイエンスの経済学
アナロジア AIの次に来るもの/図書館
人工知能人類最悪にして最後の発明/図書館
ビジネスエリートの「これはすごい！」を集めた外資系投資銀行のエクセル仕事術
戦略ごっこ―マーケティング以前の問題
エンジニアが学ぶ金融システムの「知識」と「技術」第2版

2024

4月から異動。因果推論・因果探索についての調査（なので本が偏ります）。
ChatGPTも手放せなくなる。

Rで学ぶマルチレベルモデル[入門編]: 基本モデルの考え方と分析/図書館
指標・特徴量の設計から始めるデータ可視化学入門データを洞察につなげる技術
事例で学ぶ特徴量エンジニアリング
ＭＢＡ定量分析と意思決定
ジェンダー格差-実証経済学は何を語るか/図書館
解釈可能なAI　機械学習モデルの解釈手法を実践的に理解する
Pythonではじめるオープンエンドな進化的アルゴリズム ―発散型の機械学習による多様な解の探索
面倒なことはChatGPTにやらせよう
- - データサイエンス系の人でも（だからこそ？）生成AIに逡巡してあまり触ってない人多いんじゃない私はそうだった。でもやってみるしかないんだよ。
Python時系列分析クックブック II: モデル・機械学習
データとデザイン　人とデータのつなぎかた
機械学習による検索ランキング改善ガイド
脳の意識機械の意識 - 脳神経科学の挑戦
科学で迫る勝敗の法則
Pythonでスラスラわかるベイズ推論「超」入門
教養としての生成AI/図書館
Federated Learning: プライバシー保護下における機械学習
“未”顧客理解なぜ、「買ってくれる人＝顧客」しか見ないのか？/KindleUnlimited
超デジタル世界 DX，メタバースのゆくえ/図書館
生成AIプロンプトエンジニアリング入門 ChatGPTとMidjourneyで学ぶ基本的な手法
実践　生成AIの教科書
ゲーム理論からの社会ネットワーク分析
ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめた
- IT系のスキルロードマップのサイトroadmap.shを見つけ、AI and Data Scientistというカテゴリがあったので各項目で何を学べば良いかを書いた
- こういう記事はハネる（いいねで終わってはダメなんだこの情報で学んで次はあなたが記事を書くんだ）
インフォグラフィック制作ガイド　「関係」を可視化する情報デザインの手引き
生成AIで世界はこう変わる/図書館
ネットワーク科学入門: Pythonで学ぶデータ分析とモデリング
ChatGPTと語る未来/図書館
未来を読む AIと格差は世界を滅ぼす/図書館
因果推論: 基礎から機械学習・時系列解析・因果探索を用いた意思決定のアプローチ
- 因果推論・因果探索をアカデミアではないデータサイエンティストの立場で学なら必読。ここら辺の記事も書きます。
ChatGPT　大規模言語モデルの進化と応用
企業価値向上のための経営指標大全
Pythonによる気象・気候データ解析I
Excel 最強の教科書[完全版] 【2nd Edition】
BayoLinkSで実践するベイジアンネットワーク
因果過程追跡の基礎: 経営革新事例の即応研究法
GitLabに学ぶ世界最先端のリモート組織のつくりかた
ベイジアンネットワーク（植野）
Pythonで学ぶ効果検証入門/図書館
「複雑系」入門カオス、フラクタルから生命の謎まで/図書館
PyCaretで学ぶ機械学習入門
はじめての統計的因果推論
確率的グラフィカルモデル
データ駆動型回帰分析　計量経済学と機械学習の融合
入門共分散構造分析の実際
構造的因果モデルの基礎
ベイジアンネットワーク技術ユーザ・顧客のモデル化と不確実性推論
リサーチ・デザイン: 経営知識創造の基本技術
「行為の経営学」の新展開: 因果メカニズムの解明がひらく研究の可能性
日本の人事を科学する: 因果推論に基づくデータ活用
DMM.comを支えるデータ駆動戦略
Pythonによる経済・経営分析のためのデータサイエンス～分析の基礎から因果推論まで
質的比較分析（QCA) : リサーチ・デザインと実践
深層学習教科書ディープラーニング G検定（ジェネラリスト）公式テキスト第3版
LeanとDevOpsの科学
反実仮想機械学習〜機械学習と因果推論の融合技術の理論と実践
強化学習から信頼できる意思決定へ
グラフィカルモデル（講談社KMP）
その決定に根拠はありますか？　確率思考でビジネスの成果を確実化するエビデンス・ベースド・マーケティング
統計的因果推論 -モデル・推論・推測-
経営事例の物語分析: 企業盛衰のダイナミクスをつかむ
医学研究のための　因果推論レクチャー
統計学を哲学する
DATA is BOSS 収益が上がり続けるデータドリブン経営入門
ヤバい統計政府、政治家、世論はなぜ数字に騙されるのか
AIは短歌をどう詠むか
反事実と因果推論
AI時代の質問力プロンプトリテラシー「問い」と「指示」が生成AIの可能性を最大限に引き出す
ＣｈａｔＧＰＴの全貌　何がすごくて、何が危険なのか？/図書館
能動的推論:心、脳、行動の自由エネルギー原理
自然言語処理の教科書
社会科学と因果分析: ウェーバーの方法論から知の現在へ
- 2024年版機械学習・データ分析の必須10冊+ガチ90冊+Next5冊=105冊
  - 2023年記事のUpdate
- 2024年版機械学習・データ分析の必須10冊+ガチ67冊+Next5冊=82冊（Rユーザー向け）
  - R版も書きました
AIとは機械学習とは深層学習とは生成AIとはβ版
- 生成AIがバズりすぎで間違いを含む適当な記事が増えているので、結構力を入れて書いたのだけれどこういうのはいいねがつかないな、、、
入門　サンプルサイズ設計―基本理論から計算方法まで
Pythonライブラリによる因果推論・因果探索［概念と実践］
経営事例の質的比較分析
(2024-09-16時点）

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up