#本記事のモチベーション
このご時世で出かけられないのでとにかく本よんでます。
以下項目を見て、おなじ気持ちを感じている方の本購入の助けになるのを目標にします。
- データサイエンスの理論や分析ツールでのコーディングなどは学んできた(学んでいる)
- 仕事(ビジネス)は「高精度モデル作成完了」より「モデルを使ったことでの成果」を求められる
- 具体的な数値を出さないといけない
- マネージャーや先輩のいない状況でプロジェクトを回す&ビジネスインパクトにつなげる方法が知りたい
- 社内でのデータサイエンスを組織するための必要要素を知り経営側に要請・説得できる(ようになれたらいいなぁ)
そんな目的で、ビジネス + データサイエンスの本を読み漁りました。
以下紹介を読んで興味を持たれたら是非買ってみてください。
※私の吸収力の低さが原因で微妙な評価をしている部分もあります。
鵜吞みにせず実際にご自分の目で確かめてください。
今回の目的に対して役に立ったと感じた順で並べています
インデックス | タイトル | 説明 | 傾向 | 著者・出版 |
---|---|---|---|---|
1冊目 | データサイエンティスト養成読本 ビジネス活用編 | 複数社での分析組織の運営方法や失敗事例、コンサルタントとしてかかわった時の分析で注意した部分など | ビジネス向 | 複数人が各章を担当・技術評論社 |
2冊目 | 本物のデータ分析力が身に付く本 | ビジネス課題発見と分析設定の具体的なフレームワーク | ビジネス向 | 河村 真一・日経BP |
3冊目 | 最強のデータ分析組織 | 非IT企業のデータ分析組織においてメンバーのキャリアや、ビジネス成果を出すための活動方針 | ビジネス向 | 河本 薫・日経BP |
4冊目 | 会社を変える分析の力 | 分析組織立ち上げ、非IT企業のデータ分析組織とは | ビジネス向 | 河本薫・講談社 |
5冊目 | データ分析の力 因果関係に迫る思考法 | 調査・検証の方法、データ分析時のデータ品質、効果があったのか | ビジネス向 | 伊藤 公一朗・光文社 |
6冊目 | 戦略的データサイエンス入門 | 複数社の事例紹介とマイニング手法からビジネスデータにどう立ち向かうか | ビジネス・エンジニア | Foster Provost・オライリージャパン |
7冊目 | 社内外に眠るデータをどう生かすか | マーケティングを例に仮説設定・調査検証報告までのビジネス基礎力とデータで語るとは何かについて | ビジネス向 | 蛭川速・宣伝会議 |
8冊目 | データ解析の実務プロセス入門 | 一人で社内で分析者になる時何から気を付けるべきか | ビジネス・エンジニア | あんちべ・森北出版 |
9冊目 | アクセンチュアのプロフェッショナルが教えるデータ・アナリティクス実践講座 | 分析手法によりビジネスデータとどう戦えるのか | ビジネス・エンジニア | 工藤卓哉・翔泳社 |
10冊目 | ビジネス活用事例で学ぶ データサイエンス入門 | ゲームデータを例に分析手法の活用方法 | ビジネス・エンジニア | 酒巻 隆治・SBクリエイティブ |
11冊目 | 改訂2版 データサイエンティスト養成読本 | データ分析に関係するIT技術(R,python,hadoop等)の入門 | エンジニア向 | 複数人が各章を担当・技術評論社 |
12冊目 | 手を動かしながら学ぶ ビジネスに活かすデータマイニング | Rによるマイニングの入門 | エンジニア向 | 尾崎隆・技術評論社 |
13冊目 | ディープラーニング活用の教科書 実践編 | 機械学習が実社会でどう使われているのか | 一般向 | 日本ディープラーニング協会・日経BP |
#勝手な位置関係まとめ
#1冊目:データサイエンティスト養成読本 ビジネス活用編
著者:複数人が各章を担当
出版社: 技術評論社
発売日: 2018/10/30
##感想
- データ分析ムック本の有名どころ「養成読本シリーズ」
- 泣ける(失敗事例に心当たりがありすぎてハンカチ必須)
- 1-1の一言目が「ビジネス貢献できないデータ分析、もう嫌だ」
- なぜデータサイエンス案件は成功しないのか、PoCで止まる理由、データサイエンス組織の作成とメンバ構成について各章で様々な意見を出してくれている
- コンサルタント寄りの方が書いている部分が多く「ここではコンサルタントを入れよう」と書いてあるのが宣伝かと思ったが、「自前主義」のデメリットはおっしゃる通りなので、そんなに気にならずに読み進められた
##内容紹介
-
色々な背景・社歴を持った人が各章を担当する形式の本
-
データサイエンスチームのマネージャーをしているような人が書く以下の問題とどう動くべきかが書かれている
- データサイエンスプロジェクトを進める方法
- ソフトウェアとデータサイエンスのプロジェクト管理の違い
- データサイエンティストに期待すること
- フォロー体制や活躍できる環境づくり
- 採用時のデータサイエンスに対する誤解
- 経営層・マネージャーとデータサイエンティスト間の「データ分析」の意味のギャップ
- 最新論文読んで実装しているだけの困ったサイエンティスト
- 案件に昇華させられない困ったマネージャー
-
チームが整っていないと万能人間(勇者型人材)を求められるに等しい
- 一人でやらない。万能人間でも負荷がかかりすぎるのでやらせない。
- インフラ・アプリ・ビジネスで別メンバを入れなさい。必要ならコンサルも。
- データサイエンス手法も「数学院卒なら解けるのではないか」という暴力トップダウン
- 上が手法別の専門度合を知らないままに採用・アサインを決める
#2冊目:本物のデータ分析力が身に付く本
著者:河村 真一
出版社: 日経BP
発売日: 2016/6/22
##感想
- ビジネス問題解決のためのフレームワークは数あれど、データ分析に関係したコンセプトで書かれている本はこの本くらいではないだろうか
- 他本の内容「分析で止まらず評価につなげることが大切、問題定義とその見直しを重視すべし」
- 本書の内容「漏れなく手戻り少ない目的設定から、分析実行、結果表現までをフレームワークを使いながら設計していこう」
- A4の紙と付箋をつかったブレストや、データありきで分析してしまうことの注意点などがちりばめられている
- pythonもRも使わないのでキラキラしたデータサイエンス感は薄い。
- ひたすらexcelとA4用紙で進めるが、「無理やり機械学習でプロジェクトで課題を進める本」ではなく「どんなデータ分析が信頼性があって課題解決になるかの本」なので注意。
##内容紹介
- 心強い副題:理屈はもういい、欲しいのは実践のお手本だ
- 問題設定のためのフレームワークとその模擬体験
- 分析案件の設計時に注意すべきポイント
- 「データがあるから分析しよう」は目的と結果が逆
- 「集計」よりも「可視化」で特徴をつかむ
- 問題設定→要因洗い出し→概要図に落とす→データ収集とチェック(外れ値・収集背景の信頼性)→認識バイアスの排除
#3冊目:最強のデータ分析組織
著者:河本 薫
出版社: 日経BP
発売日: 2017/11/24
##感想
- まさに抱えている悩みが本書では書かれていた
- 立ち上がったばかりの分析チーム
- 全社にデータリテラシーが浸透していない
- 全社的な推進体制がない
- 以上のような分析チームに所属する人にとってはロールモデルとなり得る一冊(特にマネージャー)
- 「手法が先立つ分析でなく、会社として役に立つ分析に必要な手法を逆算で選ぶ。ただし、新規の分析手法を試すことや、多くの手法を学ぶことは分析者として最低限必要。」
##内容紹介
- 小さな研究チームから18年間かけ、データ分析で業務改革を行うチームとして成長するまでの地道なボトムアップの過程が書かれている
- 立ち上げ時のデータ分析組織の**"おまけ"**感
- チームメンバーの不安を払しょくするためのマネジメント
- 社内のデータ分析者とは「業務コンサルティング力」が必要だった
- バックオフィス型の分析知識
- フロントオフィス型の現場訪問・折衝・問題定義・現場に使わせる力
- 見つける→解く→使わせる
- 18年かけずに分析組織を作るには?
- 数学・IT知識の問題よりも大きな4つの壁がある
- 1.モチベーション維持
- 2.事業部門との連携
- 3.会社の経営貢献
- 4.分析組織メンバの育成
- 数学・IT知識の問題よりも大きな4つの壁がある
- スポンサーシップ制度の予算獲得で事業側を巻き込む
- チーム人数を改めて考える
- 費用対効果を話し合う場をつくる
- どう業務に組み込むかまで考える
#4冊目:会社を変える分析の力
著者:河本薫
出版社: 講談社
発売日: 2013/7/20
##感想
- 古い出版日なので怪しんでいたがいい本だった
- 1章はよく話される話題(ビックデータはビックなだけでない等)
- 架空の会社を例に分析の流れを説明
- 分析人材としての働き方
- 仕事に対する心構え
- スペシャリストでなくプロフェッショナル
- 手法に詳しいだけでなく分野に詳しい
- 手法ありきの分析は問題なのは他本からも分かったが、その具体的なレベルがわからない・・・
- 本書でも「ビジネスでの得意分野」を見つけたら「その分野の分析に関しては専門家レベルになる」、「他の分析方法も知る」とあるし・・・
- 詳細まで考えると矛盾しているようにも感じる
- わからん。
##内容紹介
- 上記本と同じ著者
- データ分析・ビックデータなどに関する一般的な誤解
- 企業で働く「データ分析スペシャリストとは?」
- 数学を極めるだけでなく、それを活かす方法がひらめくこと
- 結果と分析に責任を持つ(見直す・納得まで解釈する)
- 専門分野を身に着ける
- 人脈をつくる場に出る(学会・コミュニティ)
- 情報を発信する(学会・コミュニティ)
- 無駄な分析をしないための壁
- データ
- 分析
- KKD
- 費用対効果
#5冊目:データ分析の力 因果関係に迫る思考法
著者:伊藤 公一朗
出版社: 光文社
発売日: 2017/4/20
##感想
- 著者が元々応用経済と政策の実証研究を行っていたため実証実験寄り
- タイトルにもある通り**「因果」を意識してデータ分析や課題設定・成果評価できてますか?**という一冊
- 「ランダム化試験」と「実験デザイン」に多めに紙面が割かれている
- 読みやすい。赤線引きながら長距離移動の間に読み終えられる。
-
ビジネスへの活かし方の本ではないが、「結果の評価」や「目的設定」を考える上で「実証実験や因果」の知識があると分析で終わらせず数字で経営側と話すことができるようになると思う
- (拒否感なく聞いてもらえるかはまた別の話・・・)
##内容紹介
- 「実験」と「効果」の測り方についての内容が多い
- 勘と経験だけで判断しない。web画面制作側が良いと思った画面デザインに市場は全く反応しないことだってある
- 大規模に実験できるならランダム化してABテストでも行ってから意思決定しよう
- リアルのデータでは「介入していないグループ」のデータが取れず、効果の測定が難しい
- データを可視化して、「実際には観測できなかったがこうなっていただろう」という結果を作り出し実験結果の評価の相手とする(潜在的結果や平行トレンド仮設・差分の差分法)
#6冊目:戦略的データサイエンス入門 ―ビジネスに活かすコンセプトとテクニック
著者:Foster Provost
出版社:オライリージャパン
発売日: 2014/7/19
##感想
- これは長かった。約500ページ
- 出版年からも内容は若干古さを感じる
- 海外著者本の翻訳なので、専門書の翻訳本特有の読みづらさ
- (多々理解に苦しむ部分あり。自分なりの解釈で乗り切る。)
- 求めていた話は11章から14章と付録にあった
- (特に付録と13章のマネージャー必要要件・環境整備育成・プロジェクト評価は勉強になった)
- 「上司部下に対する愛嬌」や「関係部署とのコミュニケーション力」と、「外部に出てアカデミックな場で広い分野で強い知り合いを作る事」も大事
- マネージャーであれ、経営陣であれ、データサイエンスを会社でやってくなら分析知識知っとけよ!と本文中にあり、そのため2~6章と10章は理論を含めたアルゴリズムの使い方が紹介されている
##内容紹介
- 元大手電話会社に勤めていた著者がデータサイエンスがビジネスの中でどう使われると会社にとって成功につながるかを話した本
- ビジネスでのデータサイエンスはデータから「価値になるか?」をデータサイエンス畑の人やデータサイエンスに知見のあるマネージャーが**「見極め、適切にデータを収集し、達成を評価し、ビジネスインパクトを測定し(測定できるかの判断も含む)、業務側の人に使ってもらうまで展開できるようにすること」**が大切
- そのためにデータ分析はビジネスを理解した上で「課題を明確」にして「データが十分か判断」して「データマイニング」すること・
- モデルができればヨシでなく「課題解決のための定式化・課題構造化・モデリング」を行うことが必要
- 業務側とコミュニケーションをとり、どうしたら展開できるレベルなのか、要件を明確にさせる
- 引用文献の紹介が多い
- それだけ海外では社内データを活用したデータマイニングが活発なのだろう
- 文献はまさに事例とアルゴリズムの紹介になっているので時間の許す範囲で読むことをオススメする
- facebookの「イイネした記事」で「ユーザーのIQ」が測れるのはおもしろい文献だった
- PNAS kosinski 2013
#7冊目:社内外に眠るデータをどう生かすか ―データに意味を見出す着眼点―
著者:蛭川速
出版社: 株式会社宣伝会議
発売日: 2018/2/10
##感想
- 営業&マーケティングを舞台にしているだけあって、その分野の人には刺さる内容
- 初心者が「数字で語る」ためにどのように分析を進めるか書いてある良書
- アンケート調査やターゲティングにあまり関係のない分析が必要な人には余分な内容が多い
- データ分析と仮説思考はどの分析でも必要なので、必要な部分を抽出してフォーマットにすると他の分野でも使えそう
- 課題設定どうこうよりも、分析による掘り下げと解釈のついた報告からビジネス提案を行うための本と感じる
##内容紹介
- 「マーケティング」に主眼を置き、「データ分析」を通して「企画提案」までを行う小説形式の本
- 仮説思考のために事実を集める
- 不足した事実はアンケート調査やインタビュー、決算書から収集する
- データを集計・可視化して解釈を加えることで報告の形にする
- 可視化やレートシェア分析から顧客を絞り込む
- 以上をもとに企画のコンセプトを作りこむ
- 1.ターゲット
- 2.ニーズ
- 3.商品
- 4.利益
- イシュー分析をつける
- 1.実現可能性
- 2.効果見込み
- 3.ビジネス性
- 最後にフォーマットに落として企画書として成り立たせる
- 企画とビジネスモデルがマッチしているか考える
#8冊目:データ解析の実務プロセス入門
著者:あんちべ
出版社:森北出版
発売日: 2015/6/20
##感想
- 副題にもあるように「頼れる上司も先輩も、データベースや分析のノウハウもない人」に向けた本
- 目的設定・データ収集・前処理・解析・運用(KPI)・施策の順で書いてある
- ほしい情報は「目的設定」と「運用(KPI)」にあった
- コーディングしたものがゴチャゴチャにならないように著者の分析案件のフォルダ管理について、が興味深かった
- 著者ほど細かくフォルダ分けはしていないが、分析案件や分析のアプローチごとにスクリプトとデータを分けて管理するのはいいぞ~
##内容紹介
- データが集まった。解析して精度の良いモデルができた。ではビジネス上の価値にはならない。
- 価値と判断できるKPIを設定する(ユーザーの継続率?課金額?何にするのが課題解決か)
- 解析した結果を実務側に報告し、どう施策・改善を行うべきかの案を出す
- 施策中もミーティングを行い、モデルの出す結果の解釈を続けて「活用」をする
- 施策前後でKPIを確認し、改善しているかを報告する
- 関係部署が複数ある場合はどのKPIを見るとその部署にとって有益かを理解して、必要なKPIを見せていく
#9冊目:アクセンチュアのプロフェッショナルが教えるデータ・アナリティクス実践講座
著者:工藤卓哉 ・保科学世
出版社: 翔泳社
発売日: 2016/5/30
##感想
- ビジネス活用のための課題設定は前半の章にあったが、他本に比べるとボリュームがうすい
- 全体的に言えることだが抽象的すぎてなんとでも解釈できるような書き方をしている
- しかし網羅的でもあるのでデータサイエンスのカバー範囲の広い入門書という位置づけ
- 7章以降はRを使ったなかなか見ない手法・パッケージの使い方が紹介されている
- 「Rによるデータサイエンス」を読んでいるような気分
- マーケットバスケット
- アプリオリアルゴリズム
- 地図データを使った分析・可視化
- レコメンデーション(協調フィルタリング)
- 階層クラスター分析
- Gephi,igraph
- 個人的にとても読み進めにくかった。(人気の小説家でも自分に合わない文章は読みにくい、という感覚)
##内容紹介
- 課題設定からデータ基盤の整備方法について
- 分散処理技術の歴史、デメリットを補うためにどう発展してきたか(Hadoop,MapReduce,DWH)あたりは初めて知った
- 7章以降はデータ分析の手法について紹介されている
- ビジネスでデータサイエンスを作るためには課題設定が必要
- 分析基盤を整備するためにトップダウン・ボトムアップからのアプローチがある
#10冊目:ビジネス活用事例で学ぶ データサイエンス入門
著者:酒巻 隆治・里 洋平
出版社: SBクリエイティブ
発売日: 2014/6/24
##感想
- ビジネス活用に関する部分は1,2章にあるが少ないので今回の目的からは外れていた
- ビジネス問題とRのコードが合わせて記載されているため、ちょうどその分析をしたい人には良い実践本
- ビジネス問題→もっともらしい仮説を見つける→アクション案→Rを使った分析コードの流れ
- わざと前処理を必要とするデータを例に使っていてユニーク
- SQLで抽出するような構造化(テーブル)データを使った分析例なのでイメージしやすい
##内容紹介
- 理想の姿と現状のギャップを考える
- 現象と問題は分ける
- 仮想ゲームを例に様々な問題に分析手法を使う
- クラスタリングで顧客セグメンテーション
- 継続利用顧客の特徴を決定木で知る
- 広告費の効果を重回帰係数で知る
#11冊目:改訂2版 データサイエンティスト養成読本 [プロになるためのデータ分析力が身につく!]
著者:複数人が各章を担当
出版社: 技術評論社
発売日: 2016/8/25
##感想
- 改訂前がこちら
- 改訂後のほうが読みやすいので改訂2版を購入すべし
- そもそもビジネス活用の色は薄いがエンジニア向けの一冊目ならばかなりいい本
- エンジニア側からビジネスデータを分析する時にはこんな視点で見えている、という本
- この分析手法を身に着けてデータに出会ったときにヒラメキが起こることを望んでいる
##内容紹介
- データサイエンスに関わる初心者にとって網羅的にデータサイエンスを知ることができる一冊
- ビジネスデータを仮定したデータマイニング(特集2)が載っているので候補に入れさせていただいた
- 元ドリコム、上記「データサイエンス入門」の著者でもある里洋平氏のマーケティング分析(公式サポートにスクリプトはなさそう?手書き写経はしんどいです)
- mixi下田、木村氏のマイニング事例
- 大成弘子氏のネットワーク分析
- ビジネスにどうつなげるか?という話は少ないが、顧客データからクラスタを作って、どの層にどんなマーケティングを打ったらいいか考える、といった内容がかかれている
#12冊目:手を動かしながら学ぶ ビジネスに活かすデータマイニング
著者:尾崎隆
出版社: 技術評論社
発売日: 2014/8/21
##感想
- データサイエンス界では有名なブロガーでブログおもしろい(六本木や銀座で働いておられる方)
- ビジネス活用のため、というよりもRの基本的なマイニング導入本の位置かもしれない
- Rで試してみる、イメージをつかむ、にはいいかもしれないが、
- 網羅的なR入門書は他の本をオススメする(R,統計学,機械学習などの単語をもとに調べてみてほしい)
- ビジネス活用という点でも、分析結果から「施策の種」は思いつくかもしれないがそこまでで止まってしまう
##内容紹介
- 例を出してからRで分析
- ビールデータを重回帰
- キャンペーン効果を決定木から原因を調べる
- 平均値は異なるが統計を考えて「まぐれでない」を分析する
#13冊目:ディープラーニング活用の教科書 実践編
著者:日本ディープラーニング協会
出版社: 日経BP
発売日: 2019/10/25
##感想
- 機械学習・深層学習に関して知識があれば、どんな技術で問題を解決したのかは想像がつく
- AIニュース記事の掘り下げをしたような本
- 私が知りたかったのは、その技術の紹介よりも
- 問題を思いつくまでの経緯、何をどう改善したくて機械学習を選んだのか
- 途中での検証作業や、その中でのモデルの取捨選択
- 経営的判断がどの段階であったのか
- プロジェクトに対する投資や組織編成
- データサイエンティストをどこに投じたか
- だったのだが、これらは満たされなかった。
- データサイエンスチームが既にあり、全社的に推進する用意があるのならば、「英語論文から自社転用を考えるよりも日本語で紹介されているこの本を読むか」という時に使えそう
##内容紹介
- 深層学習の各社での活用事例がのっている
- G検定推奨図書(検定では技術とその社会実装について問題が出るので)
#さいごに、感じたまとめ
- 分析手法を学ぶよりも、「企業人としてのデータ分析とは何ぞや?」の哲学を学んだ(気がする)
- 全社的に進めていく覚悟が必要(ないなら苦しいがボトムアップ)
- データを「どう使えば価値になるか」まで考えて分析すること
- 分析するだけでなく、使う人のフォローまで行う当事者意識
- 使いやすいをヒアリング・使わせられる、人脈人柄
- 結果に「現場と同じレベルで責任を持つ」
- PoC費用削減や自前主義、無駄なパワポ作成&プレゼンなど雑務によってデータサイエンティストが活かせなくなる
- 分析後、施策につなげるには「因果分析」で有力な説明をして詰めていく
- 「使われる分析結果」とは、現場へ顔売り・キーマンの信用勝ち取り・説得力ある説明・丁寧な使い方説明・見やすいUI作成・使われなくなった理由分析とフォロー・アプリインフラチームとの折衝・要件定義と機械学習の仕組みをモジュール化して外注・・・・・・やる事多くて泥臭い
#おわり
分析手法の本を読むより、著者のマインドをくみ取る必要があってしんどかった
本の内容を実際に使うには自社風土に合わせて抽象化して当てはめる必要あり
データサイエンティストってなんだっけ?