Developer Roadmapsというサイトがすごいです。ITエンジニアの分野別にスキルアップのロードマップが示されています。
言語、基盤、アプリ、かなり網羅されています。
ということで、AI and Data Scientist Roadmap について書きましたが
今回は Data Analyst Roadmap です。
- 雑感
- このロードマップの続きにAI and Data Scientistがあり、Data AnalystをData Scientistの前段階的に位置付けているのが疑問。Data AnalystとData Scientistは並ぶものではないでしょうか。
- そして、ビジネス、ドメイン知識や分析目的定義などのスキルについて、AI and Data Scientistの時よりもやや言及があるものの弱いのが残念。書籍として追加しました。
- 以下にそのカテゴリに対応する日本語書籍を13冊挙げてみました。
- Excelはありますが、Tableau、PowerBI等のツールの使い方については挙げてません。汎用のスキル等ことで。
- 以下文中にもありますがAI & Data Scientist Roadmapと重なる点も多く、ITスキルロードマップ roadmap.sh がすごい。AI and Data Scientist について対応する本をまとめたの記事もご参照ください。
- もっと学びたいという方は私の別記事2023年版データ分析の100冊をご参照ください
Introduction
-
Introductionに直接適した本は私は知りません(単に私が知らないだけ)。ただそれに近いかなという本はいくつかあります。
-
- データサイエンティストとして著名な河本薫氏の本ですがデータアナリストにも重要な考え方と思います。氏は会社を「意思決定の工場」と捉え、データ分析はその意思決定に役立たなければならないとしてます。
「現場で活用される」とは「現場の意思決定に活用される」ということ。「意思決定に活用される」とは「意思決定プロセスに分析結果が使われる」ということ。そして、意思決定プロセスに分析結果が使われるには、意思決定に有用なデータ分析を行うだけでなく、分析結果が意思決定に活用されるように「意思決定プロセスを設計する」必要があることに気づきました。
- このロードマップのIntroductionの解説にも下記記載(Google翻訳です)があり、本書の考え方が一番合致すると思います。
データ分析は、今日のデータ中心の世界において重要な役割を果たしています。これには、意思決定のための貴重な洞察を抽出するために、データの検査、クレンジング、変換、モデリングの実践が含まれます。データアナリストは、大規模なデータセットの収集、処理、および統計分析の実行を主な任務とする専門家です。彼らは、データを使用して質問に答え、問題を解決する方法を発見します。現代の企業におけるデータの急速な拡大に伴い、データ アナリストの役割は大きく進化しており、ビジネス戦略や意思決定プロセスにおける重要な資産となっています。
- データサイエンティストとして著名な河本薫氏の本ですがデータアナリストにも重要な考え方と思います。氏は会社を「意思決定の工場」と捉え、データ分析はその意思決定に役立たなければならないとしてます。
-
- ビジネスパーソン用のグロービスさんのシリーズの定量分析の本です。本書もビジネスの意思決定のために数字をどう扱うかの観点で書かれています。
- ビジネスパーソンとエンジニアの立場では「データ」について違う見方をするかなと思いますがそれを繋ぐ接点の一つになるかなと思います。
- エンジニア側からデータアナリストに入って行くと経営指標等が弱いと思います。最低限の知識インプットとして良いのではないでしょうか。
-
- 経営指標についてだけなら初心者にもわかりやすい本書が必読ですね。
-
- ロードマップ中には直接言及がありませんが、Data Analystの立場ですとビジネスダッシュボードの構築やそれについての支援の役割もあるかと思います。
- 本書はビジネスダッシュボードの使い方ではなく、何のために作るのか、その体制をどうするか、役割と必要なスキル等ダッシュボード構築と運用について、ツールの使い方以外のノウハウが網羅されています。
- トレジャーデータさんの本ですがツールによらず汎用のノウハウで、ビジネスダッシュボードに関わるなら必読かと。
Excel
-
Excel 最強の教科書[完全版] 【2nd Edition】
定番中の定番のようですが私はお恥ずかしながら知りませんでした(これから読みます!)- 三菱UFJリサーチ&コンサルティングさんでも基本書としているようであり、「MURC コンサルタントの語彙力を鍛える推薦図書とは?」間違いないのではないでしょうか。
- 読みました。事務系でExcel必須の方なら知っていることばかりかもしれませんが、プログラマ系からData Analystになる方はExcelがおろそかな方が多いのでは?
- Excelのマクロ以外はほぼ全て網羅している?と思われ必読ですね。Data Analystだと必ずしもExcelではなくてTableauとかのBIツールを使うかもですが全くExcelに触れることないと言うことでもない限り一読しておいた方が良いですね。
- 作業効率が圧倒的に変わる。
- 「除算貼り付け」とか(その他にもたくさん)知らんかった!
- ユーザー側からの信用が下がるのを防ぐため。
- 分析に直接関係なくとも分析結果を示すユーザー側から突然Excelの質問をされることあり、知らないと信用が下がる
- Excelを使って結果を示すなどの場合にユーザー側の方が操作に詳しい場合があり、戸惑っていると信用が下がる
- 作業効率が圧倒的に変わる。
- 良い本ですが何点か気になる点を付記
- ファイルのバージョンを日付か数字で管理とありますが、多くの場合はクラウド上で自動で履歴管理されるのでは?
- p.267「データは多ければ多いほど良い」とありますが、分布が偏ったデータだと困りますし、偏っていないデータならば一定量以上は処理が重くなるだけですし、ミスリードかと。Data Analystならばこの表現はしないほうがいいですね。
- p.314「縦軸を変えるとグラフの見栄えは大きく変わる」の項で「使いどころに気をつけよう」としながらも縦軸の最小値を0でなくす方法が紹介されています。
- これData AnalystがやったらOutですよね。変化を強調したくて最小値を0にしないならば棒グラフはダメで折れ線グラフにするべきですね。
-
ビジネスエリートの「これはすごい!」を集めた 外資系投資銀行のエクセル仕事術
- Excelの機能や分析についてではなく、ミスなくわかりやすいExcelを作るためにはどうしたら良いかの本の定番です。Excelって自由度が高いので同じ内容をみんなまちまちに作るじゃないですか。
- データアナリストの立場だとExcelのままユーザーに提供・プレゼンする場合も多いと思います。その場合は必読ですね。
SQL & Gain Programming Skills
- ロードマップのこの項目の書き方が今ひとつわかりませんが、要はデータを扱う(収集・加工・可視化)ためのプログラミング(SQL、Python、R等)についてかと思います。可視化はまた別の項目にあるので、データ加工系として
- SQL, Python, R
-
京都大学のPython演習テキスト
- AI and Data Scientist Roadmapの記事にも書いたとおりですが、言語の入門書は書籍、e-Learning、ネット上のドキュメント等有料・無料多数あり、適宜見つけてくださいです。ただPythonならこの文書が無料コンテンツとして人気ですね。SQL、Rも見つけたら追加します。
-
京都大学のPython演習テキスト
Data Collection & Data Cleaning
-
前処理大全 データ分析のためのSQL/R/Python実践テクニック
- これもAI and Data Scientistの方に書いたのと同様ですがデータ加工としてここまで出来ればかなり強みになると思います。
- 5/22に改訂版が出るとのこと改訂新版 前処理大全〜SQL/pandas/Polars実践テクニック
Descriptive Analysis & Data Visualization
-
データ視覚化のデザイン
- 図の書き方の本は多数ありますが、本書は
本書で言う「データ視覚化」(ビジュアライゼーション)とは、単に手元にあるデータをグラフにすることではありません。いくらデータを視覚化しても、その中から人間が重要な情報を読み取れないのなら、データ視覚化をする意味がないからです。 あくまで、そのデータが指し示す意味を明確にすること、そしてより多くの人たち(オーディエンス)に興味を持って見てももらえることがデータ視覚化の目的です。
- 色々学ぶとついついドキュメント・スライドに図を詰め詰めにしてしまいますが、分析者の努力が重要なのではなく、受け手に届くかどうかが当たり前ですが重要です。引き算の考え方ですね。その観点で必読です。
- Tableauのスペシャリストの方の書籍ですがTableauではなくデータ視覚化についての汎用の本です。
- ここら辺を極めたい方には類書もるので、それらを紹介した記事 データ可視化の本10冊 もご覧ください。
- 図の書き方の本は多数ありますが、本書は
Statistical Analysis
-
データ分析に必須の知識・考え方 統計学入門 仮説検定から統計モデリングまで重要トピックを完全網羅
- AI & Data Scientist Roadmapの記事と同じですが
- 数式ありのテキストはたくさんありお好きなのを。それよりも「考え方」みたいなところをしっかり身につける方が重要だと思う。
-
基礎から学ぶ統計学
- とはいえ、Data Analystは理数系以外からも入って来られる方も多いと思われ、しっかりとした統計学の入り口としては本書が一番いいです。
- 農学部向け講義を元にした本です。図が多く語り口は柔らかですが内容は本格的です。
Machine Learning Basics
-
[第3版]Python機械学習プログラミング 達人データサイエンティストによる理論と実践
- これも、AI & Data Scientist Roadmapの記事と同じですが、理論よりもまず手に馴染ませた方が良いと思います。本書はたくさんの分析手法を紹介しており、Pythonで実践できるので良いと思います。
Big Data Technologies
- 果たしてData AnalystにHadoopや並列計算の知識まで必要なのか(データエンジニアに任せよう!)というところがあるのと私が知らない!のですみませんそこは略。
-
実践的データ基盤への処方箋
- これまた、AI & Data Scientist Roadmapの記事と同じですが、データ基盤の基本を抑えるという意味では本書が。
-
Apache Spark徹底入門
- 2024-04に出たばかりの本です。Apache Sparkの入門書として大規模データを扱うSpark、SQL、Python、PySparkについて土台を築けると思います。