LoginSignup
32
36

ITスキルロードマップ roadmap.sh がすごい。Data Analyst について対応する本をまとめた

Posted at

Developer Roadmapsというサイトがすごいです。ITエンジニアの分野別にスキルアップのロードマップが示されています。
言語、基盤、アプリ、かなり網羅されています。

ということで、AI and Data Scientist Roadmap について書きましたが

今回は Data Analyst Roadmap です。

  • 雑感
    • このロードマップの続きにAI and Data Scientistがあり、Data AnalystをData Scientistの前段階的に位置付けているのが疑問。Data AnalystとData Scientistは並ぶものではないでしょうか。
    • そして、ビジネス、ドメイン知識や分析目的定義などのスキルについて、AI and Data Scientistの時よりもやや言及があるものの弱いのが残念。書籍として追加しました。
  • 以下にそのカテゴリに対応する日本語書籍を13冊挙げてみました。

Introduction

  • Introductionに直接適した本は私は知りません(単に私が知らないだけ)。ただそれに近いかなという本はいくつかあります。

  • データ分析・AIを実務に活かす データドリブン思考

    • データサイエンティストとして著名な河本薫氏の本ですがデータアナリストにも重要な考え方と思います。氏は会社を「意思決定の工場」と捉え、データ分析はその意思決定に役立たなければならないとしてます。

      「現場で活用される」とは「現場の意思決定に活用される」ということ。「意思決定に活用される」とは「意思決定プロセスに分析結果が使われる」ということ。そして、意思決定プロセスに分析結果が使われるには、意思決定に有用なデータ分析を行うだけでなく、分析結果が意思決定に活用されるように「意思決定プロセスを設計する」必要があることに気づきました。

    • このロードマップのIntroductionの解説にも下記記載(Google翻訳です)があり、本書の考え方が一番合致すると思います。

      データ分析は、今日のデータ中心の世界において重要な役割を果たしています。これには、意思決定のための貴重な洞察を抽出するために、データの検査、クレンジング、変換、モデリングの実践が含まれます。データアナリストは、大規模なデータセットの収集、処理、および統計分析の実行を主な任務とする専門家です。彼らは、データを使用して質問に答え、問題を解決する方法を発見します。現代の企業におけるデータの急速な拡大に伴い、データ アナリストの役割は大きく進化しており、ビジネス戦略や意思決定プロセスにおける重要な資産となっています。

  • MBA定量分析と意思決定

    • ビジネスパーソン用のグロービスさんのシリーズの定量分析の本です。本書もビジネスの意思決定のために数字をどう扱うかの観点で書かれています。
    • ビジネスパーソンとエンジニアの立場では「データ」について違う見方をするかなと思いますがそれを繋ぐ接点の一つになるかなと思います。
    • エンジニア側からデータアナリストに入って行くと経営指標等が弱いと思います。最低限の知識インプットとして良いのではないでしょうか。
  • 「ROEって何?」という人のための経営指標の教科書

    • 経営指標についてだけなら初心者にもわかりやすい本書が必読ですね。
  • ビジネスダッシュボード 設計・実装ガイドブック

    • ロードマップ中には直接言及がありませんが、Data Analystの立場ですとビジネスダッシュボードの構築やそれについての支援の役割もあるかと思います。
    • 本書はビジネスダッシュボードの使い方ではなく、何のために作るのか、その体制をどうするか、役割と必要なスキル等ダッシュボード構築と運用について、ツールの使い方以外のノウハウが網羅されています。
    • トレジャーデータさんの本ですがツールによらず汎用のノウハウで、ビジネスダッシュボードに関わるなら必読かと。

Excel

SQL & Gain Programming Skills

  • ロードマップのこの項目の書き方が今ひとつわかりませんが、要はデータを扱う(収集・加工・可視化)ためのプログラミング(SQL、Python、R等)についてかと思います。可視化はまた別の項目にあるので、データ加工系として
  • SQL, Python, R
    • 京都大学のPython演習テキスト
      • AI and Data Scientist Roadmapの記事にも書いたとおりですが、言語の入門書は書籍、e-Learning、ネット上のドキュメント等有料・無料多数あり、適宜見つけてくださいです。ただPythonならこの文書が無料コンテンツとして人気ですね。SQL、Rも見つけたら追加します。

Data Collection & Data Cleaning

Descriptive Analysis & Data Visualization

  • データ視覚化のデザイン
    • 図の書き方の本は多数ありますが、本書は

      本書で言う「データ視覚化」(ビジュアライゼーション)とは、単に手元にあるデータをグラフにすることではありません。いくらデータを視覚化しても、その中から人間が重要な情報を読み取れないのなら、データ視覚化をする意味がないからです。 あくまで、そのデータが指し示す意味を明確にすること、そしてより多くの人たち(オーディエンス)に興味を持って見てももらえることがデータ視覚化の目的です。

    • 色々学ぶとついついドキュメント・スライドに図を詰め詰めにしてしまいますが、分析者の努力が重要なのではなく、受け手に届くかどうかが当たり前ですが重要です。引き算の考え方ですね。その観点で必読です。
    • Tableauのスペシャリストの方の書籍ですがTableauではなくデータ視覚化についての汎用の本です。
    • ここら辺を極めたい方には類書もるので、それらを紹介した記事 データ可視化の本10冊 もご覧ください。

Statistical Analysis

Machine Learning Basics

Big Data Technologies

  • 果たしてData AnalystにHadoopや並列計算の知識まで必要なのか(データエンジニアに任せよう!)というところがあるのと私が知らない!のですみませんそこは略。
  • 実践的データ基盤への処方箋
    • これまた、AI & Data Scientist Roadmapの記事と同じですが、データ基盤の基本を抑えるという意味では本書が。
  • Apache Spark徹底入門
    • 2024-04に出たばかりの本です。Apache Sparkの入門書として大規模データを扱うSpark、SQL、Python、PySparkについて土台を築けると思います。
32
36
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
32
36