search
LoginSignup
120

posted at

updated at

データマネジメント・データ分析に役立つ情報をまとめる

これは何

データマネジメント・データ分析に関する書籍・記事・ツールをまとめます。
特に価値が高いと思う書籍・記事を上に並べています。
どのような分野が存在するのか概観します。

全て読むのは大変なので、興味があったり業務に関連のある分野から目を通しましょう。

対象読者

データ分析をやってみたいが何から手をつければいいのかわからない人

書籍

webに転がっている記事は断片的です。
まずは書籍を読んで体系だった知識を仕入れて、その後にwebの記事で肉付けするのをおすすめします。

データ分析全般

データ解析の実務プロセス入門
https://www.amazon.co.jp/dp/4627817711/

データマネジメント

データマネジメントが30分でわかる本
https://www.amazon.co.jp/dp/B085W4YSZJ

実践的データ基盤への処方箋
https://www.amazon.co.jp/dp/B09MSX9MQV

データモデリング

Cloud Data Management
https://dataschool.com/data-governance/
日本語の紹介記事
https://wtnvenga.notion.site/Cloud-Data-Management-c25618655c2642d68b4696f4946d22c0

Star Schema
https://www.amazon.co.jp/dp/B003Y8YWAE

Agile Data Warehouse Design
https://www.amazon.co.jp/dp/0956817203

仮説の立て方

イシューから始めよ
https://www.amazon.co.jp/dp/B00MTL340G

KGI・KPI設計

Lean Analytics
https://www.amazon.co.jp/dp/4873117119

可視化・Dashboard作成

データビジュアライゼーションの教科書
https://www.amazon.co.jp/dp/4798053481

データ視覚化のデザイン
https://www.amazon.co.jp/dp/B08BHZ4HT3

ABテスト

A/Bテスト実践ガイド
https://www.amazon.co.jp/dp/B08Z3TPVZG

ABテストが出来ない状態で効果を見積もる方法(因果推論)

効果検証入門
https://www.amazon.co.jp/dp/B0834JN23Y

調査観察データの統計科学
https://www.amazon.co.jp/dp/4000069721

統計モデリング

データ解析のための統計モデリング入門
https://www.amazon.co.jp/dp/400006973X

StanとRでベイズ統計モデリング
https://www.amazon.co.jp/dp/B07M8LWLS1

記事

データ分析全般

Simple Data Analyticsで成果を出す
https://speakerdeck.com/hik0107/simple-data-analytics-leads-impact

メルカリの分析プロセス標準化の取り組み
https://note.com/mercari_data/n/nf7da425c32b0

ランサーズの分析事例
https://yuzutas0.hatenablog.com/entry/2020/12/24/153000

データ基盤

モダンデータストック
https://satoshihirose.hateblo.jp/entry/2021/11/20/160548

BIツールの歴史
https://speakerdeck.com/shomaekawa/bituruda-quan-biturufalseli-shi

モノタロウ
https://tech-blog.monotaro.com/entry/2021/10/26/090000

メルカリのデータ基盤リプレイス
https://speakerdeck.com/__hiza__/regasihua-sitadata-pipelinefalsefei-zhi

データモデリング

ディメンションモデリング
https://zenn.dev/pei0804/articles/dimensional-modeling

スタースキーマ
https://zenn.dev/pei0804/articles/star-schema-design

Ubieでdbtを使ってOnline Analytics Processingを整えた話
https://speakerdeck.com/tanakarian/data-warehouse-logic-design-by-using-dbt

広告(VOYAGE)のデータ分析基盤の勘所
https://speakerdeck.com/pei0804/hokufalsekankaeruzui-gao-falserehoteinkuji-pan-at-awsdeshi-jian-analytics-modernization

オープンエイトがデータ基盤作った話
https://speakerdeck.com/shomaekawa/hurusutatuku-ren-mu-detaanarisutogadetaji-pan-wozuo-tutaohua

データメッシュ

とは
https://www.infoq.com/jp/news/2021/02/data-mesh-architecture/

リクルートのデータメッシュ事例
https://speakerdeck.com/yuyamada/fu-shu-detaji-pan-falsetou-ming-hua

仮説の立て方

解像度を高める
https://speakerdeck.com/tumada/jie-xiang-du-wogao-meru

データ活用する人のための論点整理トレーニング
https://speakerdeck.com/shomaekawa/detahuo-yong-sururen-falsetamefalselun-dian-zheng-li-toreningu

正解のない「面白さ」をいかに数値で計測するか? サイゲームスのデータ分析者が「最高のコンテンツ」のためにしていること
https://magazine.cygames.co.jp/archives/14812

KGI・KPI設計

良いKPIとは何か
https://note.com/hik0107/n/n54c536cc8321

プロダクト開発におけるKPIの設定について
https://note.com/gb_pdm/n/ne4ce971820a1

KPIは足し算と掛け算を併用しよう
https://note.com/yusuke_ichikawa/n/n5eeea9d1f977

可視化・Dashboard作成

データインクレシオ
"よいグラフを描くには、余分なものをすべて削除すべき”という考え方
https://www.darkhorseanalytics.com/blog/data-looks-better-naked
https://www.youtube.com/watch?v=pCp0a5_YIWE&t=4s

ユースケース別のグラフの選び方
https://speakerdeck.com/haseryo/dataengineeringstudy-number-12-ming-ri-karazhen-si-dekiru-kesubie-detake-shi-hua-falsefalseuhau

ダッシュボード内のタイルの並べ方について
https://dataschool.com/how-to-design-a-dashboard/what-makes-a-great-dashboard-aces/

クソ長ダッシュボードを1つ作るより短いダッシュボードを相互に関連付けるべきというお話
https://chartio.com/blog/best-practice-keep-shorter-dashboards/

データに基づく意思決定

意思決定のROI
https://note.com/hik0107/n/n9be0e1647e31

ABテスト

メルカリにおけるA/Bテスト標準化への取り組み
https://note.com/mercari_data/n/nb1044a53c1ab

ABEMAのABテスト。ベイジアンABテスト。
https://developers.cyberagent.co.jp/blog/archives/29088/

データ分析組織

Rettyのデータ分析組織設計事例
https://speakerdeck.com/masadooon/improve-analysis-team-structure-to-business-phase

アナリティクスエンジニアとは
https://www.getdbt.com/what-is-analytics-engineering/

ツール

基本自分が使ったことのあるツールに絞ります。
公式Docsを読むのが最短で習得する方法だと思います。

データマネジメント

  • BigQuery
  • Airflow

データモデリング

あまり触ったことがないです...

  • dbt
  • dataform

データカタログ

データベースやテーブルの詳細やカラムの定義などを参照する際に使うツールのことです。
例えば、「このカラムの値の"1"は何を意味する?」といった問いに答えます。

  • Looker

データ抽出

  • BQのコンソール
  • SQL
  • Colab
  • Looker

データハンドリング・分析

  • Spreadsheet
  • Colab
    • pandas, numpy
  • Looker

データ可視化

  • Colab
    • matplotlib, seaborn
    • plotly, plotly express
  • Spreadsheet
  • Looker

ダッシュボード

  • Data Studio
  • Looker
  • Dash(plotly)

感想

データ分析は単体で分析サイクルが閉じることは少なく、以下の領域と近接しています。

  • より高度な分析や意思決定: 戦略論
  • 得られた結果を深堀して洞察を得る: UXリサーチ, N1インタビュー
  • 意思決定の自動化: 機械学習

データマネジメント・データ分析は領域が広いですね。
スーパーマンを育成するより、チーム全体でこれらの領域をカバーする方向に倒して行ったほうがよさそうです。

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
What you can do with signing up
120