これは何
データマネジメント・データ分析に関する書籍・記事・ツールをまとめます。
特に価値が高いと思う書籍・記事を上に並べています。
どのような分野が存在するのか概観します。
全て読むのは大変なので、興味があったり業務に関連のある分野から目を通しましょう。
対象読者
データ分析をやってみたいが何から手をつければいいのかわからない人
書籍
webに転がっている記事は断片的です。
まずは書籍を読んで体系だった知識を仕入れて、その後にwebの記事で肉付けするのをおすすめします。
データ分析全般
データ解析の実務プロセス入門
https://www.amazon.co.jp/dp/4627817711/
データマネジメント
データマネジメントが30分でわかる本
https://www.amazon.co.jp/dp/B085W4YSZJ
実践的データ基盤への処方箋
https://www.amazon.co.jp/dp/B09MSX9MQV
データモデリング
Cloud Data Management
https://dataschool.com/data-governance/
日本語の紹介記事
https://wtnvenga.notion.site/Cloud-Data-Management-c25618655c2642d68b4696f4946d22c0
Star Schema
https://www.amazon.co.jp/dp/B003Y8YWAE
Agile Data Warehouse Design
https://www.amazon.co.jp/dp/0956817203
仮説の立て方
イシューから始めよ
https://www.amazon.co.jp/dp/B00MTL340G
KGI・KPI設計
Lean Analytics
https://www.amazon.co.jp/dp/4873117119
可視化・Dashboard作成
データビジュアライゼーションの教科書
https://www.amazon.co.jp/dp/4798053481
データ視覚化のデザイン
https://www.amazon.co.jp/dp/B08BHZ4HT3
ABテスト
A/Bテスト実践ガイド
https://www.amazon.co.jp/dp/B08Z3TPVZG
ABテストが出来ない状態で効果を見積もる方法(因果推論)
効果検証入門
https://www.amazon.co.jp/dp/B0834JN23Y
調査観察データの統計科学
https://www.amazon.co.jp/dp/4000069721
統計モデリング
データ解析のための統計モデリング入門
https://www.amazon.co.jp/dp/400006973X
StanとRでベイズ統計モデリング
https://www.amazon.co.jp/dp/B07M8LWLS1
記事
データ分析全般
Simple Data Analyticsで成果を出す
https://speakerdeck.com/hik0107/simple-data-analytics-leads-impact
メルカリの分析プロセス標準化の取り組み
https://note.com/mercari_data/n/nf7da425c32b0
ランサーズの分析事例
https://yuzutas0.hatenablog.com/entry/2020/12/24/153000
データ基盤
モダンデータストック
https://satoshihirose.hateblo.jp/entry/2021/11/20/160548
BIツールの歴史
https://speakerdeck.com/shomaekawa/bituruda-quan-biturufalseli-shi
モノタロウ
https://tech-blog.monotaro.com/entry/2021/10/26/090000
メルカリのデータ基盤リプレイス
https://speakerdeck.com/__hiza__/regasihua-sitadata-pipelinefalsefei-zhi
データモデリング
ディメンションモデリング
https://zenn.dev/pei0804/articles/dimensional-modeling
スタースキーマ
https://zenn.dev/pei0804/articles/star-schema-design
Ubieでdbtを使ってOnline Analytics Processingを整えた話
https://speakerdeck.com/tanakarian/data-warehouse-logic-design-by-using-dbt
広告(VOYAGE)のデータ分析基盤の勘所
https://speakerdeck.com/pei0804/hokufalsekankaeruzui-gao-falserehoteinkuji-pan-at-awsdeshi-jian-analytics-modernization
オープンエイトがデータ基盤作った話
https://speakerdeck.com/shomaekawa/hurusutatuku-ren-mu-detaanarisutogadetaji-pan-wozuo-tutaohua
データメッシュ
とは
https://www.infoq.com/jp/news/2021/02/data-mesh-architecture/
リクルートのデータメッシュ事例
https://speakerdeck.com/yuyamada/fu-shu-detaji-pan-falsetou-ming-hua
仮説の立て方
解像度を高める
https://speakerdeck.com/tumada/jie-xiang-du-wogao-meru
データ活用する人のための論点整理トレーニング
https://speakerdeck.com/shomaekawa/detahuo-yong-sururen-falsetamefalselun-dian-zheng-li-toreningu
正解のない「面白さ」をいかに数値で計測するか? サイゲームスのデータ分析者が「最高のコンテンツ」のためにしていること
https://magazine.cygames.co.jp/archives/14812
KGI・KPI設計
良いKPIとは何か
https://note.com/hik0107/n/n54c536cc8321
プロダクト開発におけるKPIの設定について
https://note.com/gb_pdm/n/ne4ce971820a1
KPIは足し算と掛け算を併用しよう
https://note.com/yusuke_ichikawa/n/n5eeea9d1f977
可視化・Dashboard作成
データインクレシオ
"よいグラフを描くには、余分なものをすべて削除すべき”という考え方
https://www.darkhorseanalytics.com/blog/data-looks-better-naked
https://www.youtube.com/watch?v=pCp0a5_YIWE&t=4s
ユースケース別のグラフの選び方
https://speakerdeck.com/haseryo/dataengineeringstudy-number-12-ming-ri-karazhen-si-dekiru-kesubie-detake-shi-hua-falsefalseuhau
ダッシュボード内のタイルの並べ方について
https://dataschool.com/how-to-design-a-dashboard/what-makes-a-great-dashboard-aces/
クソ長ダッシュボードを1つ作るより短いダッシュボードを相互に関連付けるべきというお話
https://chartio.com/blog/best-practice-keep-shorter-dashboards/
データに基づく意思決定
意思決定のROI
https://note.com/hik0107/n/n9be0e1647e31
ABテスト
メルカリにおけるA/Bテスト標準化への取り組み
https://note.com/mercari_data/n/nb1044a53c1ab
ABEMAのABテスト。ベイジアンABテスト。
https://developers.cyberagent.co.jp/blog/archives/29088/
データ分析組織
Rettyのデータ分析組織設計事例
https://speakerdeck.com/masadooon/improve-analysis-team-structure-to-business-phase
アナリティクスエンジニアとは
https://www.getdbt.com/what-is-analytics-engineering/
ツール
基本自分が使ったことのあるツールに絞ります。
公式Docsを読むのが最短で習得する方法だと思います。
データマネジメント
- BigQuery
- Airflow
データモデリング
あまり触ったことがないです...
- dbt
- dataform
データカタログ
データベースやテーブルの詳細やカラムの定義などを参照する際に使うツールのことです。
例えば、「このカラムの値の"1"は何を意味する?」といった問いに答えます。
- Looker
データ抽出
- BQのコンソール
- SQL
- Colab
- Looker
データハンドリング・分析
- Spreadsheet
- Colab
- pandas, numpy
- Looker
データ可視化
- Colab
- matplotlib, seaborn
- plotly, plotly express
- Spreadsheet
- Looker
ダッシュボード
- Data Studio
- Looker
- Dash(plotly)
感想
データ分析は単体で分析サイクルが閉じることは少なく、以下の領域と近接しています。
- より高度な分析や意思決定: 戦略論
- 得られた結果を深堀して洞察を得る: UXリサーチ, N1インタビュー
- 意思決定の自動化: 機械学習
データマネジメント・データ分析は領域が広いですね。
スーパーマンを育成するより、チーム全体でこれらの領域をカバーする方向に倒して行ったほうがよさそうです。