この記事はNuco Advent Calendar 2022の25日目の記事です
データアナリストになるためのロードマップとは
本記事の指す「データアナリストとは」
データアナリストとはデータの収集・分析のプロフェッショナルです。
分析した情報を元に仮説を立て、問題解決や目標達成を目指します。
本記事でいうデータアナリストとは、データベースへ自らアクセス可能で、データの処理と傾向の特定、主要なビジネス上の意思決定を支援するデータの視覚化が可能な人間を指します。
データアナリストの業務例
- プロダクトの機能改善、事前見積もりや効果検証
- 施策についての仮説設計と効果検証
- 予測モデル構築
- 事業戦略の振り返りやKPI設計
本記事の概要
本記事ではデータアナリストになるためのロードマップを提示します。
ステップ1:独学で学ぶ
ステップ2:データアナリストとして就職する(未経験可の求人に通る)
ステップ3:現場で学び・活躍する
※本記事ではバスケやサッカー、野球などのスポーツ専門のデータアナリストではなく、WEBにおけるデータアナリストについて記載しています。
ステップ1:独学で学ぶ
論理的思考力
おすすめの書籍は、『ロジカル・シンキング』(照屋 華子・岡田 恵子)です。
「ロジックツリー」や「ピラミッドストラクチャー」あるいは「MECE」など、今では当たり前のように使われるビジネスパーソンの「基本作法」を日本に普及させた名著です。
具体的な論理的思考として以下の思考法が挙げられます。
演繹法
-
演繹法は事実を積み重ね、新しい仮説を立てます。
「A = B」かつ「B = C」であれば、「A = C」であると推測できる思考法です。 -
具体例
「緑黄色野菜には栄養がある」という一般論に対して、「ニンジンは緑黄色野菜である」という物事を当てはめた結果、「ニンジンには栄養がある」という結論になります。
帰納法
-
共通点を見つけ出し、それらを元に新しい仮説を立てます。
Aさん=X,Bさん=X,Cさん=Xというデータがあった場合、同じグループに所属しているDさんもXかもしれないと推測可能な思考法です。 -
具体例
「日本の景気が悪い」「アメリカの景気が悪い」「中国の景気が悪い」という3つの事実があったとする場合、これらに共通しているのは「景気が悪い」という事実です。
つまり、共通点から導き出される結論は「世界的に景気が悪いのではないか」という一般論となります。
論理的思考力はどの仕事においても大切ですが、データアナリストには特に重要な力です。
課題の単純化
おすすめの書籍は、『論理的思考のコアスキル』 (波頭 亮)です。
演繹法、帰納法、ベン図やピラミッドストラクチャーなどの練習法も記載されているのでおすすめです。
具体的な方法
- オッカムの剃刀
無駄なものを限りなく削ぎ落とした方が良いという考え方となります。
朝、私は叔父の所有している丹精込めた田んぼで育てられ、最高級の厚釜炊飯器で炊かれ、自然乾燥で作られた粒の細やかな塩の掛かったおにぎりを食べた。
私は朝おにぎりを食べた。
上記、2つの文章があるとして、「私は朝おにぎりを食べた。」の文章のみを伝えたかったとすると1つ目の文章は何を伝えたいか分かりづらい可能性があります。
背景の明確化
おすすめの書籍は、『そもそも「論理的に考える」って何から始めればいいの?』 (深沢真太郎)です。
「考える」事を「考えさせられる」1冊です。
ロジカルシンキングを勉強し始めたばかりの方におすすめです。
具体的には以下の様な例が挙げられます。
例えば、メルマガの効果測定を依頼されたとします。
背景が分かっていなければ単純な効果測定かと思いますが、
- メルマガをもっといろいろな人に読んでほしい。
- メルマガを通してサイトにアクセスしてほしい。
- メルマガを通して購入を促したい。
それぞれによって目的や背景は様々です。
どれを狙っているかなど、コンテキストが最初から分かっていれば悩まなくてすむこともあります。
例えば、メルマガをもっといろいろな人に読んでほしい。
が目的だった場合、
- 今まで読んだことのない人に送信する。
- 1番開封してもらいやすい件名で送る。
- 送信する時間を最適化する。
などの施策が考えられます。
バイアスを取り除く
おすすめの書籍は、『入社1年目から差がつく ロジカル・シンキング練習帳』(グロービス)です。
練習問題が多く、楽しく論理的思考力を身につけれられます。
具体的には、以下のバイアスがあります。
認知バイアス
過去の経験を元に決めつけてしまうバイアス。
認知バイアスには以下のバイアスがあります。
・確証バイアス
仮説や検証をする際にそれを支持する情報ばかりを集め、反証する情報を無視または集めようとしない傾向のことです。
例)
- 問題
「偶数が表に書かれたカードの裏は赤色である」という仮説を証明したいとき、どのカードを裏返しますか?
多い回答は「8と赤色」あるいは「8」のカードではないでしょうか?
上記回答では十分な仮説の検証に失敗しています。
「偶数が表に書かれたカードの裏は赤色である」の仮説が否定される場合は「表面に偶数が書かれていて、かつ、裏面は赤色ではないカード」が存在する場合のみです。
なので、赤色を裏返して奇数だったとしても仮説と関係ないですが、茶色のカードを裏返して偶数ならば仮説が否定されるため、仮説の検証としては「8と茶色」のカードを裏返すのが正解です。
生存者バイアス
生存者バイアスとは、何らかの選択過程を通過した人・物・事のみを基準として判断を行い、その結果には該当しない人・物・事が見えなくなることです。
- -例)
事故の生存者の話を聞いて、「その事故はそれほど危険ではなかった」と判断するという事例がありますが、それは、話を聞く相手が全て「生き残った人」だからです。
たとえ事故による死者数を知っていたとしても、当然死んだ人達の話を聞く方法はないので、それがバイアスにつながります。
正常性バイアス
自分にとって都合の悪い情報を無視したり過小評価したりする認知の特性です。
- 例)
災害情報などのアナウンスがあっても、多くの人がそれを都合の悪い情報として過小評価し、結果逃げるのが遅れ、甚大な被害が起きてしまうことなどがあります。
データのバイアス
間違った認識や、差別、偏見など、偏りのあるデータを収集してしまうことです。
サンプリングバイアス
⺟集団を正確に表さない⽅法でデータが収集されることです。
- 例)
評価4.8のゲームがあるとします。
ですが、そのアンケートが元々好意的な回答をくれると分かっているユーザーにのみを対象としたアンケートだった場合、その評価はサンプリングバイアスがあるといえます。
事実と解釈を分ける
おすすめの書籍は、『仮説思考 BCG流 問題発見・解決の発想法』(内田 和成)です。
仮設→検証→修正のサイクルを学べます。
問題の解決に時間がかかったり、上手くまとめることができない方におすすめです。
事実と仮説を分けられる様になる方法としては、徹底的に事実を確認することです。
事実の確認を怠らないようにすると、自ずと事実と仮説の切り分けが可能になってきます。
- 事実と解釈が分けれていない例
90%の確率で成功するものがあるとします。
それが宝くじであったら、それは確率が高いでしょう。
ですが、自動運転の自動車が人を目の前にして止まれる確率だったらいかがでしょうか?
それは高いとは言えません。
「事象Aの発生確率は統計上90%です」という同じ事実に対しても、「高い」「低い」といった解釈は文脈によって異なります。
「事象A」=「ある宝くじの当たる確率」の場合、比較的高いと解釈する人が多そうですが、「事象A」=「自動運転で人身事故が起こる確率」の場合、低いと解釈する人が多いかもしれません。
数学・統計学
確率・統計学
おすすめの書籍は、『入門統計解析法』(永田 靖)と、『統計学が最強の学問』(西内 啓)です。
『入門統計解析法』(永田 靖)
初心者レベルから中級レベルまで解説されています。
高校レベルの数学が理解できていれば理解できます。
『統計学が最強の学問』(西内 啓)
統計学をビジネスに活かすために勉強したいと考えている方におすすめです。
同じシリーズには「実践編」「ビジネス編」などもあります。
特に習得しておくべきこと
確率統計では平均・分散・標準偏差などの初歩から学ぶことが大切です。
母集団・標本集団などの考え方や確率分布がわかれば、統計的数値などを推定することも可能です。
範囲の多い確率分布の中でも、最低限正規分布は押さえておきましょう。
- 正規分布
正規分布は、統計を理解する上で一番大切な確率分布です。
正確に言葉で表すと、「左右対称で平均を中心に左右に裾野を持つ、釣鐘や富士山のような形をしているカーブ」となります
どんな時に役に立つか
そもそも確率分布がわからないとデータが読めません。
間違った解釈をしてしまう可能性があるからです。
多変量解析や、重回帰分析、単回帰分析などを理解する際に役立ちます。
微積分
おすすめの書籍は、『やさしく学べる微分積分とゼロから学ぶ微分積分』(石村 園子)と『ゼロから学ぶ微分積分』(小島 寛之)です。
『やさしく学べる微分積分とゼロから学ぶ微分積分』(石村 園子)
整数や有理数の定義から2変数の微分積分まで、非常にやさしく教えてくれます。
丁寧な式変形が魅力的です。
『ゼロから学ぶ微分積分』(小島 寛之)
例を用いて理解する本です。
微積分の定理や公式はをグラフや表を用いて、直感的にわかる工夫がされています。
イメージで理解したい人におすすめです。
特に習得しておくべきこと
微分・積分とは何か、という基礎的な考え方。
少なくとも高等数学の簡単な微分の問題を自分で解けるようになりましょう。
どんな時に役に立つか
機械学習における代表的なパラメータ更新手段である勾配降下法などは微分を理解していないと理解できません。
他にも、ニューラルネットワークを支える誤差逆伝播法などを理解できるようになります。
線形代数
おすすめの書籍は、『意味がわかる線形代数と線形代数キャンパス・ゼミ』(石井 俊全)、『線形代数キャンパス・ゼミ』(馬場 敬之)です。
『意味がわかる線形代数と線形代数キャンパス・ゼミ』(石井 俊全)
機械学習について学び始める人や文系出身の社会人向けに線形代数を説明してます。
線形代数をこれから学ぶ方や苦手な方は、この本を読むことで線形代数を学ぶ意味と図形的なイメージが身につくでしょう。
『線形代数キャンパス・ゼミ』(馬場 敬之)
図やグラフが見やすくまとめてあるうえに、解説も理解しやすく丁寧です。
途中で挫折することなく、楽しく最後まで読み進んでいけるでしょう。
特に習得しておくべきこと
データセットの処理やアルゴリズムの理解には、線形代数の知識が必要です。
理解程度であれば、大学の初等教育レベルの知識、高校で習う数2や数Cの知識があれば良いとされます。
ベクトル・行列の概念とその演算方法が身についているとよいです。
どんな時に役に立つか
機械学習全般や多変量解析を理解する際に役に立ちます。
多くのアルゴリズムにおいて、線形代数の知識が、その理解の助けとなることは間違いありません。
ITスキル
表計算ソフト
おすすめの書籍は、『Excel 最強の教科書[完全版] 【2nd Edition】』(藤井 直弥)です。
「どのように解説したら、よりわかりやすいか」を意識して書かれており、Excelに苦手意識のある人に大しておすすめです。
ExcelやGoogleスプレッドシートは使いこなせるととても便利です。
簡単な分析だったら表計算ソフトで充分な場合もあり、最先端のデータアナリストでも表計算ソフトを使用している人は多くいます。
DB・SQL
おすすめの書籍は、『スッキリわかるSQL入門 第3版 ドリル256問付き! (スッキリわかる入門シリーズ)』(中山 清喬)です。
SQLだけでなく、ACID特性、正規化、ER図に触れているので、データベースに関する基礎的な知識を学べます。
SQLはデータベースを操作できる言語です。
データ分析を行う際は、基本的にデータを取得するだけなのですが、以外と奥が深いです。
使いこなすまで時間がかかりますが、一次データにアクセス可能になりましょう。
ダッシュボード
おすすめの書籍は、『Tableauデータ分析 ~入門から実践まで~ 第3』(清水隆介)と、『「BIツール」活用 超入門 Google Data Portalではじめるデータ集計・分析・可視化』(近藤慧・前側将)です。
『Tableauデータ分析 ~入門から実践まで~ 第3』(清水隆介)
BI導入でよくある失敗を避けるためのデータ分析の考え方や、Tableauの公式より詳細なユーザー事例が紹介されているので参考になります。
『「BIツール」活用 超入門 Google Data Portalではじめるデータ集計・分析・可視化』(近藤慧・前側将)
業務の中で感じる壁が綺麗にまとめられていて勉強し始めの方におすすめです。
代表的なダッシュボード
Looker Studio
Google製のダッシュボードです。
Googleの製品なだけあって、Google Spread sheetと連携がしやすく、使い方も比較的簡単なため、初心者におすすめのダッシュボードです。
後述のTableauほどは自由度がないので注意しましょう。
Tableau
セールスフォース製の製品です。
Looker Studioよりも難易度は上がりますが、自由度が高いです。
Looker StudioほどGoogle製品との連携が容易ではないため、注意しましょう。
プログラミング
おすすめの書籍は、『R言語ではじめるプログラミングとデータ分析とPythonによるあたらしいデータ分析の教科書 第2版』(馬場 真哉)と『Pythonによるあたらしいデータ分析の教科書 第2版』(寺田 学)です。
『R言語ではじめるプログラミングとデータ分析とPythonによるあたらしいデータ分析の教科書 第2版』(馬場 真哉)
プログラミングをはじめて学ぶ人向けの本です。
Rをデータ分析のツールとして使えるようになります。
『Pythonによるあたらしいデータ分析の教科書 第2版』(寺田 学)
Pythonの基礎から勉強できます。
試験や資格の勉強にも最適です。
R
Rはデータ分析の中でも特に統計領域に特化したプログラミング言語です。
- メリット
- データ分析、統計に強く、パッケージが数多く存在しています。
- デメリット
- 処理速度が他の言語に比べると遅く、多くのデータを扱うときは向きません。
Python
PythonはWEBアプリケーションからデータ分析まで幅広く行えるプログラミング言語です。
- メリット
- データ分析、ソフトウェア開発が可能なため、汎用性が高く、使用者が多いため、テキストも多く存在しています。
- デメリット
- Rほど統計のためのライブラリが存在していないため、統計に焦点を置く場合は、Pythonは向かないかもしれません。
SQLや表計算ソフトだけでは分析できないものも、プログラミングさえ操れれば分析できるものも多いです。
ステップ2:データアナリストとして就職する(未経験可の求人に通る)
ステップ1と並行して就職活動する
知り合い(コネ)があるならばそこからアプローチするのが一番の近道ですが、そうでない場合は就職・転職サービスを利用することになるでしょう。
おすすめの転職サイトは『リクルートエージェント』、『doda』、『パソナキャリア』です。
リクルートエージェント
『リクルートエージェント』は、求人件数No.1の総合転職エージェントです。
業界最大の転職支援実績がありサポートも充実しているので、おすすめです。
doda
『dodaエージェント』は、パーソルキャリアが運営する国内最大級の転職エージェントです。
首都圏の20代30代に強く提案力も高いので、おすすめです。
パソナキャリア
『パソナキャリア』は手厚いサポートに定評があり、転職に不安がある方に特におすすめです。
多くの企業とのパートナーシップが実現する求人数の充実ぶりも安心材料の一つです。
学ぶことと平行して、転職活動を行うことはとても重要です。
充分に学んでから転職をしようとしても、学ぶことに集中してしまい、本来の目的である転職に二の足を踏んでしまうこともあります。
様々な求人媒体から多くの求人に応募しましょう。
未経験でもアピールできるポイント
業務経験は最大のアピールポイントになりますが、それがない場合にも、別の強みを伝えられるようにしておくことは大きな武器になります。
未経験でもアピールできるポイントを磨くためにおすすめなのは、『Coursera』と『Kaggle』に取り組むことです。
Coursera
Courseraとは、世界的な有名大学が提供してくれる授業や、GoogleやIBMなどの一流企業が主催する7000以上の講座をオンラインで受けられるサイトです。
成果物をコース終了の条件に指定しているコースが多く、コース終了後にはポートフォリオに記載可能なものが制作出来ます。
コース終了後に電子の修了証明書が発行され、履歴書にも記載可能なため、アピールポイントとなります。
Kaggle
Kaggleとは、企業などとデータアナリストを繋げるプラットフォームです。
500万人を超えるユーザーが登録しているサイトで、世界中のデータアナリストが参加するデータ分析の大会が日々行われています。
Kaggleで実績がある方は、企業が求めている能力があると認識されるケースが多いです。
実績をSNSに載せているだけでスカウトが来ることもあるので、アピールポイントになります。
取っておくと良い資格
取得しておくと良い資格は『統計検定』、『G検定・E資格』、『データスペシャリスト試験』です。
統計検定
統計検定は、一般財団法人統計質保証推進協会が実施する検定試験です。
統計学に関する知識や活用力が身につきます。
ビッグデータの解析・処理を行うデータアナリストに有益な資格です。
G検定・E資格
一般社団法人日本ディープラーニング協会(JDLA)が主催する試験です。
データアナリストはAIの知識も求められることも多く、資格取得により業務知識が深まります。
データベーススペシャリスト試験
情報処理技術者試験と同様に「独立行政法人情報処理推進機構(IPA)」が実施する国家資格です。
データベースの設計や運用管理についての知識が身につきます。
公式サイトに掲載されている過去問を中心に勉強を進めるとよいでしょう。
ステップ3:現場で学び・活躍する
マーケティング
おすすめの書籍は、『沈黙のWebマーケティング -Webマーケッター ボーンの逆襲- アップデート・エディション』(松尾 茂起・上野 高史)と、『たった一人の分析から事業は成長する 実践 顧客起点マーケティング』(西口 一希)です。
『沈黙のWebマーケティング -Webマーケッター ボーンの逆襲- アップデート・エディション』(松尾 茂起・上野 高史)
ストーリー仕立のマンガでマーケティング用語や具体例を丁寧に解説した文章で構成されています。
『たった一人の分析から事業は成長する 実践 顧客起点マーケティング』(西口 一希)
理論に終始することなく、実践で使える考え方を事例とともに紹介されています。
経営に関する分野も含まれるので、マーケティングと経営を紐づける視点で読むのもおすすめです。
データアナリストには、マーケターとしての想像力や思考力が必要です。
ただデータを見ても、それはただのデータでしかなく、そこから導きだされるユーザーの行動や属性、心理までもに踏み込み、仮説検証を行う必要があります。
具体的なマーケティング用語
- CV(コンバージョン)
- 成果、目的としている指標が達成されたときなどに使います。
- PV(ページビュー)
- WEBページが閲覧された時に使います。
- UU(ユニークユーザー)
- 重複していない1人のユーザーを指します。
例えば、スポーツデータアナリストがWEB系のデータアナリストになっても、WEB業界特有の用語や基礎知識でつまずくことでしょう。
そもそもマーケティング能力とは、ビジネスの場において消費者のニーズと欲求を明らかにし、適切な製品開発、価格決定、流通、効果的な販売促進など遂行するための基礎的な能力を要する人のことを指します。
マーケティングの分野で活躍するデータアナリストには、マーケティング力があると重宝されます。
分析したデータのコンテキストが分かっていると、深く洞察でき、充分な成果を残せます。
業界・業種の徹底研究(ドメイン知識)
マーケティングスキルとセットで、その業界のドメイン知識をどんどん吸収していきましょう。
マーケティングスキルとドメイン知識を備えることで、初めて意味のある分析が可能になります。
ドメイン知識はその業界にいないと身につきません。
ステップ1の独学で学ぶまででは、勉強できる範囲に限界がありますし、そもそもどの業界知識が必要になるのかわかりません。
例えば、子供向けアニメーションの個別課金サイトがあったとして、1ヶ月だけ異常に売上の数値が伸びていたとします。
業界の知識がなければ、売上が上がった喜ばしいことの様に感じられますが、両親が決済を管理しているサービスで子供が勝手に決済を行ってしまい、売上が起こるなんてこともあります。
もしそういったことが起こりうると知っていたら、データを見た瞬間に確認が出来ます。
業界特有の観点を踏まえた分析を可能にするためには、その業界知識が必要不可欠です。
まとめ
データアナリストになるためのステップを3つ紹介させて頂きました。
長く険しいように思えるかもしれませんが、一つ一つを確実にクリアしながら、データアナリストとしてのキャリアを形作っていていただきたいです。
おわりに
最後まで読んでいただきありがとうございます。
弊社では、経験の有無を問わず、社員やインターン生の採用を行っています。
興味のある方はこちらをご覧ください。