はじめに
本記事は、Googleデータアナリティクスのプロフェッショナル認定証のプログラムより、参照させて頂いています。興味を持った方は、是非受講してみてください。

データ分析の6つのフェーズ
データ分析には 6 つのフェーズがあります。
ステージ | 内容 |
---|---|
問いかけ | 効果的な質問をする、課題を明確にする、体系的に考える、他の人たちとコミュニケーションする。 |
準備 | データがどのように生成・収集されるかを理解する、さまざまなデータ形式・タイプ・構造を見極めて使用する、データの公平性・信頼性を確認する、データを整理・保護する。 |
処理 | データを作成・変換する、データの整合性を維持する、データをテストする、データをクリーンアップする、クリーンアップした結果を確認・報告する。 |
分析 | ツールを使ってデータの形式を揃えて変換する、データを並べ替えて絞り込む、パターンを見つけて結論を出す、予測と推奨を行う、データ主導の意思決定を行う。 |
共有 | 可視化を理解する、効果的な可視化資料を作成する、データに命を吹き込む、データにストーリーを与える、他の人が理解できるようコミュニケーションを図る。 |
行動 | インサイトを活かす、課題を解決する、決断する、新しいものを創造する。 |

データ ライフサイクルは、データが使用される期間中に通過するさまざまなステージを示すのに対し、データ分析は、データを分析するプロセスです。
1.問いかけ
課題定義
まず、課題を定義するためには 現状を把握し、理想との ズレを見極める 必要があります。 一般的には 問題を解決するか、 良くない点を見直すかが必要になります。
- 例えば、 スポーツスタジアムのチケット売り場に 人が並ぶ時間を短くしたいとしましょう。 この場合には、 顧客が席につくまでの時間を 短くする方法は何か、というのが 解決すべき問題となります。
ステークホルダー理解
問いかけフェーズにはもう一つ、 ステークホルダーの期待を理解する という大事なポイントがあります。 そのためにはまず ステークホルダーの範囲を決めます。 まず自分のマネージャーがいるでしょうし、 担当役員や販売パートナーも 入るかもしれません。 ステークホルダーは大勢いることもあります。 ですが、いずれも 意思決定をサポートしてくれたり、 行動や戦略に影響を与えたり、 具体的な目標を持っていたりする点で 共通しています。 さらにプロジェクトのことを 気にかけているわけですから、 ステークホルダーの期待を 理解するのは大事なことなのです。
- 例えば、マネージャーから ビジネスリスクに関する データ分析プロジェクトを任された場合、 会社に影響しそうなリスクをすべて 対象にするのか、それとも ハリケーンや竜巻など気象関係の リスクだけなのか、確認しておくべきでしょう。
自分がプロジェクトに積極的に関わり 方向性を誤らないよう、ステークホルダーとの コミュニケーションを 欠かさないことがポイントです。 そのため、データ アナリストの仕事では しっかりとしたコミュニケーション戦略を 確立しておくことが 極めて重要になります。 問いかけフェーズの中でも特にこの部分は 課題の状況だけではなく 根源にも注目するのに役に立ちます。 以前紹介した 5 つの「なぜ」が ここで大活躍します。
2.準備
データ アナリストが次の分析プロセスで使う データを収集、保管するステップです。 さまざまな種類のデータを紹介し、 目の前の問題を解決するのに 最適な種類のデータを特定する 方法を考えます。 なぜデータと結果の客観性、 不偏性が大事なのかもわかるはずです。 言い換えれば、分析に基づく判断は すべて事実に基づいた 公正、公平なもの でなければなりません。
3.処理
データのクリーンアップ
データ アナリストは結果に影響する データの誤りや不正確さを すべて洗い出し、解消します。 通常はデータをクリーンアップし、 より有用なフォーマットに変換し、 複数のデータセットを組み合わせて 情報を理想的な状態に近づけ、さらに 情報全体を歪めそうな 極端に外れたデータを取り除きます。
データの品質確認作業
それが終わったら、今度は準備したデータの 完全性、正確性を確認する方法を学びます。 このフェーズでは、 細部への注意がポイントになります。 誤字脱字、 矛盾点、データの欠落や誤りを修正します。
- 「予定していたデータは すべて揃ったか」
- 「たまたま一部のデータが足りないのか、 それともデータの集め方に問題があり ごっそり抜けた データがあるのか」
- 「コード化が必要な場合、 データのコード変換は正しかったか」
- 「別枠で扱うべき外れ値はあるか」
仕上げとして データをクリーンアップした結果を ステークホルダーと一緒に 検証、共有する戦略を押さえましょう。
4.分析
収集したデータを分析するには ツールを使って情報を変換、 整理して 意味のある結論を導き出し、 予測を立て、十分な情報に基づいて意思決定 できるようにしておく必要があります。 データ アナリストは さまざまな便利なツールを使って 仕事を進めます。
データ分析で 特に大変なのは多分、 我々アナリストは パターンを見つけるには 慣れるしかないということです。 経験を積んで腕を上げるにつれ データから読み取れそうな内容が なんとなくわかるようになります。 データが語る内容の 見当が付くようになるのです。 このタイミングで一歩下がって データ自身の声に 耳を傾けるのがポイントです。 我々データ アナリストは 語り部ではありますが 自分自身について語るのではない ということを 覚えておいてください。 物語の主人公はデータであり、 私たちの仕事はデータの声を拾い上げて できる限り公平で客観的な態度で データの声を代弁することなのです。
5.共有
このフェーズではデータ アナリストが 結果を解釈し、他の関係者と共有して ステークホルダーがデータに基づく 意思決定を行うのをサポートする方法を学びます。 共有フェーズでは ビジュアライゼーションが データ アナリストの強い味方です。 適切な可視化資料を使うと 事実と数字が見やすく、 複雑な概念がわかりやすくなります。
6.行動
みなさんがデータ アナリストとして 提示したインサイトをビジネス側が すべて検討し、元々の課題にあてはめて 解決するべく動き出します。
すべてのステップを着実に実行せず 途中を飛ばしたりすると 求めているインサイトが 得られません。