0
0

データ分析プロジェクトの大まかな流れ 〜ウォーターフォールモデルとの対比〜

Posted at

データ分析プロジェクトの大まかな流れについて 〜ウォーターフォールモデルとの対比〜

 システム開発でよく用いられる「ウォーターフォールモデル」は、要件定義、設計、実装、テスト、運用といったフェーズを順に進める手法があります。この手法はプロジェクトの進行が直線的で、各フェーズが一度完了すると前のフェーズには戻りにくいという特徴を持っています。

 一方、データ分析プロジェクトの流れは、ウォーターフォールモデルと似た側面もありますが、より探索的で反復的なアプローチが求められます。ここでは、データ分析プロジェクトの一般的なフレームワークとして用いられるPPDACサイクルを基に、その流れをウォーターフォールモデルと比較しながら説明します。

1. Problem(課題設定)/ 立ち上げと管理

データ分析プロジェクトの第一ステップは、解決したい問題や目標を明確にする「課題設定」です。これは、ウォーターフォールモデルにおける「要件定義」に相当します。システム開発と同様に、このフェーズが不十分であるとプロジェクト全体に影響を及ぼすため、慎重に進める必要があります。

ただし、データ分析の課題は、分析が進む中で新たな発見や洞察が生まれ、当初の課題が修正されることも多いです。したがって、ウォーターフォールモデルのように一度決まった要件から動かないのではなく、柔軟な見直しが許容される点が異なります。

2. Plan(計画) / データ種類と分析手法の検討

次に、データ収集の方法や分析手法を計画します。これはシステム開発における「設計」に似ています。プロジェクトのスコープ、必要なリソース、データの入手可能性などを考慮しながら、具体的な進行方法を定めます。

ウォーターフォールモデルでは設計が詳細かつ固定的であるのに対し、データ分析プロジェクトでは、計画フェーズも再考が可能です。たとえば、想定していたデータが不足していたり、より有効な手法が見つかった場合、計画を変更して柔軟に対応します。

3. Data(データ収集)

計画に基づいて、データを収集し、整理します。ウォーターフォールモデルの「実装」に相当しますが、ここではプログラムを書くのではなく、必要なデータを収集して準備する工程に重きを置きます。

データ分析では、収集データの質や量がプロジェクトの成否を大きく左右するため、このステップは特に重要です。システム開発と異なり、収集したデータの整合性や品質が低い場合、次のステップに進む前に問題解決を行う必要があり、反復作業が多く発生します。
 企業で扱われるデータは大きく分けると、SCMやERP、CRMなどの業務ソフトウェアのデータベースで利用される「構造化データ」と、従業員の日常業務やユーザーへのアンケートで生成されるワード、PDFエクセルや、設計図面、画像、動画などの「非構造化データ」に分けられます。

4. Analysis(分析)/ 分析結果の評価と改善

分析作業は、ウォーターフォールモデルの「テスト」に相当します。ここでは、収集したデータを使って仮説を検証したり、モデルを使って予測やパターン認識を行います。このステップは探索的な要素が強く、ウォーターフォールモデルのように計画通りに進まないことも多いです。

新しい知見が得られた場合は、課題やデータ収集のステップに戻り、計画の修正や追加のデータ収集が行われることもあります。この点で、データ分析はウォーターフォールモデルと比べて非常に反復的であり、柔軟なサイクルを持つのが特徴です。

5. Conclusion(結論)/ レポーティングとBI

分析結果が出たら、結論をまとめ、成果を共有します。ウォーターフォールモデルでは「運用」にあたりますが、データ分析では結果が終わりではありません。実際のビジネスへの適用やフィードバックを基に、さらに分析を深めたり、新たな分析プロジェクトがスタートすることもあります。

まとめ

つまり整理すると
-「Problem:課題設定」
-「Plan:分析計画」
-「Data:データ収集」
-「Analysis:分析」
-「Conclusion:結論を出す」
の大まかな流れがあることがわかります。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0