参考図書:
DX時代のデータマネジメント大全 DX、データドリブン経営、データ利活用から理解する
データマネジメントを学ぶ中でこちらの本が非常に為になったので、その中で解説されていたPPDACサイクルについて自分なりに整理してまとめてみます。
PDACサイクルとは
ビジネスでは、PDCAサイクルが一般的に普及しているが、
データ活用の場面においては以下のPPDACサイクルという手法が知られている。
Problem(問題)
Plan(計画)
Data(データ収集)
Analysis(データ分析)
Conclusion(結論)

データ活用において重要なのは「明確な問題設定」から始めるべきだということ。明確な問題設定により、後に続く仮説設定・検証、またそのための計画とデータ収集が適切に行える。
一般のPDCAサイクルと同様、PPDACサイクルも素早く繰り返すことが重要。
Problem(問題)
問題と課題の違いとは
問題とは現状と理想とのギャップのこと、課題はそのギャップを埋めるための取るべきアクションを指す。
例えば、ある店舗で利益が下がっているという現状がある場合、下記のようにまとめられる。
利益が下がっている = 問題
利益を向上させる = 課題
利益率 = 指標
問題、解決が見えてきたら、その課題をどのような指標を用いて検証していくかを決める。
Plan(計画)
仮説の設定・進め方の計画
指標が決まったら、指標に影響を与える因果関係を考える
仮説思考:
仮説思考は、現在あるデータを使って仮の答えを立ててみて、現時点で最も適切だと思われる結論を出すことであるが、それ対をなすのが網羅指向となる。データ分析においては仮説思考が非常に重要となる。
仮説思考 | 網羅指向 |
---|---|
早い段階で仮説を立てる | データを網羅的に集める |
素早く検証 | 網羅的にデータ分析 |
間違いに気づいたら迅速に軌道修正 | 緻密な計画 |
新た別の仮説を立てる | 完璧を目指す |
仮説思考についてはこちらの本が個人的に分かりやすかった。
仮説思考 BCG流 問題発見・解決の発想法
仮説を立てる上ではロジックツリーが有用。問題を掘り下げていき、根本的な問題まで落とし込んだら、それに対する打ち手を考える。
ここまででProblem(問題)〜Plan(仮説)まで見てきたが、問題、課題、仮説という概念が出てきた。下図を例にすると、まず「問題」を掘り下げ仮説を立てていき、レベル2の時点で根本原因だと思われる問題を定め、「新規客を増やす」というアクションを打つ。これが課題となる。その結果を検証し、必要に応じて再度仮説を立て別の打ち手を考えていくという流れになる。

Data(データ収集)
データの収集・前処理
計画を立てたら次に必要なデータ収集に乗り出す。
データの種類とデータ処理について以下概要をまとめる。
データ収集時の1次データと2次データについて
データには1次データと2次データがあるがそれぞれの特徴は以下。
1次データ:自社が独自に集めたデータ
例:自社の売上データ、顧客データetc
2次データ;他者が集めたデータ
例:地理データ、政府の統計データetc
以下、1次データと2次データの特徴
1次データ | 2次データ |
---|---|
差別化しやすい | 差別化しにくい |
収集コストが高い | 収集コストが低い |
収集時間が長い | 収集時間が短い |
欲しいデータを欲しい形にしやすい | 欲しい形で揃えたれない場合もある |
企業単体で収集できる範囲のデータ | 企業単体では収集仕切れない範囲のデータ |
社内プロセスのシミュレーション | 外部要因の影響分析 |
上記の通り1次データ、2次データそれぞれメリット・デメリットがあり、収集できるデータも異なる。なので1次データを土台に2次データを補完して活用する形が理想となる。
データの前処理
データを活用する前にデータの前処理と呼ばれるデータの加工、変換などの処理を施す。
これはデータ分析過程の8割を占めるとも言われ地道な作業が多いが非常に重要。
データの前処理はデータクレンジングとも呼ばれるが例えば以下のような処理が含まれる。
・重複の削除
・表記揺れの統一
・データの欠損に対する処理
・型変換
etc...
これらの処理を施さないと適切にデータが紐づかなかったり、誤った状態で分析することになるので処理は必須。
データエンジニアリングの全体像と概要については、下記でも記事にしているので併せてご参照ください。
Analysis(データ分析)
データ分析のステップ
実際にデータ分析を行う際、分析は下記の5つのステップから構成される。
データの全体像を掴む
まず各種統計値をざっと見て、外れ値やばらつきなどを概観する。
データを比較する
過去との比較や競合との比較、計画とのずれ、国・地域といった分類での差異など様々な切り口で比較をする。
データを可視化する
グラフや図で視覚化する。
データの関係性を探る
データ間での因果関係や相関関係を見出す。
データから予測する
回帰分析などで予測を行う。
なお、各種統計的分析手法については、こちらのサイトで分かりやすく解説されています。
また、おすすめ書籍については過去に記事にまとめているので、こちらも併せてご参考ください。
Conclusion(結論)
分析結果の考察・結論
分析した結果はビジネスに生かさなければならない。そのためにはステークホルダーに理解してもらい実用化に繋げる必要がある。その際に重要なのがどう伝えるか。
分析結果の伝え方3原則
1、相手は誰か
伝える相手が誰かによって伝え方を変える必要がある。どういう立場にいる人か、予備知識はどれぐらいあるか、何に対して関心を持っているかなど多種多様なステークホルダーがいるはず。例えばあまりデータ分析に詳しくない人に対して専門用語をそのまま使って淡々と説明しても伝わらないので噛み砕いて説明する必要がある。
2、ゴールはどこか
相手にわかりやすく伝えることは重要だが、「相手に伝わった」というのはゴールではない。相手に内容を理解してもらったら、次のステップは「納得」してもらうこと。つまり、」「確かにこの問題は解決しなければならない」と思ってもらうこと。納得してもらったら最後は、「実際に行動に移してもらう」こと。ここでは、2つ目のPlanで紹介した仮設思考の末に導き出した「打ち手」を提示する。
3、何をどう伝えるか
3つ目に重要なのが何をどう伝えるか。例えば以下のPREP法は伝え方のフレームワークとして有名なものの一つ。

おそらく「根拠」や「分析例」の箇所で専門的な言葉を使ってしまいがちになりそうなので、上述の通り相手に合わせて話し方を変えるのが良いかもしれない。
まとめ
今回は、DX時代のデータマネジメント大全 DX、データドリブン経営、データ利活用から理解するを読んで気になったPPDACサイクルについてまとめてみました。この本はデータマネジメントの内容が体系的に書かれており非常に勉強になりました。今回はPPDACサイクルをテーマに選びましたが、また別のテーマで書いてみたいと思います。