はじめに
はじめまして、Orbitics株式会社データサイエンス部の上野です。
機械学習プロジェクトを始めるにあたり、モデルの「予測精度」に目が行きがちですが、その前に最も重要なステップがあります。それが「目的設計」です。本記事では、予測AIモデルの目的設計において押さえるべき重要なポイントと、その具体的な考え方について解説します。
1. 目的設計の重要性
予測AIモデルは、ビジネス課題を解決するためのツールに過ぎません。どんなに高性能なモデルを構築しても、それがビジネスの目的と合致していなければ、期待する成果は得られません。目的設計は、プロジェクトの方向性を定め、関係者間の認識を統一し、最終的なビジネス価値を最大化するために不可欠です。
予測AIモデルの目的設計では、以下の3つの主要なポイントを押さえることが重要です。
- ビジネス課題
- 予測モデルの活用方法
- 予測精度と説明性
2. ビジネス課題を明確にする
最初に予測AIモデルを導入する根本的な理由であるビジネス課題を明確に定義します。
-
何が問題となっているのか?
- 例: 施策による売上が目標を下回っているので改善したい。
-
問題に対してどのような改善を行いたいか?
- 例: CVRの高い会員に限定してインセンティブ施策を打つことで、売上の改善を図りたい。
ビジネス課題が不明確なままモデル構築を進めてしまうと、期待外れの結果に終わる可能性が高まります。
3. 予測モデルの活用方法を明確にする
構築する予測モデルをビジネスの中でどのように活用したいのかを具体的にイメージすることが重要です。
例:会員毎のCVR(購入率)を予測するモデルの場合
- 活用方法: 予測スコアの高い会員に絞ってインセンティブ施策を打ちたい。
このように、予測モデルがどのようなアクションに繋がり、どのようなビジネス上の改善をもたらすのかを明確にすることで、モデルの要件が具体化されます。
4. 重視する点を明確にする:予測精度か、説明性か?
予測AIモデルの評価において最も重視すべきは予測精度ですが、ビジネス活用においては「説明性」も非常に重要となる場合があります。このバランスを事前に検討しておく必要があります。
-
予測精度が最優先の場合:
- 例: 予測スコアを使ってインセンティブ施策の対象者を決めるだけであり、予測精度が担保されていれば、モデルの説明性はドメイン知識と大きく矛盾しなければ良い。
- この場合、モデルの内部構造が複雑であっても、高い予測精度が得られるモデルが選択肢に入ります。
-
説明性が重視される場合:
- 例: 架電営業の対象者を予測スコアに基づいて決めるものの、営業担当者が対象者がなぜ選ばれたのかまでを理解しないと的確な営業トークができない。
- このようなケースでは、モデルがなぜそのような予測をしたのかを人間が理解できる形で提示できる「解釈性(Explainable AI: XAI)」が求められます。
ただし、大前提として「予測精度が担保されていないモデルの説明性に言及することはナンセンス」であるということを忘れてはなりません。例えば、AUCが0.5のようなランダム予測と同程度のモデルについて、その説明性を議論しても意味がありません。
予測精度の目標設定
予測精度の目標設定には、主に以下の2つの方法があります。
-
ビジネス要件に基づく目標設定
- 予測モデルを用いて期待する売上増加とコスト削減の金額効果の目標値を定義します。
- その金額効果を達成するために、施策の指標としての目標値を設定します。
- 例: 予測モデルを活用することでマーケティング施策による年間売上を1億円から1.2億円(+20%)に増加させたい。そのためには、従来の施策のCV(コンバージョン)に対して、予測モデルを用いた施策のCVを1.2倍にする必要がある。
-
ランダム予測に対する優位性
- ランダムに予測した場合の予測精度に対して、予測モデルの精度がN倍以上高いことを目標値とします。
- 特に、2値分類において正例が負例に比べて非常に少ない不均衡なデータの場合に用いられます。
- 例: ランダム予測のPrecisionが0.2に対して、予測モデルのPrecisionは0.4(2倍)以上を目標とする。
5. 予測AIモデルの主な活用パターンと適用対象
予測AIモデルは、主に以下の2つのパターンで活用されることが多いです。
- 欠損補完: データを取得できない会員の属性を予測するなど、既存データの欠損値を補完する目的で利用されます。
- 将来予測: 将来の行動(例: 将来の離反有無)や未知の値を予測する際に利用されます。
-
適用すべき対象の例:
- 将来の行動など、そもそも存在しないデータ(例: 将来の顧客の購買行動)
- 部分的には取得できるものの、大部分は取得できないもの(例: 特定のアンケート回答項目、世帯年収)
- 他の情報に基づいて、何らかの予測ができるもの(例: 1週間後のECサイト訪問有無)
-
適用する価値が低い・不可能な対象の例:
- 会員登録時に必ず入力するデータ(例: 性別、年代) → これは予測ではなく集計で十分な場合が多い。
- 目的変数を定義するのが困難なもの(例: 漠然とした顧客満足度、企業のビジョンなど、定量化が難しい概念)。
- 予測に寄与する特徴量を生成するのが困難なもの(例: 個人の詳細な思考パターン、完全にランダムな事象)。
まとめ
予測AIモデルの目的設計は、単なる技術的な作業ではなく、ビジネス価値と密接に連携するプロセスです。ビジネス課題を明確にした上で、予測モデルの活用方法、予測精度と説明性のバランスを十分に検討することで、プロジェクトの成功確率を飛躍的に高めることができると考えられます。