決定理論とは
不確実性の状況下で得られた情報(データ)からどのような行動をとるか、統計学的に決定する理論のことです。
目的
決定理論は「不確実性の状況下で人々にとっての最良の意思決定を特定する」ことを目的としています
具体例
例えば、授業で宿題チェックを行うかどうかという不確実性の中で、宿題をやるかどうかの意思決定をするとしましょう
そうすると、以下の状態、意思決定、結果の関係に表せると思います
状態 | 意思決定 | 結果 |
---|---|---|
宿題チェックされた | 宿題をやった | やってきたことが評価されて嬉しい |
宿題チェックされなかった | 宿題をやった | 無駄な労力を割いてしまい悲しい |
宿題チェックされた | 宿題をやらなかった | 評価が下がって悲しい |
宿題チェックされなかった | 宿題をやらなかった | 無駄な労力を割かずに済んで嬉しい |
以上のように不確実な状況に対して自身がどんな意思決定をしたら結果が最良になるかを決定する理論が決定理論です
決定理論の定量的な測り方の例
期待効用理論(Expected Utility Theory)
この理論は、効用と呼ばれる結果に対する重みづけ(嬉しさの度合い)を決定し、それが起こる確率を掛け合わせるつまり、期待値を求めることで自身にとって最良の意思決定を行う手法です
例
先ほどの宿題の例を用います
確率と重みを以下のように定義してみましょう
状態 | 状態が起こる確率 |
---|---|
宿題チェックされた | 0.6 |
宿題チェックされなかった | 0.4 |
意思決定 | 結果 | 重み(嬉しさの度合い) |
---|---|---|
宿題をやった | やってきたことが評価されて嬉しい | 10 |
宿題をやった | 無駄な労力を割いてしまい悲しい | 14 |
宿題をやらなかった | 評価が下がって悲しい | 8 |
宿題をやらなかった | 無駄な労力を割かずに済んで嬉しい | 20 |
宿題をやった時の期待値
0.6 * 10 + 0.4 * 14 = 11.6
宿題をやらなかった
0.6 * 8 + 0.4 * 20 = 12.8
結果
この場合
宿題をやった時の期待値 < 宿題をやらなかった
といった結果が出たため、宿題をやらないのがその人にとっての最良の結果ということになります
参考文献