こんにちは。秋田県のIT企業、北日本コンピューターサービスのR&Dチーム「AUL(アウル)」に所属しています。トラフクロウです。
突然ですが、僕はかなりの心配性です。何かイベントが控えていると、規模の大小や公私に関係なく不安になってしまいます。
なにか大きな失敗をするんじゃないか?
なにかよくないことが起こるんじゃないか?
そんなことばかり考えてしまい、イベントまでの期間にソワソワしてしまうのです(イベントが始まると案外開き直れるタイプです)。
あるとき、こんな僕を勇気づけてくれる心強い言葉を知りました。曰く
「心配事の9割は起こらない」
とのことです(本のタイトルにもなっているようですが、僕は言葉しか知りません)。
初めてこの言葉を聞いたときに妙に安心したのを覚えています。「あー、そうなのか」と、「もしそうなら、そんなに怯えなくてもいいのかな」という気持ちになりました。
しかし、冷静に自分の過去を振り返ってみて気づいてしまったのです。
「いや・・・、僕が心配したこと、結構な頻度で起こってるくない?」
たとえば、
テスト勉強中、「ここはさすがにテストに出ないだろ(というか疲れたから休憩したい)」と思ったところが、しっかりテストに出て減点をくらう。
プレゼンの準備中、「さすがにこれはツッコまれないよね(もう十分準備したし、平気かな)」とスルーしたところを本番で見事に質問され、しどろもどろになる。
というように、僕には不安に思ったことを、面倒がってスルーすると後で後悔しやすいというジンクスがあります。
そんなわけで、「僕の場合、心配事はどれくらいの割合で実現するのかを数学的に計算してみよう」 と思い、その結果をまとめたのが本記事の内容になります。
この記事では、ベイズ統計の雰囲気を具体例で紹介します
最近、「完全独習 ベイズ統計入門」という本を読みました。ダイヤモンド社から出版されており、小島寛之さんによって書かれている本です。その本で解説されているベイズ統計がとても面白かったので、アウトプットも兼ねて僕のジンクスを数学的に計算し、その過程をまとめたいと思います。
以下、今回のお品書きです。
- ベイズ統計ってなんなのさ
- ベイズを使った推論の例
- 追加情報でさらに正確な推論ができる
- トラフクロウの心配事は7割5分で実現する
お断り
タイトル的に「心配事の9割は実現しない」という主張へ、異を唱えているように見えるかもしれませんが、決してこの主張を否定したいわけではありません。
あくまでもベイズ統計を理解するための1つの例として使用しています。
ベイズ統計とは、観測結果から原因を考える統計学のこと
一般的な統計学は、ある「原因」から「結果」を説明するように議論が展開されていきます。
たとえば、インフルエンザにかかってしまった場合を例に考えてみましょう。インフルエンザにかかると、高熱や関節痛、ノドの痛みなどの症状が出るとされています。
これは「インフルエンザにかかった人を集めてみたら、割合として高熱や関節痛、ノドの痛みをうったえる人が多かった」という統計結果に基づいた主張です。つまり、インフルエンザという「原因」のもとで高熱や関節痛、ノドの痛みといった「結果」が観測される可能性を考えていることになります。
対して、ベイズ統計では逆方向に議論を行います。つまり 「結果」から「原因」を考えるのです。
インフルエンザを例にとると、「なんかノド痛いし、関節痛もあるぞ」という結果が観測されたときに「もしやインフルになったか?」と原因を考える流れです。
数学っぽく表現するなら「ノドの痛みと関節痛の症状があるときにインフルエンザにかかっている確率」を考えるということですね。
これら2つの例からもわかりますが、ベイズ統計の「これが起こった原因は、きっとこれのせいだろう」という考え方は、日常でもよく遭遇します。そのためベイズ統計は、迷惑メールのフィルタリングや、機械学習など多くの場面で活用が期待されている分野なのです。
観測結果によって確率は変化する
ここからはベイズ的な確率を計算する過程を、具体的に見ていきたいと思います。計算については、今回参考にさせていただいている「完全独習 ベイズ統計入門」に掲載されているやり方にならって進めていこうと思います。
ではさっそく、僕が資格試験の勉強をしているという状況を例にして考えていきましょう。
資格試験を明日に控えたある日、僕は最終確認のために参考書を再度読み込んでいました。
参考書を読む中で、「これってなんだっけ?」と思う個所を見つけたところから僕の葛藤が始まります。
「ちょっと理解が怪しいけど、今から内容確認して覚えるの面倒だなー。でも、試験で聞かれたら答えられなそうだなー。こんなピンポイントな部分、さすがに出題されないか?」
さて、この思考に陥ったとき、僕の未来には2つの可能性があります(シュレディンガーの試験結果ですね)。すなわち、
- 心配事(覚えていない単元が試験にでる)は実現せず、後悔なく試験を終える
- 心配事(覚えていない単元が試験にでる)が的中し、後悔を胸に撃沈する
冒頭の「心配事の9割は実現しない」を享受するのであれば、僕の未来の実現確率はそれぞれ、次の図のように表現できます。
ここでは1辺の長さが $1$ の正方形を分割し、分割された領域の面積をそれぞれ「後悔しない確率 $0.9$(左)」、「後悔する確率 $0.1$(右)」としています。
それぞれの確率を足し算することで、「試験中に何かが起こる確率 $1$(全体の確率)」が得られます。以後、確率とはこの正方形内の領域の面積だと思って議論を進めていきます。
一瞬の葛藤の後、僕は自分に1つのジンクスがあることを思い出しました。
「僕が不安に思ったことって実現しやすいんだよな。後悔するときって大体、”こうじゃないかな”って何かを不安に思ったときなんだよね。」
これは僕の体感ですが、嫌なことが起きて後悔するときの9割は、事前に不安を感じていた場合だったと思います。
この考えを踏まえると、正方形の中の「僕が後悔する世界(右)」はさらに2つに分断されます。すなわち、事前に不安を認識していた場合と、そうでない場合です。
一方で、後悔しない場合であっても不安を認識してるケースはあります。心配性なので3割くらいは不安を感じている気がします。すると、正方形の中の「僕が後悔しない世界(左)」もまた、2つに分断されるわけです。
ここで正方形内の各区画の面積はそれぞれ
- 僕は後悔しなかったが、事前に不安を感じていた(①)
- 僕は後悔し、かつ、事前に不安を感じていた(②)
- 僕は後悔せず、事前に不安を感じていなかった(③)
- 僕は後悔したが、事前に不安は感じていなかった(④)
という世界が実現する確率を表します。
さて、いま現在葛藤をしている時点で、僕は「不安」を認識しています。つまり「不安を感じなかった未来」は消失します。
このとき気になるのは、「不安を感じなかった未来」が消失した際に、僕が後悔する確率はどれくらいかということです。言い換えれば、不安を感じたときに、未来で後悔する確率はどれくらいになるのでしょうか?ということですね。
確率とは正方形の面積であると考えていたことを思い出しましょう。これはすなわち、全体の領域のうち、何割を該当の世界が占めているかを考えていることに相当します。
そこで、残された部分の領域を全体と考え直して、残った2つの世界が、それぞれ、全体の広さの何割を占めているかを計算してみましょう。
全体の面積が $1$ になればいいので、ぞれぞれの世界の面積を、2つの面積の合計で割れば、広さの割合が求まりますね。
2つの世界の面積の合計は、
$$
0.27 + 0.09 = 0.36
$$
です。このとき、①の世界が全体を占める割合は
$$
0.27 \div 0.36 = 0.75
$$
②の世界が占める割合は
$$
0.09 \div 0.36 = 0.25
$$
と計算できます。これが、僕が不安を感じたときに未来で後悔する、または後悔しない確率になります。
さて、ここで面白いことが起きていることに気がついたでしょうか?
もともと、心配事の9割は実現しない(9割で後悔しない)としていたはずなのに、実際に不安を覚えたかどうかを考慮したところ、後悔しない可能性が7割5分まで減少してしまいました。つまり確率が変化したのです。
実はベイズ統計では、とある現象(結果)を観測したことで、当初考えていた原因の妥当性が更新されていきます。
今回の例であれば、僕自身が「不安」を観測したことにより、「心配事が実現しなかった」という可能性が減少したのです。
「これってあなたの主観じゃないですか?」という人向けの補足
ここまでの内容を見て、
「これはあなたに限った話ですよね。一般的な確率として論じるのは筋違いなんじゃないですか?」
と思われたかもしれません。
この何となく騙されたような感覚は、おそらく皆さんがイメージする確率と、上の例で紹介した確率の質の違いによるものです。
一般的に「確率」と言うと次のようなものをイメージするかと思います。
6面のサイコロを振ったときに1の目が出る確率は $\displaystyle{\frac{1}{6}}$。
というようなやつですね。これは、とある出来事の起こりやすさや、発生の割合を表すための数値です。
同じシチュエーションで考える以上、6面のサイコロを振ったときに1の目が出る確率は、世界中の誰が考えても変わりません。つまり、Aさんが考えようが、Bさんが考えようが、6面のサイコロを振ったときに1の目が出る確率は、例外なく、$\displaystyle{\frac{1}{6}}$ です(いかさまダイスは考えないでください)。
このように誰が見ても同じように考えることができる確率を「客観確率」といいます。一般に学校教育の数学で習う確率はこの客観確率です。
一方で、世の中には、主観的な確率や割合というものも存在します。
たとえばの質問ですが、
今日、あなたに幸運が訪れる確率はどれくらいですか?
「そんな気配は微塵もないな」という人は 「$0$ だね」 と言うかもしれませんし、「なんか今日ツイてるんだよね」という人は「$80$% くらいかな」と答えるかもしれません。このように、人によってとらえ方が変わる確率を「主観確率」といいます。
主観確率はあまり確率感がないので、個人の信念や信頼の度合いと読み替えた方がスッキリするかもしれません。
先ほどまで上で計算していた「僕が後悔する確率」の例がどこか腑に落ちないのは、普段から見慣れた客観確率ではなく、僕の主観確率をベースに議論が展開されているためです。
一般的な統計学では、個人の主観を数値に落とし込んで議論することができません。たとえば、サイコロなどは、何千、何万回とダイスを振って出目の統計を取ることができます。ですが、僕の気持ちや主観的な感覚、信念については統計の取りようがありません。一方で、「幸福度」というような、統計は取れないけれど確率っぽい数値は日常生活のいたるところで普通に登場します。
既存の統計では扱えないけど、役に立つから理論に組み込みたい。そんな経緯から発展してきたものがベイズ統計です。
ベイズ統計では、従来の客観的な統計に基づいた確率に加えて、集計では形をとらえることができない個人の主観までも理論に組み込んだ推論ができてしまいます。そして、この柔軟さ(良い意味での適当さ)が、人間の不合理な行動をや思考を記述するうえで非常に都合がよいのです。
観測を継ぎ足してさらに確率を変えてみよう
ここまでの議論により、資格試験を受けた後に僕が後悔する、または後悔しない確率は次のように変化しました。
ここで少し頭を切り替えてみましょう。僕たちはこれまで、正方形の面積を確率に見た立ててゴニョゴニョ議論をしながら、新しい確率を手に入れました。
では、これまでの議論をすっかり忘れて、最後に得られた確率が、あたかも最初から手元にあったかのように考えたらどうなるでしょうか?
僕たちは当初、「心配事の9割は実現しない」という信念にのっとって議論をスタートさせました。それと同じように、今度は「心配事の7割5分は実現しない」という信念にのっとってみようということです。
このあと何をするか想像ができましたか?
なんと、ベイズ統計における確率の推定では、推定後に得られた更新済みの確率を、新たな観測結果を考慮して、さらに更新することが可能なのです(メッチャすごくないですか?)。
引き続き、具体例で見てみましょう。
僕が「不安を覚えた」という条件下で、その不安が実現し僕が後悔する確率は $0.25$ になりました。
僕のこれまでの経験上、不安に思っていることへ事前に対処しておくことで後悔する割合を減らすことができます。逆に、何も対処しないでいると激しく後悔するパターンが多いです。
その感覚を数値として次のように考えます。
- 不安が実現して後悔するときは、おおよそ9割の場合で対抗策をとっていない
- 逆に後悔しないときは、9割の場合で対策をとっている
このように考えると、僕の後悔する、または後悔しない世界は、それぞれ次のように分割されます。
さて、ここまで内容を踏まえて僕が不安に対し何かしらの対策を講じたと仮定してみましょう。つまり、試験前日に不安なセクションがあったので、腹をくくって勉強したわけですね。
すると、僕が対処しなかった世界は消失するので、次の領域だけ考えればいいわけです。
2つの領域の面積の和は、
$$
0.675 + 0.025 = 0.7
$$
になります。このとき、後悔する確率は
$$
0.025 \div 0.7 = 0.036
$$
後悔しない確率は
$$
0.675 \div 0.7 = 0.964
$$
になります。つまり、不安を感じたうえで適切に事前の対策を取っていれば、約 $96$% の確率で僕は後悔しないわけです。
では逆に、不安に思っていたにも関わらず、何も対策をとらなかったらどうなるでしょうか?
この場合は、対策をとった世界線が消失し、考える正方形の領域は次のようになります。
このとき、2つの領域の面積全体は
$$
0.075 + 0.225 = 0.3
$$
なので、後悔する確率は
$$
0.225 \div 0.3 = 0.75
$$
後悔しない確率は
$$
0.075 \div 0.3 = 0.25
$$
となります。
つまり、「心配事の9割は実現しない」と高をくくって何もしないでいると、僕の場合は $75$% の確率で心配事が実現して後悔するということです。
ベイズ統計って面白いですよね。
まとめ
$$
(トラフクロウに限り)事前の不安はなくしておくが吉。 \quad \quad Q.E.D.
$$
最後まで読んでいただき、ありがとうございました!
最後まで読み進めていただき、ありがとうございました。
ベイズ統計は以前から興味があり、触ってみたいなと思いつつも具体的に手を出す機会がなくモヤモヤしていました。今回はネタ要素の多い記事になりましたが、自分の学んだ内容を曲がりなりにも使えたという点で満足しています。
上でも書きましたが、今回の記事の内容は僕の主観を数値化してベイズ統計の枠組みで議論をした(つもりになっている)ものです。ですので、他の人の考え方に異議を唱えたり、否定しようという意図は一切なく、エンタメの1つとして眺めていただければと思います。議論についても「仮定が不十分では?」と思われる部分もあるかもしれませんが、それもご愛嬌ということでご容赦ください。
参考文献
- 小島寛之, 「完全独習 ベイズ統計入門」, ダイヤモンド社, 2021年, 第6刷発行