この投稿は以下の投稿の続きとなります。
【Token】スズメバチの数え方(指数分布とポアソン分布のベイズ統計学的解釈)
階乗表現と指数分布を一般化したΓ分布
上掲の投稿で扱ったポワソン分布には階乗表現が出てきます。
ポアソン分布Po(x;λ)=\frac{e^{-λ}λ^x}{x!}(λ≧1,x≧0)
階上表現は離散的ですが、それを連続的に表したのが「ある期間βごとに平均して1回起こる現象が、α回起きるまでの期間XがX=xとなる確率密度関数f(x)が以下となる」Γ分布となります。
確率密度関数f(x)=\left\{
\begin{array}{ll}
\frac{1}{β^αΓ(α)}x^{α-1}e^{-\frac{x}{β}} & x≧0 \\
0 & x<0
\end{array}
\right.
Γ(α)=\int_0^∞x^{α-1}e^{-x}dx(α>0)
αが自然数の場合
Γ(α)=(α-1)!(α \in \mathbb{N})
αとβはガンマ分布のパラメータであり、それぞれ形状母数、尺度母数とよばれます。そしてα=1の時、
確率密度関数f(x)=\frac{1}{β^αΓ(α)}x^{α-1}e^{-\frac{x}{β}}
=\frac{1}{β^10!}x^{1-1=0}e^{-\frac{x}{β}}
=\frac{1}{β}e^{-\frac{x}{β}}
この「ある期間に平均して$\frac{1}{β}$回起こる現象が、1回起きるまでの期間Xが従う」なるα=1の時のΓ分布の定義は$\frac{1}{β}=λ$と置くと「ある期間に平均してλ回起こる現象が、次に起こるまでの期間XがX=xとなる確率密度関数f(x)が以下となる」指数分布の定義とピッタリと重なるのです。
指数分布Exp(x;λ)=λe^{-λx}(λ≧1,x≧0)
この意味合いにおいてΓ分布は「指数分布概念を一般化したもの」と規定されるのです。
N次元球における半径・直径・円周長・円の面積・球の表面積・球の体積概念の統合
そしてΓ関数はまたN次元球の概念を用いて半径・直径・円周長・円の面積・球の表面積・球の体積の概念を統合するのにも用いられるのです。
【Token】半径・直径・円周長・円の面積・球の表面積・球の体積の計算上の往復
- 半径1のn次元球の表面積
c_n = \frac{\pi^{\frac{n}{2}}}{\Gamma(\frac{n}{2}+1)}
- 半径1のn次元球の体積
V_n = \frac{\pi^{\frac{n}{2}}}{\Gamma(\frac{n}{2}+1)}r^2
よって半径rのn次元球の体積は $c_n r^n$、表面積は$n c_nr^{n−1}$。
①$n=1$ のとき$C_n=\frac{\pi^{\frac{1}{2}}}{\Gamma(\frac{1}{2}+1)}=2$、よって1次元球の体積=直径は2r。
②$n=2$ のとき$C_n=\frac{\pi^{\frac{2}{2}}}{\Gamma(\frac{2}{2}+1)}=\pi$、よって2次元球の体積=面積は$\pi r^2$、表面積=円周長は$2 \pi r$。
③$n=3$ のとき$C_n=\frac{\pi^{\frac{3}{2}}}{\Gamma(\frac{3}{2}+1)}=\frac{3}{4} \pi$、よって3次元球の体積は$\frac{3}{4} \pi r^3$、表面積は$4 \pi r^2$。
なお自明の場合として$n=4$ のとき$C_n=\frac{\pi^{\frac{4}{2}}}{\Gamma(\frac{4}{2}+1)}=\frac{1}{2} \pi^2$、よって4次元球の体積は$\frac{1}{2} \pi^2 r^4$、表面積は$2 \pi^2 r^3$。ただしこの考え方の有効活用法は不明。
Γ分布の応用例としてのβ分布を用いた「スズメバチの数え方」。
Γ分布の応用例として著名なのがβ関数(B(a,b))を用いて規定されるβ分布(Be{x;α,β})となります。
Be(a,b)=\int_0^∞x^{a-1}(1-x)^{β-1}dx
ここでpは成功確率(1-pは失敗確率)、aは成功回数、bは失敗回数として、
Be(a,b)=\frac{p^{α-1}(1-p)^{β-1}}{B(a,b)}=\frac{Γ(α)Γ(β)}{Γ(a+b)}
- Be(1,1)の場合、Be(1,1)=1で一陽分布となる事は以下の投稿でも確認。
【Token】連続一様分布(Continuous Uniform Distribution)の平均と分散と最尤値
コインで理解するベータ分布
Be(1,2)の場合、B(1,2)=$\frac{1}{2}$からBe(2,1)=2p。一次関数の様な感じに。
Be(2,2)の場合、B(2,2)=$\frac{1}{6}$からBe(2,2)=6p(1-p)。二次関数の様な感じに。
さらなる振る舞いの詳細は以下に。
【R】ベータ関数の作図
何が一体可能となるのでしょうか?
ベータ関数・ベータ分布は何に使われるのかを5分で知る
ベータ分布は統計学で使われている連続型の確率分布の1つです。成功数aと失敗数bが分かっている試行に関して、成功率 p の分布を表します。ベータ関数はベータ分布の定義に用いられている確率密度関数です。
確率というものは、0と1の間の値をとります。ベータ分布は、2つのパラメータa(成功数)とb(失敗数)を持ち、区間[0,1]で定義されているため、確率や比率を表す確率変数をモデル化するために使用することができます。例えば、コイン投げやクリックスルーレートのような2通りの結果におる現象の「成功確率」をモデル化する際に用いられます。
統計学の中でも、ベイズ統計学でベータ分布がよく使われ、ベイズ推定における事前分布として扱いやすいのが特徴です。ちなみに、ベイズ統計とは「主観確率」を扱う統計学です。ある現象が発生する確率(事前確率)を事前に設定し、その後に新しい情報が得られるたびにその情報を用いて、先ほどの現象が発生する確率を更新し続けます(=事後確率)。このプロセスによって、その事象の真の発生確率「主観確率」を算出します。
A/Bテストは、実世界でのベータ分布の代表的な用途例です。A/Bテストとは、あるウェブサイトの訪問者が機能Aを使う(Aをクリック)確率と機能Bを使う(Bをクリック)確率を比較するものです。ここで、それぞれが選ばれる確率(の不確定性)がベータ分布に従うと仮定し、ウェブサイト訪問者がとる行動をモデル化します。具体的に、各機能のクリック数は、「2通りのどちらの結果になる」ベルヌーイ過程であり、「クリックスルーレートに関する不確定性」をベータ分布で表現しています。
もう1つ、ベータ分布は、”Multi-armed Bandit Problem”(マルチアームバンディット問題)の解決にも使われます。これは、強化学習などにおいて、限られた試行で最大の報酬を得るための最適な行動の方策を見つける問題です。多数の行動の選択肢(=マルチアーム)があり、それぞれが異なる報酬分布、つまり、未知の成功確率を持ちます。これらの確率はベータ分布でモデル化した上で、トレードオフ関係にある「探索」(アームを見つけるための新たな試行)と「利用」(既知の最適なアームを利用)の間のバランスを最適化します。
他に、ベータ分布は、機械学習のアルゴリズムにおける学習率の調整にも使用されます。
特にベイズ推定との相性の良さで知られます。ChatGPTが生成した例示が以下。
コイン投げを例に考えてみます。
①初めに、コインが公平であると仮定して、事前分布として Be(1,1)(一様分布)を仮定します。
②これに基づいて10回のコイン投げを行い、7回が表で3回が裏だった場合、事後分布は以下のように更新されます。事後分布:Be(1 + 7, 1 + 3)=Be(8, 4)
このように、ベータ分布はベイズ推定で非常に便利な役割を果たし、特に成功確率の推定において広く使われます。
β分布を使った「スズメバチの数え方」
①まずススメバチの観測データを「必ず各区画の観測数が1か0になる」様に均等割する。
②α=観測成功数(観測数1の区画数)、β=観測失敗数(観測数0の区画数)としてβ分布Be(1+α,1+β)を求める。
③あらかじめ定めた観測成功率(例えばβ分布Be(1+α,1+β)≧0.8)においてあらかじめ定めた観測間隔(例えば1日)を下回る様なら「スズメバチはいる」と考える。
こういう考え方もあるのか…そんな感じで以下続報。