自然災害と再現期間
近年、地球温暖化による異常気象の影響で、集中豪雨や土砂災害など従来の統計データからは予測不可能なほどの大規模な気象災害が日本でも観測されていると言われている。また、地震大国でもある日本では、次なる大地震はいつどこで発生するのか、地震の発生頻度に関する確率的評価が国や自治体の公表資料、各種報道を通じて長年周知されている。
このような自然災害の発生頻度を評価する指標として頻繁に用いられるのは「再現期間」という概念である。防災関連資料、報道等で「およそ〜年に1回の災害」などというフレーズを見聞きした場合、通常はこの再現期間の概念に基づく頻度を示したものと考えられる。また、建築の分野では耐震性能や耐風性能など、建物が耐えるべき災害規模の指標として、各種設計基準の中で用いられる。再現期間を考えれば災害規模を時間的尺度として把握できるため、直感的で分かりやすい側面を持つといえる。一方で、オーソドックスな統計理論の中で再現期間という概念が登場することはさほど多くなく、あまり馴染みのない概念かもしれない。
再現期間の統計学的意味合い
再現期間とは、ある事象の発生間隔の期待値である。発生に周期性などがなく時間を通じてランダムに発生する事象について、再現期間は以下のように考えられる。
離散時間の場合
ある災害の発生のタイミングが離散時間、すなわち、1年目に発生、2年目に発生、3年目に発生といった具合に、区切りの存在する時間軸の中で表現されるとする。ある災害の年間発生確率を$p$とすると、災害が発生するまでの年数(発生間隔)は幾何分布で表現できる。幾何分布の確率密度は以下である。
f(x) =p^k(1-p)^{n-k}\quad n\in\mathbb{N} \quad k=1,2,...,n
では、この分布の期待値、災害が発生するまでの年数の期待値$E(x)$はどうなっているだろうか。ここでは離散型の確率変数を仮定しているため、確率密度は、ピンポイントで$n$年目に災害が発生する確率と同値である。$n$年目に災害が発生する確率を$ P_n $として以下のように期待値を考えることができる。
\displaylines{
P_1=p,\quad P_2=(1-p)p,\quad P_3=(1-p)^2p,\quad \cdots P_n=(1-p)^{n-1}p\\\\
\therefore \:P_{n+1}=(1-p)P_n
\\\\
E(x)=1\cdot P_1+2\cdot P_2+3\cdot P_3+\cdots+n\cdot P_n+\cdots\quad\quad(1)\\
(1-p)E(x)=1\cdot P_2+2\cdot P_3+\cdots+(n-1)\cdot P_n+\cdots\quad\quad(2)\\
(1)-(2)=pE(x)=P_1+P_2+P_3+\cdots=1\quad\\
E(x)=\frac{1}{p}
}
よって、災害が発生するまでの年数の期待値は$1/p$年であることが示される。これがいわゆる再現期間である。
この考えによると、例えば年間発生確率が1/100の事象は再現期間が100年と表現される。ただしそれは何の脈絡もなく確率値の逆数で表現しているのではなく、上記のような分布を想定した場合、発生間隔の期待値(それは1年後、50年後、5億年後、あらゆる間隔で発生する場合を勘案した加重平均期待値)が確率値の逆数となるからである。
連続時間の場合
また連続時間、すなわち時間的な区切りがなく、一刹那ごとにどのタイミングでも発生しうるような時間軸の中で災害の発生が表現されるとき、ある災害の次の一刹那における発生確率を$p$とすると、災害の発生間隔は指数分布で表現できる。指数分布の確率密度は以下である。
f(x)=pe^{-px}
部分積分に留意しつつ期待値を算出すると、
\displaylines{
E(x)=\int_{0}^{\infty}xpe^{-px}dx=p\int_{0}^{\infty}x\Big\{\frac{1}{p}e^{-px}\Big\}^{\prime}dx\\
=p\Big(\frac{1}{p}\left[xe^{-px}\right]^\infty_0-\int_{0}^{\infty}\frac{1}{p}e^{-px}dx\Big)\\
=\lim_{x\to \infty}xe^{-px}-p\left[\frac{1}{p^2}e^{-px}\right]^\infty_0\\
=0-\Big\{\frac{1}{p}(0-1)\Big\} \\
(\because 1<e^{p},\quad x=\omicron(e^{px}) x→\infty)\\
=\frac{1}{p}
}
よって連続時間のケースでも、災害が発生するまでの期間の期待値は$1/p$となることが示された。
発生間隔のマルコフ性
前述のように、事象がランダムに発生することを前提とすると、再現期間が$1/p$となる。このとき、上述の幾何分布や指数分布により表現される発生間隔は、過去に事象が発生したかどうかに依存せず決定される性質を有する(マルコフ性)。
地震など、データが十分になく、発生パターンの推定が困難な災害の場合は、このように発生間隔にマルコフ性を仮定し再現期間は$1/p$とされることが一般的である。ただし、地震のような事象でも、過去の地震活動の時期から発生の周期性が推定可能な場合もあり、この場合、詳細は割愛するが、周期性を勘案した別の分布を用いた再現期間の推定がなされる。
災害規模の確率分布
以上の考えから、例えば100年に1度の規模の災害を想定する場合、事象の発生間隔がマルコフ性を有することを前提とすれば、発生確率1/100の災害を想定すればよいと考えられる。
このような任意の発生確率における災害規模を推定、あるいは、災害規模からその発生確率を推定するためには、極値統計学の理論に基づき、災害という極端事象の規模と発生確率を結びつける確率分布(極値分布)を推定する必要がある。
以下では、極値分布の基本的な3つの形とその一般形を紹介する。
極値分布の基本形
一般的な統計理論が平均的な値が従う法則性に関心を持つのに対し、極値統計学の関心は、最大値や最小値といった平均から最も遠い値(極値)が従う法則性(極値分布)にある。
ある事象(分布関数をF(x) とする)の極値分布G(x) は、非退化(※)であることを前提として、以下の3種類のいずれかに法則収束することが知られている。またこの時、元の事象の確率分布F(x) は収束先の極値分布G(x) の吸引域に属すると表現される。
(※) n → ∞ において確率1で極値が特定の最大値や最小値に収束する状況でなく分布していること。
- フレシェ分布
\Phi_\alpha(x) = \left\{
\begin{array}{ll}
0 & x\leq\mu\\
\exp\Big\{-(\frac{x-\mu}{\sigma})^{-\alpha}\Big\} & x>\mu
\end{array}
\right.
(\alpha>0)
吸引域に属する主な分布:コーシー分布、パレート分布等
- グンベル分布
\Lambda(x)=\exp\Big\{-\exp\Big(\frac{x-\mu}{\sigma}\Big)\Big\}\quad x\in\mathbb{R}
吸引域に属する主な分布:正規分布、対数正規分布等
- ワイブル分布
\Psi_\alpha(x) = \left\{
\begin{array}{ll}
\exp(-(-x^{-\alpha})) & x\leq\mu \\
1 & x> \mu
\end{array}
\right.
(\alpha>0)
吸引域に属する主な分布:一様分布、ベータ分布等
これら3つの違いを簡単に述べると、非常に大きな極値が出やすい事象の場合はフレシェ分布に従うことが多く、あまり大きな値が出ない事象の場合はワイブル分布に従うことが多い、グンベル分布はその中間と解釈される。
極値分布の一般形
さらに、上記3つの分布は以下のように一般化し一つの関数で表現することができる。極値分布の推定においては、実際の極値データ(最大値の年次、月次データなど)をもとに、この一般化極値分布のパラメータを推定し、3パターンのうちどの極値分布に収束するのかを判定する。
・一般化極値分布
G_{\mu,\sigma,\xi}=\exp\Bigg[\max\Big[-\Big\{1+\xi\Big(\frac{x-\mu}{\sigma} \Big)\Big\}^{-\frac{1}{\xi}}, 0 \Big]\Bigg]
ここで、パラメータ ξ は形状母数とよばれ、3パターンの分布のいずれに収束するのかは ξ の符号により判定する。ξ > 0 ならばフレシェ分布、ξ = 0 ならばグンベル分布( ξ → 0のとき一般化極値分布はグンベル分布に収束)、ξ < 0 ならばワイブル分布と分布関数の形状を推定することができる。
参考文献
西郷達彦,有本彰雄(2020)「Rによる極値統計学」
小寺平治(1986)「明解演習 数理統計」
志村隆彰(2014)「極値分布の確率論的な基礎知識―裾の挙動から見た確率分布―」