日本語で学べる極値統計の本の紹介
東京工業大学/株式会社Nospare リサーチャーの栗栖です.
この記事では極値統計学について日本語で解説されている本について,初学者向けから専門的なレベルまで紹介したいと思います.
統計学の分野の一つに極値統計学と呼ばれる分野があります. 通常統計学ではデータの"平均的"な性質を調べることが多いですが,極値統計学ではデータの"最大値"あるいは"最小値"に注目してデータの分析を行います.年最大日降水量や最大風速,最高・最低気温など,よく目にするデータは実は極値統計学の考え方を用いて分析されます1.このように,地震や台風,大雨,大雪など自然災害の多い日本においては重要な分野なのですが,日本語で体系的に学ぶことのできる本は非常に数が少ないというのが現状です...
これは極値統計学がもともとは確率論という数学の分野で発展してきたこともあり,大学などで提供されている標準的な統計学・データサイエンスのコースにおいて極値統計学がほとんど扱われないことに加え,現在,極値統計学を専門とする統計学者が日本に少ないというのも理由だと思います.この記事が極値統計学について初めて触れる人・データを分析したい人・より専門的なことまで知りたい人にとって少しでも参考になれば幸いです.
① 高橋倫也・志村隆彰 (2016)『極値統計学』近代科学社
日本語の極値統計学の本としては最も初学者向けの本で,大学の学部で習うレベルの統計学の知識があれば読み進められる思います.内容としては,極値統計学の方法が使われるデータの紹介から始まり,それ以降は実際に極値統計で利用されるモデルやそれらのデータ分析への適用方法について解説されています.この本で紹介される手法を学ぶことで,極値統計で重要な考え方や統計手法について一通り知ることができるようになっています. 本の最後の章ではベイズ統計の手法を用いた分析についても触れられており,ベイズ統計の考え方がどのように極値統計の分析に活かされるのか知ることができます.さらに各手法の理論的妥当性の議論に加え,統計解析向けプログラミング言語Rを用いた統計手法の実装や実際のデータ分析が行えるように出版社の web サイトにRのコードとデータが掲載されているので,理論・実装・応用のバランスの取れた本だと思います.
② 西郷達彦・有本彰雄 (2020)『Rによる極値統計学』オーム社
内容的には①と重なる部分もありますが,確率統計の基礎的な内容の解説からはじめて①よりも発展的な内容まで解説されています.データの分析例としては気温や台風,オリンピックの記録などが挙げられており,特に金融データなどの時系列データに対する極値統計を用いた分析手法について理論・実装の両面から解説されている点が特徴です2.時系列データでは現在の観測値が過去の観測値に影響を受けるので,最新の値がその直近の値に近い値になりやすい傾向があります(このような時系列データの性質はクラスタリングとも呼ばれ,本の中では「群れ」と表現されています).この点が独立なデータを観測する場合と大きく異なり,極値統計学の手法を用いて分析する際にデータに対してどのような処理をすればよいか,ということについても解説されています.また本のタイトルにもある通り,Rのインストールの方法から統計手法の実装・分析結果の可視化まで解説されているので,実際に手を動かしながら学ぶことができます.
③ S.I. レズニック著 / 国友直人・栗栖大輔訳 (2021) 『極値現象の統計分析-裾の重い分布のモデリング』朝倉書店
Resnick, S.I. (2007a) Heavy-Tail Phenomena : Probabilistic and Statistical Modeling
を日本語訳した本で,原著は極値統計学の研究で有名な Resnick 先生(コーネル大学OR学科教授)による講義をベースにしています.主な内容としては点過程の理論に基づく近代的な極値統計学の理論とその応用として自然災害・金融・保険・通信などのデータ分析について解説されています.この本についても巻末にR言語のコードが提供されており,本書で解説されている統計手法の実装が可能になっています.数学的には ①,② と比べるとかなり発展的な内容まで含みます3.①,② では比較的初学者向けということで点過程を用いた分析手法(特に閾値超過法,peaks over threshold (POT) method)はあまり詳細には解説されていませんが,この本では点過程という数学のツールを通してPOT法を含む極値統計学の手法を俯瞰的に理解することができます.
レベルとしては
①(大学の学部生向け)$\to$②(学部~修士向け)$\to$③(修士以上向け)
の順でより進んだ内容の数学・統計学の知識が必要になります.
その他洋書(極値統計学の基礎・理論的背景について詳しく知りたい人向け)
・Coles (2001) : 極値統計学について解説した洋書としては一番入門的な本だと思います.この本でも R を使いながら極値統計の手法を学ぶことができます.
・de Haan and Ferreira (2006) : Resnick(2007a,b) 以降に整理された点過程の理論に基づく近代的な極値統計の手法とは異なり,比較的古典的な極値統計学の理論について学ぶことができる本です.著者の2人はこの分野を築いてきた研究者なので(個人的には)極値統計の歴史を感じられる本です.
・Resnick (2007a) : 国友・栗栖(2021) の原著です.
・Resnick (2007b) : Resnick (2007a) で扱っている内容+その発展的内容を数学的に厳密に理解することができます.
まとめ
この記事では極値統計学について学べる本について紹介してきました.
株式会社Nospareでは極値統計学に限らず,統計学の様々な分野を専門とする研究者が所属しております.統計アドバイザリーやビジネスデータ分析につきましては株式会社Nospareまでお問い合わせください.
参考文献
[1] 西郷達彦・有本彰雄 (2020)『Rによる極値統計学』オーム社.
[2] 高橋倫也・志村隆彰 (2016)『極値統計学』近代科学社.
[3] S.I. レズニック著 / 国友直人・栗栖大輔訳 (2021) 『極値現象の統計分析-裾の重い分布のモデリング』朝倉書店.
[4] Coles, S. (2001) An Introduction to Statistical Model of Extreme Values. Springer.
[5] de Haan, L. and Ferreira, A. (2006) Extreme Value Theory: An Introduction. Springer.
[6] Resnick, S.I. (2007a) Heavy-Tail Phenomena : Probabilistic and Statistical Modeling. Springer.
[7] Resnick, S.I. (2007b) Extreme Values, Regular Variation and Point Processes. Springer.
-
参考: 気象庁ホームページ https://www.data.jma.go.jp/cpdinfo/riskmap/cal_qt.html ↩
-
(気になる人向けの説明) どんな条件(特にミキシング(mixing) 条件)があれば独立なデータに対する極値統計の手法が時系列データにも適用可能か,など. ↩
-
(気になる人向けの説明) 確率過程の弱収束,点過程の平均測度の漠収束(vague convergence), レヴィ過程の性質など. ↩