増川 直裕
想定よりも出生数の減少が進んでいる日本
"2022年の出生数が初の80万人割れ、想定よりかなり早いペースで出生数の減少が進んでいる" というニュースが大きな話題になっています。確かに日本の将来を考えると、出生数が想定以上に減っているのは大きな社会問題だと思います。
実は昨年(2022年)はじめに、時系列分析でよく用いられる季節ARIMAモデルを使って、2014年~2021年における月ごとの出生数から2022年の出生数を予測していました。そのときに得られた2022年の出生数の予測値は839,796人です。実際の出生数は799,728人だったので、ARIMAモデルによる予測値はおおよそ4万人ほど多く予測してしまったことになります。
別の考え方をすると、実際は過去のデータから予測できる出生数より大幅に少なかった、ともいえるでしょう。
季節ARIMAモデルによる出生数の予測
季節ARIMAモデルは、周期性がある時系列データにあてはめるモデルの一種であり、移動平均(MA)モデル、自己回帰モデル(AR)モデル、和分(I)モデル、周期性(s) の組み合わせで構成されています。
季節ARIMAモデルでは上記のARIMAの次数(p,d,q)、季節ARIMAの次数(P,Q,R)、1周期における時点数(周期)を指定する必要があり、これらの次数の決め方が悩ましいところであったりします。
今回の例では、周期は12(12か月周期)で良いですが、それ以外の次数は次のステップ1、ステップ2の手順により決めています。
ステップ1 . 季節ARIMAモデルの次数決定
-2014年~2020年を学習データとして、さまざまな次数(0,1,2)の季節ARIMAモデルをあてはめる。
-2021年を検証データとして、あてはまりを評価する統計量(RMSE)を使い最適な次数を決定する。
ステップ2. 決定した次数を使って2022年を予測
ステップ1.で決定した最適な次数を用い、2014年~2021年に対して季節ARIMAモデルをあてはめ、2022年を予測する。
ステップ1ではJMPの「複数のARIMAモデル」という機能を使い、さまざまな次数の季節ARIMAモデル(今回の例では729個のモデル)をあてはめています。RMSEが最も小さくなったモデル(最も良いモデル)は、季節ARIMA(2,0,0)(2,0,0)12 です。
ステップ2ではステップ1で求めた季節ARIMAモデルを用い、2022年の月ごとの出生数を予測しています。
下図は月ごとの出生数を示していますが、黒い点は実際の出生数、赤色の折れ線は季節ARIMAモデルによる出生数の予測値を、赤色で塗りつぶされた区間は予測における95%信頼区間を示します。
図の右側、水色で囲んだ領域が2022年の月ごとの予測になり、1月~12月の予測値を足し算して、2022年の出生数の予測値839,796人を算出しました。
2022年の実測値と予測値の部分を拡大した下の図を確認してみましょう。2022年の月ごとの予測値(赤色の折れ線)、実測値(黒い点)をみると、1月、8月はかろうじて予測より実測の方が上回っているのですが、それ以外の月はすべて予測より実測が下回っているのです。
季節ARIMAモデルの折れ線をみると、2月に少なくなる、秋ごろに多くなるといった月ごとの傾向はとらえられているのですが、特に3月~7月までの出生数の下振れが大きく影響しているように見えます。
2023年における出生数の予測
前節のステップ1, 2の方法を用い、2014年~2022年の出生数データを使って、2023年の出生数の予測をしてみます。
最も良いモデルは季節ARIMA(2,1,1)(2,1,2)12 となり、このモデルをあてはめて、2023年の月ごとの出生数を予測したのが下図です。
この結果より求められる2023年の出生数の予測値は745,468人です。2022年の大幅な減少がモデル選択、予測に反映され、2023年はさらに5万人以上も減少すると予測しているのです。
ただ、あくまでもこの予測値は過去の値から季節ARIMAモデルという統計モデルによって求められたものです。今後の政府による少子化対策や社会状況の変化などによって、実際の出生数が大幅に上振れする可能性もあります。
今回紹介した季節ARIMAモデルは、"あくまで過去の状況から考えると、将来はこのぐらいになると予測されますよ" と提示しているに過ぎないのです。ただ今後公開される出生数と比較して、予測より多かった、少なかったと考察する目安にはなります。さて、2023年はどうなるのでしょうか? 上振れを期待です!
統計ソフトの使いやすさ、面白さを試してみませんか?JMPの全機能を30日間試せるトライアル版は下のリンクから!