1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

More than 1 year has passed since last update.

日本の婚姻件数を可視化、予測してみる ~「令和婚」の影響は?~

Last updated at Posted at 2019-12-23

今回は統計解析ソフト「JMP」で、日本の婚姻件数を可視化し、年や月ごとの傾向を見ていきます。さらに時系列分析により将来の婚姻件数を予測してみます。そのときに、今年特有イベントである**「令和婚」**が絡んできます。

今年も終わりに近づいて来ました。5月に元号が平成から令和になり、その時は「新たな時代の幕開けだな」と感じましたが、正直なところ今はその実感が薄れ、個人的には10月に実施された消費税増税のインパクトの方が強かった印象です。

令和に関連する事項として、元号が令和に変わるタイミングで結婚をする「令和婚」が話題になりました。ワイドショーやメディアで取り上げられた「令和婚」、しかし、「令和婚」によって今年結婚した人は本当に増えたのでしょうか?データを使って考察してみます。

厚生労働省の人口動態統計を参照することにより、月ごとの婚姻件数がわかります。そこで、2014年1月~2019年9月(本記事執筆時点における最新の公表月)の婚姻件数*を可視化してみます。

*注意:すべての月に対し速報値のデータを用いています。

●婚姻件数は減少傾向
下図は、年ごとの婚姻件数を棒グラフにしたものです。出生数が年ごとに減少傾向にあることはよく話題にされますが、その前段階である婚姻件数も年ごとに減少傾向にあることがわかります。

fig1.png

2019年は9月までのデータしかありませんが、昨年(2018年)9月までの婚姻件数とほぼ同じであることがわかります。しかし、2019年の月ごとの婚姻件数の分布は、他の年と比べ大きく異なりますね。

そうです。元号が令和に変わった5月の婚姻件数が非常に多いのです。ということは、他の月の婚姻件数が少なくなったとも言えます。

●婚姻件数が多い月は?
月ごとの婚姻件数の推移をみるために、折れ線グラフにしてみます。赤色は月ごとの婚姻件数をつなげた折れ線グラフであり、青色はトレンドを示す「平滑線」というグラフです。

fig2.png

**平滑線をみると、婚姻数は減少傾向にあることがわかりますが、実際の婚姻件数は月ごとに多かったり、少なかったりと変動していることがわかります。**何よりも、2019年5月が異常なほど婚姻件数が多くなっていることがわかります。

具体的にどの月の婚姻件数が多いのでしょうか。下のように、横軸を月(1月~12月)とし、各年を重ね合わせた折れ線グラフを描いてみます。

fig3.png

2014年から2018年までの折れ線をみると、年度末である3月の婚姻件数多く、次いで11月、7月が多いことがわかります。引用している人口動態統計では日ごとの婚姻件数(いわゆる入籍日)の情報はないので詳しくはわかりませんが、7月は「七夕」(7月7日)がありますし、11月は「いい夫婦の日」(11月22日)があることが影響しているのかもしれません。

2019年は、他の年とは異なる傾向を示しているのがわかります。令和婚の反動でしょうか、7月の婚姻件数は多くなっていませんし、4月は極端に少なくなっています。どうせなら平成の終わりより、令和の始まりにしようといったところでしょうか。

ちなみに、入籍日として大安の日を選ぶことが多いかと思いますが、2019年7月が特別に大安の日が少なかったということはありません。2019年7月の大安は4日あり、2014年、2015年、2017年の7月の大安も4日です。

●時系列分析による2019年の異常傾向を確認してみる
令和婚の影響で2019年は他の年とは違う傾向を示していることを見てきましたが、時系列分析により、もう少し詳しく見ていくことにします。

時系列分析は、主に今までの傾向から将来の傾向を予測する目的で使われますが、ここでは2019年の傾向が、それ以前の年と比べて異常な傾向をしていることを確かめるために用いてみます。

2014年から2018年までのデータを用いて時系列モデル(指数平滑化モデルを使用)をあてはめ、2019年の月ごとの婚姻件数の予測値を出してみます。すると**2014年から2018年の時系列の傾向から、2019年はこれぐらいの婚姻件数になるだろうという予測ができるのです。すなわち、その月に期待される婚姻件数がわかります。**この予測では婚姻件数が減少傾向であるということも考慮されています。

下図の折れ線グラフは、時系列モデルにより予測した婚姻係数を示します。黒の点(2014年~2018年)や赤の点(2019年)は実際の婚姻件数であり、折れ線と点が離れている月は、「実際の婚姻件数」と「(時系列分析により)予測された婚姻件数」の間に乖離があることを示します。

fig4_2.JPG

図の右側、緑色で塗られた部分である2019年の結果を見てみましょう。極端に赤色と折れ線が離れている月は、5月です。他の月は折れ線と点がほぼ重なっているか、点が折れ線より下にあることがわかります。

もう少しわかりやすく、2019年の各月について、実際の婚姻件数から、時系列分析によって予測された婚姻件数を引き算して乖離度合い(予測誤差)を見てみます。下のグラフは、月ごとの乖離度合いを示したものです。実際の婚姻件数と予測された婚姻件数が一致する場合、縦軸の値は0になります。

fig7.JPG

やはり5月の乖離度合いが突出していることがわかり、他の月は5月の反動もあってか、予測される婚姻件数とほぼ同等か、少なくなっていることがわかります。すなわち、5月は期待された婚姻件数を大幅に上回り、他の月は期待された婚姻件数並み、または下回っていることになります。

●2020年の婚姻件数の予測
では、2020年の婚姻件数を予測したいとき、現在持っている2019年9月までのデータを使ってみるとどうなるでしょうか。その結果が下図です。緑色の部分が2020年の婚姻件数の予測値となります。

fig5_2.JPG

2020年で突出して値が大きくなっているのは5月です。時系列の予測では、今年5月の令和婚の婚姻件数が考慮された予測結果になっているからです。しかし、実際2020年5月に何か特別なことでもない限り、婚姻件数が多くなることは考えにくいです。

時系列分析ではデータの背景をきちんと考えないと、想定とは大きくかけ離れる予測結果が得られることがあります。今回の令和婚の例はそうですし、製品を販売している会社が将来の販売個数を予測する際、突発なキャンペーンで販売個数が急激に増えたことを考慮せずに、将来の予測する例が挙げられます。このようなケースでは、例外となるイベントを説明変数として含めて分析する方法が考えられますが、ここでは2019年のデータは使わずに、2018年までのデータを使って、2020年の婚姻件数を予測した結果を下図に示します。

fig6_2.JPG

2018年までのデータで2020年を予測するとなると、1年以上も後を予測することになりますので、予測の精度は悪くなってしまいます。グラフで水色に塗りつぶされている箇所は予測区間になり、予測がぶれる範囲だと考えてください。実際に2020年の予測区間は広くなっていることを確認できます。ただ予測値(水色の折れ線)を確認すると、まあ、実際の婚姻件数もこれぐらいに落ち着くのではと思ってしまいます。

来年、この予測結果が実際はどうだったか検証してみる予定です。日本の将来を考えると、予測値よりさらに上にぶれていると良いですが。

By 増川 直裕 (SAS Institute Japan 株式会社 JMPジャパン事業部 テクニカルグループ)

■ さあ始めよう!
JMPの全機能を30日間試せるトライアル版で、データからさらなる情報を導き出せることを実感してください。
さあ始めましょう。

ダウンロードはコチラ!

■ JMPについて
JMP(ジャンプ)は世界中のエンジニア、データアナリストに選ばれているインタラクティブで可視的なデータ分析ツールです。

< SNSで様々な情報をお届けしています >
Facebook
Twitter

1
1
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
1
1

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?