Covid19の死亡者が肺炎でカウントされていた場合に、どの程度から誤差と言えなくなるかについてあたりをつける。あきらかに季節変動とトレンドがあるため、それぞれを取り除いた残差のバラツキで見る。
時系列解析
データは人口動態統計から。2,015年〜2,018年の死亡者数月別推移を重ねて確認する。
縦軸は死亡者数で、横軸は月。
偏自己相関を見るまでもなく、12ヶ月周期。年毎に、全体が上がっていくトレンドが見られる。
今回は、肺炎による死者を全体の9%(投稿最後の資料から)ととして、加法モデルで、トレンド、季節変動、残差に分解する。StatsModelsのseasonal_decomposeを加法モデルで使う(移動平均を繰り返して季節変動を計算している、はず)
Y[t] = T[t] + S[t] + e[t]
Tがトレンド、Sが季節変動、eが残差
import statsmodels.api as sm
#
# deathは、1列に死亡者数のみが入っているデータ
#
dec = sm.tsa.seasonal_decompose(death,period=12)
trend = dec.trend
seasonal = dec.seasonal
residual = dec.resid
データのプロット
トレンド
季節変動
残差
結論
残差の最小値-409.1、最大値が282.8。標準偏差は、136.5。平均は-4.59。
1,000件以上増加といえる数になってくると、おそらくはCovid19が多く含まれているのだろう、という印象。
致死率2%とすると、感染者数で5万人ほどであれば、死者1,000名のライン。
Covid19の患者が全国にまばらに分布していると、病院の方から肺炎での死者の増加を見て取るのは難しい(精神病院を抜いた病院は7,000件超くらいのはず、1人増えたぐらいにもならない)。
全国の死因別データは5ヶ月遅れになるため、
現状を把握するためには自治体の速報で速いところを探す必要がある。存在しないかもしれない。
現状について
現状は、日本では専門家会議が残り1〜2週間と指定した時点から、2週間経過。
NYでは非常事態宣言が出され、EU圏での被害が深刻になっている。
日本では、EUや韓国ほどの被害が報告されていないが、
メインで流行しているウイルスの特性が違う可能性や、医療体制の違いなど、
様々な要因が考えられ、特定のシナリオに紐付けるにはデータが足りていない。
武漢のウイルスと同等かつ、欧米と同程度の環境とした場合、
死者の数値は推測されるより低いので、Covid19の死亡者が肺炎の死者にまぎれているのかどうかをデータから検知できるかどうか検証した。
(ウイルスと環境を変数として固定しているだけであって、そう判断しているわけではなく、その他のシナリオの検証は別の話。今回はこれだけ確認した)
データ
月別死亡数データ(死亡月別にみた年次別死亡数及び死亡率(人口千対)):
https://www.e-stat.go.jp/stat-search/files?page=1&layout=datalist&toukei=00450011&tstat=000001028897&cycle=7&year=20180&month=0&tclass1=000001053058&tclass2=000001053061&tclass3=000001053065&result_back=1
全体の死亡者月別は速報があり、2ヶ月前が最新(人口動態統計速報 19年11月分):
https://www.mhlw.go.jp/toukei/saikin/hw/jinkou/geppo/s2019/11.html
肺炎(人口動態統計からみた日本における肺炎による死亡について):
http://www.tokyo-eiken.go.jp/sage/sage2018/