統計の知識がない素人ですが、昨今の報道をみて「実際なにが起こっているのか」を知りたいと思い調べてみました。
PCR実施状況 厚生省HPより
https://www.mhlw.go.jp/content/10906000/000623123.pdf
これによると【1/15~4/19】の期間で
- 検査実施人数 94,826人
- 陽性者数 10,608人
- 陽性率は 10.9%
総務省は2019年4月12日、昨年10月時点の人口推計を発表した。
総人口は、126,443,000人
ひとまずこちらの数字で推測してみる。
検査実施人数が全国の人数を表すのに有意な人数か?
標本誤差の数式
\sqrt{\frac{N-n}{N-1}×\frac{p×(1-p)}{n}}
このうち抽出率(母集団の大きさに対する標本の大きさの割合)
は下記になります
\sqrt{\frac{N-n}{N-1}}
この式にあてはめると
\sqrt{\frac{126443000-94826}{126443000-1}}
0.9996 つまりはほとんど1のため
標準誤差は
\sqrt{p×(1-p)/n}
で示されます。
感染率10.9%であるなら
\sqrt{0.109×(1-0.109)/94826}
標本比率の標準偏差σは 0.0010 つまり0.1%
正規分布では、
データの68.26%が標準偏差1つ分(1σ)に含まれる
データの95.44%が標準偏差2つ分(2σ)に含まれる
2σをとれば 0.1%x2=0.2% つまり95.44%の確率で誤差0.2%の範囲に収まる。
感染率は10.7%から11.1%になる。となります。
顕在化する問題
- 出版バイアス(こうであってほしい。と思う公開者側の意図)がかかっている可能性
- 検査を受けた人が健康な人を含む国民の総体を表していない。
- 採取日、結果判定日のズレ
- 地域差(40%から0%の幅がある)
- PCR検査の偽陽性・偽陰性と集団の感染率。ドイツ・韓国のように感染率が低い段階で網羅的に検査をすると偽陽性が問題になる。ただ今の日本では検査を受けるべき患者が正しく受検できる環境なのかは(?)
結局、感染状態を知るためにどのくらいの検査数が有意な数なのか。を知りたかったが、政治的な不信感が高まっただけだった。
もう少し統計を勉強して出直します。。
参考にさせていただいたサイト
視聴率の計算
https://toukeigaku-jouhou.info/2015/08/25/audience-rate/
標本調査
https://www.stat.go.jp/teacher/c2hyohon.html