- 本記事は**「ヤバい」を多用します。「ヤバい」**が嫌いな方はブラウザバック推奨です。
- テーマに沿って仮説検証アプローチでデータ分析をやっていきます
- プログラミング要素はありません...
- 筆者はつい先月、西東京に引っ越ししました(謎アピール)
本当に今年の花粉はヤバいのか?
私は捻くれているので「どうせテレビの誇張表現だろ...」と最初から穿った目で見ていました。
しかし、twitterを見てみると、この情報を鵜呑みにして八王子市民以外でも「ヤバイよヤバイよ」と某氏の如く呟いている方々が大勢いらっしゃるので、実際にデータ1を確認して本当に今年はそんなにヤバいのかどうかを確認したいと思います。
グラフを読み解く
写真から読み取れる情報から、どんなグラフなのかを確認します。
- x軸は年度で、2000年から2018年までのデータ
- y軸は3/1から4/2までの日次**「平均」「ヒノキ」花粉飛散数(写真には日次との記載なしだが後述のデータから日次と断定)で、「東京・八王子市」**での観測結果。
- 単位は個/㎤(以降グラフのy軸は全てこの単位です)。つまり、容量1㎤の空箱の中に何個花粉が入っているかになります。ちなみに、これが1個/㎥だと値が100万倍になります。
このグラフで視聴者に伝えたいことは**「今年の花粉はめちゃくちゃヤバい」**ということですね。
これを本記事では反証していきます。
仮説を立てて検証する
反証の仮説を立てて、データからその仮説が正しいかを検証します。
また、今回はスコープを東京に絞ります。他地域に広げると検証が大変なので。。。
仮説検証1:飛びぬけて高い日があるだけで、他の日はそこまで高くない
**「平均」**というのがやっかいな値で、大きく飛びぬけている値(外れ値)があると、他の値が低いにも関わらず外れ値に大きく影響してしまいます。平均貯蓄額の話とか有名ですね。
ここで実際に3/1から4/4までの八王子市のヒノキ花粉日次飛散数を見てみましょう。
!?
3/29(木)だけべらぼうに飛びぬけてますね...
実測値を見るとなんと4446.9!
この日に何があったんだ...そしてよく生きてたな自分...
まあでも、完全にこの日の影響で平均値が大きく引き上げられているじゃないですか~
やっぱり言い過ぎじゃないですかぁ~?
まあこれだけじゃ例年と比べてどうだかわからないので
一応、年度別に見てみますか...
!!??
明らかに2018年だけ飛びぬけている...
しかも4/4にまた上昇...これはヤバいんじゃないか...
平均でみるのは強ち誇張し過ぎている表現ではないのかもしれない...
飛散のピーク時期がズレているだけというわけでもなさそう...
4/3までの累積で見ると以下の通り。
!!!???
実績値でみると、去年の390倍。比較的花粉量が多かった2013年と比べても18倍という結果に。
また、もともと八王子市はヒノキ花粉量がそこまで多くなかったのもあって倍数はどうしてもデカくなってしまいますね。
ちなみに八王子ほどではありませんが、3/28から3/29にかけて西東京では同じように極端に高い値になっています。(府中だけ少ない)
この日、西東京では猛烈に花粉が舞っていたわけですね...
というわけでこの仮説検証の結論は、正しかったのですが**「今年の花粉はめちゃくちゃヤバい」**の反証にはなりませんでした。
仮説がちゃんとゴールに沿っているか確認せずに「仮説は正しかった!」で終わらせてしまうと間違ったゴールに行きそうですね。怖い怖い。
仮説検証2:ヒノキ以外の花粉は大したことない
3-4月の花粉といえばスギ、次いでヒノキというイメージだと思います。(僕の中ではそうでした)
ヒノキは確かにヤバいけど、スギはそうでもないかもしれません。
ヒノキと同じように東京の各地域における今年の花粉飛散量の合計値を見てみましょう。
去年と、比較的ヒノキの飛散値も多かった2013年と比較します。
!?
はい、ヒノキほどではありませんが、スギも去年と比較すると十分ヤバいですね。
こちらは東東京は2倍ほどで西東京は3〜5倍程度になっています。青梅がヤバいですね。
ただスギ花粉においては西東京では2013年の方がヤバかったみたいですね。
仮説検証の結論としては、スギ花粉も去年よりは大分ヤバいが、多い年と比べるとそこまでではない感じですかね。
去年が少なかったとも言えそうです。
仮説検証3:八王子市以外は大したことない
わざわざ、東京都・八王子市と限定しているところが怪しいですよね。しかも文字を小さくしてる。
ですので東京の他の地域も見てみましょう。
以下のグラフは東京の各地域における今年のヒノキ花粉飛散量の合計値になります。
!?
確かに東京都の23区周辺はそこまでですが、西東京はどこもべらぼうに高いですね。。。
しかも八王子が一番ではなく、青梅が一番という。
また、このデータは2018年は4月3日時点の累積となってます。もっと青グラフは増加する予定。。。恐ろしい。。。
この仮説検証の結論は、東東京は確かに花粉量は上がってるけど去年と比べても大したことないと言えますが、西東京はめちゃくちゃヤバいですね...
結論
- 去年と比べると今年の東京における花粉はヤバい。特に西東京のヒノキ花粉がめちゃくちゃヤバい。
原因が気になりますが、それはまた別の機会で...
林野庁より、戦後に植えたスギ・ヒノキが生殖期に入ったことが花粉大幅増加の原因である可能性があります。(にしても急に増加しすぎている気がしますが)
いいたかったこと
- グラフ等でそれらしいデータを見せられると、思考停止で信じてしまいがちですがきちんと確認しましょうね!
- 仮説立案・検証はきちんとゴールを確認しながら行っていきましょう
- なんでこんな時期に西東京に引っ越しちゃったんだろう
-
今回花粉データは全て東京都健康安全研究センターのサイトから引用しています。 ↩