Qiita Teams that are logged in
You are not logged in to any team

Log in to Qiita Team
Community
OrganizationEventAdvent CalendarQiitadon (β)
Service
Qiita JobsQiita ZineQiita Blog
4
Help us understand the problem. What is going on with this article?
@ZESSU

バスの到着時刻が正規分布に従っているか実験してみた

背景

プラントエンジニアのKeisukeです。
去年まで千葉で業務をしていましたが、2021年4月から北海道に転勤して工場で仕事をしています。
現場目線でプラントを見れるので学ぶ事も多く良い経験になっています。
現場は経験がものを言う世界ですが、運転データや不具合記録を分析をして読み取れることも多々あります。今までになかった観点から現場の力になれればと思いながら日々活動しています。

動機

働いている工場までは自宅から10km、車なしでは到底通勤できない距離です。私は自家用車を持っていませんが、幸いなことに会社から社有バスが出ており、バス停から拾ってもらって通勤をしています。感謝感激です。

バスに揺られながら私はふとこんなことを考えました。
「バスの到着時刻って正規分布にのるのかなぁ?」
夏休みの自由研究でやるような素朴な疑問を解決すべく、私はバスの到着時刻をこの2ヶ月間、せっせと収集していました。社会人も腰を据えて自由研究に取り組める日がいつか来ることを祈りつつ、、、

データ収集

日付 バス到着時刻
4月2日 07:10:02
4月5日 07:08:27
4月6日 07:08:17
4月7日 07:11:02
4月8日 07:09:12
4月9日 07:10:07
4月12日 07:08:07
4月16日 07:12:17
4月19日 07:08:17
4月20日 07:09:57
4月21日 07:05:23
4月22日 07:08:55
4月26日 07:11:30
4月27日 07:07:22
4月28日 07:08:30
5月6日 07:08:22
5月7日 07:07:32
5月10日 07:11:35
5月11日 07:07:20
5月12日 07:07:35
5月13日 07:10:17
5月19日 07:08:00
5月20日 07:08:37
5月24日 07:07:57
5月25日 07:10:15
5月26日 07:07:17
5月27日 07:08:34

ということで上表がバス到着時刻のデータになります。会社の朝は結構早いです。6月現在はまだ暖かいですが、あと半年もすれば冬の猛烈な寒波がやってきます。冷え性な私が北海道の凍てつく寒さに耐えられるか心配で夜しか眠れません。
7時6分が到着予定の時刻でやや遅れがある感は否めませんが、いい感じに分布してそうな雰囲気です。

Figure_1.png

到着時刻データをヒストグラムで表したものが上図になります。7時00分00秒を基準(0[s])としています。
正規分布の形はおぼろげながら見えますが、ちょっと情報量が足りずジグザグな感じが拭えません。それもそのはず今回のデータ数は27個。

評価方法

正規分布に従っているかを確認する手法として
・Q-Qプロット
・シャピロ・ウィルク検定(S-W検定)
・コルモゴロフ・スミルノフ検定(K-S検定)
があります。

Q-Qプロット

Q-Qプロットはグラフに引いた直線と今回のデータがどれだけ一致しているかを見る定性的な評価方法です。実際に解析した結果が下図になります。

Q-Qplot.png

赤い直線にプロットが乗ると正規性が強い事を示します。
どうでしょうか、横軸の両端のデータも直線に乗っていて、正規性を捉えているように感じます。しかし、この手法では正規性を定量的に評価することが出来ません。なので他の方法もトライしてみます。

シャピロ・ウィルク検定(S-W検定)

S-W検定はデータからP値を計算して定量的に判定する手法になります。
P<0.05であれば「母集団が正規分布である」という帰無仮説を棄却します。
今回は

P = 0.2995

という結果で、母集団が正規分布であるという帰無仮説「母集団が正規分布である」は棄却されないという結果になりました。

コルモゴロフ・スミルノフ検定(K-S検定)

K-S検定はデータ数が多い(1000以上)時に使われる検定です。今回のデータ数は少なく適切ではないですが一応トライしてみます。

P = 0

P<0.05となり、K-S検定では帰無仮説が棄却されるという結果になりました。

まとめ

今回の結果をまとめます。

評価方法 正規性
Q-Qプロット △(○)
S-W検定
K-S検定 ×

2ヶ月分の少ないデータ量でしたが、一部の検定で正規性が垣間見える結果となりました。
6月13日現在も絶賛データ収集中なので、バスの到着時刻が正規分布に近づくのかを引き続き検証していきます!
みなさんもバスや電車を待っている時の暇つぶしとしてトライしてみて結果を報告してくれると嬉しいです!!

参考文献

Why not register and get more from Qiita?
  1. We will deliver articles that match you
    By following users and tags, you can catch up information on technical fields that you are interested in as a whole
  2. you can read useful information later efficiently
    By "stocking" the articles you like, you can search right away
4
Help us understand the problem. What is going on with this article?