最近、運動たりてない?
コロナのロックダウンと、職業柄コマンドラインを叩いてばかりの日々。
バ先の研究室の椅子が座り心地が良く、あまり動かなくなってきた気がする。
2月からスマートウォッチをずっとつけていて、いろんな生体データが溜まってきたので、ここらで一回生活習慣を振り返ってみましょうか。
何回かに分けて試行錯誤して何らかの知見を得ようとしてみます。今回は1回目です。
仮説:「歩数の多い日の夜は睡眠の質が高いはずだ」
運動と睡眠の関係はいくつかの研究で既に相関関係があることが示されていますが、そうは言われても、実感は難しいです。自分自身のデータからもし相関があったら、肌でそうしたことが実感できるかもしれませんし。
睡眠の質は定義が難しいので、今回は単純にスマートウォッチによる深い眠りの分数(deepSleepTime)を睡眠の質と捉えてみましょう。 もしこれでうまくいかなければ、仮説の建て方自体に問題があるかもしれませんね。
データ収集:スマートウォッチで歩数と睡眠の質を測定
シャオミのMi Band 5という時計は、様々なシグナルを計測しますが、今回は歩数と睡眠スコアのみのデータを購入時から4/29まで公式アプリ記載の方法でエクスポートし、これを使いました。
エクスポートした生データはcsv形式で保存されていました。それでは生データを覗いてみましょう!
歩数を含む生データ
睡眠の質に関わる生データ
_人人人人人人人人人_
> 何もわからへん <
 ̄Y^Y^Y^Y^Y^Y^Y^Y ̄
ぱっと見何もわからないという知見が得られました。
とりあえずデータの可視化,相関係数をみてみる
とりあえず生データのぞいたけど、何もわかんねえよ!
というわけで、歩数と睡眠の質に関わるdeepSleepTimeをプロットして可視化してみましょう。
なお、前日の歩数の影響が、次の日に影響が出うると今回仮定しているので、きちんとデータを1日分ずらすことを忘れずにしましょう。
(次の日の睡眠データと、前の日の歩数データを比べるとわけわからんくなります。)
深い眠りの分数 deepSleepTimeは外れ値の処理が難しい(明確な基準がない)ので、生データのまま用いました。
相関係数は0.2953 となり、この値だと、ほぼ相関無しと判断されることが多いようです。すなわち、**「睡眠の質を、深い睡眠の時間とすれば、前日の歩数が多いほど睡眠の質は高くなる」、という仮説は否定もできないし、肯定も出来ない、というなんとも微妙な結果になりました。**このままでは断定はできないので、他の指標を考えてみる必要がありそうです。ただ、ためしに全ての日付を二つの値の間でずらしてみると、負の相関になるので、これらの二つの指標の間に関係が全くないともいえません。
結果
単純に歩数だけを深い眠りの時間と比べたときに、これらの相関は0.2953となり、相関があるともないともいえないことがわかった。
次回に続く
To be continued.
反省点&改善の余地
僕はデータ分析は全く専門ではありません。
Qiitaには素晴らしいデータサイエンティストが溢れているらしいと思われますので、コメントでみなさんの知見を募集してます。
こうしてみなさんのツッコミをいただき、何かしら今後の学びにします。
以下、自分でツッコミ:
1.睡眠の質として、深い眠りの時間のみを単純に採用するべきではない?
例えば、レム睡眠の時間や、睡眠時間合計などを考慮するべきか?
2.歩数自体だけが睡眠の質に影響する、という仮定は単純すぎないか?
他にも、運動の強度や、カフェインの摂取の有無、人と会った回数など、それらも考慮する必要があるかも?
平日はスクリーンタイムが多いので、平日と休日で別々にデータを扱うのは?
3.データの数は十分だったか?
歩数と深い眠りのペアは80個ほどであった。もっとサンプル数が必要?
だとしたらそれはどのくらいか?
コメントで詳しい方、教えてください:
仮説の立て方にどんな問題がありますか?
指標の選び方にどんな問題がありますか?
もっともっとツッコミお願いします。
もう寝ます。
この記事を書いていたら夜10時になりました。
いろいろ考えたいですが、眠いので寝ます。
それではみなさん、ごきげんよう。