初の投稿。駆け出しのデータ分析者です。
経緯
某ウイルスの関係で在宅勤務となり完全な運動不足なので、GWをきっかけにランニング始めました。ASICSのRunkeeperを使ってランニングの記録を取っており、「これ解析したら効率よく痩せられんじゃね?」という安直な考えのもと、とりあえずやってみた。
企んでいること
- ジョギングのペースや距離、天候といった情報をデータとして蓄積
- 蓄積したデータを使って、体脂肪の減少を目的とした分析を行う
- 分析結果から導かれたランニングの改善点は、本当に効果があったのか検証する
初日:データとご対面
データ分析のピカピカキラキラしてる部分は全体作業の中のほんの1割未満な訳で、残りは殆ど調べものか実装か頭を抱える時間になる印象です。今回の取り組みでも、Runkeeperのアプリに記録されたペースや高低差、ケイデンスをエクスポートすればいいかと思ってたが、そう簡単にいかないのが世の常。
この記事では、Runkeeperからデータを取り出して加工してみたときの記録を残します。
まずはデータ落とす
とにかくどんなデータが手に入るのか知らねばならん、というか、そもそもデータを取得できるのか。恐る恐るマイページ見てみた。ありがたいことに画面右下にExport機能があった。
...GPX?Google Earthでエクスポート?
初めての取組というものは、最初は分からないことだらけです。秒でやる気を無くしました調べてみました。
GPX
なるほどGPXというのは、GPS eXchange Formatの略なのか。
GPXファイルに必要な最小限のプロパティは、単一のポイントの緯度経度情報である。それ以外の情報はすべて任意である。
これは痺れますね。ドキドキしながらExportします。
中身はこんな感じ。
上の部分はヘッダーですが、下にあるtrkseg
タグに座標データ群が入っているようです。個々のデータはtrkpt
タグにあります。見たところ緯度経度の他に、高度情報(ele
タグ)とタイムスタンプ(time
タグ)がある。
つまり、2つの座標から距離を計算し、タイムスタンプの差分から速度を算出せねばならないということか。距離やペースの情報が欲しいのに。と思いつつも、こねくり回されたデータを渡されるより観測値を渡すからあとは好きにしちゃって、というのは理解できる。
Google Earth (kml)
続いてGoogle Earth形式。
リンク先によると、GPXと同じくXML形式で記述されていて、名前の通りGoogle EarthやGoogleマップで表示するためのデータ形式らしい。中身はこんな感じ。
座標データ群は、coordinates
タグで一括で記載されているが、GPXと異なるのは、タイムスタンプが無い。これじゃ速度の計算ができない。
以上のことから、今回やりたいことを実現するにはGPX形式のデータを使えばよいと分かった。
続いて、緯度経度やタイムスタンプからランニングのペースを算出してみる。
意外と大変!? 座標→距離計算
近いうちにアップします。