データの可視化シリーズ 第11弾 - ヒートマップを使って「組み合わせ」を可視化する
こんにちは
Exploratoryの白戸です。
前回は、ラインチャートとトレンドラインのLoessを使用して、時系列のトレンドを可視化しました。
今回は、下記のようにヒートマップを使用してカテゴリー間の組み合わせごとに集計した数値を色で表示していきます。
データの可視化の目的
目的
- 何曜日の何時にアクセス数やユーザー数が多い傾向にあるのか知りたい
使用機能
- ヒートマップ
使用データ
今回から、またactivitiesというアクセスログのデータを使用します。このデータの取得とインポートはこちらの記事にあります。
また今回は、このデータフレームのラングリングの3番目のステップを使用するので、チャートが正しく3番目のステップに「ピン」されていることを確認してください。
もし、ステップのピンの変更方法がわからない場合は前回の記事を参照してください。
可視化
今回は、何曜日の何時にアクセス数やユーザー数が多いかの傾向を掴みたいということですが、これは曜日と時間という2つのカテゴリーの組み合わせを見たいということになります。このようなときに便利なのが、ヒートマップというチャートです。
実際にヒートマップを作成して、みていきましょう。
アクセス数
新しくチャートを作り、「ヒートマップ」を選択します。
曜日ごとにデータを見ていきたいので、X軸にtimestampを選び、「曜日 - ショート(月)」を選択します。
次に、1日の時間ごとにデータを見ていきたいので、Y軸も同様に、timestampを選び、「時」を選択してください。
今回は、アクセス数の傾向を色を使用して可視化していきます。
そこで、「色で分割」に「行の数」を選びます。
曜日と時間毎のアクセス数を色を使用して可視化することができました。
ここでは、色が赤で濃くなればなるほどアクセス数が多いことを意味します。逆に、青の色が濃くなればなるほどアクセス数が少ないということになります。
ヒートマップを見ると、土曜日と日曜日はアクセス数が極端に少ないため、平日に使用されていることがわかりました。また、使用時間は朝の9時から多くなっているようです。
ユーザー数
次に、アクセス数ではなく、ユーザー数を見ていきたいと思います。
色で分割をクリックします。
ユーザー数を見ていきたいために、色で分割には「userid」を選択します。
曜日と時間毎のユーザーが何人いるかを見たいため、集計関数は「一意な数(UNQ)」を選びましょう。
曜日と時間毎のユーザー数を色を使用して可視化することができました。
先ほどのアクセス数と同様に、土曜日と日曜日は使用しているユーザーがほとんどいないようです。
また、ユーザーは午前の時間帯に多く集まっているようです。特に火曜日の7時と8時はかなり多い結果となりました。
まとめ
今回はヒートマップを使用して、カテゴリー間の組み合わせを集計して、数値を色で可視化していきました。
次回はヒートマップと繰り返しを使用して、カテゴリー間の組み合わせをOS別に見ていきたいと思います。
Exploratoryデータ・アカデミー
データの可視化、またはデータ分析に関してもっと知りたい、学びたいという方は、私達が提供しているトレーニングやセミナーに参加してみてください。
こちらのExploratoryデータ・アカデミーのページに詳細情報があります。
データを使ってより良い意思決定を行っていきたいと言う方は、ぜひこの機会に参加をご検討ください!