データの可視化シリーズ 第2弾 - バーチャートを使って「比べる」
こんにちは
Exploratoryの白戸です。
前回からスタートしたデータの可視化シリーズですが、
今回はデータの比較を行なっていきます。
使用データとサマリーは前回の記事にあるので、まだの方は前回の記事でダウンロードお願いします。
使用データ:activities
データの可視化の目的
目的
- どの国がサービスの利用者数が多いのか知りたい
- どの国が利用者の使用頻度が高いのか知りたい
使用機能
- バーチャート
- リファレンスライン
それでは、実際にデータの可視化をしてみましょう!
可視化
チャートはバーチャートを選択して、X軸にCountry、Y軸にCounts(SUM)を選びます。
すると下記のように、各国のアクセス回数の合計がバーチャートで表示されたかと思います。
US の値がかなり大きいことがこのグラフから読み取れます。しかし、Otherも多いことがわかりました。今回は、Otherではなく、どの国のアクセス数が多いのか知りたいのでOtherを抜いたグラフにしたいと思います。
チャート上部にあるフィルタをクリックして、列にCountry、演算子に等しくない、値にOtherを選択しましょう。
するとOtherの値を抜いたチャートが表示されたかと思います。
このままでは直感的に国のアクセス数が多いのかわからないため、ソート機能を使いたいと思います。
ソートをクリックし、Y1軸にDESC(降順)を選択します。
綺麗にアクセス数が多い順に並びました!
USがJapanの4倍近くありますね。これで、上位の3カ国がわかりました。
次にアクセス回数の平均をみていきたいと思います。
Y軸の隣にあるハンバーガーメニューをクリックし、リファレンスラインを選択。
リファレンスラインのタイプは、今回は平均値をみたいために、平均を選択します。
適用を押すとリファレンスラインが引くことができます。
リファレンスラインの平均値が表示されました。平均値をみると、US のせいで引っ張られているような気がします。
そのため、US をOtherと同じように、フィルタ機能を使用して抜いてみます。
すると、各国の値がより綺麗に見ることができました。
また、リファレンスラインもチャートにある値に応じて、平均値が12Kから6kに下がりました。
このチャートからは、上位グループ(US, Japan, UK)と、中間グループ(Brazil, Australia, India)、下位グループ(Canada, France, China, Germany)の3グループがあるようです。
次に、Y軸のcounts(SUM)から(AVG)に変えてみましょう。そうすることで、ユーザー一人当たりのセッション回数の平均になります。
※先ほどフィルタで作成したUnited Statesの項目を削除します。
アクセスの総回数ではなく、ユーザー一人当たりのアクセス回数になりました。
アクセスの総回数ではUSが一番でしたが、一人当たりのアクセス回数の平均ではAustraliaが一番高いことがわかります。
ということは、ユーザーのエンゲージメントが高いのがAustraliaで、単純にユーザー数が多いのがUSなのではないか?
では、次はユーザーの数を見てみましょう。
Y軸にuserid(UNQ)を選択します。
各国のユーザー数が表示されました。
上位3カ国はセッション総数と比べて変化はありませんが、
中間層にいたBrazilとAustraliaはユーザー数が低いことがわかります。
まとめ
今回はバーチャートを使って、各国ごとにセッション総数、ユーザーあたりの平均セッション数、ユーザー数をみていきました。
今回は、観察できたこととして、
US とJapanはどのチャートでも高い数字をだしていたましたが、UK はユーザーの平均セッション回数が平均に比べると少ないようです。
AustraliaやBrasilは使用頻度が高いがユーザー数が少ないことがわかりましたね。
では、OS別に見てみてはどうなんでしょうか。
次回は色(グループ化)を使用し、OSで分けた各国のデータを可視化していきたいと思います。
ぜひ次も読んでみてください!
Exploratoryデータ・アカデミー
データの可視化、またはデータ分析に関してもっと知りたい、学びたいという方は、私達が提供しているトレーニングやセミナーに参加してみてください。
こちらのExploratoryデータ・アカデミーのページに詳細情報があります。
データを使ってより良い意思決定を行っていきたいと言う方は、ぜひこの機会に参加をご検討ください!