データ分析
データ
データ可視化
データサイエンス
Exploratory

Exploratoryを使ったデータの可視化シリーズ 第2弾 - 比べる


Exploratoryを使ったデータの可視化シリーズ 第2弾 - 比べる

こんにちは

Exploratoryの白戸です。

前回からスタートしたExploratoryを使ったデータの可視化シリーズですが、

今回はデータの比較を行なっていきます。

使用データとサマリーは前回の記事にあるので、まだの方は前回の記事でダウンロードお願いします。

使用データ:activities


データの可視化の目的

目的

売上を伸ばしたい。

質問


  • どの国がサービスの利用者数が多いのか

  • どの国が利用者の使用頻度が高いのか

使用機能


  • バーチャート

  • リファレンスライン

それでは、実際にデータの可視化をしてみましょう!


可視化

チャートはバーチャートを選択して、X軸にCountry、Y軸にCounts(SUM)を選びます。

すると下記のように、各国のアクセス回数の合計がバーチャートで表示されたかと思います。

image.png

US の値がかなり大きいことがこのグラフから読み取れます。しかし、Otherも多いことがわかりました。今回は、Otherではなく、どの国のアクセス数が多いのか知りたいのでOtherを抜いたグラフにしたいと思います。

チャート上部にあるフィルタをクリックして、列にCountry、演算子に等しくない、値にOtherを選択しましょう。

image.png

するとOtherの値を抜いたチャートが表示されたかと思います。

このままでは直感的に国のアクセス数が多いのかわからないため、ソート機能を使いたいと思います。

ソートをクリックし、Y1軸にDESC(降順)を選択します。

image.png

綺麗にアクセス数が多い順に並びました!

image.png

USがJapanの4倍近くありますね。これで、上位の3カ国がわかりました。

次にアクセス回数の平均をみていきたいと思います。

Y軸の隣にあるハンバーガーメニューをクリックし、リファレンスラインを選択。

image.png

リファレンスラインのタイプは、今回は平均値をみたいために、平均を選択します。

image.png

適用を押すとリファレンスラインが引くことができます。

image.png

リファレンスラインの平均値が表示されました。平均値をみると、US のせいで引っ張られているような気がします。

そのため、US をOtherと同じように、フィルタ機能を使用して抜いてみます。

image.png

すると、各国の値がより綺麗に見ることができました。

また、リファレンスラインもチャートにある値に応じて、平均値が12Kから6kに下がりました。

このチャートからは、上位グループ(US, Japan, UK)と、中間グループ(Brazil, Australia, India)、下位グループ(Canada, France, China, Germany)の3グループがあるようです。

次に、Y軸のcounts(SUM)から(AVG)に変えてみましょう。そうすることで、ユーザー一人当たりのセッション回数の平均になります。

※先ほどフィルタで作成したUnited Statesの項目を削除します。

image.png

アクセスの総回数ではなく、ユーザー一人当たりのアクセス回数になりました。

image.png

アクセスの総回数ではUSが一番でしたが、一人当たりのアクセス回数の平均ではAustraliaが一番高いことがわかります。

ということは、ユーザーのエンゲージメントが高いのがAustraliaで、単純にユーザー数が多いのがUSなのではないか?

では、次はユーザーの数を見てみましょう。

Y軸にuserid(UNQ)を選択します。

image.png

各国のユーザー数が表示されました。

image.png

上位3カ国はセッション総数と比べて変化はありませんが、

中間層にいたBrazilとAustraliaはユーザー数が低いことがわかります。


まとめ

今回はバーチャートを使って、各国ごとにセッション総数、ユーザーあたりの平均セッション数、ユーザー数をみていきました。

今回は、観察できたこととして、

US とJapanはどのチャートでも高い数字をだしていたましたが、UK はユーザーの平均セッション回数が平均に比べると少ないようです。

AustraliaやBrasilは使用頻度が高いがユーザー数が少ないことがわかりましたね。

では、OS別に見てみてはどうなんでしょうか。

次回は色(グループ化)を使用し、OSで分けた各国のデータを可視化していきたいと思います。

Exploratoryを使ったデータの可視化シリーズ 第3弾 - 分割

ぜひ次も読んでみてください!



データの可視化を使った探索的データ分析のトレーニング5月開催!

Exploratoryでは5月27日に、データの可視化の仕方や適したチャートの選び方、さらにデータの可視化を通して自分たちのビジネスの改善のための仮説を導き出すための手法である「探索的データ分析」という手法を身に着けていただくためのトレーニングを行います。

詳しくはこちらのページをご覧ください。

データを使ってより良い意思決定を行っていきたいと言う方は、ぜひこの機会に参加をご検討ください!