はじめに
Adobe Analytics で収集したデータは、視覚化と統計量(中央値、平均といった、データの特徴を要約した数値)の算出という2つの作業、いわゆる「記述統計」のアプローチを通して、その特徴を把握する事ができます。ところで Adobe Analytics には、これら作業を容易にする機能、「ビジュアライゼーション」 「計算指標」という2つの機能で実現する事ができます。
本エントリーでは、これら2つの機能のうち、計算指標を活用した統計量の算出方法について紹介します。
この機能を利用することで、現状の訪問者の平均値や中央値がどうなっているのかを理解することはもちろん、売上データの中央値や標準偏差を知るなども簡単に実現できます。ぜひご活用ください。
※もう一方の機能、視覚化については過去に「正しくデータを可視化するために知っておくべきこと」というエントリーで紹介しておりますので、こちらとセットでお読みいただけますと幸いです。
この記事の内容は 2022 年 8 月時点の情報に基づいて執筆しています。 計算指標の追加・変更等、適宜変更されている場合があります。
想定読者
本エントリーは初歩的な統計の知識でもある「統計量」、そして、Adobe Analytics の分析ワークスペース、計算指標、これらの知識をお持ちの読者を想定し作成しております。
以下参考資料となります。適宜ご確認ください。
Adobe Analytics に含まれる統計量と算出方法
統計量はデータの基本的な特徴を表す値を指しますが、それらは一般的に「代表値」と「散らばり」とに区分が可能です。また、それぞれの区分において、Adobe Analytics は以下のように指標を用意しています。また、指標が存在しない場合も、別の指標で代替、または、作成することで算出可能です。
Adobe Analytics指標名マッピング
区分 | 統計量 | 指標名 |
---|---|---|
代表値 | 平均 | 平均値 |
中央値 | 中央値 | |
最頻値 | なし(指標「最大値」を利用して算出可能) | |
散らばり | 標準偏差 | 標準偏差 |
分散 | なし(指標「標準偏差」と指標「平方根」を使って算出可能) | |
範囲 | なし(指標「最大値」、「最小値」を利用して算出可能) | |
四分位範囲 | 四分位数 |
統計量を算出してみる
以下統計量の算出方法の流れです。
- 算出したい統計量を決める
- 1の内容を計算指標ビルダーで作成する
- 分析ワークスペース「フリーフォームテーブル」を利用し統計量を算出する
- (補足)結果をビジュアライズする
1. 算出したい統計量を決める
算出に必要な情報は下記です。セグメント以外はすべて必須な情報です。
決めること
・期間
・ディメンション
・指標
・算出したい統計量を決める
・セグメント(オプション)
例
以下のようなデータの特性を把握することができます。
例1:「2022年第1四半期の日別訪問回数」
例2:「2022年の第1四半期と第2四半期の日別訪問回数の違い」
2. 1の内容を計算指標ビルダーで作成する
計算指標を作成していきます。完成形サンプルは下記です。
変動係数
変動係数はデフォルトでは用意しておりませんが、作成方法は非常にシンプルで標準偏差÷平均で出力できます。上で作成した平均、標準偏差を活用し作成します。
3. 分析ワークスペース「フリーフォームテーブル」を利用し統計量を算出する
分析ワークスペースの「フリーフォームテーブル」を用意し、1で決めたディメンション、期間、そして2で作成した計算指標を割り当てます。この設定を実施することで期待する統計量を算出することができます。尚、今回利用する計算指標はすべて「表関数」の計算指標のため、下記完成イメージの赤枠が今回期待する統計量となります。
完成形イメージ
4. (補足)ビジュアライズする
先の完成形イメージでも結果が読み取れるためこの状態でも構いませんが、下記の様にワークスペースのビジュアライゼーション、「数値の概要」を利用することでより伝わりやすくなります。
その2
カスタム日付範囲を利用し、比較したい期間を1度に表現する
まとめ
以上が計算指標を利用した統計量の算出方法となります。このように統計量を算出することによって、視覚化だけでは読み取れなかったデータの特徴を把握することができます。
また、Adobe Analytics では今回のエントリー以外にも様々な計算指標を用意しています。今後これらの使い方含めてご紹介していきたいと考えています。