最初に
この記事は、Microsoft Power BI Advent Calendar 2023 12月2日の記事となります。
自己紹介
佐賀県の小売業(和服)で情シスをしています。
去年は佐賀県のDXフラグシップモデル、今年は日本DX大賞を受賞をすることができ、とても慌ただしい1年だったような気がします。 来年こそはゆっくりしたいと思っています。
内容
Googleのウェブ検索(Googleトレンド)と季節商品販売の関連性を、2019年のコロナ前から2023年のコロナ後の11月までの間で
季節商品の代表格である、浴衣と七五三を元に販売データとトレンド検索との関連性を調べてみました。
データソース
Googleトレンドからデータをダウンロード
Googleトレンドから、コロナ前の1999年1月から2023年11月までの浴衣、七五三それぞれのトレンド検索データをダウンロードします。
Power Queryにて、日付、分類(浴衣、七五三)、人気度をファクトテーブルとする。
販売データから対象データを抽出
Power Queryにて、売上データから浴衣・七五三のデータのみをデータ抽出してSalesDataのファクトテーブルを作成する。
Power Query側で、SalesDataに浴衣・七五三以外のデータは入らないするのは重要です。
データモデリングとメジャー作成
データモデリング
ファクトテーブルが売上データ(SalesData)とGoogleのウェブ検索(Trenddata)、ディメンションテーブルが、カテゴリと日付テーブルを作成しリーレーションシップで結びつけスタースキーマにします。
メジャーの作成 最大の日付を
販売実績は販売数量をベースにメジャーを作成
販売数量が一番多い日付を算出するメジャーも作成とウェブ検索で人気度が一番高い日付を算出するメジャーを作成します。
最大販売数量日付 =
MAXX(
TOPN(
1,
VALUES('Calendertbl'[Date]),
[販売数量]
,DESC
)
,'Calendertbl'[Date]
)
可視化・分析をしてみる。
浴衣
2022年以外は、ウェブ検索の最大人気度の日付と販売数量一番多い日付とあまり差がさほどない。
2021~2022年はウェブ検索と販売実績共にコロナ渦の影響を受けている。
2023年は全国で夏祭りの開催や8月下旬も暑かったこともあり、2019年はウェブ検索での人気度のピークを過ぎると一気に下がっていたが、2023年はウェブ検索での人気度のピークが続いていた分、販売実績もよくなったと考えられる。ただその分来年が予測しづらい。
七五三
コロナ禍の影響を多少は受けてはいるが、浴衣ほどではない。
コロナ期間は10月上旬~中旬にかけての販売実績が多いのは、密を避けるためにピーク前にお参りしているのが考えられる。ただ2023年は、分散はしているがピークである11月に戻りつつある。
ウェブ検索人気度と販売実績が比例しており、ウェブ検索の人気度も年々下がっているので、少子化の影響が多少あるかもしれない、ただ浴衣と違い来年も予測しやすい。
2021年のウェブ検索と販売実績が両方高い原因を調査する必要がある。
まとめ
Googleトレンドデータと季節商品の販売実績との関連性について、Power BIにて可視化・分析してみました。
アフターコロナで浴衣は今後の需要やウェブ検索と販売実績の関連性も把握することが出来たが、グラフがまだ見にくいので改良する余地がたくさんある。
来年こそは業務部門自ら調査しレポート作成・分析出来るように社内人材を増やして行きたいと思う。