本ブログでは、さまざまな時系列データを統計手法を用いて、形状が似ている系列や異なる系列に分類する方法を説明します。
スーパーマーケットに行くと、野菜、果物、納豆、保存食品など、普段はこの値段で買えるだろうと思っていたものが想像以上に高くなり、驚くことが多くなりました。物価上昇は、一段と加速しているように感じます。
食料品の消費支出の傾向分析
物価上昇は2022年ごろから現在まで続いており、特に食料品は削りにくい支出であるため、その影響が大きく反映されています。
総務省が公表している家計調査では、月ごとの食料品の消費支出金額(以下、消費支出)が公開されています。本ブログ執筆時点の最新データ(2024年10月まで)を用いて、2020年1月からの消費支出の推移をグラフ化しました(図1)。
図1. 消費支出の推移:食料品
図左側:折れ線グラフ(赤色実線)、トレンドを示す平滑線(青色点線)
図右側:年、月ごとの消費支出を示したヒートマップ、赤色が濃いほど、その年月で多く消費していることを示す
折れ線グラフやヒートマップを見ると、毎年12月に消費支出が多くなる傾向があります。トレンドを示す平滑線を見ると、2022年から現在まで上昇傾向が続いていることが分かります。
図1 はあくまでも食料品全体での話になりますが、個々の食品についてもグラフ化してみましょう。
日本の主食であるコメについて、同様のグラフで傾向を見ていきます(図2)。
2020年には外食控えの影響で消費が伸びましたが、価格が安定していたこともあり、その後は減少傾向にありました。しかし、2024年半ばから急激に上昇しており、これはコメ不足と価格上昇が影響しています。
図2. 消費支出の推移:米
米に対して、パンはどうなっているでしょうか(図3)。パンの消費支出は2022年から小麦価格の上昇により増加トレンドが続いていましたが、最近は減少傾向に転じています。これは、米の価格上昇がパンの消費抑制に影響した可能性があります。
もう一つ、牛肉をみていきましょう(図4)。
牛肉は年末年始やお歳暮の需要で12月に消費支出が増加しますが、全体的には2021年から消費支出が減少傾向にあります。円安や価格上昇などの影響で消費が抑えられていると考えられます。
ここまで、米、パン、牛肉の消費支出の傾向をみてきましたが、食品ごとに傾向が異なることがわかります。家計調査では、これ以外にも果物や野菜、乳製品などさまざまな食品に対する消費支出が公表されています。しかし、多くの食品があるため、上記のようなグラフを1つ1つ眺めて考察するのは困難で時間がかかります。
そこで、今回は関数主成分分析という統計手法を用い、さまざまな食品(150種類程度)について、同じような消費支出の傾向を示す食品、異なる傾向を示す食品を分類してみます。
関数主成分分析による食品の消費傾向に対するマッピング
関数主成分分析(Functional PCA)は、時系列データなどの関数系列における主な変動パターンを抽出し、それをもとに系列を分類する手法です。この分析により、食品間の似た傾向や異なる傾向を把握できます。
以下に、関数主成分分析を実施して食品を分類する流れを示します。
1.スプライン関数のあてはめ
まずは、各食品それぞれにスプライン関数をあてはめます。図5の赤色の線がスプライン関数です。スプライン関数とはデータを平滑化する関数で、異なる区間にあるデータにフィットさせた多項式をつなぎ合わせて構成されます。
図5. スプライン関数のあてはめ
2.関数主成分の抽出
あてはめた複数のスプライン関数について、それらに共通の特徴を示す関数を「形状関数」として抽出します。本分析では3つの形状関数を抽出しており、図6は各系列の平均的な傾向を示す「平均関数」と、3つの形状関数(E1(T)、E2(T)、E3(T))を示しています。
図6. 形状関数
平均関数は、年ごとに消費支出がほぼ一定の傾向を示します。この平均関数に対して、各食品の特徴を示す形状関数が追加されます。
形状関数1は、年に対してY(重み)の値が0.0001程度(正の値)で推移している一定の関数です。
形状関数2は、コロナが始まった時期に上昇し、しばらく減少傾向を示した後、2024年から急激に増加する関数です。
形状関数3は、2021年以降増加傾向が続き、2024年の中盤以降に減少に転じている関数です。
例えば、米やパンにあてはめたスプライン関数は、平均関数、3つの形状関数を使って次のように近似できます。
ここで、3つの形状関数にかかる係数が「主成分スコア」であり、各食品の特徴を示します。
他の食品についても主成分スコアを求めることができ、このスコアをプロットした散布図により、食品間の類似性や異なる部分を考察できます。
3.各食品の主成分スコアをマッピング
まずは、食品ごとに主成分スコア(成分1、成分2)を求め、散布図を用いて類似性や差異を可視化します(図7)。
図6の形状関数1は一定の正の値をとるため、正の係数が大きいほど消費支出額が多いことを示しています。この軸は、全体を通した消費支出額の違いを表します。
図7. 主成分1と主成分2のスコアプロット
成分1の右側に位置する「豚肉」や「パン」は、そもそも他の食品に比べ消費支出が大きいものであり、逆に左側に位置する「さんま」は消費支出が小さいものであることを示しています。
結局のところ、この成分1の消費支出の違いが、食品を分類する大きな指標となっているのですが、これは今回調べたいことの本質ではありません。そこで成分2、成分3のスコアプロットを参照します(図8)。
成分2の正の値が大きい食品と負の値が大きい食品を対比し見ていきましょう。正の値が大きい「アイスクリーム・シャーベット」、「ぶどう」は主に夏に消費が多くなるものであり、負の値が大きい「みかん」、「チョコレート」、「いちご」は冬に消費が多くなるものです。そのため、成分2は季節的な消費傾向を示す軸と解釈できます。
成分3は、形状関数3から、徐々に消費支出が増加し、最近減少傾向になる食品を識別する軸と解釈できます。
スコアプロットに対し、①、②、➂の部分を考察してみましょう。
図8. 主成分2と主成分3のプロット
① 「米」が他の食品とは異なる外れた場所にプロットされています。先ほど示した通り、米は形状関数2のように、最近急激に消費支出が増加していることを示しています。
② 「パン」や「卵」、「ビスケット」や「冷凍調理食品」は、物価上昇の影響を受けて消費支出が増えているが、ここ最近減少傾向にある食品です。
③ 「いちご」、「ケーキ」、「チョコレート」は冬に多く消費される食品です。そのため、これらの消費支出も同じような傾向を示しています。
このように、各食品の主成分スコアをマッピングすることにより、食品間の消費支出における類似性や差異を把握することができました。
今回の例では、食品の消費支出を対象としましたが、時系列データやスペクトルデータなど、連続的な変数を含むデータにおいて、関数主成分分析は多くの系列を分類する際に有効な手法です。
※本ブログで紹介した関数主成分分析は、JMP Proの「関数データエクスプローラ」で実施できます。
統計ソフト「JMP(ジャンプ)」には、30日間すべての機能を無料で利用できるトライアル版があります。よければ試してみてください。
30日間全機能無料のトライアル版はこちら
https://www.jmp.com/ja_jp/download-jmp-free-trial.html?utm_campaign=bl&utm_source=JMPblog&utm_medium=social
by 増川 直裕(JMP Japan)
Naohiro Masukawa - JMP User Community