データの可視化シリーズ 第9弾 - 表計算の「移動平均」を使って時系列のトレンドを可視化する
こんにちは
Exploratoryの白戸です。
前回は、表計算の「差の割合」を使用して株価の成長率のトレンドを見ていきました。
今回は、時系列データのトレンドを可視化するときによく使われる「移動平均」を紹介します。
移動平均とは、ある一定期間ごとの平均値を期間をずらしながら求めたものです。移動平均は長期的な傾向を表す滑らかな曲線を描いてくれるため、トレンドを理解しやすくなります。
データの可視化の目的
目的
Appleの株価のトレンドを移動平均を利用して理解したい
使用機能
- ラインチャート
- フィルタ(カテゴリの指定、期間の指定)
- 表計算の移動平均
- カスタムパレットの使用
使用データ
前回から使用している、AppleやGoogleといったテック企業の株価のデータを使用していきます。
使用データは前回の記事からダウンロードできますので、そちらをご覧ください。
それでは、実際に可視化していきましょう!
可視化
今回も時系列のトレンドを見たいために、チャートはラインチャートを選択します。
X軸にdateを選択し、スケールを「日に切り捨て」を選ぶことで、日単位にデータを見れるようにします。
次に、Y軸にはadjustedを選択し、集計関数に「平均値」を選びます。
株価が表示されました。
チャート・フィルターを使う
Appleの株価のみにする
このままでは、AppleやAmazonなどの全ての株価の合計値が表示されているので、フィルタ機能を使用してAppleのみの株価を表示させましょう。
フィルタをクリックします。
列には「symbol」、演算子には「等しい」を選択して、値はAppleの株価の名称の「AAPL」を選びましょう。
これで、Appleのみの株価を表示することができました。
期間を2018年のみにする
次に、去年の株価のトレンドを見たいために、フィルタ機能を使用して期間を2018年のみにします。
先ほどの作成したフィルタの隣の「+」をクリックします。
列には「date」を選択し、フィルタ演算子は「等しい」、値は'2018'にしてください。
これで、アップルの株価を2018年のみで表示することができました!
表計算:移動平均を使う
それでは、ここからよりトレンドを理解するために、表計算の「移動平均」を使用して可視化していきます。
Y軸の2つ目のドロップダウンに先ほどと同様に、「adjusted」を選択します。
集計関数は平均値を選択しましょう。
Y軸のメニューをクリックして表計算を選択します。
計算のタイプは移動計算を選びましょう。
値の集計方法は「平均値」を選びます。
ウィンドウサイズは、移動平均で使用する区間のことを指します。
ここでは、ウィンドウサイズは' 20 'にします。
今回の場合は、X軸の単位が日のため、ウィンドウサイズが20の場合は、20日の平均値をずらしながら求めることを意味します。
ラインチャートに移動平均が適用されました。
次に、カスタムパレットを使用して、移動平均のトレンドを見やすくしていきます。
カスタムパレットの作り方は、こちらの記事をご覧ください。
カスタムパレットは今回のために作成した、グレイとブルーの色のパレットを適用します。
これで、移動平均のラインチャートを可視化できました!
株価は、2018年の10月までは伸びていましたが、11月からは下降しているようです。
また、移動平均には欠点があります。
このように、元の曲線より短くなってしまうことです。
それは、移動平均が前後の値の平均値を求めることによって起こります。また、時系列が滑らかになるほど(ウィンドウサイズが大きいほど)曲線は短くなります。
まとめ
今回はラインチャートと表計算の移動平均を使用して、アップルの株価のトレンドを可視化しました。
個々のデータポイントがどこにあるのかという具体的な詳細よりも、データの包括的な傾向を知りたいときは、移動平均を使用するのがおすすめです。
次回は、時系列データのトレンドを見やすくするために、「トレンドライン」という機能を使って線を滑らかにする手法の紹介をします。
Exploratoryデータ・アカデミー
データの可視化、またはデータ分析に関してもっと知りたい、学びたいという方は、私達が提供しているトレーニングやセミナーに参加してみてください。
こちらのExploratoryデータ・アカデミーのページに詳細情報があります。
データを使ってより良い意思決定を行っていきたいと言う方は、ぜひこの機会に参加をご検討ください!