- 統計学の活用:企業の収益成長率における算術平均と幾何平均の違い
- 使用するデータの紹介
- 幾何平均とは
- Pythonで算術平均と幾何平均の違いを可視化
統計学の活用:企業の収益成長率における算術平均と幾何平均の違い
企業の収益成長率の例を用いて算術平均と幾何平均の違いについて考えてみたいと思います。
所要時間は20分ほどとなっています。
それでは、さっそく始めていきましょう!
使用するデータの紹介
幾何平均とは
幾何平均(Geometric Mean)は、特に成長率や比率など、連続的に変化する値の平均を計算する際に用いられる統計的な指標です。
主な特徴と目的:
複利効果の考慮: 投資リターンや人口増加、企業の成長率など、時間とともに複利的に変化する現象の平均成長率を計算する際に非常に強力なツールとなります。
算術平均では、複利効果が考慮されず、実際の成長を過大評価する可能性があります。
正確な成長の把握: 各期間の成長率を複利計算の視点から平均化するため、初期値が最終的にどの程度の年間平均成長率で増えたかを示す、より正確な指標となります。
比率データの平均: 例えば、複数の比率を平均する際にも有用です。
計算方法:
例えば、ある投資が1年目に10%増加し、2年目に20%増加したとします。この場合、算術平均は (10% + 20%) / 2 = 15% となりますが、幾何平均は sqrt{(1+0.10) * (1+0.20)} - 1 ≒ 0.1489 = 14.89% となり、より実態に近い平均成長率を示します。実際の資産の増え方は、この14.89%で毎年増えた場合と同じ最終結果になります。
Pythonで算術平均と幾何平均の違いを可視化
この分析では、ある企業の5年間の年間収益データを使用し、その成長率の平均を計算しました。
算術平均成長率は 17.50% となりましたが、これは各年の成長率を単純に足し合わせて平均したものです。
これに対し、幾何平均成長率 (CAGR - Compound Annual Growth Rate)は 14.45% となりました。
なぜ算術平均は実際の収益トレンドを過大評価してしまうのか
算術平均が実際の収益トレンドを過大評価してしまうのは、複利効果(Compounding Effect)を適切に考慮しないためです。
先ほどの例で、2020年の初期収益が1000で、その後の年間成長率が +50%, -20%, +30%, +10% だったケースで考えてみます。
算術平均の計算方法: 算術平均は、各期間の成長率を単純に足し合わせて、その期間数で割ることで計算されます。先ほどの例では、(50% + (-20%) + 30% + 10%) / 4 = 17.50% でした。
これは、各期間の成長率を独立したものとして扱い、「単利」の考え方に近いと言えます。つまり、初期の基準値に対して毎期同じ割合で増減すると仮定するようなものです。
実際の収益の増え方(複利): 実際の収益は、前の期の収益を基準にして次の期の成長率が適用されます。つまり、「複利」の形で増減していきます。
たとえば、1年目に50%成長して1500になった後、2年目に-20%成長すると、1500の-20%で1200になります。2年目の成長は1年目の成長後の1500に対して計算されており、初期の1000に対して単純に-20%されるわけではありません。
過大評価のメカニズム
算術平均は、負の成長率があっても、それがその時点の絶対的な金額ではなく、初期の基準値に相対的な「率」として平均に組み込まれてしまうため、成長が低い期間やマイナスの期間の影響を十分に吸収しきれません。
特に、成長率が大きく変動する(正の値と負の値が混ざる)場合、算術平均は各時点での絶対的な資産額の増減を反映せず、まるで常に初期の金額に対して成長率が適用されているかのように振る舞います。その結果、
・実際の最終的な収益は、高い成長率と低い成長率の複合的な影響で推移します。
・算術平均に基づいた仮想的な収益推移は、複利効果を考慮せずに「平均的な成長率」を単純に適用するため、実際の最終的な収益よりも大きな値に到達してしまう傾向があります。
先ほどのグラフで、青色の点線(算術平均成長率に基づく収益推移)が、赤色の破線(幾何平均成長率に基づく収益推移)や黒色の実線(実際の年間収益)よりも最終的に高い位置にあったのは、このためです。算術平均は、あたかも現実よりも高い成長が継続したかのように収益を過大評価して表示してしまうのです。
対照的に、幾何平均は、各期間の成長率を乗算して平均を取るため、複利効果を正確に捉え、初期収益から最終収益までの実質的な平均成長率を正確に示します。そのため、幾何平均に基づいた収益推移は、必ず実際の最終収益と一致します。



