本記事は、企業のマーケティングにデータ分析を活用したいデータ分析初心者の方向けに、「回帰分析」という統計的手法で売上予測をする方法をわかりやすく説明しています。
「データ分析を業務に取り入れたいけれどやり方がわからない」
「私は文系出身だから統計やデータ分析はそもそも苦手」
と諦めかけてしまっている方への参考になれば嬉しいです。
では、始めましょう。そもそも、「回帰分析」という言葉、普段の生活では聞きなれないですよね。
でも、仕事をしながら「売上は広告費によってどれくらい変わるのだろう?」とか「花粉が飛ぶ日と飛ばない日でマスクの売れ行きはどうなるのかな?」と、ふと疑問に思うことはあるはずです。
このように「売上」と「広告費」、「花粉量」と「マスクの販売数」のような変数同士の関係を明らかにし、予測や意思決定に役立つのが回帰分析なのです。
そこで本記事では、回帰分析の基本概念から統計ソフトによる実践まで、初心者の方にもわかりやすく解説していきます。
1. 回帰分析とは?
回帰分析とは、「ある変数(説明変数)が他の変数(目的変数)にどの程度の影響を与えるか」を統計的に分析する手法です。
たとえば、次のような場面をイメージしてみてください。
説明変数(x) | 目的変数(y) | |
---|---|---|
マーケティング | 広告費 | 売上 |
不動産価格 | 築年数 | 住宅価格 |
資格の勉強 | 学習時間 | 試験の得点 |
上の例では、なんとなく説明変数(x)が大きくなれば、それにあわせて目的変数(y) も大きくなる気がしますよね。でも「なんとなく」や「気がする」では心もとないので、回帰分析(単回帰分析)を使って統計的に説明できると便利なわけです。
では、回帰分析の手始めにぴったりな「単回帰分析」から始めましょう。
2. 単回帰分析
1)単回帰分析とは?
「単回帰分析」は最もシンプルで基本的な回帰分析です。「1つの説明変数が目的変数にどのような影響を与えているか?」を分析する手法で、データの関係を直線で表します。
単回帰分析の回帰式は以下のようになります。
y=ax+b(+誤差項)
・y: 目的変数(例:売上)
・x: 説明変数(例:広告費)
・a: 回帰係数(広告費が売上に与える影響を示す数値)
・b: 切片[定数項] (広告費(説明変数)がゼロの時の売上(目的変数))
それでは、具体例で考えてみましょう!
2)単回帰分析の具体例
ある会社でマーケティングを担当する佐藤さんは、広告費が売上に与える影響を分析したいと考えていて、手元には以下のようなデータがあります。
広告費(万円) | 売上(万円) |
---|---|
10 | 100 |
20 | 180 |
30 | 250 |
40 | 320 |
50 | 400 |
このデータをもとに、統計ソフト「JMP(ジャンプ)」で単回帰分析を実行してみます。
JMPは30年以上の歴史を持つ操作性と可視化に優れた統計ソフトです。未体験の方は、30日間全機能を無料で試せるトライアル版があるので試してみてください(自動課金はされません)。
https://www.jmp.com/ja_jp/download-jmp-free-trial.html?utm_campaign=td&utm_source=facebook&utm_medium=social
また、資格のある学生、教職員、研究者の方は、JMP Proを無料で利用可能(12か月ごとに更新必要)です。
https://www.jmp.com/ja_jp/academic/jmp-student-edition.html?utm_campaign=ot&utm_source=facebook&utm_medium=social
3.JMPによる単回帰分析
1) データの準備
初めに、上の広告費と売上のデータをJMPに読み込みます(画面上の「ファイル」>「開く」)。ちなみに、JMPでは以下のように、非常に多くのファイル形式を読み込むことが可能です。

また、読み込む前にはプレビューできるので、事前にデータがJMPでどのように表示されるのか確認したり、シートの設定を調整することも可能です。

2)散布図の作成
回帰直線を引くにあたり、まずは散布図を描きます。
A. 画面上の「分析」>「二変量の関係」を選択。
B. 「X,説明変数」に「広告費」、「Y,目的変数」に「売上」を指定(ドラッグ&ドロップでも可)し、「OK」を押す。
すると、以下のような散布図が表示されます。

JMPでは、この「二変量の関係」による作図以外にも、変数をドラッグ&ドロップするだけで作図できる「グラフビルダー」という機能でも散布図を作成できます。
また、外れ値となるデータ点を除外する等してデータが変わった場合にはグラフが自動更新されたり、下のようにデータとグラフ(散布図行列)が連動してインタラクティブに解析できたりするので、JMPのグラフはデータの理解とインサイトの獲得に有益です。
3)回帰分析の実行
では、いよいよ回帰直線を引いてみましょう。
A. 左上の下向き赤三角ボタンを押し、「直線のあてはめ」を選択。
B. 先ほどの散布図に回帰直線が表示され、回帰式を含むレポートが表示される。

簡単ですよね!回帰直線を引くのはMicrosoft Excelや他の統計ソフトでもできますが、JMPなら回帰分析の詳細な結果(R2値、p値、誤差の標準偏差(RMSE)等)を同じウィンドウで確認して、データの可視化と解析を同時に行うこともできます。
4)回帰式の解釈
このレポートをもとに結果の分析を行いましょう。回帰式を見ると、「売上 = 28 + 7.4 x 広告費」とあります。ここで回帰係数は7.4なので、広告費を1万円増やすと売上は7.4万円増加するようです。
それでは、広告費をもっと増やしたら、売上は具体的にどれくらいになると予測できるのでしょうか。
たとえば、広告費を90万円に増加する場合、売上がいくらになるかJMPで見てみましょう。
5)JMPによる売上予測
ここでも操作は簡単です。
A. 「直線のあてはめ」左横の下向き赤三角ボタンから「プロファイル」を選択。

B. 新たに表示された「予測プロファイル」の「広告費(万円)」上の「30」を「90」に変更する。
すると、下のように広告費を90万円に設定すると、売上は凡そ「694万円」になると出力されました。

これくらい具体的に予測を立てられれば、マーケティング担当の佐藤さんとしては、広告費の予算を決める時に、上司や同僚を説得しやすくなりそうですね。
4. まとめ
回帰分析は、説明変数が目的変数にどの程度の影響を与えるかを分析するもので、売上等の予測に活用できる便利な統計的手法です。
初歩的な内容のこの記事を手始めに、実務でよく使われる重回帰分析等のより深い理解にチャレンジしてみてください!
他の統計的手法について、さらに詳しく知りたい方は以下のWebページもおすすめです。
【3分でざっくり理解】t検定とは?具体例で初心者にもわかりやすく
https://qiita.com/JMP_Japan/items/6538ae8a4c8261648159
【3分でざっくり理解】「一元配置分散分析」を分かりやすく解説
https://qiita.com/JMP_Japan/items/37cce43118b294a6e970
Statistics Knowledge Portal (t検定)
https://www.jmp.com/ja_jp/statistics-knowledge-portal/t-test.html?utm_campaign=bl&utm_source=JMPblog&utm_medium=social