LoginSignup
19
20

More than 3 years have passed since last update.

全上場企業の過去5年間の決算情報から機械学習で業績予想

Posted at

はじめに

金融庁のEDINETというサイトから得た決算情報について、これまで2つ記事を書きました。

今回は前回作った決算情報のCSVファイルから機械学習で業績予想をしてみました。

機械学習は以下の手法を使いました。
* リッジ回帰
* サポートベクターマシン
* ランダムフォレスト
* XGBoost
* LightGBM
* CatBoost
* 全結合NN(ニューラルネットワーク)
* LSTM

EDINETからは5年分(5期分)の決算情報を得られます。

LSTMでは、過去4期分のデータから5期目の業績を予測しました。
LSTM以外では、前期と今期のデータから次期の予測をしました。

※ 有価証券報告書は決算日から3ヵ月くらいあとに提出されます。
  最新の決算書の決算日は2019年末なので決算情報に新型コロナウイルスの影響は入っていません。

以下の項目の業績予想をしました。
* 売上高
* 営業利益     = 売上高 - 原価 - 販管費
* 経常利益     = 営業利益 + 営業外損益
* 税引前純利益 = 経常利益 + 特別損益

上から順に不確定要素が増えるので、予想は難しくなります。

業績予想は次期の変化率を予測します。
つまり、売上高などが次期にどれだけ増えるかの予測です。

結論を先に言いますと、売上高の予測はある程度できますが、それ以外については結構むつかしいです。

売上高の予測

以下はLightGBMによる売上高の次期変化率の正解と予測を散布図にプロットしたものです。
売上高.png

変化率は平均0、標準偏差1に正規化しています。

正解の最小値と最大値の部分で縦に点が密集していますが、これは正解値の5%と95%でクリッピングしたためです。

このグラフを見ると、正解の値が大きい点は予測の値も大きい傾向があり、ある程度予測ができていることがわかります。

以下はLightGBMが計算した特徴量の重要度を高い順に並べたリストです。

特徴量の重要度
  1   5500 従業員数変化率
  2   4700 総資本回転率変化率
  3   3200 売上高変化率
  4   3100 受取手形及び売掛金変化率
  5   3100 流動負債変化率
  6   2100 その他、流動資産変化率
  7   1900 現金及び預金変化率
  8   1900 総資産額変化率
  9   1800 売上高総利益率
 10   1700 個別期首期末平均資産変化率

ここでの変化率は前期から今期への変化率です。
9位の売上高総利益率は変化率ではなく、今期のいわゆる粗利率です。

従業員数変化率がトップというのが少しおもしろいと思いました。
来期に売上高が伸びそうと思った会社は、今期のうちに従業員を増やすみたいです。

税引前純利益の予測

以下はCatBoostによる税引前純利益の次期変化率の正解と予測を散布図にプロットしたものです。
税引前純利益.png
売上高の場合のような右上がりの相関はあまり見らせません。
ただ、予測値が0.02以上の部分では正解の値はグラフの右に偏在しているように見えます。

同じデータで予測値が0.02以上の部分の散布図を作ってみました。
税引前純利益-部分.png
多くの点がグラフの中央よりも右にあります。

企業の業績予想を元に株式投資をする場合、全企業の業績予想が正確にできる必要はなく、業績がよさそうな企業のグループさえつかめればよいです。

例えば、予測値が0.02以上の企業のうち10社に投資した場合、1社や2社は業績が悪くても残りの会社の業績が良ければ、全体として利益が出る確率は高そうです。

ここから先はわたしもよく分かってない現代ポートフォリオ理論の話ですが、ある企業のグループの利益の期待値と分散が分かれば、高い確率で利益が出せるんじゃない?ということです。

実行方法

アプリはGoogle Colaboratoryのノートブックで実行できます。
ColaboratoryのランタイムのタイプはGPUなしでかまいません。

処理1 をしなくても、処理2処理3 は実行できますが、自分で財務指標などを追加したい場合は処理1のノートブックを修正する必要があります。

アプリのソースは前回の記事と同じGitHubに入っています。
https://github.com/teatime77/xbrl-reader

これまでの記事の内容を含めた全体の説明が以下にあります。
http://lkzf.info/xbrl/doc

おわりに

もともとはわたしが機械学習を勉強するためのテストデータとしてXBRLから決算情報を得ようとしたのが始まりでした。
今後は機械学習をはじめて学ぶ人でもわかるようなドキュメントを作っていきたいと思います。

まちがいなどがあれば、コメント欄に書かれるかTwitterに連絡をしていただければ助かります。
Twitterでアプリの更新のお知らせもしていきます。
Twitter_Logo_White_On_Blue20.png teatime77

ここまで読んでいただき、ありがとうございました。

19
20
2

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
19
20