元記事:https://www.octoparse.jp/blog/scraping-stock-prices/
2020年1月に中国で感染が報告された新型コロナウィルス(COVID-19)は、世界に蔓延し、3月中旬には他国の感染者数が中国の感染者数を追い抜きました。各国で外出制限等が行われ、金融市場は大きく動き、実体経済も多くの国で大きく落ち込みました。新型コロナウイルスのパンデミックを受けて、株式市場の大幅な下落も生じています。
この記事では、1月から4月までの日経平均株価をスクレイピングしようと思います。今回はYahoo!ファイナンスのWebサイトの公開しているデータを利用します。以下URLで、日経平均株価データ過去4ヶ月分を参照できます。
それでは、始めましょう!
#データ収集
PythonやAPIなどで株価データをスクレイピングすることがよくありますが、Pythonだと作業が複雑になり、無料API情報も持ってないので、今回はスクレイピングツールであるOctoparseを使います。
最新バージョンの8.1版はWebページの自動認識機能が備え、先のURLを入力するだけで、肝心なデータが検出され、実行すると、すばやく抽出できます。
Pythonなどは割と高速ですが、過去1年以上の時系列データをスクレイピングしようとするとやはり時間がかかります。株価分析したい時、大量のデータを解析したい場合は、やはりOctoparseなどのスクレイピングツールでデータ収集するのが最も効率的だと思います。しかもハンズフリーでデータをスクレイピングできるのは素人にもやさしいですね。
以下は取得したデータです。整理することもなく、完璧なデータフォーマットです。
#データ分析
今回はデータも取得したので、公式のものほど完璧ではありませんが、Excelで株価のグラフを作ってみました。
グラフに見れば、日経平均株価は2/21の23,386.74円から暴落が続いて、3/19に目先の底値16,552.83円を付けました。日銀による買い支えもあって目先戻り基調となり、3/25には戻り高値19,546.63円まで戻しました。4/1には18,065.41円まで下げたが、今では、暴落はいったん下げ止まり、しかも徐々に上げています。
新型コロナウイルス感染症の流行拡大による混乱により、日本だけでなく、世界各国の株式市場も下落が続いています。アメリカ株式市場でも、3月9日、12日、16日の取引で寄り付き直後にS&P500種株価指数が7%を超える下落となり、取引が15分間停止されるサーキットブレーカーが発動されました。この措置が発動されたのは1997年以来です。
#まとめ
過去、株式市場は何度も、様々な理由で急落を繰り返してきましたが、今回の新型コロナウイルスの世界的な感染拡大については、工場の生産能力の低下、サプライチェーンや交通網の遮断など供給面での影響(供給ショック)への懸念が株価の下落に繋がりました。グローバル化が進んだから、どこかの国で新型コロナウィルスの影響が続けば、それが他国の経済活動に影響し、それだけに厳しい局面が続きそうと思います。
いずれにしても、一刻も早く事態が収束し、新型コロナウィルス危機を乗り越えられるよう望んでいます。