0
4

機械学習で株価分析 05.銘柄一覧データの取得

Last updated at Posted at 2023-12-17

はじめに

本記事では、TOPIX Core30 の構成銘柄一覧をデータフレーム形式で取得する方法を紹介します。

手順

1. TOPIX構成銘柄一覧のダウンロード

日本取引所グループの公式ホームページ(2023/12/17参照)から、TOPIXの構成銘柄の一覧をCSV形式でダウンロードします。ページ中の「構成銘柄別ウエイト一覧」が該当ファイルです。ダウンロードしたファイルは、Google Drive内の任意のフォルダに保存します。

2. データフレーム形式で銘柄コード一覧を保存

以下のコードを実行することで、データフレーム形式で銘柄コード一覧を保存・表示できます。なお、csvファイルから銘柄データ一覧を読み込む際には、ご自身で該当ファイルまでのパスを指定してください。

# ライブラリのインポート
import numpy  as np
import pandas as pd
from   pandas_datareader import data
from   IPython.display   import display
from   google.colab      import drive
drive.mount('/content/drive', force_remount=True)

# csvファイルから銘柄データ一覧を読み込み
data_csv = pd.read_csv("/content/drive/MyDrive/"自身のパスを指定"/topixweight_j.csv", encoding="shift-jis")

# topixCore30銘柄を抽出
data_topix30 = data_csv[["銘柄名","コード","ニューインデックス区分"]]
data_topix30 = data_topix30[(data_topix30['ニューインデックス区分'] == "TOPIX Core30")]
data_topix30["コード"] = data_topix30["コード"].astype(str).str[:4]

# 行・列のラベルを編集
data_topix30 = data_topix30.reset_index(drop=True)
data_topix30 = data_topix30.rename(columns={'銘柄名':'name', 'コード':'code', 'ニューインデックス区分':'new_index'})

# 結果を表示
display(data_topix30)

プログラムを実行すると、Google Driveへのアクセス許可を求められますので許可します。その後コンソール上に取得したデータが表示されれば成功です。

目次へのリンク

0
4
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
4