More than 1 year has passed since last update.

機械学習で株価分析 05.銘柄一覧データの取得

Last updated at 2023-12-18Posted at 2023-12-17

はじめに

本記事では、TOPIX Core30 の構成銘柄一覧をデータフレーム形式で取得する方法を紹介します。

手順

1. TOPIX構成銘柄一覧のダウンロード

日本取引所グループの公式ホームページ（2023/12/17参照）から、TOPIXの構成銘柄の一覧をCSV形式でダウンロードします。ページ中の「構成銘柄別ウエイト一覧」が該当ファイルです。ダウンロードしたファイルは、Google Drive内の任意のフォルダに保存します。

2. データフレーム形式で銘柄コード一覧を保存

以下のコードを実行することで、データフレーム形式で銘柄コード一覧を保存・表示できます。なお、csvファイルから銘柄データ一覧を読み込む際には、ご自身で該当ファイルまでのパスを指定してください。

# ライブラリのインポート
import numpy  as np
import pandas as pd
from   pandas_datareader import data
from   IPython.display   import display
from   google.colab      import drive
drive.mount('/content/drive', force_remount=True)

# csvファイルから銘柄データ一覧を読み込み
data_csv = pd.read_csv("/content/drive/MyDrive/"自身のパスを指定"/topixweight_j.csv", encoding="shift-jis")

# topixCore30銘柄を抽出
data_topix30 = data_csv[["銘柄名","コード","ニューインデックス区分"]]
data_topix30 = data_topix30[(data_topix30['ニューインデックス区分'] == "TOPIX Core30")]
data_topix30["コード"] = data_topix30["コード"].astype(str).str[:4]

# 行・列のラベルを編集
data_topix30 = data_topix30.reset_index(drop=True)
data_topix30 = data_topix30.rename(columns={'銘柄名':'name', 'コード':'code', 'ニューインデックス区分':'new_index'})

# 結果を表示
display(data_topix30)

プログラムを実行すると、Google Driveへのアクセス許可を求められますので許可します。その後コンソール上に取得したデータが表示されれば成功です。

目次へのリンク

You get articles that match your needs
You can efficiently read back useful information
You can use dark theme

What you can do with signing up