はじめに
本記事では、TOPIX Core30 の構成銘柄一覧をデータフレーム形式で取得する方法を紹介します。
手順
1. TOPIX構成銘柄一覧のダウンロード
日本取引所グループの公式ホームページ(2023/12/17参照)から、TOPIXの構成銘柄の一覧をCSV形式でダウンロードします。ページ中の「構成銘柄別ウエイト一覧」が該当ファイルです。ダウンロードしたファイルは、Google Drive内の任意のフォルダに保存します。
2. データフレーム形式で銘柄コード一覧を保存
以下のコードを実行することで、データフレーム形式で銘柄コード一覧を保存・表示できます。なお、csvファイルから銘柄データ一覧を読み込む際には、ご自身で該当ファイルまでのパスを指定してください。
# ライブラリのインポート
import numpy as np
import pandas as pd
from pandas_datareader import data
from IPython.display import display
from google.colab import drive
drive.mount('/content/drive', force_remount=True)
# csvファイルから銘柄データ一覧を読み込み
data_csv = pd.read_csv("/content/drive/MyDrive/"自身のパスを指定"/topixweight_j.csv", encoding="shift-jis")
# topixCore30銘柄を抽出
data_topix30 = data_csv[["銘柄名","コード","ニューインデックス区分"]]
data_topix30 = data_topix30[(data_topix30['ニューインデックス区分'] == "TOPIX Core30")]
data_topix30["コード"] = data_topix30["コード"].astype(str).str[:4]
# 行・列のラベルを編集
data_topix30 = data_topix30.reset_index(drop=True)
data_topix30 = data_topix30.rename(columns={'銘柄名':'name', 'コード':'code', 'ニューインデックス区分':'new_index'})
# 結果を表示
display(data_topix30)
プログラムを実行すると、Google Driveへのアクセス許可を求められますので許可します。その後コンソール上に取得したデータが表示されれば成功です。
目次へのリンク