#1. 記事の目的
「ファイナンス機械学習」の輪読メモを残す。輪読内容については、まずは文章の目的の理解に特化することにより内容を大まかに理解する。(方法についての深入りするのは次のステップとする。)また本を理解すると何ができるようになるのかを明確にする。
#2. 内容
「ファイナンス機機械学習」2章の構成を紹介する。
第2章 金融データの構造
節番号 | タイトル | 参照情報 |
---|---|---|
2-1 | はじめに | |
2-2 | 金融データの基本形式 | |
2-3 | バー | 資料1,資料2 |
2-4 | マルチプロダクト(資産構成による商品)の取扱い | (1)Data Structure |
2-5 | 特徴量サンプリング |
2-1. はじめに
本節の要約
非構造化金融データを機械学習アルゴリズムの利用に適した構造化データセットへ変換する方法を学習する。
言葉の定義
・非構造化金融データ
定型化された行列を持たないデータ群のこと。加工されていないデータと考えてもよい。例えば素の取引データやSNS情報など(参考資料: 非構造化データとは何か )
2-2. 金融データの基本形式
本節の要約
金融データの基本形式は、ファンダメンタルデータ、市場データ、アナリティクス、オルタナティブデータの4つが存在する。
言葉の定義
・オルタナティブデータ
政府や企業が公式に発表する統計データや決算データとは異なり、IoT(Internet of Things)機器や衛星画像、SNS(Social Network Service)などから得られる「非伝統的なデータ」を指す。(参考資料: 【基礎解説】オルタナティブデータを知るための4つのポイント )
2-3. バー
本節の要約
標準バー方式と情報ドリブンバー方式が存在する。標準バー方式は一般的であるが、情報ドリブンバー方式の方が、拡張的な理論構成ができるため現場では好まれる。
★標準バー方式
標準バー方式は、「測定量」があらかじめ決められたしきい値を超えたら、OHLCVから構成される行を作る方式を示す。
ティックバーの場合は、「測定量」はティックとなる。
ボリュームバーの場合は、「測定量」は出来高となる。
ドルバーの場合は、「測定量」は売買代金となる。
★情報ドリブンバー方式
情報ドリブンバー方式は、「測定量」が過去のデータから動的に算出されるしきい値を超えたタイミングで、OHLCVから構成される行を作る方式を示す。
ティックバーインバランスバーの場合は、「測定量」はティックとなる。
ボリュームインバランスバーの場合は、「測定量」は出来高となる。
ドルインバランスバーの場合は、「測定量」は売買代金となる
言葉の定義
・バー
テーブルの行のことを言う。
・ティック
取引のことを言う。
・確率変数$X$の期待値$E[X]$の定義
確率変数$X$は離散的な値$x_{1},x_{2},...x_{n}$をとる場合、確率変数$X$の期待値$E[X]$は
$E[X]=\sum_{i=1}^{n} x_{i}P(X=x_{i})$
となる。
・条件付き期待値 $E[X|A]$
事象Aが発生した条件での確率変数Xの期待値は、
E[X|A]=\frac{E[X,A]}{P(A)}
2-4. マルチプロダクト(資産構成による商品)の取扱い
本節の要約
言葉の定義
・スプレッド取引[出典先リンク]
相関関係の強い銘柄の価格差を利用して利益を得る取引方法。相関関係の強い銘柄は一時的に価格差が開くことがあるが、いづれは価格差は収束する特性を利用している。
例えば、
[1]NT倍率が12倍まで低下。日経平均とTOPIXの価格差が今後拡大すると予想してNT買いを注文。(NT倍率12倍 日経225先物 20,400円買い, TOPIX先物 1,700ポイント売り)[2]予想通り日経平均とTOPIXの価格差が12.5倍まで拡大したので決済。
(NT倍率12.5倍 日経225先物 21,500円売り TOPIX先物 1,720ポイント買い)★★ 損益計算 ★★
損益(1枚) 日経225先物 (21,500-20,400) × 1枚 × 1,000 =1,100,000円
TOPIX先物 (1,700-1,720) × 1枚 × 10,000 = -200,000円
合計損益 +900,000円
・バスケット取引 [出典先リンク]
多数の銘柄をまとめてバスケット(=かご)に入った1つの商品とみなして売買する取引。
一般的には15銘柄以上かつ1億円以上の大口の取引でおこなわれ、大口の投資家がまとまった銘柄を買いたい(売りた>い)時に証券会社が執行コスト分を上乗せ(コスト分を割引)して売りむかう(買いむかう)ことにより約定をおこなう。
・先物取引 [出典先リンク]
たとえば「日経平均先物取引」の場合、日経平均株価をSQ日に約定価格で売買することを約束すること。
SQ日前に日経平均が24000円だったとします。ここでSQ日前に、「SQ日当日に日経平均を24000円でAさんが買い取>りは、Bさんに売る約束」を行います。
(パターン1 下落パターン) 実際SQ日に、日経平均が23000円になった場合、Aさんは23000円で日経平均を入>手でき、Bさんに24000円で売却できる。(Aさんは、+1000円の利益, Bさんは-1000円の損失になる。)
(パターン2 上昇パターン) 実際SQ日に、日経平均が25000円になった場合、Aさんは25000円で日経平均をせざるを得なく、Bさんは24000円で購入できる。(Aさんは、-1000円の利益, Bさんは+1000円の損失になる。)
・限月 [出典先リンク]
限月は、「期限の月」の略称で、期限が満了となる月(最終決済月)のことをいいます。これは、株価指数や国債証>券、金利、商品などの取引所の先物・オプション取引において使われる用語で、例えば、12月に期限が満了となるもの>は「12月限(ぎり)」と言います。また、取引所に上場された限月のものを売買することを「限月取引」と言います
・ロールオーバー [出典先リンク]
例えば、日経平均先物取引で「買いポジションの期日が近づいているが、ポジションを維持したい」といった場合に、買いポジションをいったん決済して、それより期日が先の先物を買うというよう取引のこと