#概要
この記事では、高頻度取引の世界でよく知られている(?)指標である、Probability of Informed Trading(PIN)について解説を行います。より実務的に有用な指標である、Volume-synchronized Probability of Iformed trading(VPIN)についても、別記事で解説を行う予定です。
#イントロダクション
少し前の記事のようですが、執行戦略や取引コストに関する研究についてまとめた文献である[1]によると、高頻度取引のモデルは以下のように分類できます。
こちらの分類に基づくと、PIN, VPINなどは情報モデルで出てくる指標であり、投資家間の情報の非対称性を表す量となっています。PINは元々Easleyらによるこちら論文[2]で発表されましたが、後述するようにパラメーターの推定が計算コストがかかるため、実際の高頻度取引に向かないという問題点などがありました。VPIN[3]は、推定量を出来高の情報を用いることでこちらの問題点を解消したものですが、ベースのモデルはPINのものと同じであるため、元のPINを理解しておくことはVPINを理解する上でも重要になります。
#モデル
以下、モデルを定義しますが、記号の定義はほぼ現論文[2]に合わせてあります。モデルは離散と連続時間のモデルを合わせたものになっています。トレーディングの日にちを$i=1, 2, \cdots, I$と表します。さらに、イントラデイでの時間を$t \in [0, T)$で表します。つまり、$i$は離散値、$t$は連続値になっています。
##ニュース
PINのモデルにおいて重要なことは二つあります。それはニュースの存在と、そのニュースの情報を知るInformed Trader(情報トレーダーと訳します)の存在です。ここで、ニュースの存在を以下に定義します。各日にちにおいて、独立に確率$\alpha$でニュースがあるとします。一方、確率$1- \alpha$でニュースはありません。さらに、ニュースのうち、確率$\delta$で悪いニュース、確率$1 - \delta$で良いニュースになるとします。ここで、ニュースとは、単なる確率変数として定義されているわけですが、具体的には例えば、株式銘柄であれば決算発表などがニュースとして該当すると考えられます。
また、$(V_i)^T_{i=1}$を日にち$i$における終値を表す確率変数であるとします。$V_i$自体のモデリングは、今回の議論には関係ありません。ただ、アセットに応じて適当にイメージをしておくと良いと思います(株であれば対数正規分布など)。さらに、良いニュースがあったときの終値(の期待値)を$\overline{V_i}$、悪いニュースの場合の期待値を$\underline{V_i}$、何もニュースがなかった場合の期待値を$V^*_i$と定義します。
論文中には記載がないですが、上のことは以下のように条件付き期待値で記述できます。日にち$i$のニュースを現す離散確率変数$N_i$を
$$
N_i(\omega) =
\begin{cases}
-1 & \omega = \mathrm{bad}, \
0 & \omega = \mathrm{nonews}, \
1 & \omega = \mathrm{positive}, \
\end{cases}
$$
として定義すると、
$$
\begin{align}
\overline{V_i} & \equiv \mathbb{E}[V_i | N_i = 1], \
{V_i}^* & \equiv \mathbb{E}[V_i | N_i = 0], \
\underline{V_i} & \equiv \mathbb{E}[V_i | N_i = -1] ,
\end{align} \tag{1}
$$
と表現できます。また、良いニュースがあった場合は、資産価格も上昇すると期待されるので、$ \underline{V_i} < V_i < \overline{V_i}$と仮定します。
##トレーダー
次に、トレーダーの定義を行います。トレーダーには、情報トレーダーと非情報トレーダーの2種類のトレーダーがいます。非情報トレーダーは、ニュースの有無によらず、rate $\epsilon$のポアソン過程にしたがって、BuyとSellの注文を独立に出します。一方、情報トレーダーはニュースがあるときに限り現れます。良いニュース($N_i = 1$)であれば、rate $\mu$のポアソン過程にしたがってBuyの注文を出します。これは、具体的には、トレーダーが何らかのオルタナティブデータをデータベンダーから買って、分析した結果、ある株式銘柄の業績がとても良いだろう(=良いニュースである)ということを、事前に知っているような状況が相当します。一方、悪いニュース($N_i = -1$)であれば、rate $\mu$でSellの注文を出します。以上のニュース、それに基づくトレーダーの行動をまとめると、以下のツリー・ダイアグラムが得られます(原論文[2]より転載)。
##マーケットメイカー
最後であり、主要な登場人物である、マーケットメイカーを定義します。物理をやっていた人向けに言えば、今回はマーケットメイカーが注目している部分系であり、トレーダーや原資産が環境であり、それら全てを含んだものが全体系というイメージです(※イメージなので厳密ではありません)。マーケットメイカーは、ニュースというものの存在を知っていますが、各日にちでどのニュースがあるのかは知りません。ある時刻$t$における、マーケットメイカーの(主観)確率を
$$
\mathbf{P}(t) \equiv (P_n(t),P_b(t), P_{g}(t) ) \tag{2}
$$
として定義します。ここで、$P_n(t),P_b(t), P_{g}(t)$はそれぞれ、ニュースのない確率、悪いニュースである確率、良いニュースである確率を表します。また、確率の定義より、$ \mathbf{P}(t) \cdot \mathbf{1}=1$および $\mathbf{P}(t) \geq 0$を満たします。$\mathbf{1}=(1,1,1)^t$は縦単位ベクトルです。マーケットメイカーの確率のダイナミクスは、各時刻における注文量に応じてベイズ的に更新されます。初期時刻において、確率は$\mathbf{P}(0) = (1-\alpha, \alpha \delta, \alpha (1 - \delta))$とします。
#PIN
##売買情報による事後確率
以上の設定のもと、マーケットメイカーはBitとAskを幾らのプライスで出すのが適切か?という問題を考えます。ここで、この後よく用いるポアソン過程に関する性質を説明します。rate $\epsilon$ のポアソン過程に従うイベントがあるとし、時刻$[0, T]$の間に発生するイベントの回数を(表す確率変数を)$N_T$とします。このとき、$n$回発生する確率$P(N_T=n)$は、
$$
P(N_T=n) =\frac{1}{n!}\left( \epsilon T\right) ^{n} e^{-\epsilon T}, \tag{3}
$$
とかけます。今、定常過程ですので、初期時刻によらずに、時間間隔のみに依存していることに注意してください。証明は適当に確率論の教科書を参照していただければと思います。式(3)より、$[t, t+ dt]$の微小時間において、1回イベントが来る確率は
$$
P(N_{dt}=1) = \epsilon dt, \tag{4}
$$
とかけます(右辺の指数関数をテイラー展開して、2次以上の項を無視すればでできます)。つまり、微小時間でイベントが起こる確率はrateに比例するというわけです(これが定義ともできます)。これはよくある注意ですが、確率と確率密度は異なります。確率密度は区間をかけあわせないと(積分しないと)、確率にはなりません。詳しくは、確率論の教科書を参照してください。
今、$S_t,B_t$を、時刻$t$(から$t+dt$の間)における売り、買いのイベントを表す確率変数とします。論文中で使われている定義をここではそのまま用いていますが、細かい注意点としては、$S_t$の下添字と、式(3)(4)の$N_T$の下添字では、意味が異なります。$N_T$では、時間"間隔"を添字としていましたが、論文中の$S_t$は時刻を添字としています。しかしながら、上では見たように、実際には時間間隔$dt$のみが確率を決定しています。ここで、式(4)を用いると、各ニュースで条件づけられた場合の、時間$t$(から$t+dt$の間)に売りが来る確率は、それぞれ
$$
\begin{align}
P(S_{t}| N_i = 0) &= \epsilon dt, \
P(S_{t}| N_i = -1) &= (\epsilon + \mu) dt, \tag{5} \
P(S_{t}| N_i = 1) &= \epsilon dt,
\end{align}
$$
とかけます。(5)の右辺は時刻$t$に依存しません。ここで、マーケットメイカーはベイズ的に確率を更新することを思い出します。式(5)を用いると、時刻$t$(から$t+dt$の間)で売りが来た場合に、ニュースが無いと考える事後確率$P_n(t|S_t)$は、
$$
\begin{align}
P_n(t|S_t) &= \frac{ P(S_t \cap N_i= 1|t)}{P(S_t|t)} \
&= \frac{P(S_{t} | N_i = 0)P_n(t)}{P(S_{t} | N_i = 0)P_n(t) +P(S_{t} | N_i = -1)P_b(t) + P(S_{t} | N_i = 1)P_g(t)} \
&= \frac{ \epsilon dt P_n(t)}{ \epsilon dt P_n(t) + (\epsilon + \mu) dtP_b(t) +
\epsilon dt P_g(t)} \
&= \frac{\epsilon P_n(t)}{ \epsilon + \mu P_b(t)} \tag{6}
\end{align}
$$
ここで、1行目はベイズの定理を用いていおり、右辺の$P(S_t|t)$は、$t$以前の全ての売買情報で条件づけられた場合に$S_t$が起こる確率を表します。3行目では式(5)を用いており、4行目では確率の性質$ \mathbf{P}(t) \cdot \mathbf{1}=1$を用いています。
全く同様にして、
$$
\begin{align}
P_b(t|S_t) &= \frac{ (\epsilon+ \mu) P_b(t)}{ \epsilon + \mu P_b(t)}, \tag{7} \
P_g(t|S_t) &= \frac{ \epsilon P_g(t)}{ \epsilon + \mu P_b(t)}, \tag{8}
\end{align}
$$
が得られます。
##Bid-Ask Spread
式(6)-(8)を用いると、売りのオーダーが来た場合に、時刻$t$でマーケットメイカーの出すべき、利益が期待値0のBit価格$b(t)$が計算できます。それは、時刻$t$においてマーケットメイカーの思う各イベント確率に、原資産価格の条件付き期待値(式(1))をかけあわせたものであり、
$$
\begin{align}
b(t) &= P_n(t|S_t) {V_i}^* + P_b(t|S_t)\underline{V_i} + P_g(t|S_t) \overline{V_i} \
&= \frac{\epsilon P_n(t) {V_i}^* + (\epsilon+ \mu) P_b(t) \underline{V_i} + \epsilon P_g(t)\overline{V_i}}{\epsilon + \mu P_b(t)}, \tag{9}
\end{align}
$$
となります。買いのイベント$B_t$が来た場合の、Askの価格$a(t)$も全く同様に計算でき、
$$
\begin{align}
P_n(t|B_t) &= \frac{ \epsilon P_n(t)}{ \epsilon + \mu P_g(t)}, \
P_b(t|B_t) &= \frac{ \epsilon P_b(t)}{ \epsilon + \mu P_g(t)}, \
P_g(t|B_t) &= \frac{ (\epsilon + \mu) P_g(t)}{ \epsilon + \mu P_g(t)},
\end{align}
$$
となるので、
$$
\begin{align}
a(t) &= \frac{\epsilon P_n(t) {V_i}^* + \epsilon P_b(t) \underline{V_i} + (\epsilon + \mu) P_g(t)\overline{V_i}}{\epsilon + \mu P_g(t)}, \tag{10}
\end{align}
$$
となります。式(9), (10)の意味をわかりやすくするため、時刻$t$の事前分布における期待値
$$
\mathbb{E}[V_t|t] = P_n(t) {V_i}^* + P_b(t) \underline{V_i} + P_g(t)\overline{V_i}
$$
を用いて式(9)、(10)を書き直すと、
$$
\begin{align}
b(t) &= \mathbb{E}[V_t|t] - \frac{ \mu P_b(t)}{\epsilon + \mu P_b(t)}(\mathbb{E}[V_t|t] - \underline{V_i}), \tag{11} \
a(t) &= \mathbb{E}[V_t|t] + \frac{ \mu P_g(t)}{\epsilon + \mu P_g(t)}(\overline{V_i} - \mathbb{E}[V_t|t]), \tag{12}
\end{align}
$$
となります。ここで、上式の表す意味を考えます。まず、情報トレーダーがいない場合($\mu=0$)の場合を考えます。このとき、BidとAskともに$b(t)=a(t)=\mathbb{E}[V_t|t]$となります。つまり、情報トレーダーがいなければ、ニュースがあろうがなかろうが、時刻$t$までのパスに条件づけられた期待値で価格を提示すれば、Lossは出ないわけです。一方、$\mu\neq 0$の場合、第二項が現れます。ここで、(6)の導出を振り返ると、式(11)における第二項の係数は、時刻$t$で売りがあった場合に、それが情報トレーダーによるものである確率を表していることがわかります。従って、情報トレーダーがいる場合には、時刻$t$の売りが情報トレーダーによる確率に比例して、Bidを(期待値0であるためにも)多少安めに価格を提示する必要があることを意味しています。Askの場合には、逆の議論が成り立ち、情報トレーダーによる買いである確率を加味して、少し高めに売値を出すことで、適正価格になることがわかります。
さらに、$\epsilon=0$あるいは$\mu \rightarrow \infty$の極限を考えると、$b(t) = \underline{V}_i, a(t) = \overline{V_i}$になります。つまり、この状況では全てのトレーダーは情報トレーダーなので、良い、悪いニュースで条件づけられた価格を時刻によらずに提示しない限り、期待値は負になることを意味しています。
式(11)と(12)より、Bid-Ask spread, $\Sigma(t)$, を計算すると、
$$
\begin{align}
\Sigma(t) &\equiv a(t) - b(t) \
&=\frac{ \mu P_b(t)}{\epsilon + \mu P_b(t)}(\mathbb{E}[V_t|t] - \underline{V_i}) + \frac{ \mu P_g(t)}{\epsilon + \mu P_g(t)}(\overline{V_i} - \mathbb{E}[V_t|t]), \tag{13}
\end{align}
$$
となります。上でのべた通り、各項の係数は、各売りと買いの注文が来た場合に、情報トレーダーによるものである確率を表します。
##PIN
以上を踏まえると、任意の注文が来た場合に、それが情報トレーダーによるものである確率(=Probability of Informed Trading)が、トレーダーとマーケットメイカーとの情報の非対称性を表す量と言えそうです。それは、(6)と同様に計算でき、
$$
\begin{align}
PI(t) &= \frac{\mu(P_b(t) + P_g(t))}{2 \epsilon + \mu(P_b(t) + P_g(t))} \
&=\frac{\mu(1 - P_n(t))}{2 \epsilon + \mu(1 - P_n(t))} \tag{14}
\end{align}
$$
となります。これは、式(13)の各第一、二項の係数に、注文が売りである条件付き確率、買いである条件付き確率をかけあわせ、和をとったものになります。ここで、特に$\delta=0.5$の場合を考えます、これは、つまり初期時刻でマーケットメイカーが良いニュースと悪いニュースが等確率で起こると考えている場合に相当し、自然な仮定と言えます。このとき、初期時刻における$PI(0)$は
$$
PI(0) = \frac{ \mu \alpha}{\mu \alpha + 2 \epsilon}
$$
と、単純なものになります。これが、通称PINと呼ばれるもので、(14)は時刻$t$における一般的な表式になります。
#パラメーター推定
最後に、尤度関数を用いたモデルパラメーターの推定について説明します。今回のモデルのパラメーターは$\theta = (\alpha, \delta, \epsilon, \mu)$になります。今、ある日にちに合計$S$、$B$の売りと買いがあったと仮定します。このとき、式(3)より、尤度$L(B, S) |\theta)$は
$$
\begin{align}
L(B, S) |\theta) &= (1 - \alpha) \frac{(\epsilon T)^B}{B!} e^{- \epsilon T} \frac{(\epsilon T)^S}{S!} e^{- \epsilon T} \
& + \alpha \delta \frac{( \epsilon T)^B}{B!} e^{- \epsilon T} \frac{((\epsilon + \mu) T)^S}{S!} e^{- (\epsilon + \mu) T} \
&+ \alpha (1 - \delta) \frac{( (\epsilon + \mu) T)^B}{B!} e^{- (\epsilon + \mu) T} \frac{(\epsilon T)^S}{S!} e^{- \epsilon T}
\end{align}
$$
とかけます。各項の意味は、それぞれ順番にニュースがない場合、良いニュースが出た場合、悪いニュースが出た場合に売りが$S$,買いが$B$発生する確率になっています。さらに、$I$日に渡るデータがある場合には、
$$
L(I |\theta) = \prod_{i=1}^I L(B_i, S_i) |\theta)
$$
と尤度はかけます。従って、上記の式を最大化(あるいは負の対数尤度を最小化)するような、パラメーターの組み合わせを探索すれば良いということになります。
しかしながら、こちらの推定は計算時間がかかるため、各時刻ごとに売買データが追加されていく、実際の高頻度取引には向きません。その問題点を、出来高の情報を用いて解消したものが、VPINになります。
#まとめ
今回の記事では、トレーダーとマーケットメイカーの情報の非対称性を表す量として有名なPINについて解説を行いました。多少長くなってしまいましたが、1行ずつ数式を追いながら解説を行ったので、読みながら手を動かして追える形になっているはずです(もし分からない箇所、怪しい箇所があったら遠慮なくご指摘下されば幸いです)。
どういったモデルや仮定のもと、PINが計算されるのか、詳しく知りたい方に役立てば幸いです。次は、VPINの解説を行う予定です。
#参考文献
[1] 杉原慶彦(2012), 執行戦略と取引コストに関する研究の進展
[2] Easley, David, et al. "Liquidity, information, and infrequently traded stocks." The Journal of Finance 51.4 (1996): 1405-1436.
[3] Easley, David, Marcos M. López de Prado, and Maureen O'Hara. "Flow toxicity and liquidity in a high-frequency world." The Review of Financial Studies 25.5 (2012): 1457-1493.