はじめに
本記事では、古典情報を量子状態を使って送信するという状況で非常に重要な、量子状態識別問題をSDPとして扱います。SDPの基本は以下にまとまっています。
参考文献
量子状態識別問題の一般論がこの3章にまとまっています。
[1] Watrous, The Theory of Quantum Information (Cambridge University Press, Cambridge, UK, 2018).
2量子状態識別問題はSDPを使う必要はなく、Holevo-Helstromの定理([1]のTheorem 3. 4、[2,3]がオリジナル)が解析解を与えています。
[2] C. W. Helstrom, Detection theory and quantum mechanics, Inform. Control, 10, 254 (1967).
[3] A. S. Holevo, Analog of a theory of statistical decisions in a noncommutative theory of probability, Tr. Mosk. Mat. Obs. 26, 133 (1972).
以下も非常に勉強になります。4章に量子状態識別の問題があります。
[4] P. Skrzypczyk and D. Cavalcanti, Semidefinite Programming in Quantum Information Science (IOP Publishing, Bristol, UK, 2023), pp. 2053–2563.
本記事は[1]や[4]を読んで学んだことを踏まえて、自分なりに説明や数式を補っています。
表記
| 表記 | 意味 |
|---|---|
| $\mathscr S(\mathrm{A})$ ($\mathscr S$は花文字のS) | 量子系$\mathrm{A}$の量子状態を表現する「密度演算子」の集合。すなわち、$\mathscr S(\mathrm A):=\{\rho_\mathrm{A}\in\mathcal L_{\mathrm{Her}}(\mathcal H_\mathrm{A});\rho_\mathrm{A}\succeq 0_\mathrm{A},\mathrm{Tr}\rho_\mathrm{A}=1\}$ |
| $\mathscr C(\mathrm{A}\to\mathrm{B})$ ($\mathscr C$は花文字のC) | 量子系$\mathrm{A}$から量子系$\mathrm{B}$への「量子通信路」の集合。すなわち、$\mathscr C(\mathrm{A}\to\mathrm{B}):=\{\Phi_{\mathrm{A}\to\mathrm{B}}\in \mathscr T(\mathrm{A}\to\mathrm{B});\Phi_{\mathrm{A}\to\mathrm{B}}は\text{CPTP}写像\}$ |
| $\mathsf E^\mathcal{X}_\mathrm{A}$ (サンセリフの大文字) | 量子系$\mathrm{A}$における、測定値の集合$\mathcal{X}$を伴う「正作用素値(POVM)測定」。 |
| $\mathscr M^\mathcal X_\mathrm{A}$ | 量子系$\mathrm{A}$における、測定値の集合$\mathcal X$を伴うPOVM測定の集合。すなわち、$\mathscr M^\mathcal X(\mathrm{A}):=\{\mathsf E^\mathcal X_\mathrm A;\text{POVM}\}$ |
量子状態識別問題(測定固定)
ここの話は少し長いので、状態識別問題が何かご存知の方は次の章に飛んでください。
アンサンブル
古典的なメッセージ集合$\mathcal X$上の確率変数$X$を考え、その実現値を$x\in\mathcal X$、$x$を得る確率を$p_X(x)$、このような確率分布を$p_X$と書くことにします。
以下のような状況を考えましょう。この確率分布に従って$x$に対応する量子状態$\rho^x_\mathrm{A}\in \mathscr S(\mathrm{A})$を出力する機械があります。こういう状況を「アンサンブル」といって
\mathcal E^\mathcal X_\mathrm{A}:=\{p_X(x);\rho^x_\mathrm A\}_{x\in\mathcal X}
と表記します。
識別成功確率の計算
次に、アンサンブルの量子状態に対し、POVM$\mathsf E^\mathcal Y_\mathrm A:=\{E^y_\mathrm A\}_{y\in\mathcal Y}\in\mathscr M^\mathcal Y(\mathrm A)$で測定します。最後に、$p(\hat{x}|y)$という条件付き確率に従って古典事後処理をして、$\hat{x}\in\mathcal X$を$x$の推定値として出力します。$\hat{X}$は推定されたメッセージに対応する確率変数で、対応するメッセージ集合は$X$と同じく$\mathcal X$です。推定に成功するとは、$\hat{x}=x$となることです。
以下では、アンサンブル$\mathcal E^\mathcal X_\mathrm{A}$に対してPOVM$\mathsf E^\mathcal Y_\mathrm A$を施し、事後処理$p_{\hat{X}|Y}$を行ったときの識別成功確率
p_\mathrm{guess}(\mathcal E^\mathcal X_\mathrm{A},\mathsf E^\mathcal{Y}_\mathrm{A},p_{\hat{X}|Y}):=p(\hat{X}=X)
を順番に考えていきましょう。$x$が出たもとで、測定値$y$を得る条件付き確率$p_{Y|X}(y|x)$は、Born則に従って$\mathrm{Tr}[E^y_\mathrm A\rho^x_\mathrm A]$です。$x$が出たもとで$\hat{x}$を得る確率は$\sum_{y\in\mathcal Y}p_{\hat{X}|Y}(\hat{x}|y)p_{Y|X}(y|x)$です。最後に、各$x$は確率$p_X(x)$で出現するのでこれで平均するのですが、推定に成功しているのは$\hat{x}=x$なので、$\delta_{x\hat{x}}$をかけて平均することで、推定成功確率が計算できます。
\begin{align}
p_\mathrm{guess}(\mathcal E^\mathcal X_\mathrm{A},\mathsf E^\mathcal Y_\mathrm A,p_{\hat{X}|Y})&=\sum_{x\in\mathcal X}p_X(x)\delta_{x\hat{x}}\sum_{y\in\mathcal Y}p_{\hat{X}|Y}(\hat{x}|y)p_{Y|X}(y|x)\\
&=\sum_{x\in\mathcal X}p_X(x)\delta_{x\hat{x}}\sum_{y\in\mathcal Y}p_{\hat{X}|Y}(\hat{x}|y)\mathrm{Tr}[E^y_\mathrm A\rho^x_\mathrm A]\\
&=\sum_{x\in\mathcal X}p_X(x)\mathrm{Tr}\left[\left(\sum_{y\in\mathcal Y}p_{\hat{X}|Y}(x|y)E^y_\mathrm A\right)\rho_\mathrm A\right]
\end{align}
4行目はトレースの線形性を利用しています。ここで、新しく次のような演算子を定義します。
\tilde{E}^x_\mathrm A:=\sum_{y\in\mathcal Y}p_{\hat{X}|Y}(x|y)E^y_\mathrm A
これから構成される
\tilde{\mathsf E}^\mathcal X_\mathrm{A}:=\{\tilde{E}^x_\mathrm A\}_{x\in\mathcal X}
がPOVM測定になっていることを確認しましょう。$\tilde{E}^x_\mathrm A\succeq 0_\mathrm A$は明らかです。また、
\sum_{x\in\mathcal X}\tilde{E}^x_\mathrm A=\sum_{x\in\mathcal X}\sum_{y\in\mathcal Y}p_{\hat{X}|Y}(x|y)E^y_\mathrm A=\sum_{y\in\mathcal Y}E^y_\mathrm A=I_\mathrm{A}
です。よって確認できました。
さて、以上より
p_\mathrm{guess}(\mathcal E^\mathcal X_\mathrm{A},\mathsf E^\mathcal{Y}_\mathrm{A},p_{\hat{X}|Y})=\sum_{x\in\mathcal X}p_X(x)\mathrm{Tr}[\tilde{E}^x_\mathrm A\rho^x_\mathrm A]
が得られます。こうなるともはやわざわざ$\mathcal X$とは違う測定値の集合を持つPOVMを考えたり、事後処理を考えたりする必要もなくなっています。ですので、以下では識別成功確率を次のように記載することにしましょう。表記が長いと大変なので、状態$\rho^x_\mathrm A$が出現する確率$p_X(x)$を$p_x$と書いてます。
p_\mathrm{guess}(\mathcal E^\mathcal X_\mathrm{A},\mathsf E^\mathcal{X}_\mathrm{A}):=\sum_{x\in\mathcal X}p_x\mathrm{Tr}[E^x_\mathrm A\rho^x_\mathrm A].
量子状態識別問題(測定で最適化バージョン)
アンサンブル$\mathcal E^\mathcal X_\mathrm{A}:=\{p_x;\rho^x_\mathrm A\}$をPOVM $\mathsf E^\mathcal X_\mathrm A:=\{E^x_\mathrm A\}_{x\in\mathcal X}$で識別に成功する確率は以下のようになるのでした。
p_\mathrm{guess}(\mathcal E^\mathcal X_\mathrm{A},\mathsf E^\mathcal{X}_\mathrm{A}):=\sum_{x\in\mathcal X}p_x\mathrm{Tr}[E^x_\mathrm A\rho^x_\mathrm A].
これは$\mathsf E^\mathcal{X}_\mathrm{A}$で測定した場合の識別成功確率を考えてますが、自然と気になるのは以下のようなことです。
- POVM測定全体で最適化したら、識別成功確率の最大値はどうなるのか?
- 最適なPOVM測定はどのようにあたえられるか?
状態が2つの場合はHolevo-Helstromの定理(Theorem 3.4 in [1])によって最適POVMと最適値の解析解がわかっています。しかし、一般のケースでは解析解は知られていません。なので最適化の出番です。
目標は次を計算することです: 与えられたアンサンブル$\mathcal E^\mathcal X_\mathrm{A}:=\{p_X(x);\rho^x_\mathrm{A}\}$に対して、
p_\mathrm{guess}(\mathcal E^\mathcal X_\mathrm{A}):=\max_{\mathsf E^\mathcal{X}_\mathrm{A}\in\mathscr M^\mathcal X_\mathrm A}p_\mathrm{guess}(\mathcal E^\mathcal X_\mathrm{A},\mathsf E^\mathcal{X}_\mathrm{A}).
目的関数が定義できました。
以降はPOVMで最適化という部分を明示的に書いた、以下の問題をベースに議論を進めます。
\begin{align}
\underset{E^x_\mathrm A}{\text{Maximize}}\quad & \sum_{x\in\mathcal X}p_x\mathrm{Tr}[E^x_\mathrm A\rho^x_\mathrm A]\\
\text{subject to} \quad & \sum_{x\in\mathcal X}E^x_\mathrm{A}=I_\mathrm{A}\\
\quad &E^x_\mathrm{A}\succeq 0_\mathrm{A}\quad(\forall x\in\mathcal X).
\end{align}
制約はまさにPOVMで最適化するということを言っていて、1つ目はPOVM要素を全部足すと恒等演算子という完全性、2つ目はPOVM要素は半正定値演算子ということです。
これはSDPなの?
結論を言うとこれはSDPなのですが、以下のSDPの標準形(前の記事)と見比べると、形はちょっと違いますよね。
\begin{align}
\underset{X_\mathrm{A}}{\text{Maximize}}\quad &\mathrm{Tr}[J_\mathrm A X_\mathrm A]\\
\text{subject to}\quad &\Phi_{\mathrm{A}\to\mathrm{B}}(X_\mathrm A)=K_\mathrm B\\
\quad &X_\mathrm A\succeq 0_\mathrm A.
\end{align}
標準形は、変数は$X_\mathrm A$だけで、等式と不等式制約が一つずつです。一方、量子状態識別の場合は、$E^x_\mathrm A$全部半正定値という形で標準形とはちょっと違います。目的関数の形も違います。ところが[1]に従って、
\begin{align}
X_{\mathrm X\mathrm A}&:=\left(
\begin{array}{ccc}
E^1_\mathrm A & 0_\mathrm A &\cdots\\
0_\mathrm A & E^2_\mathrm A & \cdots\\
\vdots & \vdots & \ddots
\end{array}
\right)=\sum_{x\in\mathcal X}|x\rangle\langle x|_\mathrm{X}\otimes E^x_\mathrm A\\
\Phi_\mathrm{XA\to A}&:=\mathrm{Tr}_\mathrm{X}\\
J_{\mathrm{XA}}&:=\left(
\begin{array}{ccc}
p_1\rho^1_\mathrm A & 0_\mathrm A &\cdots\\
0_\mathrm A & p_2\rho^2_\mathrm A & \cdots\\
\vdots & \vdots & \ddots
\end{array}
\right)=\sum_{x\in\mathcal X}p_x|x\rangle\langle x|_\mathrm{X}\otimes \rho^x_\mathrm{A}.
\end{align}
というふうな行列を構成してやります。$\{|x\rangle_\mathrm{X}\}_{x\in\mathcal X}$は古典系$\mathrm X$の標準基底です。
$E^x_\mathrm A\succeq 0_\mathrm A$なら$X_{\mathrm{XA}}\succeq 0_{\mathrm{XA}}$ですし、
\mathrm{Tr}[J_{\mathrm{XA}}X_{\mathrm{XA}}]=\mathrm{Tr}\left[\sum_{x,x'\in\mathcal X}p_x|x\rangle\langle x||x'\rangle\langle x'|\otimes E^x_\mathrm{A}\rho^x_{\mathrm{A}}\right]=\sum_{x\in\mathcal X}\mathrm{Tr}[E^x_\mathrm A\rho^x_\mathrm A]
となるので、目的関数もOKです。
。。。でも、ちょっと待ってください。この$J_{\mathrm{XA}}$に対して、
\begin{align}
\underset{X_{\mathrm{XA}}}{\text{Maximize}}\quad &\mathrm{Tr}[J_{\mathrm{XA}}X_{\mathrm{XA}}]\\
\text{subject to}\quad &\mathrm{Tr}_{\mathrm{X}}X_{\mathrm{XA}}=I_\mathrm{A}\\
\quad & X_{\mathrm{XA}}\succeq 0_{\mathrm{XA}}
\end{align}
は、本当に元の量子状態識別問題の最適値と一致するのでしょうか?というのも、今$X_{\mathrm{XA}}$はブロック対角に限らず、あらゆる半正定値行列の中で最適化します。つまり、もとの問題よりも探索できる空間が広がっているので、少なくともこの問題の最適値は、オリジナルの問題未満になることは無いです。しかしながら実際のところ、最適値はブロック対角化された行列でも達成できることが言えるので、ブロック対角に制限したとして最適解は変わらないのです。これは[1]でも言及されていますが、ちょっと計算と説明を補って実際に確認してみます。まず、ブロック対角ではない
X^{\circ}_{\mathrm{XA}}=\sum_{x,y\in\mathcal X}|x\rangle\langle y|_\mathrm{X}\otimes E^{xy}_\mathrm{A}
というものが最適解だったとしましょう。このとき目的関数は
\mathrm{Tr}[J_{\mathrm{XA}} X^{\circ}_{\mathrm{XA}}]=\sum_{x\in\mathcal X}p_x\mathrm{Tr}[E^{xx}_\mathrm A\rho^x_\mathrm{A}]
となります。また制約条件は満たされるべきなので
\mathrm{Tr}_\mathrm{X}[X^{\circ}_{\mathrm{XA}}]=\sum_{x\in\mathcal X}E^{xx}_\mathrm{A}=I_\mathrm{A}
となります。つまり目的関数にも制約条件にも効いてくるのは結局$E^{xx}_\mathrm A$というブロック対角成分だけです。
したがって、$X^{\circ}_{\mathrm{XA}}$をブロック対角化した
\tilde{X}^{\circ}_{\mathrm{XA}}=\sum_{x\in\mathcal X}|x\rangle\langle x|_\mathrm{X}\otimes E^{xx}_\mathrm{A}
も最適値を達成しています(※)。つまり、最適値はブロック対角に限定された行列で達成できるのです。
※$E^{xx}_{\mathrm{A}}$はちゃんと半正定値であることに注意。
∵$\mathcal H_\mathrm{A}$の任意のベクトルに対して$|\psi\rangle_\mathrm{A}$以下が成り立つため
\langle\psi|E^{xx}_\mathrm{A}|\psi\rangle_\mathrm{A}=\langle x|_\mathrm{X}\otimes\langle \psi|_\mathrm{A}X^{\circ}_{\mathrm{XA}}|x\rangle_\mathrm{X}\otimes|\psi\rangle_\mathrm{A}\ge 0
最後の不等式は$X^{\circ}_{\mathrm{XA}}$の半正定値性より。