機械学習や統計学の中で、複素数を扱うこともありますが、複素数は実数と同じように計算していいのかは確かめないといけません。(統計学では分布の特徴づけとして複素数を積分の中で用いる特性関数があります)
・複素数を考える動機
2次方程式$x^2-x+1=0$を解の公式で解くと、
$$x=\frac{1±\sqrt{-3}}{2}$$
となり、ルートの中がマイナスになりますが、実数の範囲では2乗して$-3$になるものが存在しません。高校の時は、$\sqrt{-1}$これを一旦形式的に$i$とおいて計算しました。上の例では$\sqrt{-3}$だから、$\sqrt{3}i$と書いていたと思いますが、$i$は定数のように扱っていいのでしょうか。次のような式があります。
$$1=\sqrt{1}=\sqrt{-1・-1}=\sqrt{-1}・\sqrt{-1}=i^2=-1$$
$1$と$-1$がイコールになってしまいました。なにも考えずにやると、このようにやってしまいそうなので、実際に複素数でできる計算はどんなものなのか確かめないといけません。
・矛盾しないように複素数を作れるか
一般の複素数は2つの実数$x,y$を用いて$x+iy$という形で表すことは習いますが、四則演算をするときに、実数と同じように計算して$i^2$が出てきたら$-1$に置き換える、という方法で矛盾しないのか?
ここで、複素数$z$に対して$z=x+iy$を$(x,y)$という2次元の点に置き換えて考えてみます。一旦$i$の存在は忘れて下さい。そうすると、平面のある座標になるので$(x,y)$自体は実数の直積$R^2$として存在します。
更に、演算については$(a,b)$と$(c,d)$という2つの座標に対して和と積を
$$(a,b)+(c,d)=(a+b,c+d)$$ $$(a,b)(c,d)=(ac-bd,ad+bc)$$
と定義します。
演算に関する命題
$(a,b),(c,d),(e,f)$をそれぞれ複素数(平面座標の点)とすると下記が成立する。
①$(a,b)+(c,d)=(c,d)+(a,b)$ (和の交換法則)
②$(a,b)(c,d)=(c,d)(a,b)$ (積の交換法則)
③$(a,b)+((c,d)+(e,f))=((a,b)+(c,d))+(e,f)$ (和の結合法則)
④$(a,b)((c,d)(e,f))=((a,b)(c,d))(e,f)$ (積の結合法則)
➄$(a,b){(c,d)+(e,f)}=(a,b)(c,d)+(a,b)(e,f)$ (分配法則)
⑥$(a,b)+(x,y)=(a,b)$が成立する$(x,y)$は$(0,0)$しかない (和の単位元存在)
➆$(a,b)(x,y)=(a,b)$が成立する$(x,y)$は$(1,0)$しかない (積の単位元存在)
⑧$(0,1)(0,1)=(-1,0)$
複素数表現の定義
・$(a,0)$を$a$と書き、$(0,1)$を$i$と書くことにします。上の和と積の定義により
$$(a,b)=(a,0)+(0,b)=(a,0)+(b,0)(0,1)$$
とできるので、つまり$(a,b)=a+ib$になります。
命題
➈$i×i=i^2=-1$
これは命題⑧と定義により$i^2=(0,1)(0,1)=(-1,0)=-1$となるからです。
つまり、2乗して$-1$になる$i$は$(0,1)$だったということで$i$の正当化ができます。
➉$(a,b)+(x,y)=(0,0)=0$となる$(x,y)$を$-(a,b)$と表すことにすると、$(a,b)+(x,y)=(a+x,b+y)=(0,0)$なので$x=-a,y=-b$となります。
$$(a,b)-(a,b)=(0,0)$$
が成立します。※実数と同様に、$(a,b)+(-(a,b))$を$(a,b)-(a,b)$と書きました。
⑪$a≠0$または$b≠0$の時に$(a,b)(x,y)=(1,0)=1$となる$(x,y)$は、連立方程式を立てて計算すると
$$(x,y)=(\frac{a}{a^2+b^2},\frac{-b}{a^2+b^2})$$
となります。この$(x,y)$を$\frac{1}{(a,b)}$または$(a,b)^{-1}$と書くことにすると
$$(a,b)\frac{1}{(a,b)}=(a,b)(a,b)^{-1}=(1,0)=1$$
になります。$(a,b)^{-1}$を$(a,b)$の逆数と呼びます。
複素数は$z=(a,b)$という風に$z$と書いた方が書きやすいく見やすいです。
四則演算の例
複素数$z_1=(a,b),z_2=(c,d),z_3=(e,f)$に対して考えます。
・$z_1iz_2i=-z_1z_2$
交換法則により成立します。$i$は複素数の特別な場合$(0,1)$なので問題ありません。
・$z_1i(z_2+i)=z_1z_2i-z_1z_2$
分配法則により成立します。
・$z_1,z_2,z_3≠0⇒(z_1z_2)^{-1}=z_1^{-1}・z_2^{-1}$
$(z_1z_2)z_3=1$とおいて、両辺に$z_1^{-1}$と$z_2^{-1}$をかけて結合法則に注意すれば成立する。
・$z_1,z_2,z_3≠0⇒\frac{z_1}{z_2}=\frac{z_1z_3}{z_2z_3}$
逆数の定義と結合法則により、$z_1z_2^{-1}=z_1z_2^{-1}・(z_3・z_3^{-1})=z_1z_3z_2^{-1}z_3^{-1}$
・$z_2≠0⇒(\frac{z_1}{z_2})z_3=\frac{(z_1z_3)}{z_2}$
交換法則により、$(z_1z_2^{-1})z_3=z_1(z_3・z_2^{-1})=(z_1z_3)z_2^{-1}$
・$z_2,z_3≠0⇒\frac{(\frac{z_1}{z_2})}{z_3}=\frac{z_1}{(z_2z_3)}$
交換法則により$(z_1z_2^{-1})z_3^{-1}=z_1(z_2^{-1}z_3^{-1})=z_1(z_2z_3)^{-1}$
演算の命題や上記例によって、$i^2$がでてきたら$-1$にすればいいだけで、複素数でも実数と同じように計算していけることが分かりました。
極座標表示の正当性
複素数$z=x+iy$を$z=r(\cos\theta+i\sin\theta)$と表すことがありますが、このような表現をして大丈夫か検証します。$z=x+iy$ ⇔ $z=r(\cos\theta+i\sin\theta)$と相互に変換できなければ使えません。
複素数は平面座標で$z=x+iy$は$(x,y)$のことです。点$(x,y)$に対して、原点$(0,0)$からどの角度$\theta$にあるのかを探し、長さ$r$を決めればただ一つの点$(x,y)$にたどり着けることは図を書けば分かります。厳密にいうと、$\theta=\arctan(\frac{y}{x}),r=\sqrt{x^2+y^2}$となるように変換するのです。ただし、$x=0,y>0⇒\frac{\pi}{2}$として、$x=0,y<0⇒-\frac{\pi}{2}$にすると定めておきます。また、$\theta$は周期が$2\pi$なので、$x,y$と$\theta$間の変換は無限個存在することに注意します。ちなみに逆変換として$x=r\sin\theta,y=r\cos\theta$に表現しなおせます。
これにより、$x$座標と$y$座標がきまれば角度$\theta$と長さ$r$が決まり、逆に角度$\theta$と長さ$r$が決まれば$x$座標と$y$座標が定まるので、複素数$z$はどちらの表現でもよく、変換しても元に戻せることが分かります。
極座標形式の例
・$r=1,\theta=0⇒\cos0+i\sin0=1+0=1$
・$r=1,\theta=\frac{\pi}{2}⇒\cos\frac{\pi}{2}+i\sin\frac{\pi}{2}=0+i=i$
・$z_1=r_1(\cos\theta_1+i\sin\theta_1),z_2=r_2(\cos\theta_2+i\sin\theta_1)$のとき、$z_1z_2=r_1r_2(\cos\theta_1\cos\theta_2+i\cos\theta_1\sin\theta_2+i\sin\theta_1\cos\theta_2-\sin\theta_1\sin\theta_1)$
$=r_1r_2(\cos(\theta_1+\theta_2)+i\sin(\theta_1+\theta_2))$
最後の式は実数における三角関数の加法定理を用いました。この結果から、$z_1$は$z_2$を掛けることで長さが$r_2$倍され、$\theta_2$分だけ回転することを意味します。回転するところが複素数と実数の違いです。
その他の補足
・$r=\sqrt{x^2+y^2}$と書いていますが、これは$z=x+iy=(x,y)$のベクトルとしての長さでもあるので、$r$を$|z|$と書く時もあります。
・$z=x+iy$の共役複素数を$x-iy$で定義して$\bar{z}$と書きます。これは平面座標で考えると、横軸(x軸)を基準に反転させた複素数になります。
・$z=x+iy$の実部$Re(z)=x$、虚部$Im(z)=y$と定義します。共役複素数の定義と合わせると
$$Re(z)=\frac{z+\bar{z}}{2} Im(z)=\frac{z-\bar{z}}{2}$$
・最初の方で紹介した$1=-1$となった下記式について再度考えてみます。
$$1=\sqrt{1}=\sqrt{-1・-1}=\sqrt{-1}・\sqrt{-1}=i^2=-1$$
本来、ルートの中にはマイナスは入れてはいけません。しかし右辺からみていくと、$\sqrt{-1}・\sqrt{-1}=i^2=-1$としています。注意する点は$\sqrt{-1}・\sqrt{-1}$です。ルートの中にはマイナスはNGですが、これは2乗して$-1$になるという意味から今の段階では形式的に$\sqrt{-1}$を用いているだけです。その形式的なものに対して$\sqrt{-1・-1}=\sqrt{-1}・\sqrt{-1}$とすることで矛盾しているのです。
・しかし一方で、2次方程式の解の公式をそのまま使うと、ルートの中にはマイナスが登場します。
$$x=\frac{1±\sqrt{-3}}{2}$$
実はこれを実数の範囲だけで理解することはできません。公式を導く際に、最初から複素数ありきでルートをとらないといけません。つまり複素数に対するルートを初めに定義しないと説明できないのです。
実数と同様に複素数$z=x+iy$の平方根を$z=u^2$となる$u$で定義しましょう。このとき$u=\sqrt{z}$と書くことにします。また、$u=s+it$と表せるとすると下記の式になります。
$$(s+it)^2=x+iy$$
これで実部と虚部で対応させてそれぞれ連立方程式を解くと
$$s=±\sqrt{\frac{x+\sqrt{x^2+y^2}}{2}} t=±\sqrt{\frac{-x+\sqrt{x^2+y^2}}{2}}$$
が導けます。$s$と$t$のルートの中は共に非負の実数なので大丈夫です。
ここまでできれば、あとは解の公式ででてきた$u=\sqrt{-3}$の場合に適用すれば分かりそうです。この場合は$z=-3$になるので、$x=-3,y=0$です。これを代入すると
$$s=0,t=±\sqrt{3}$$
となるので、$u=±i\sqrt{3}$となります。これが$-3$の平方根です。つまり
$$\sqrt{-3}=±i\sqrt{3}$$
が正当化されます。左辺は複素数の意味でのルートに対し、右辺は複素数×非負実数のルートです。
ちなみに、$z$が非負の実数の場合、$x≧0,y=0$なので、$s$と$t$を求めると、
$$s=±\sqrt{x} t=0 ⇒ z=±\sqrt{x}$$
となるので、複素数の意味でのルートは、通常使ってきた非負実数のルートと同じであることがわかります。これでルートの適用範囲を負数や複素数まで拡張したことになります。