数学

ベクトルの内積とはなんぞや?

執筆の動機

ベクトルの内積って結局なんなの?という質問はよくある質問です。ですが、そもそも論として、それを問うことに意味があるのでしょうか?また、それを問うて得られた答えに意味があるのでしょうか?など、そもそも論について考える人は少ないように思います。

「定義だ、覚えろ」は乱暴ですし、「正射影だなんだ」というのも、僕はちょっと違うと思います(後述)。

そこで、純粋数学を真面目にやってきてないなら、こんくらいで理解しておけばいいんじゃないかぁというちょうどいい妥協点を模索する旅にでることにしました。

本稿の目的

[疑問1]
高校のときに習うベクトルの内積 $\vec{a} \cdot \vec{b} = |\vec{a}||\vec{b}| {\cos \theta} $ はどこからきたの?

[疑問2]
$\vec{a} \cdot \vec{b} = |\vec{a}||\vec{b}| {\cos \theta} $ はどういう意味があるの?

の2つの疑問に答えていくのが目的です。

ではさっそく本題に入ります。上記の疑問に一個ずつ答えていきます。

本題

 準備

平面上に $\vec{a} = (a_1, \ a_2), \ \vec{b} = (b_1, \ b_2) $ という2つのベクトルをとります。

 疑問1への解答

[疑問1] 高校のときに習うベクトルの内積 $\vec{a} \cdot \vec{b} = |\vec{a}||\vec{b}| {\cos \theta} $ はどこからきたの?

僕の知る限り、ハミルトンの四元数を使って内積や外積を語る方法などがありますが、今回は、単にこの式を導出できるようになることで安心してもらえればと思いますので、複素平面を使って簡単に説明します。細かい議論はすっとばして、全体的なストーリーを持って帰ってもらえるようにしたいと思います。

まず、複素平面上に2つの異なる $z_1 = a_1 + \mathrm{i}b_1 $ と $z_2 = a_2 + \mathrm{i}b_2$ をとります。そして、$z_2$ の共役複素数 $ \overline{z_2} = a_2 - \mathrm{i}b_2 $ をとります。

ここで、 $z_1$ と $\overline{z_2}$ の積を考えます。

まず、 $z_1 \overline{z_2} = ( a_1 + \mathrm{i}b_1) ( a_2 - \mathrm{i}b_2 )$ について、これの実数部分は、

 Re(z_1 \overline{z_2} )= a_1 b_1 + a_2 b_2 \tag{1}

と表せます。ただし、$Re(\cdot)$は、実数部分を表すものとします。これは、複素平面上で2つの複素数を掛け合わせることにより出てきた結果です。

次に、 $z_1$ と $z_2$ が 実軸となす角(偏角)をそれぞれ $\alpha, \beta$ とします。すると、複素数 $z_1 \overline{z_2} $ が $x$ 軸となす角は

\begin{eqnarray}
 \arg (z_1 \overline{z_2}) &=& \arg(z_1) + \arg(\overline{z_2})  \\
 &=&
\arg(z_1) - \arg(z_2) \\
&=&
\alpha - \beta
\end{eqnarray}

となります。$ \theta = \alpha - \beta$ とおき、極形式で考えた場合、

Re(z_1 \overline{z_2} ) = |z_1||z_2|\cos \theta \tag{2}

となります。ここで、 $\theta$ は $z_1$ と $z_2$ のなす角になっていることに注意してください。また、この結果は、掛け算した2つの複素数の、大きさとなす角だけを考えて導いた結果であることに注意してください。

以上(1)と(2)により、

a_1 b_1 + a_2 b_2 = |z_1||z_2|\cos \theta \tag{3}

が導かれました。

さて、今僕たちが欲しい結論は $\vec{a} \cdot \vec{b} = |\vec{a}||\vec{b}| {\cos \theta} $ です。直感的にも明らかだと思いますが、複素平面上の1点と、実数の平面(デカルト平面)の点は一対一対応しており、同一視できます。要は、複素平面上の $z = x + \mathrm{i}y$ という点を、実数の平面上の $(x, \ y) $ に一対一対応させることができるし、それら2つは「平面上の点」という観点だけで見れば、複素平面上で見ようが実数平面上で見ようが、原点から距離や位置は変わらないし、おんなじもんとみなせるよね、と言えます。

そこで、上でみてきた複素数 $ z_1$ と $ z_2 $ をそれぞれ実数平面上のベクトル $(a_1, \ b_1), \ (a_2, \ b_2) $ と読みかえると、(3)は

a_1 b_1 + a_2 b_2 = |\vec{a}||\vec{b}|\cos \theta \tag{4}

のように書きかえられ、この両辺の値のことを $\vec{a} \cdot \vec{b}$ と書き表し、それをベクトル $\vec{a} $ と $ \vec{b}$ の内積と呼ぼう!と言っているのです。これで、疑問1へ答えることができました。

Screen Shot 2018-04-06 at 21.12.21.png

疑問2への解答

[疑問2] $\vec{a} \cdot \vec{b} = |\vec{a}||\vec{b}| {\cos \theta} $ はどういう意味があるの?

先に見た(4)をちょっと書き直します。

 \vec{a} \cdot \vec{b} = a_1 b_1 + a_2 b_2 = |\vec{a}||\vec{b}|\cos \theta \tag{5}

この式の意味を考えるとき、しばしば、「正射影がどうのこうの」という議論があります。僕は、初めてその説明を聞いたとき、この式の「意味」の説明になっているとは思えませんでした。(5)の右辺を図に書くと、たしかに内積を語るときに出てくるキーワード「なす角」と「正射影」が登場しするし、それにお絵描きまでできてしまうので、なんとなく「これが内積の意味なんだなぁ」なんて納得した気になってしまいそうです。でも、その説明だけですと(5)の真ん中の式はいったい何を意味しているのか?を全く説明できていないように思いますし、真ん中の項と右辺の間のイコールが何を意味するかの説明にはなっていません。

では(5)の意味はなんなでしょうか?

これは、先に(4)を導出したプロセスにヒントがあります。まず、(1)を計算したときのことを思い出してください。これは、複素平面という平面上から出てきた計算式です。これを、実数平面と複素平面の一対一対応の話に照らして解釈すると、(1)は「$xy$ 座標平面上」から出てきた式です。つまり、直接 $ xy $ 平面を眺めることで出てきた関係式です。

一方で、(2)の式はどこから出てきたかというと、「極座標」から出てきた式です。直接複素平面を眺めることで出てきた関係式ではありません。この意味を説明します。

極座標の考え方というのは、$ \ (r,\ \theta) $ という2つの数の組(つまり、原点からの距離と実数軸となす角)を選ぶと、それを元にして、複素平面上に、$ r (\cos \theta + \mathrm{i}\ \sin \theta )$ という点を選ぶことができるよ、というものです。つまり、これは

 \ (r,\ \theta)  \mapsto r (\cos \theta + \mathrm{i}\ \sin \theta )

という関数を表していることになります。

Screen Shot 2018-04-06 at 21.53.39.png

複素平面上に現れているのは $ r (\cos \theta + \mathrm{i}\ \sin \theta) $ であり、 $\ (r,\ \theta)$ は複素平面上の点ではありません。僕たちは、(2)の導出の際、まさにこの、複素数の大きさ $r$ と偏角 $\theta $ のみを使いました。複素平面のことは一切考えずに、大きさと角度だけに思いを馳せて導出したのです(そのように考えることができるのです)。

ここで(5)の式に話を戻すと、(5)の右辺 $|\vec{a}||\vec{b}|\cos \theta $ は、ベクトルの座標による表現を気にすることなく、ベクトルの大きさとなす角を考えることにより出てきた、ということになります。

このように、違う世界(普通の座標上の点の世界と、大きさと角度を軸にもつような世界)から出てきた2つの項がイコールで結ばれた式が、内積なわけです。

 \vec{a} \cdot \vec{b} = a_1 b_1 + a_2 b_2 = |\vec{a}||\vec{b}|\cos \theta

この考察からわかるように、この式に意味を与えようと思っても、世界が違うものがイコールで結ばれているので、なかなか直感的に理解ができずにもやもやしてしまうのは当然かと思います。ですので、上の式が表す意味はなんだろう?と深く追求するよりは、「異なる世界を結ぶ連絡となる式」くらいに思った方がいいと思います。これが、内積の意味の一つの結論になると思います。

最後に

現代数学においては、内積はしばしば、「一方のベクトルでもう一方のベクトルを測るものさし」のように解釈されることが多いです(もっというと、汎関数のお話になります)。「ベクトル同士の掛け算みたいなもの」みたいなことを言う人がいますが、それは違うんじゃないなあと思います。

僕が学生の頃夢中になっていた微分幾何学などでは、座標系を相手にする数学ということもあり、内積という測定マシーンでベクトルを何らかの意味で測る、というようなことはしょっちゅうやっていました。

例えば、$\vec{a}$ を使って、未知のベクトル $\vec{x}$ を測ったりします。きれいな座標系では内積は、$ \vec{a} \cdot \vec{x} = a_1 x_1 + a_2 x_2$ みたいに計算できるので、$ \vec{a} \cdot \vec{x} = a_1 x_1 + a_2 x_2$ と $ \vec{b} \cdot \vec{x} = b_1 x_1 + b_2 x_2$ の値がわかれば、2つの既知のベクトル $\vec{a} $ と $ \vec{b} $ をつかって $ \vec{x}$ を測ることができます(連立方程式になりますからね!)。測るとはそう言うイメージです(自分自身を測ると自分自身の大きさの2乗が出てくるので、俄然内積が測定器の役割をしているということが納得できるのではないでしょうか?)。

興味のある方は、wikipedeaで内積の定義や、ノルム(ベクトルの大きさの一般化概念)について調べてみてください。それを見れば、実は内積が、現代数学の枠組みでは「大きさを測る」という概念にすごくマッチするような構造であることがよくわかると思います!

[追記]
内積の導出箇所は、余弦定理からも出せると思います。