工学部に入ってはじめに学ぶ数学は,微分積分学と線形代数学の2つであることが多いと思います.
学部の線形代数学では特に,掃き出し法とか対角化のアルゴリズムを覚えて手計算を行えるようになることに尽力してしまい,結局何を学んだのかわからないままになっている方が多い印象があります.かくいう筆者もそのような学生の一人でした.
ここでは,細かい計算を抜きにして,最速で対角化の理論までたどり着き,1年生の線形代数学で何を学んだのかを整理してみようと思います.
本稿では,紙面の都合上,細かい用語の定義や,定理の証明は飛ばして自由に用いることにしますので,必要に応じて適宜線形代数の教科書を参照して下さい.
1. ベクトル空間
1.1. ベクトル空間とベクトルの定義
線形代数ではまずベクトルを定義します.ここでベクトルとは,高校生で習った「向きと大きさを持つ量」というイメージを超えて,かなり抽象的な定義を行います.
まず,ベクトル空間を定義します.
ベクトル空間とは,以下のような性質をもつものの集合です.
- $ \boldsymbol{u}+\boldsymbol{v} = \boldsymbol{u}+\boldsymbol{v} $
- $(\boldsymbol{u}+\boldsymbol{v})+\boldsymbol{w} = \boldsymbol{u}+(\boldsymbol{v}+\boldsymbol{w})$
- $\boldsymbol{v}+\boldsymbol{0}=\boldsymbol{v}$となる元$\boldsymbol{0}$が存在する
- $\boldsymbol{v}$に対して$\boldsymbol{v} + \boldsymbol{v'}=\boldsymbol{0}$となる元$\boldsymbol{v'}=-\boldsymbol{v}$が存在する
- $c(\boldsymbol{u}+\boldsymbol{v}) = c\boldsymbol{u}+c\boldsymbol{v}$
- $(c_1+c_2)\boldsymbol{v} = c_1 \boldsymbol{v} + c_2\boldsymbol{v}$
- $(c_1c_2)\boldsymbol{v} =c_1 (c_2\boldsymbol{v})$
- $1\boldsymbol{v} = \boldsymbol{v}$
ベクトルは,ベクトル空間の元(げん,集合の要素) として定義します.
先に「ベクトル空間」が定義されるのが不思議ですね.
なお,性質1から4はベクトルどうしの演算について,5から8はベクトルとスカラーの演算についてを定義しています.
ベクトルどうしの掛け算や割り算は定義に含まれないことに注意しましょう.
ベクトル空間の定義から,4次元を超えるベクトルや複素ベクトルのように「大きさと向き」を定義しにくい量であっても,上記の8つの性質を満たすのであれば,何でもベクトルとみなすということになります.
ただし,ここまでイメージを広げてしまうと,後の議論が大変です.基本的には高校数学のベクトルのようなものを例として考え,具体的なイメージも同時に捉えておくのが良いでしょう.
なお本稿では,上記のようにベクトルは太字で,スカラーは細字で表すこととします.
1.2. 基底
いくつかのベクトル$\boldsymbol{a}_1, \boldsymbol{a}_2, \cdots, \boldsymbol{a}_n$をそれぞれスカラー倍して足し合わせて作られたベクトル
$$
c_1\boldsymbol{a}_1 + c_2\boldsymbol{a}_2+ \cdots+ c_n\boldsymbol{a}_n
$$
を,線形結合といいます.
$\boldsymbol{a}_1, \boldsymbol{a}_2, \cdots, \boldsymbol{a}_n$の間に
$$
c_1\boldsymbol{a}_1 + c_2\boldsymbol{a}_2+ \cdots+ c_n\boldsymbol{a}_n =0
$$
という関係が$c_1=\cdots=c_n=0$以外で成立するのであれば,$\boldsymbol{a}_1, \boldsymbol{a}_2, \cdots, \boldsymbol{a}_n$は線形従属といい,そうでないとき,線形独立であるといいます.
あるベクトル空間$V$の元で,線形独立な$\boldsymbol{e}_1,\cdots,\boldsymbol{e}_n$があるとします.$V$の任意の元$\boldsymbol{x}$が$\boldsymbol{e}_1,\cdots,\boldsymbol{e}_n$の線形結合
$$
\boldsymbol{x} = x_1 \boldsymbol{e}_1 + x_2 \boldsymbol{e}_2 + \cdots + x_n \boldsymbol{e}_n
$$
として表せるとき,$\boldsymbol{e}_1,\cdots,\boldsymbol{e}_n$を$V$の基底と呼びます.さらに,$V$の基底が$n$個の元からなるとき,$V$は$n$次元であるといいます.
2. 写像
2.1. 写像の定義
ある要素$a$に対して,(別の)ただ一つの要素$b$が,あるルールでによって対応づけられているとき,以下のように表記します.
$$
b = f(a)
$$
ここで,$f$を$a$から$b$への写像と呼びます.
高校数学で習う関数と似たものに見えますが,写像は関数を拡張したものであり,$a$が1次元のスカラーでなくてベクトルでも良いし,極端に言えば,連続に定義されていなくても構わないという特徴があります.例えば,$f$が引数のジャンルを表す写像と定義して,
$$
f(ねこ)=動物,f(おにぎり)=食べ物
$$
とすることも可能です.
逆に,一つの要素に対して複数のものが対応している場合,その対応ルールを写像と呼ぶことはありません.
例えば原点を中心とした単位円を考えてみましょう.ある$-1<x<1$に対して,その位置にある円周上の点は2つ存在するため,円周上の点の$x$座標に対応する$y$座標を写像と呼ぶことはできません.
2.2. 線形写像
写像の中で,以下のような特別な関係を満たすものを線形写像といいます.
- $f(\boldsymbol{a}+\boldsymbol{b}) = f(\boldsymbol{a})+f(\boldsymbol{b})$
- $f(c\boldsymbol{a}) = c f(\boldsymbol{a})$
このような等号が一般の写像に対して成り立たないことは,例えば一般に
$$
\sin(\theta_1+\theta_2) \neq \sin\theta_1+\sin\theta_2
$$
であることからも理解できるでしょう.
任意の線形写像$f$は,それに対応した行列$A$を用いて
$$
f(\boldsymbol{x}) = A\boldsymbol{x}
$$
と書き表せることが証明できます.
3. 固有値と固有ベクトル
行列$A$で定められる線形写像は,2つのベクトル$\boldsymbol{a}$と$\boldsymbol{b}:=A\boldsymbol{a}$を特定のルールで関連付けています.
$\boldsymbol{b}:=A\boldsymbol{a}$という関係から,$\boldsymbol{b}$は$\boldsymbol{a}$を一定のルールで変換したものと捉えることもできます.
例えば$\boldsymbol{a}$と$\boldsymbol{b}$が2次元平面上のベクトルであるときを考えてみましょう.
行列$A$がよほど特殊な形をしていない限り,「$\boldsymbol{b}$は$\boldsymbol{a}$の大きさと向きを変えたもの」であり,それ以上はっきりとした関係を見出すのは難しいように見えます.
この行列$A$が正方行列であるとき,すなわち変換前と変換後のベクトルの次元が変化しないとき,変換をわかりやすく説明することができるのが,以下で紹介する,固有値と固有ベクトルです.
3.1. 定義
ある特別なベクトル$\boldsymbol{v}$に対して,以下のような関係がたまたま成り立っていたとしましょう.
$$
A\boldsymbol{v} = \lambda \boldsymbol{v}
$$
すなわち,ベクトル$\boldsymbol{v}$に対して行列$A$による変換を施したとき,向きは一切変化せず,大きさだけが$\lambda$倍に変化したということになります.
このような$A$にとって特別なベクトルを,行列$A$の固有ベクトルといいます.また,倍率$\lambda$を行列$A$の固有値といいます.定義から,固有ベクトルと固有値は必ずセットで存在することになります.
固有ベクトルは,行列$A$の階数と同じだけ存在します.すなわち,$A$が$n\times n$の行列であったとき,($A$がランク落ちしていない限り)$n$個の独立な固有ベクトルが存在することになります.
3.2. 線形写像を固有ベクトルで捉える
さて,一般に$n$次元のベクトルは,$n$個の独立なベクトルの線形和で表すことができることが示されています.この事実を用いると,任意のベクトル$\boldsymbol{a}$は,$n$個の固有ベクトル$\boldsymbol{v}_i$と,それぞれに対応したスカラー$c_i$を用いて
\boldsymbol{a} = c_1 \boldsymbol{v}_1 + c_2 \boldsymbol{v}_2 + \cdots +c_n
と表すことができます.
これは,固有ベクトル$\boldsymbol{v}_i$を基底としてベクトル$\boldsymbol{a}$を分解したと見ることもできます.
続いて,$\boldsymbol{a}$を行列$A$で変換したベクトル$\boldsymbol{b}$を考えてみましょう.このとき,上式を用いて
\boldsymbol{b} = A\boldsymbol{a} = c_1 A\boldsymbol{v}_1 + c_2 A\boldsymbol{v}_2 + \cdots +c_n A\boldsymbol{v}_n = \sum^n_{i=1} c_i A\boldsymbol{v}_i
となります.ここで,$n$個の固有値$\lambda_i$を用いて$A\boldsymbol{v}_i = \lambda_i \boldsymbol{v}_i$と表せることを思い出すと,
\boldsymbol{b} = A\boldsymbol{a} = c_1 \lambda_1\boldsymbol{v}_1 + c_2 \lambda_2\boldsymbol{v}_2 + \cdots +c_n \lambda_n\boldsymbol{v}_n = \sum^n_{i=1} c_i \lambda_i\boldsymbol{v}_i
となることがわかります.
すなわち,ベクトル$\boldsymbol{a}$の行列$A$による変換は,「固有ベクトル$v_i$の方向に分割した$\boldsymbol{a}$の成分を,それぞれ$\lambda_i$倍すること」というふうに捉えなおすことができます.
まとめ
行列$A$による変換は,固有ベクトルの方向ごとに捉えると簡単
4. 行列の対角化
すこしテクニカルな計算になりますが,ベクトル$\boldsymbol{a}$を新たな行列$P$とベクトル$\boldsymbol{c}$を用いて以下のように書き換えることができます.
\boldsymbol{a} = \begin{bmatrix}
\boldsymbol{v}_1\ \boldsymbol{v}_2 \ \cdots \ \boldsymbol{v}_n
\end{bmatrix}\begin{bmatrix}
c_1\\ c_2\\ \vdots \\ c_n
\end{bmatrix} = P\boldsymbol{c}
ここで,正方行列$P$とベクトル$\boldsymbol{c}$を
P := \begin{bmatrix}
\boldsymbol{v}_1\ \boldsymbol{v}_2 \ \cdots \ \boldsymbol{v}_n
\end{bmatrix},\
\boldsymbol{c} := \begin{bmatrix}
c_1\\ c_2\\ \vdots \\ c_n
\end{bmatrix}
としています.同様の計算と定義によって,$\boldsymbol{b}=A\boldsymbol{a}$も
$$
\boldsymbol{b} = P\boldsymbol{d}
$$
と表すことができます.
このとき,
\boldsymbol{d}=P^{-1}AP\boldsymbol{c} = \begin{bmatrix}
\lambda_1 & 0 &\cdots &0\\
0 & \lambda_2 & \cdots & 0\\
\vdots & \vdots & \ddots & \vdots\\
0 & 0 & \cdots & \lambda_n
\end{bmatrix}\boldsymbol{c}
となります.このような作業を,行列$A$の対角化と呼びます.
これはすなわち,
d_1 = \lambda_1 c_1,
d_2 = \lambda_2 c_2,
\cdots,\\
d_n = \lambda_n c_n
ということです.$\boldsymbol{c}$と$\boldsymbol{d}$の各要素にはカップリングしている項がなく,非常に簡潔な関係になっていることがわかります.
これは,適切な座標変換$P$によって,$A$による変換はすべてデカップリングされたと読み取ることもできます.
すなわち,行列の対角化とは,行列による変換が最も簡潔に表せるような座標系(固有ベクトルを基底とする座標系)に取り直すことだと理解すると良いでしょう.
まとめ
行列$A$による変換は,固有ベクトルを基底に取り直すと,対角行列で表せるようになる