PhysiKyu アドベントカレンダー15日目です。
今回、担当するのは、物理学科2年の安成温也と申します。
今回は、物理や数学を専門とする学部1年生からそれ以上の人まで、広く役に立つような記事を心がけて書いてみました。ぜひ一読してみてください。
はじめに
連鎖率(チェインンルール)をご存じでしょうか?1理系の大学生にとっては愚問かもしれません。一般教養科目の微分積分学で学部1年生の後期までには、誰もが習うからです。特に物理を専門とする学生は、一生付き合っていくものですね。しかし、連鎖率の考え方は、意外と難しく混乱しやすいものだと私は思います。例えば、砂川さんの理論電磁気学という書物にある第2章2ページ目にある以下の数式の行間は、連鎖率を掌握してなければ、しっかり埋めることはなかなか難しいです。(これは、$\delta$関数による電荷密度と電流密度の表現においても電荷保存則が成り立っていることを確認するための計算です。)
\begin{aligned}
\frac{\partial \rho(\mathbf{x}, t)}{\partial t} + \operatorname{div} \mathbf{i}(\mathbf{x}, t)
&= e \left[ \frac{\partial}{\partial t} \delta^3(\mathbf{x} - \mathbf{r}(t)) + \dot{\mathbf{r}}(t) \cdot \operatorname{grad}_{\mathbf{x}} \delta^3(\mathbf{x} - \mathbf{r}(t)) \right] \\
&= e \left[ \operatorname{grad}_{\mathbf{r}} \delta^3(\mathbf{x} - \mathbf{r}(t)) \cdot \dot{\mathbf{r}}(t) - \dot{\mathbf{r}}(t) \cdot \operatorname{grad}_{\mathbf{r}} \delta^3(\mathbf{x} - \mathbf{r}(t)) \right] \\
&= 0.
\end{aligned}
→文字の説明は脚注へ2
なので、今回は、連鎖率を数学的に理解し、さらに、その実用的な使い方をマスターすることで、この行間を埋めることを一つのゴールとしたいと思います。
また、さらに連鎖率の強力さを知る一つの例として、複素解析学で学ぶ複素関数$f$が正則となるための同値な式が以下であることを、コーシーリーマン方程式を介さずに、直感的にそうだと分かるような説明をしたいと思います。
$$\frac{\partial}{\partial \bar z} f = 0$$
($\bar z$は複素数$z$の複素共役を表しています。)
連鎖率(チェインルール)とは
一旦、数学の言葉を使って連鎖率とは何かを、ここで述べます。数学の言葉や表現に慣れていない方でも分かるように脚注や補足の説明で補うので安心してください。
| 連鎖律 (Chain Rule) |
|---|
|
$U\subset \mathbf{R^m}$,$V\subset \mathbf{R^n}$ の開集合 とする3。 写像$h:U→V$と写像$f:V→\mathbf{R}$とこれらの合成写像$f\circ h:U→ \mathbf{R}$(これを合成関数という)があり、これらすべての写像が$C^1$級関数であるとする45。このとき写像$h$の座標表示を$h_1,h_2,...,h_n$とすると、それらはすべて偏微分可能であり、かつ次の公式が成り立つ(合成関数の微分法:連鎖率) ここで ${y} = {h}({x})$ である。 |
脚注も見ながら、頑張って解読してみてください。
ここで、偏微分について重要なことを述べておきます。
| 偏微分に関する重要な補足 (Chain Rule) |
|---|
|
写像$f:V→\mathbf{R}$は関数として具体的に書くと、 これを$y_i$で偏微分するとは、$y_j(\forall j\ne i)$を固定させて$y_i$だけに関する変化量を見るということです。ここで重要なのは、固定させるものが何であるのかをしっかりと把握することです。これを明示的に以下のように書いてみましょう。 下付きで書いた文字等が固定させる文字です。 ここで ${y} = {h}({x})$ です。なので、$y$と$h$を同一視して、以下のように書いても大丈夫です。 連鎖率は、物理などの本では、だいたい上の1行目の形で紹介されますが、固定させている文字が$f$と$h$のそれぞれについて全く違うということをちゃんと認識できていたでしょうか? |
ここまで、読んでくれた方には、ほとんど連鎖率を習得し終えています。
次項以降では、これをどういう捉え方をして、どういった場面で有効に使うことができるのかを解説していきます!
連鎖率(チェインルール)の実用性
この章では、物理などあらゆる分野で連鎖率が多用されている訳を述べていきます。
有効な場面
連鎖率は、ある関数の引数(独立変数)を変換したいときに、きわめて有効なのです。例えば、物理学では、ある物理量がカーテシアン座標系($x,y,z$)よりも、極座標系($r,\theta,\psi $)の表示のほうが簡単に与えられることが頻繁にあります。
万有引力の以下の2式をみると一目瞭然ですね。
・カーテシアン座標系:$F(x,y,z) = -G \frac{M m}{(x^2+y^2+z^2)}$
・極座標系${\tilde{F}}(r,\theta,\psi) = -G \frac{M m}{r^2} $6
明らかに極座標系のほうが簡単に書けます。
このようなときに、連鎖率はとても役に立ちます。例えば上の場合だと$\frac{\partial {F}}{\partial x}$を計算するときに連鎖率を使って極座標系を介すことで、簡単に求められます。では、次の対応関係を確認した後に、実際に連鎖率を使って求めてみることにしましょう。
連鎖率の説明と具体例の対応
連鎖率とは?で述べた説明と、万有引力の具体例との対応を見て、$\frac{\partial F}{\partial x}$を連鎖率を用いて計算してみたいと思います。
| 連鎖率の説明 | 具体例(万有引力) |
|---|---|
| $U\subset \mathbf{R^m}$,$V\subset \mathbf{R^n}$ | $(x,y,z)\in U \subset \mathbf{R^3}$, $(r,\theta,\psi)\in V\subset \mathbf{R^3}$ |
| 写像$h:U→V$ | $(r,\theta,\psi):(x,y,z)\in U →(r(x,y,z),\theta(x,y,z),\psi(x,y,z))\in V$ |
| 写像$f:V→\mathbf{R}$ | $\tilde{F}:(r,\theta,\psi)\in V →\tilde{F}(r,\theta,\psi)\in \mathbf{R}$ |
| 写像$f\circ h:U→\mathbf{R}$ | $\tilde{F}\circ (r,\theta,\psi)≡F:(x,y,z)\in U →F(x,y,z)\in \mathbf{R}$7 |
この対応関係をよく見ながら連鎖率をかくと...
\begin{align}
\Bigl(\frac{\partial{F}}{\partial x}\Bigl )_{y,z}
&=
\Bigl(\frac{\partial \tilde{F}}{\partial r}(r,\theta,\psi)\Bigl )_{\theta,\psi}
\cdot \Bigl( \frac{\partial r}{\partial x}({x,y,z}) \Bigl)_{y,z}
+
\Bigl(\frac{\partial \tilde{F}}{\partial \theta}{({r,\theta,\psi})}\Bigl )_{r,\psi}
\cdot
\Bigl(\frac{\partial \theta}{\partial x_i}({x})\Bigl)_{y,z}
\\
&+
\Bigl(\frac{\partial \tilde{F}}{\partial \psi}({h}) \Bigl )_{r,\theta}
\cdot
\Bigl(\frac{\partial \psi}{\partial x_i}({x})\Bigl)_{y,z}
\end{align}
となります。
あとは素直に計算すればいいだけです。明らかに1項目しかのこらず、すぐに計算できるので省略します。
ここで、重要なことは簡単な形だった極座標系の$\tilde{F}$に関する偏微分を計算するだけで、カーテシアン系の$F$に関する偏微分の結果が得られている点です。
また、対応関係の図で一番注目すべきところは、写像$h$です。写像$h$を私たちが自由に定めることで、引数をあらゆる変数にとりかえることができるのです!
理論電磁気学の行間を埋めよう!(演習)
はじめに、で紹介した以下の式の行間を埋めてみましょう。
今まで、頑張って説明したわけがこの行間埋めで伝わってくれると嬉しいです。
\begin{aligned}
\frac{\partial \rho(\mathbf{x}, t)}{\partial t} + \operatorname{div} \mathbf{i}(\mathbf{x}, t)
&= e \left[ \frac{\partial}{\partial t} \delta^3(\mathbf{x} - \mathbf{r}(t)) + \dot{\mathbf{r}}(t) \cdot \operatorname{grad}_{\mathbf{x}} \delta^3(\mathbf{x} - \mathbf{r}(t)) \right] \\
&= e \left[ \operatorname{grad}_{\mathbf{r}} \delta^3(\mathbf{x} - \mathbf{r}(t)) \cdot \dot{\mathbf{r}}(t) - \dot{\mathbf{r}}(t) \cdot \operatorname{grad}_{\mathbf{r}} \delta^3(\mathbf{x} - \mathbf{r}(t)) \right] \\
&= 0.
\end{aligned}
答えは以下の画像のとおりです。ポイントは写像$h$の定め方です。
※数式を打ちすぎて、記事が重たくなり、数式をこれ以上打つのが困難になってしまったので、画像として貼ることにしました
これが理解できたら、連鎖率は完全掌握です!!
連鎖率関連の面白い話(複素解析学)
今回、連鎖率を実数体$\mathbf{R}$に限ってお話しましたが、複素数体$\mathbf{C}$でも成り立ちます8。
面白い話として、複素数バージョンで連鎖率を用いることで、突然与えられがちな複素数の偏微分を自然に定義することができます。また、さらに複素数の偏微分をつかった正則9であるための同値な条件もコーシーリーマン方程式を介さずに自然に導かれるので、お話ししたいと思います。
(ここでも、重たくて数式を打つのが困難なので、手書きの画像で補います)
僕が読んだ複素解析の本でも、大学の授業でも、このように習わず、自分で考えて気づいたことなので、もしかしたら間違いもあるのかもしれませんが、高確率で合っていると思いますし、個人的にかなり有益な考え方だと思います!
最後に
ここまで、読んでくださりありがとうございました。この記事を読んで、連鎖率の理解が確実に向上した実感を得てもらえたなら、この記事を書いた甲斐がありました。私は物理学科ですが、数学科がするような数学が物理を理解するうえで、とても役に立つと思っています。最近のイチオシの数学は位相空間論です。この記事で、数学に興味持った方がいれば、ぜひ読んでみてください。とても面白いですよ!
参考文献
$[1]$杉浦光夫 解析入門Ⅰ(東京大学出版)
$[2]$松本幸夫 多様体の基礎(東京大学出版)
$[3]$砂川重信 理論電磁気学(紀伊國屋書店)
$[4]$野口潤次郎 複素解析概論(裳華房)
脚注
-
連鎖率という言葉で知らなくても、単に多変数関数の合成関数の偏微分として、知っているかもしれません。 ↩
-
電荷保存則の式で用いられていた記号一覧
↩記号 説明 (日本語) 説明 (英語) 関連する数式表現 $\rho(\mathbf{x}, t)$ 電荷密度 Charge Density $\rho(\mathbf{x}, t) = e \delta^3(\mathbf{x} - \mathbf{r}(t))$ $\mathbf{i}(\mathbf{x}, t)$ 電流密度 Current Density $\mathbf{i}(\mathbf{x}, t) = e \dot{\mathbf{r}}(t) \delta^3(\mathbf{x} - \mathbf{r}(t))$ $t$ 時刻 Time 時間変数 $\mathbf{x}$ 位置ベクトル Position Vector 観測点の3次元座標 $e$ 点電荷の電荷量 Charge of the Point Particle スカラー量 $\mathbf{r}(t)$ 点電荷の位置ベクトル Position of the Point Particle 時刻 $t$ における粒子の位置 $\dot{\mathbf{r}}(t)$ 点電荷の速度 Velocity of the Point Particle $\dot{\mathbf{r}}(t) = \frac{d\mathbf{r}(t)}{dt}$ $\frac{\partial}{\partial t}$ 時間偏微分 Partial Derivative with Respect to Time $t$ に関する微分作用素 $\operatorname{div}$ 発散 Divergence $\nabla \cdot$ (ベクトル場に対する微分作用素) $\operatorname{grad}_{\mathbf{x}}$ 勾配 Gradient $\mathbf{x}$についての$\nabla_{\mathbf{x}}$ (スカラー場に対する $\mathbf{x}$についての微分作用素) $\operatorname{grad}_{\mathbf{r}}$ 勾配 Gradient $\nabla_{\mathbf{r}}$ (スカラー場に対する $\mathbf{r}$についての微分作用素) $\delta^3(\mathbf{x} - \mathbf{r}(t))$ 3次元ディラックのデルタ関数 3D Dirac Delta Function 点電荷を空間的に局在させる関数 -
$\mathbf{R^n}$とは、実数の$n$成分で表される集合全体です(例:平面における実ベクトルは$\mathbf{R^2}$)。
また開集合とは、任意の点の近傍もその集合内にあることを示しますが、今回の場合は集合内のすべての点で微分可能とするための条件の一つとして機能しています(開集合でないと片側微分係数などを定義する必要がでてくる)。 ↩ -
$C^r$級関数とは、$r$階の偏導関数がすべて存在し、元の関数も含め、それらがすべて連続であることを言う。ここでは、$C^1$級なので、単に1階の偏微分がすべて存在するんだな、と思っておけば十分です。 ↩
-
写像$h$と写像$f$が$C^1$級であれば、その合成関数も$C^1$級となるので、実は前者の$2$つだけを$C^1$級関数と仮定するだけで構いません。 ↩
-
$F$と$\tilde{F}$は、同じ物理量であり、
$F(x,y,z)=\tilde{F}(r(x,y,z),\theta(x,y,z),\psi(x,y,z))$
であるが、それぞれ写像の始集合(引数)が異なるため、別の関数として区別した。 ↩ -
$≡$は写像が完全に同じであることを表す記号とした。 ↩
-
体(四則演算ができる空間)で完備性がある空間であればよく、複素数体$C$はそのような空間の一つである。 ↩
-
複素微分可能な領域をこの領域で正則といいます。 ↩



