概要
高校では$\frac{dy}{dx}$は割り算じゃないよって言われるけどぶっちゃけ割り算だよね、ってあたりの話。内容は以下の順で。
- 導関数の定義
- 微分と微分商
- 合成関数の微分(微分の連鎖律)
参考:『定本 解析概論』(高木貞治)
次回『数学勉強ノート(偏微分と全微分):すべての理系が読むべき宇宙一わかりやすい微分の説明』
導関数の定義
ある区間で定義された独立変数$x$の関数$y=f(x)$について、$x,x_1$に対応する関数の値をそれぞれ$y,y_1$とします。このとき
$$
x_1 - x = \Delta x, ,, y_1 - y = \Delta y
$$とおくと、区間$[x, x_1]$の間における関数$y$の平均変化率は
$$
\frac{\Delta y}{\Delta x} = \frac{y_1 - y}{x_1 - x}
$$と表すことができます。伝統的に$h = \Delta x$とおいて、この極限値
$$
\frac{dy}{dx}=\lim_{h \to 0} \frac{f(x+h) - f(h)}{h}
$$が存在するとき、関数$y=f(x)$は点$x$において微分可能であるといいます。また、ある区間内の任意の点$x$において$f(x)$が微分可能ならば、$f(x)$はその区間において微分可能であるといいます。$f(x)$がある区間において微分可能であるとき、極限値$\frac{dy}{dx}$は$x$の関数です。その関数を$f(x)$の導関数といい$f'(x)$で表します。他にも
$$
\frac{dy}{dx}=f'(x)=y'=\dot{y}=D_x y = Df(x)
$$など様々な表記があります。
さて、この微分の定義を根拠に$\frac{dy}{dx}$は商なのだと主張することはいささか暴論です。というのも、いま$dy$や$dx$を何か具体的な形で表してください、と言われても無理だからです。$dy$と$dx$がなんなのかもわかっていないのに、その割り算をするなんてとんでもない話です。つまり高校数学の範囲でいえば確かに導関数$\frac{dy}{dx}$を商として扱うことはできません。
微分と微分商
独立変数$x$の関数$y=f(x)$の導関数$f'(x)$が存在すると仮定します。導関数が存在しなければいまの議題である「$\frac{dy}{dx}$を商として扱えるかどうか」はナンセンスなのでこの仮定は認めてください。このとき
$$
\lim_{\Delta x \to 0} \frac{\Delta y}{\Delta x} = f'(x) \tag{1}
$$が成立するので、極限をとる前ととった後での誤差を、$x$と$\Delta x$に依存する関数$\varepsilon(x, \Delta x)$を用いて
$$
\varepsilon(x, \Delta x) = \frac{\Delta y}{\Delta x} - f'(x) \tag{2}
$$と書けます。このとき
$$
\frac{\Delta y}{\Delta x} = f'(x) + \varepsilon(x, \Delta x) \tag{3}
$$であり、$(1)$式を成り立たせるためには$\Delta x \to 0$のとき$\varepsilon(x, \Delta x) \to 0$でなければなりません。つまり極限をとる前の値は極限値から$\varepsilon(x, \Delta x)$だけズレており、極限をとるとそのズレは消失する($0$に収束する)ことを主張しています。
$(3)$式の両辺に$\Delta x$をかけると
$$
\Delta y = f'(x) \Delta x + \varepsilon(x, \Delta x) \Delta x \tag{4}
$$となります。この式について$(4)$式の両辺で$\Delta x \to 0$の極限をとると、第1項は$f'(x) \times \Delta x \to (定数) \times 0$で、第2項は$\varepsilon(x, \Delta x) \times \Delta x \to 0 \times 0$なので、直感的になんとなく第2項のほうが早く$0$に潰れてしまいそうだと気づきます。
ここで思い切って
$$
dy = f'(x) \Delta x \tag{5}
$$と定義し、これを$y$の微分と呼ぶことにします(注:$y$の導関数とは別物です。導関数に$\Delta x$がかかっています)。$dy$は$\Delta y$からちょうど$\varepsilon(x, \Delta x)\Delta x$だけズレており、$\Delta y$とは別物であることに注意してください。この定義にしたがって$dx$も計算します。
注意したいのは$x$はいまのところ独立変数であって、関数ではないということです。独立変数$x$はそれ自身に恒等関数$\mathrm{id}$を適用したものと一致するため、関数$x=\mathrm{id}(x)$を定義する、といってもいいのですが、あまりにも紛らわしいためいまは関数$t = g(x) = x$を考えて$dt$を計算することにします。この場合は$dy$と異なり具体的に導関数$g'(x)=1$がもとまるため、
$$
dt = g'(x) \Delta x = 1 \cdot \Delta x = \Delta x \tag{6}
$$と計算できます。文字$t$は単にわかりやすさのために$x$を書き直したものであったことを思い出せば、
$$
dx = g'(x) \Delta x = \Delta x \tag{7}
$$となります。
以上の議論によって$dx, dy$について、それぞれ具体的な形で表すことができたことになります。実際に$(7)$式を$(5)$式に代入すれば
$$
dy = f'(x) dx
$$となり、この両辺を$dx$で割れば
$$
\frac{dy}{dx}=f'(x)
$$となって導関数に一致します。これで記号法$\frac{dy}{dx}$には「$y$の微分$dy$を$x$の微分$dx$で割った商」という意味付けがなされました。なんだ、結局割り算だったんですね。この意味合いを反映して$\frac{dy}{dx}$は微分商1と呼ばれることもあります。
合成関数の微分(微分の連鎖律)
さて、まだこの定義に慣れていない方にとって「$y$の微分を$dy = f'(x)dx$で表します」と言われてもまだ混乱が残るでしょう。なぜならばこの式は「$y$の微分$dy$を説明するために$x$の微分$dx$を用いている」という状態であり、結局のところ「微分とはなんなのか」という問いには答えていないからです。もしそうなったときは$(5)$式まで、つまりもう一度書いておくと、
$$
dy = f'(x) \Delta x
$$の定義まで立ち返ってください。この式の右辺に含まれているのは「導関数」と「$x$の変化量」だけですから混乱はないかと思います。
もう少ししつこく念を押しておくと、「微分を行うには必ずどの独立変数で微分したのかについての情報が必要になる」ことを常に頭においてください。私たちはいままで
$$
\frac{dy}{dx}=f'(x)
$$という記法に慣れ親しんでいるので、左辺だけを見て「$y$の$x$に関する微分だ」というイメージを抱きます。これが突然
$$
dy = f'(x)dx \tag{8}
$$と書かれると、あたかも「左辺から$dx$が消えて$dy$というよくわからないものが残った」という印象を受けます。しかし実際は単に「どの変数で微分したかの情報が右辺に移っただけ」です。$(8)$式は見た目こそ違えど「$y$の($x$に関する)微分である」ことに変わりはありません。微分の起源が「独立変数$x$の変化量に対する関数$y$の変化量」の極限だったことを考えれば、変化量の基準になる独立変数$x$が必ずどこかに存在しています。これを忘れないでください。そしてこの「基準になる独立変数」に当たるのが
$$
dy = f'(x) \Delta x
$$の$\Delta x$です。
今までに説明したことを用いて、$(8)$式の右辺に出てくる$dx$を解釈できるか確かめてみてください。いいですか、これが最後の練習です。定義に立ち戻れば
$$
dx = g'(x)\Delta x
$$です。この式を見た時点で「$dx$は$x$の($x$自身に関する)微分である」と読み取れます。ここから$g'(x)=1$が求まるので
$$
dx = \Delta x
$$が成り立つのですよ。まだ混乱が残るようなら理解できるまで何度でもこの記事を最初から読み返してください。この解釈ができてしまえば、微分の連鎖律はほぼ自明です。
微分の連鎖律
関数$y = f(x), x = g(t)$が定義されているとき、合成関数$y=f(g(t))$の$t$に関する導関数は
$$
\frac{dy}{dt}= \frac{dy}{dx} \cdot \frac{dx}{dt}
$$で表すことができます。なぜならば
$$
\left\{
\begin{align}
dy &= f'(x) dx \\
dx &= g'(t) dt
\end{align}
\right.
$$が成り立つので、第2式を第1式に代入して、
$$
dy = f'(x)g'(x) dt
$$となり、したがって両辺を$dt$で割って
$$
\frac{dy}{dt} = f'(x)g'(t) = \frac{dy}{dx}\cdot \frac{dx}{dt}
$$が成り立つからです。
逆関数の微分
逆関数の微分は、逆関数が連続かつ単調で微分可能であることを証明せねばならず趣が位相論寄りになってしまうため厳密な話は避けて形式的な解説をします。
関数$y=f(x)$の逆関数を$x = \varphi(y)$が存在するとします。このとき逆関数$x=\varphi(y)$の$y$に関する微分は
$$
dx = \varphi'(y) dy
$$と書けます。ここで着目しているのは点$y$における微分ですが、この点$y$がもともとある点$x$と一意に対応しているならば$y=f(x)$と書けるはずなので、$dy=f'(x)dx$と合わせて
$$
dx = \varphi'(f(x)) \cdot f'(x)dx
$$が成り立っています。両辺を$dx$で割れば、点$x$とそれに対応する点$y$においては常に
$$
f'(x) \cdot \varphi' (y) = 1
$$が成り立つことがわかりますから、
$$
\frac{dy}{dx}\cdot \frac{dx}{dy}=1
$$となり、おなじみの
$$
\frac{dx}{dy}= \frac{1}{\frac{dy}{dx}}
$$の公式が導かれます。
おわりに
本当はついでに偏微分と全微分、リーマン積分、リーマン-スティルチェス積分あたりまで書こうと思ったのですが、全微分の導出がまだ気に入った形にならないのでここでいったん締めます。
次回『数学勉強ノート(偏微分と全微分):すべての理系が読むべき宇宙一わかりやすい微分の説明』
-
$\frac{dy}{dx}$はドイツの哲学者・数学者のLeibnizによる記法であるため、微分商(differentialquotient)の呼称は特にドイツ語圏で人気があるようです。 ↩