
読書記録
読者プロフィール
組み込みエンジニア。数学は大学1年、2年でやったのが最後。大学に入ってからの数学は分からん殺しされて、なんとなく問題は解いているが本質的な理解からは程遠い。そのまま卒業しプログラマーになり、数学は使っても高校数学くらいな環境で過ごす。
雑感
率直に言って難しかった。かなり読み進めるのに苦労してしまった。著者はイメージすることを大事にしており、極限、微分、偏微分、積分を身近な自然現象であったり、幾何的に表現してくれている。そのおかげでふんわりとは理解できる。ただ、1ステップは理解できてもそれを繰り返して10ステップも歩くともうどこにいるのか分からなくなってしまう。少し戻って読み直し、10ステップの中のエッセンスを見極めたうえで再度1ステップずつ歩く、というのを繰り返さないと私の理解力では読み進められなかった。
途中音階?音律?の話が出てくるのだが、周波数的に倍々になっていることや、倍の音を和音と呼ぶことすら知らなかったので勉強になりました。本書は東大の講義を書籍化したもののようだが、そんなところで一般教養の差を感じてしまった。
極限と指数の関係、指数の微分あたりの説明はなるほど!という感動があった。微分あたりから苦しくなってしまったが、ある程度内容を把握したうえで時間を空けてもう一度読んでみたい。
あらすじ
大きな数→極限→微分→偏微分、積分という流れで話が進む。積分のページ数は少なく、概念自体は分かり易く割愛した(図を転記できないということもあり)
ネイピア数 e
ネイピア数eは高校で習ったeで、実数としては2.718…。自然対数の底として習ったもの。本書では複利の説明として利子を受け取る(そして再投資する)スパンを1か月→1週間→1日→1時間と分割し、1年後の利益は何倍になるか?という説明でeが出現している。
下記のnはスパンが1か月なら12、1秒なら60×60×24×365となる。nが大きくと極限値としてネイピア数が出現する。このネイピア数は積の極限である。
e=\lim_{n \to \infty} (1+\frac{1}{n})^n
ネイピア数は積の極限ではなく、和の極限としてもあらわされる。実際にnに数字を入れてみると確かにネイピア数に近いことがわかる。
e=\sum_{n=0}^{\infty} \frac{1}{n!}
つまりネイピア数eを介して、積の極限の和の極限には以下の関係が成立する。本書では簡単な証明(の雰囲気)でこれを示している。
\lim_{n \to \infty} (1+\frac{1}{n})^n=\sum_{n=0}^{\infty} \frac{1}{n!}
e^x
以下の無限級数は
f(x)=\sum_{n=0}^{\infty} \frac{x^n}{n!}
いくつかの証明を経て指数法則を満たすと示される。
f(x+y)=f(x)f(y)
指数法則の具体例はこんな感じ
x^{a+b}=x^ax^b
指数法則という観点からさらにいくつかの証明を経て、無限級数と指数の関係が示される。
\begin{align}
e^x &= \sum_{n=0}^{\infty} \frac{x^n}{n!} \
\end{align}
指数関数の微分
指数関数の微分を考えるために以下の無限級数の微分を考える。
\begin{align}
f(x)= \sum_{n=0}^{\infty} \frac{x^n}{n!} \
\end{align}
n番目の項の微分は以下の通りn-1番目の項と一致するため、無限に加算する場合の極限は一致するとみなすことができる。
\begin{align}
\frac{d}{dx} \frac{x^n}{n!} \ &= n\frac{x^{n-1}}{n!} \\
&=\frac{x^{n-1}}{{n-1}!}
\end{align}
よって以下の通り元の関数と微分後の関数は一致する。これは指数関数の特徴といえる。
\begin{align}
f(x) &= \sum_{n=0}^{\infty} \frac{x^n}{n!} \\ &= e^x \\
\\
f(x)^{'} &= f(x)
\end{align}
なお、指数関数から見たとき、極限の表現を指数関数のべき級数展開(テイラー展開)と言う。
微分方程式と指数関数
微分方程式とはf'(x)やf''(x)が含まれる方程式を指す。微分方程式とは動的な現象や連続的な関係を数学的に分析する基本的な概念とのこと。Webで調べると微分方程式にはいくつかあるようだが、本書では以下の微分方程式について述べている。
微分方程式
λを定数とする。実数全体で定義されたF(t)が
\begin{align}
F^{'}(t) &= λ F(t) ※微分方程式\\
F(0) &= A \\
\end{align}
を満たすならば
\begin{align}
F(t)& =Ae^{λt}である
\end{align}
解にe^xが含まれる。指数関数の性質である①無限級数表示、②指数法則、③微分方程式の解という3つの側面は同じ(指数)関数の3つの側面とのこと。
実際の物理現象として指数関数が現れる例として炭素14による年代測定、放射性核種の崩壊(半減期)、さらには次第に思い出せる数が減るような記憶の想起、コーヒーの温度変化について述べられている。
三角関数の微分
単位円での等速円運動をxy座標表示すると以下のように表される。
\begin{align}
(x(t),y(t))=(\cos t,\sin t)
\end{align}
よって円の接線方向の速度ベクトルは以下のように三角関数の微分となる。
\begin{align}
速度ベクトル=(\frac{d}{dt}\cos t,\frac{d}{dt} \sin t)
\end{align}
速度ベクトルは位置ベクトルと直行するためπ/2左回転しており、以下の微分の公式が導かれる。
\begin{align}
\frac{d}{dt}\cos t &= -\sin t\\
\frac{d}{dt} \sin t &= \cos t
\end{align}
オイラーの公式
急に以下の複素数を考え遊び始めている。(このような下りは何度かあるが、唐突さを気にしてはいけない気がする)
\begin{align}
F(t) = \cos t + i \sin t
\end{align}
この微分は以下のようになる。
\begin{align}
\frac{dF(t)}{dt} &= \frac{d}{dt}\cos t + i \frac{d}{dt}\sin t \\
&=-\sin t + i \cos t \\
&=i(\cos t + i \sin t) \\
&=iF(t) \\
\end{align}
これは微分方程式と初期条件を満たすためオイラーの公式が示される
\begin{align}
e^{it} = \cos t + i \sin t
\end{align}
本書ではオイラーの公式と指数法則を使い、実部と虚部を比較することで三角関数の加法定理や3倍角の公式を導いている。また指数関数を無限級数として表現し、三角関数の実部虚部と比較することで三角関数のべき級数展開(テイラー展開)を示している。
\begin{align}
e^{it} &=1 + (it) + \frac{1}{2!}(it)^2 + \frac{1}{3!}(it)^3 + ・・・\\
&=1 + it - \frac{1}{2}t^2 - \frac{i}{3!}t^3 + ・・・\\
\end{align}
よってオイラーの公式より
\begin{align}
e^{it} &= \cos t + i \sin t \\
\cos t &= 1 - \frac{1}{2}t^2 + \frac{1}{24}t^5 - ・・・\\
&= \sum_{n=0}^{\infty} \frac{(-1)^n}{2n!}t^{2n} \\
\sin t &= \sum_{n=0}^{\infty} \frac{(-1)^n}{(2n+1)!}t^{2n+1} \
\end{align}
偏微分
偏微分とはxやyといった複数の変数を持つ関数(多変数関数)の微分で、手順としてはxを固定値とみなしyについて微分したり、yを固定値とみなしxについて微分することを指す。偏微分の幾何的な意味は多変数関数を示す図のある点における接平面の傾きとのこと。
接平面の方程式は目的の関数f(x,y)と接平面g(x,y)について、ある点(x0,y0)で傾きが一致する。式は記載しないが、接平面の方程式は関数fのX0,y0における偏微分によって示すことができる。
臨界点と極大・極小
勾配ベクトルは以下の形で定義される。幾何的には接平面とのこと。
grad f(x,y)= (\frac{∂f}{∂x}(x,y),\frac{∂f}{∂y}(x,y))
ある点が極値であるとき、勾配ベクトルは0となるが、逆は言えない。つまり勾配ベクトルが0であるだけでは極値であるかどうかはわからない。次に述べるラグランジェの未定乗数定理はある関数の極値を求める手法(最適化問題)で、より正確には「制約付きの最適化問題のための手法」とのこと。
ラグランジェの未定乗数定理
ラグランジェの未定乗数定理とは「制約付き最適化問題を解くための数学的手法」とのこと。目的の関数と、制約を示す関数が登場し、目的の関数の極値を求める。
制約条件gと目的の関数fとする。ある点x0,y0が極値とすると、制約条件を満たしg(x0,y0)=0、fとgの勾配ベクトルは平行であるため以下が成立する。
\begin{align}
\frac{∂f}{∂x}(x0,y0) = λ\frac{∂g}{∂x}(x0,y0) \\
\frac{∂f}{∂y}(x0,y0) = λ\frac{∂g}{∂y}(x0,y0) \\
g(x0,y0) = 0\\
\end{align}