はじめに
機械学習を扱っていく上で、その根底を支える数学的知見の重要性を感じ、
記事を書こうと思いました。
内容は、大学の情報系学科で教わるぐらいの難易度となると思われます。
あらかじめ、ご了承下さい。
なぜ数学を学ぶ必要があるのか
東京大学の松岡聡さんも、同様のことを仰られておりましたが、
数学を学習することは、その技術の根底を担う基礎的な部分を理解することに繋がります。
原理の理解が徹底されていると、"量的な" 感覚が自然と身に付き、
さらに、その基礎学習から得られた知見から帰結の結論も考えれば、
「将来は大体こうなるんだろうな。」と未来の予測ができます。
すなわち、ライバル達よりも "5~10" 年は先を見通せるわけです。
日進月歩の如く技術革新を続けるこのIT業界において、
如何にして、"取り残されず" さらには "常に先を行く" 為に、
数学的知見の重要性をご理解いただければ、幸いです。
導入
まずは、基本事項についての定義からです。
標本空間
定義
ある事象に対して、起こり得る全ての結果の集合を標本空間という。
確率分布
定義
確率空間 $(;Ω,;P;)$ において、標本空間 $Ω$ から実数空間 $R=(-∞,;∞)$ への関数 $X$ を確率変数といい、
$X$ のとり得る値とその確率の組を $X$ の確率分布という。
確率関数
定義
確率変数 $X$ に対して、実数空間 $R$ 上の関数
p(x)=\;P({X\!=\!x}),\quad-∞<x<∞
を $X$ の確率関数という。