Aiに必要な数学知識の単元一覧
・微分積分
・線形代数
・統計学
微分積分
微分
・理解するためによく使われる車の速度の話を読むといい(距離が300kmのA地点からB地点まで車で移動すると、6時間後に到着した場合は時速50km(300÷6)だけど、ずっと時速50kmのスピードで進んではいないよね?途中でカーブとかでスピードが変化し、そういった瞬間的な速度を求めたりできるのが微分)
微分の使われ方
・AIでは一般的に、関数の傾き(AIでは傾き=誤差:予測値と正しい値の差)を算出するために使う
・モデルを作る際の手順の、例えば損失関数/lossで使う(入力データに対しての正解データ(教師データ)を用意してやり、損失関数という式を使って予測値が正解ととれだけ離れているかを計算)
・損失関数の誤差を小さくすると良いモデルになる
積分
・特に曲線の面積を求めるのが積分の役割
・∫ (インテグラル)という記号を使う
積分の使われ方
・確率分布の計算: 確率密度関数を積分することで、特定の範囲内での事象の発生確率を求めることができます。例えば、ある値以下(または以上)のデータポイントが発生する確率を計算する際に使用されます。
・強化学習: 強化学習における期待報酬の計算にも積分が使われます。状態遷移確率や報酬関数を積分することで、ポリシーの良さを評価することができます
線形代数
・線形代数は、ベクトルと行列の概念を用いて、直線や平面などの線形の性質を扱う数学の分野
・線型代数の勉強に特化したサイト
線形代数の使われ方
・AIで使う大量の計算式をわかりやすく表記するために線形代数を使うことで、効率よく大量の知識を学習させることが可能となる
・例えば、Word2VecやBERTなどのモデルは、単語の意味をベクトルとして表現し、これを用いて文脈を理解します
統計学
・多変量解析はディープラーニングで活用される
統計学の分類
・記述統計
・推測統計
・ベイズ統計
推測統計
・限られたデータ(標本)から全体のデータ(母集団)の特性を推定する統計学の分野
多変量解析
・ディープラーニングで使われる
ベイズ理論
・事象が起こる確率を、既に持っている情報や新たに得られたデータを基に更新する方法
統計学の使われ方
- データの前処理
欠損値処理、外れ値検出、正規化などのデータ前処理に統計的手法が用いられます - モデル選択と評価
機械学習モデルの選択や評価には、統計的尤度やモデル選択基準(AIC、BICなど)が使われます。交差検証によるモデル評価にも、統計的な考え方が不可欠 - パラメータ推定
ニューラルネットワークなどのモデルパラメータの推定には、最尤推定や事前分布を用いたベイズ推定の考え方が役立ちます。 - サンプリングと推論
確率的勾配降下法や近似ベイズ推論(MCMC、変分ベイズなど)では、確率分布からのサンプリングが重要です。
予測時にも、予測分布からのサンプリングが行われることがあります。 - テスト
モデルの性能を統計的に検証するため、様々な統計的検定(t検定、カイ二乗検定など)が使われます。 - データ解釈
機械学習モデルの出力を解釈する際、統計的な信頼区間の推定などが役立ちます。
その他
・集合位相などetc...
参考
https://www.seplus.jp/dokushuzemi/blog/2019/03/remaster_calculus.html
https://toukei-lab.com/ai-math
https://www.seplus.jp/dokushuzemi/blog/2019/03/remaster_calculus.html