ニューラルネットワーク(neural network)はなぜ任意の関数を近似できるのか

Posted at 2025-06-07

近年、機械学習や深層学習が飛躍的に進化し、音声認識、画像分類、翻訳、さらには創作まで自動で行えるようになっています。
その中心にあるのが「ニューラルネットワーク」という仕組みです。

では、なぜニューラルネットワークは、あらゆる関数の形（ルール）を学習・再現できるのでしょうか？

以下の流れで丁寧に解説します：

🧩 ニューラルネットワークの基本構造

ニューラルネットワークは、以下のような**レイヤー構造（層の重なり）**で成り立っています。

各層には「ノード（ニューロン）」があり、それぞれが**小さな計算（重み付き加算と活性化関数）**を行います。
この計算を何層にもわたって繰り返すことで、複雑なルールを表現できるようになるのです。

関数：y = 2x + 1

これは「入力xに対して出力yが直線的に増える」というルール。
1つのノードでも学習可能で、ニューラルネットワークの「最も簡単な使い方」です。

関数：y = x² - x + 3

これは放物線になります。こうなると、直線の組み合わせだけでは表現できません。

しかし、ニューラルネットワークなら、以下のようにして近似できます：

関数：y = 1（偶数のとき）、0（奇数のとき）

このように「段差のある関数」は非常に扱いにくいですが、十分に大きなニューラルネットワークなら、段差を細かい線で真似できます。

数学の世界では、「任意の連続関数は、1つの隠れ層を持つニューラルネットワークで近似できる」ということが証明されています。
これを「ユニバーサル近似定理（Universal Approximation Theorem）」と呼びます。

この理論により、「どんな複雑な関数でも、ニューラルネットワークで表現可能」とわかります。

以下は、具体的なニューラルネットワーク（3層構造）の図です：

分野	入力	出力	利用されている関数の例
画像認識	ピクセルの明るさ	「これは犬/猫/人」などのラベル	非線形関数 + ソフトマックス分類
翻訳	英文の単語列	対応する日本語の文	時系列関数・注意機構（Transformer）
声→文字変換	音の波形データ	テキスト（例：「こんにちは」）	時系列 + 畳み込み + リカレントネットワーク
自動運転	カメラ画像、速度など	ハンドルの角度、ブレーキ操作	多層パーセプトロン、強化学習

ポイント	説明
ニューラルネットワークは「入力→出力」のルールを学ぶ機械
小さな非線形計算を重ねることで、複雑な関数を再現できる
ユニバーサル近似定理により、任意の連続関数を理論上近似可能
実際に多くの分野で使われており、人間のような判断も可能に

「ニューラルネットワークは何でも学べる」というのは魔法ではなく、小さなパーツ（ノード）の積み重ねによるものです。
この考え方を理解することで、AIの仕組みに対する理解もぐっと深まります。