More than 5 years have passed since last update.

【数式なしで説明】なぜニューラルネットワーク分類にクロスエントロピー、シグモイド、ソフトマックスが使われがち？

Last updated at 2018-01-01Posted at 2018-01-01

背景

ニューラルネットワークでの分類問題にクロスエントロピー、シグモイド関数、ソフトマックス関数がよく使われている。

そして、計算式があふれ、目を背け、結果だけみて、修正できない。

こんな私ですが、ニューラルネットワークでの分類問題にクロスエントロピー、シグモイド関数、ソフトマックス関数が使われがちかを数式無しで説明してみます。

ソフトマックス関数の数式は気にせず、その特徴は以下の2つ

つまり、最後の出力の直前の活性化関数にソフトマックス関数を使えば、分類問題の答えとしてカテゴリAが50%、Bが20%・・・みたいな感じで理想的な結果を出力できるのです。

ニューラルネットワークでの分類問題において、目的関数は正直なんだっていいのです。
でもなぜ平均二乗誤差でなく、クロスエントロピー誤差なのか？

当然、目的関数は微分しないといけません。

驚くべきは、クロスエントロピーの微分とシグモイド関数の微分を掛け算するとすごくきれいな数式になるのです。

これらの話を結論付けると、

とするのが、計算コストや求める答えにとって理想的ということがわかります。