More than 5 years have passed since last update.

deep learningの出力層でsoftmax関数が活性化関数として使われているけどなんで？

Last updated at 2017-07-04Posted at 2017-07-03

なんでsoftmaxの関数を使う必要があるの？

deep learningの最後の出力の前にsoftmax関数を挟む。なぜなら
softmax関数を使うことで、全ての要素を足すと1になる数に変換できるので、確率として扱うことができるようになるからである。

ここで疑問は２つで

このケースではわざわざsoftmax関数で変換する必要がない。出力結果が一番大きい値をとっている分類1つだけ返すだけなので、max関数で判定してOK
使う活性化関数によっては、最終出力が負の数の場合があり、負の数になると全ての要素を足した値で割れなくなる可能性があるので、全ての要素を足した値で割るというのは駄目。
　　 ex 最終出力が[-1, 0.3, 0.7]の場合、合計値0になり、割れない。
負の数というのは、何かと扱いづらいので、正の数に変換したいのと、単調増加の関数でかつ足して1になるような良い変換をしてくれるのがsoftmax関数だというわけ。

とりあえず納得！