ラビットチャレンジday4 レポート
Section1:強化学習 ■強化学習とは ・長期的に報酬を最大化できるように環境のなかで行動を選択できるエージェントを作ることを目標とする機械学習の一分野 →行動の結果として与えられる利益(報...
3
1
Comment0
3 search resultsShowing 1~3 results
Section1:強化学習 ■強化学習とは ・長期的に報酬を最大化できるように環境のなかで行動を選択できるエージェントを作ることを目標とする機械学習の一分野 →行動の結果として与えられる利益(報...
Section1:再帰型ニューラルネットワークの概念 ■RNNとは ・自然言語や時系列データなど連続的なつながりのあるデータに対応可能な、ニューラルネットワークである。 ・時系列データとは、時間...
Section1:勾配消失問題 ・誤差逆伝播法が階層に進んでいくについて勾配がどんどん緩やかになっていく。そのため、勾配降下法による更新では下位層のパラメータはほとんど変わらず訓練は最適値に収束...
3 search resultsShowing 1~3 results
Qiita is a knowledge sharing service for engineers.