LSTM(Long short-term memory)は、RNN(Recurrent Neural Network)の拡張として1995年に登場した、時系列データ(sequential data)に対するモデルのことを指す。
LSTMはRNNの中間層のユニットをLSTM blockと呼ばれるメモリと3つのゲートを持つブロックに置き換えることで実現されている。
メモリ:勾配消失及び勾配爆発の解決方法として、勾配を1とした自己ループ(CEC)
ゲート:入力ゲート、忘却ゲート、出力ゲート
またパラメータ数が多くなり、計算負荷が大きくなる課題がある。
More than 5 years have passed since last update.
Register as a new user and use Qiita more conveniently
- You get articles that match your needs
- You can efficiently read back useful information
- You can use dark theme