1.まえがき
- こちらは以下のFeed-Forward Networkの解説をするための記事です。
Go to list of users who liked
Share on X(Twitter)
Share on Facebook
Feed-Forward Networkの解説をするための記事です。
Feed-Forward Networkとは前のMulti-Head Attentionにて得た表現を本当に必要な表現だけにして、そこから知識として関連する表現に繋げる機構です。upで表現を広げるのと細かく分けて、gateで必要な所の大きさを教えます。actで互いの場所のその大きさの分掛ける事で必要な情報だけを大きくします。downによって表現を縮小させ元のサイズに戻して、知識として繋げてあげて、整えられた情報を次の層に渡してあげることが可能になります。LLMの専門家として選択をするMoEと似ています。Register as a new user and use Qiita more conveniently
Go to list of users who liked