@classical_style
2022-05-26
Decoderの挙動において、Encoderの出力をKeyとValueにしたMulti-Head Attentionは Self Attentionではないのでは、と思いました。