Attention

如果去掉rnn的传递的连接关系变为self-attention机制，您的页面特别像MLP的结构，我不懂这两者之间有什么核心的区别。