我是靠谱客的博主 幸福仙人掌,最近开发中收集的这篇文章主要介绍[EMNLP2015]Effective Approaches to Attention-based Neural Machine Translation,觉得挺不错的,现在分享给大家,希望可以做个参考。
概述
neural machine translation有以下优点:
(1) 有能力生成很长的词序列
(2) 因为不需要存储巨大的短语词表,所以需要很小的内存
(3) 解码很容易
A: 介绍了两种attention模型,其共同点是在每一步decoding时hidden state h
t
都作为输入参与计算c
t
(1)global attention
在生成target word y
t
时, input 中的所有词都参与其中
上图给出了两条计算路线, 上面一条是以往的计算路线,下面的是本文给出的计算路线
(2) local attention
input 中的部分词参与生成 y
t
重点是计算p
t
, 文章写的很详细,这里不赘述
B:input-feeding Approach
图1和图4中蓝色方框是encoder, 红色部分是decoder, 现在关注的是decoder的输入有变化, 在图1中,decoder的当前时刻的input 是前一时刻的输出,而在图4中decoder的当前时刻input除了前一时刻的输出还有前一时刻的隐状态
h̃ t
最后
以上就是幸福仙人掌为你收集整理的[EMNLP2015]Effective Approaches to Attention-based Neural Machine Translation的全部内容,希望文章能够帮你解决[EMNLP2015]Effective Approaches to Attention-based Neural Machine Translation所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复