Global Embedding 理解
1.Attention-based seq2seqe(t,i):求上一时刻的输出和这一时刻编码器的输出的相似度a(t,i):求这个词在整个文本中占多大的比重,每个时刻都存在着一个值,这个只是求一个softmaxc(t):文本向量,求和,n代表序列长度,每个词都有一个softmax值,用每一个概率值去乘以隐变量,这个隐变量就是最初的文本向量,这个概率值就是每个词在整个文本中占多大的比...