NLP算法(三)- 循环神经网络1 背景2 RNN3 LSTM4 GRU
1 背景在解决文本相关的任务时,各单词之间在语义上是有关联的。若直接使用全连接层等线性模型,则会丢失各单词之间的联系。CNN模型虽然可以构建相邻单词的联系,但受限于窗口大小,该模型仅能建立有限邻近单词之间的联系。因此,一种新的模型被提出,期望能改进上述两种模型的缺陷,既能建立单词之间的联系,同时使单词的信息可以传递到更远的位置。这一模型便是循环神经网络。迄今为止,主要有3种循环神经网络模型被提出,分别是RNN、LSTM、GRU,下面我们将依次展开讨论。2 RNNRNN模型结构如下所示,该模