CS224n笔记三之词向量模型与GloVe
词向量模型语言学家J. R. Firth提出,通过一个单词的上下文可以得到它的意思,所以我们可以定义一个以预测某个单词的上下文的模型: p(context|wt)= ...p(context|w_t) = \ ... 我们的目标当然是希望概率p越大越好,所以我们可以定义一个目标函数: J′(θ)=∏t=1T∏−m≤j≤m, j≠0P(wt+j|wt;θ){J}'(\theta) = \pr