A Neural Probabilistic Language Model ------阅读笔记公式推导
传统的统计语言模型有一些缺点:1.由于维度灾难(特别是离散变量),在高维下,数据的稀缺性导致统计语言模型存在很多为0的条件概率,传统的统计语言模型也花费大量的精力来处理这个,包括平滑,插值,回退等方法2.语言模型的参数个数随着阶数呈指数增长,所以一般这个模型的阶数不会很高,这样n-gram无法建立长远的关系3.n-gram无法建模出多个相似词的关系,比如在训练集中有: the cat is wal...