LDA主题模型、Word2Vec
原文地址:http://blog.csdn.net/huagong_adu/article/details/7937616背景隐含狄利克雷分配(Latent Dirichlet Allocation)是一种主题模型即从所给文档中挖掘潜在主题。LDA的出现是为了解决类似TFIDF只能从词频衡量文档相似度,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的情形: 乔布斯、苹果。LDA通常用