主题模型-LDA小结 转载自:http://blog.csdn.net/nanjunxiao/article/details/9006539一.主题模型传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的。 举个例子,有两个句子分别如下: 数据挖掘 2024-01-04 40 点赞 0 评论 60 浏览