暴躁大炮

文章
7
资源
0
加入时间
3年0月21天

主题模型-LDA小结

转载自:http://blog.csdn.net/nanjunxiao/article/details/9006539一.主题模型传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,如TF-IDF等,这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有,但两个文档是相似的。        举个例子,有两个句子分别如下: