spark Word2Vec+LSH相似文本推荐(scala)
在上一篇博客,我们使用spark CountVectorizer与IDF进行了关键词提取,博客地址:spark CountVectorizer+IDF提取中文关键词(scala)本篇博客在上一篇博客的基础上,介绍如何根据关键词获取文档的相似度,进行相似文本的推荐。在这里我们需要使用到两个算法:Word2Vec与LSH。其中Word2Vec即将词转换为词向量,这样词之间的关系就可以向量距...