使用余弦相似度算法计算文本相似度 在求相似度的时候经常会有以下一些方法,1.基于词向量余弦相似度曼哈顿距离欧几里得距离明式距离(是前两种距离测度的推广),在极限情况下的距离是切比雪夫距离2.基于字符的编辑距离simhash共有字符数(有点类似 onehot 编码 ,直接统计两个文本的共有字符数,最 naive 的相似度算法了)3.基于概率统计的杰卡德相似系数4.基于词嵌入模型的word2ve... NLP 2023-10-08 38 点赞 0 评论 57 浏览