含糊面包

文章
4
资源
0
加入时间
3年0月8天

[Algorithm] 局部敏感哈希算法(Locality Sensitive Hashing)

  局部敏感哈希(Locality Sensitive Hashing,LSH)算法是我在前一段时间找工作时接触到的一种衡量文本相似度的算法。局部敏感哈希是近似最近邻搜索算法中最流行的一种,它有坚实的理论依据并且在高维数据空间中表现优异。它的主要作用就是从海量的数据中挖掘出相似的数据,可以具体应用到文本相似度检测、网页搜索等领域。1. 基本思想  局部敏感哈希的基本思想类似于一种空间域转换...