编辑距离,又称Levenshtein距离(也叫做Edit Distance),是指两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。
网上有很多关于此算法的源代码,但其中一些存在Bug,如百度搜索排名靠前的:
http://www.cppblog.com/whncpp/archive/2008/09/21/62378.html
Bug:matrix[0][0]没有初始化
此外,几乎所有的代码都没有考虑是否忽视字母大小写的问题,因此我用C#重新实现此算法。
测试代码:
最后
以上就是神勇香菇最近收集整理的关于C#:字符串相似度算法( Levenshtein Distance算法)的全部内容,更多相关C#:字符串相似度算法(内容请搜索靠谱客的其他文章。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复