python 编辑距离_Python文本相似性计算之编辑距离详解
编辑距离编辑距离(Edit Distance),又称Levenshtein距离,是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。例如将kitten一字转成sitting:('kitten' 和 ‘sitting' 的编辑距离为3)sitten (k→s)sittin (e→i)...