激动帽子

文章
5
资源
0
加入时间
3年0月9天

编辑距离——莱文斯坦距离1.编辑距离2.莱文斯坦距离

1.编辑距离1.1简介编辑距离是针对二个字符串(例如英文字)的差异程度的量化量测,量测方式是看至少需要多少次的处理才能将一个字符串变成另一个字符串。1.2应用自然语言处理:如拼写检查可以根据一个拼错的字和其他正确的字的编辑距离,判断哪一个(或哪几个)是比较可能的字。生物信息学:DNA也可以视为用A、C、G和T组成的字符串,编辑距离可以用来判断二个DNA的类似程度。Unix下的diff及patch即是利用编辑距离来进行文本编辑对比的例子1.3分类最长公共子序列距离(Longest Com