概述
描述:Levenshtein 距离,又称编辑距离,指的是两个字符串之间,由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出的,故又叫Levenshtein Distance。
字符串A:abc
字符串B: abcd
通过增加或是删掉字符”g”的方式达到目的。这两种方案都需要一次操作。把这个操作所需要的次数定义为两个字符串的距离。
要求:给定任意两个字符串,写出一个算法计算它们的编辑距离。如上方A到B/B到A的距离为1。
思路:典型的动态规划思路。
一般多重决策最优解的问题都可以用动态规划来解决,DP算法的本质就是穷举,是一种用空间换取时间的算法。
其数学证明过程比较复杂,只是简单使用的话以此题为例动态规划思路可以分为四步:
1.状态
bp[x][y]表示A前x个字符串编辑成 B前y个字符所花费的代价。即需要一个二维数组。
2.状态转移方程
见下方分析。
3.初始化
0行0列的初始化参考,数学归纳的原理。
4.遍历方向
一般是顺序遍历,特殊场景下会采用逆序遍历。
生成大小为(m+1)(n+1)的矩阵bp. bp[x][y]表示A前x个字符串编辑成 B前y个字符所花费的代价.
对于第一行来说,bp[0][y]表示将一个空串变为B的前y个字符组成的子串,花费的代价为ic*y;
同理,对于第一列bp[x][0] = x*dc;
每个位置的解都与之前的值取最优,bp[x][y]可能有以下四种取值:
斜向上的+1:
bp[x-1][y-1]+rc;//A[x-1]!=B[y-1] 将前x-1个字符变为B前y-1个字符,再将最后一个字符替换.
斜向上的+0:
bp[x-1][y-1];//A[x-1]==B[y-1] 将前x-1个字符变为B前y-1个字符,最后一个不用修改.
竖向上的+1:
bp[x-1][y]+bc;//删除一个字符,将前x-1个字符变为B的前y个字符
横向上的+1:
bp[x][y-1]+ic;//将A前x-1个字符变为B的前y个字符,再插入一个字符
bp[x][y]的值就为以上四者最小的一个.
最后bp[m][n]为解。如图解为(3,4) 的值1.
a | ab | abc | abcd | ||
0 | 1 | 2 | 3 | 4 | |
a | 1 | 0 | 1 | 2 | 3 |
ab | 2 | 1 | 0 | 1 | 2 |
abc | 3 | 2 | 1 | 0 | 1 |
实现:
#include<iostream>
#include<string>
#include<vector>
using namespace std;
int CountStrDistance(string a,string b)
{
int one,two,three = 0;
/* one为竖向,two为横向,three为斜向 */
int m
= (int)a.size(),n = (int)b.size();
vector<vector<int>>dp(m+1,vector<int>(n+1,0));//长m+1,宽n+1的二维数组
dp[0][0]=0;
for (int i = 1; i<= m; i++) dp[m][0] = i;
for (int i = 1; i<= n; i++) dp[0][n] = i;
for (int i = 1; i<= m; i++)
{
for (int j = 1;j<=n;++j)
{
one = dp[i-1][j]+1;
two = dp[i][j-1]+1;
three = dp[i-1][j-1];
if (a[i-1]!=b[j-1])
three+=1;
dp[i][j] = min (min(one,two),three);
}
}
return dp[m][n];
}
最后
以上就是背后白猫为你收集整理的算法题:求字符串编辑距离(动态规划问题)的全部内容,希望文章能够帮你解决算法题:求字符串编辑距离(动态规划问题)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复