概述
问题:
设 A 和 B 是两个字符串。我们要用最少的字符操作次数,将字符串 A 转换为字符串 B 。这里所说的字符操作共有三种:
-
删除一个字符;
-
插入一个字符;
-
将一个字符改为另一个字符。
对任给的两个字符串 A 和 B ,计算出将字符串 A 变换为字符串 B 所用的最少字符操作次数。
1. 阐述实验原理
这个问题本质上是一个无向图的问题,固定了起点和终点,起点为字符串 A ,终点为字符串 B 。但是每一个点所对应的分支太多。所以我们需要对其进行转化。在以下特殊情况下,最短编辑距离容易求出:
-
当 A 、 B 的长度都为 0 时,最短编辑距离为 0
-
当 A 的长度为 0,B 的长度不为0,最短编辑距离为 A 的长度
-
当 A 的长度不为0,B的长度为0,最短编辑距离为 B 的长度
我们可以将所有的字符串转化为以上的三种情况。
可以尝试使用动态规划来解决。动态规划对于有向无环图比较合适,如果我们只对字符串 A 、 B 的最后一个字符做操作,而且将“增删改”变为“删改”,那么无向图就变成了有向无环图。使用动态规划,首先需要定义状态。我们可以把 A,B 变换成的子串的长度 (i,j) 看成一个状态,然后定义状态 (i,j) 的指标函数 d(i,j)为 (i,j) 变为相同子串所需的最小编辑次数。然后观察不同状态之间是如何转移的,从状态 (i,j) 出发有三种决策,分别对应题目中所给出的三种字符操作(三种字符操作都是对最后一个字符的操作)。
-
删除一个字符 ==> 删除 A 字符串的最后一个字符,转移到了 (i−1,j)
-
插入一个字符 ==> 在 A 字符串末尾插入 B 字符串的一个字符,相当于 B 字符串删除一个字符,转移到了 (i,j−1)
-
将一个字符改为另一个字符。 ==> 将 A 的最后一个字符改为 B 的最后一个字符,将状态转移到了 (i−1,j−1)
则状态转移方程为:
d(i,j)=min{d(i−1,j)+1,d(i,j−1)+1,d(i−1,j−1)+c}
式中,当子串的最后一个字符相同时, AB 的最小编辑距离与 AB 都去掉最后一个字母的最小编辑距离相同,所以 c=0,否则 c=1。
2. 提交实验程序和注释
#include
#include <stdio.h>
using namespace std;
int main()
{
int n=5,m=9,i,j;
char word1[5]={‘h’,‘e’,‘l’,‘l’,‘o’};
char word2[9]={‘h’,‘e’,‘l’,‘l’,‘o’,‘h’,‘i’,‘j’,‘k’};
int dist[n][m];
for(int i = 1; i <= n; ++i)
dist[i][0] = i;
for(int j = 1; j <= m; ++j)
dist[0][j] = j;
for(j=1;j<=m;j++){
for(i=1;i<=n;i++){
if(word2[j]==word1[i]){
dist[i][j]=dist[i-1][j-1];
}
else{
if(j>i){
dist[i][j]=1+dist[i-1][j];
}
if(j<i){
dist[i][j]=1+dist[i][j-1];
}
if(j==i){
dist[i][j]=1+dist[i-1][j-1];
}
}
}
}
printf("%d",dist[i][j]);
}
最后
以上就是无语香菇为你收集整理的算法-最短距离问题的全部内容,希望文章能够帮你解决算法-最短距离问题所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复