字符串最短编辑距离问题
问题:
设 A 和 B 是两个字符串。我们要用最少的字符操作次数,将字符串 A 转换为字符串 B 。这里所说的字符操作共有三种:样例:
对任给的两个字符串 A 和 B ,计算出将字符串 A 变换为字符串 B 所用的最少字符操作次数。
- 删除一个字符;
- 插入一个字符;
- 将一个字符改为另一个字符。
2
bcodeqwrty
bdq
baician
bczdd
输出:
7
5
这个问题本质上是一个无向图的问题,固定了起点和终点,起点为字符串 A ,终点为字符串 B 。但是每一个点所对应的分支太多。所以我们需要对其进行转化。
在以下特殊情况下,最短编辑距离容易求出:
- 当 A 、 B 的长度都为 0 时,最短编辑距离为 0
- 当 A 的长度为 0 , B 的长度不为 0 ,最短编辑距离为 A 的长度
- 当 A 的长度不为 0 , B 的长度为 0 ,,最短编辑距离为 B 的长度
可以尝试使用动态规划来解决。动态规划对于有向无环图比较合适,如果我们只对字符串 A 、 B 的最后一个字符做操作,而且将“增删改”变为“删改”,那么无向图就变成了有向无环图。
使用动态规划,首先需要定义状态。我们可以把 A,B 变换成的子串的长度( i , j ) (i,j) (i,j) 看成一个状态,然后定义状态( i , j ) (i,j) (i,j) 的指标函数d ( i , j ) d(i,j) d(i,j) 为( i , j ) (i,j) (i,j) 变为相同子串所需的最小编辑次数。
然后观察不同状态之间是如何转移的,从状态( i , j ) (i,j) (i,j) 出发有三种决策,分别对应题目中所给出的三种字符操作(三种字符操作都是对最后一个字符的操作)。
则状态转移方程为:
- 删除一个字符 ==> 删除 A 字符串的最后一个字符,转移到了( i ? 1 , j ) (i-1,j) (i?1,j)
- 插入一个字符 ==> 在 A 字符串末尾插入 B 字符串的一个字符,相当于 B 字符串删除一个字符,转移到了( i , j ? 1 ) (i,j-1) (i,j?1)
- 将一个字符改为另一个字符。 ==> 将 A 的最后一个字符改为 B 的最后一个字符,将状态转移到了( i ? 1 , j ? 1 ) (i-1,j-1) (i?1,j?1)
d ( i , j ) = m i n { d ( i ? 1 , j ) + 1 , d ( i , j ? 1 ) + 1 , d ( i ? 1 , j ? 1 ) + c } d(i,j)=min \{d(i-1,j)+1,d(i,j-1)+1,d(i-1,j-1)+c\} d(i,j)=min{d(i?1,j)+1,d(i,j?1)+1,d(i?1,j?1)+c}
式中,当子串的最后一个字符相同时, AB 的最小编辑距离与 AB 都去掉最后一个字母的最小编辑距离相同,所以c = 0 c=0 c=0 ,否则c = 1 c=1 c=1 。
【字符串最短编辑距离问题】完整程序:
//#define LOCAL
#include
#include
#include
#include
#include using namespace std;
const int maxn = 1000 + 2;
char a[maxn];
char b[maxn];
int step[maxn][maxn];
int findStep(int i, int j)
{
int &ans = step[i][j];
if (ans != -1)
{
return ans;
}
if (i == 0 && j == 0)
{
return ans = 0;
}
if (i == 0)
{
return ans = j;
}
else if (j == 0)
{
return ans = i;
}
int c;
if (a[i - 1] != b[j - 1])
{
c = 1;
}
else
{
c = 0;
}
ans = min(min(findStep(i - 1, j) + 1,
findStep(i, j - 1) + 1),
findStep(i - 1, j - 1) + c);
return ans;
}int main()
{
#ifdef LOCAL
freopen("data.in", "r", stdin);
freopen("data.out", "w", stdout);
#endif // LOCAL
int n;
int m1, n1;
while (cin >> n && n)
{for (int j = 0;
j < n;
j++)
{
memset(step, -1, sizeof(step));
cin >> a >> b;
cout << strlen(a) << " " << strlen(b) << endl;
m1 = strlen(a);
n1 = strlen(b);
cout << findStep(m1, n1) << endl;
}
}
return 0;
}
推荐阅读
- 一起来学习C语言的字符串转换函数
- 字符串拼接成段落,换行符(\n)如何只执行n-1次
- 涵养字外功
- C语言的版本比较
- JavaScript|JavaScript — call()和apply()、Date对象、Math、包装类、字符串的方法
- JS截取字符串的方法详解
- Python|Python 字符串 子串 回文串
- LeetCode|LeetCode 每日一题 [52] 表示数值的字符串
- 135编辑器给大家解析12月新媒体营销日历
- 论文发表时间能提前吗-WOSCI沃斯编辑