摘要:最长公共子序列问题指的是求解两个序列和的长度最长的公共子序列。当然,可以看出,问题容易出现重叠子问题,这时候,就需要用动态规划法来解决。
问题介绍
给定一个序列$X=
给定两个序列$X$和$Y$,如果$Z$同时是$X$和$Y$的子序列,则称$Z$是$X$和$Y$的公共子序列。最长公共子序列(LCS)问题指的是:求解两个序列$X$和$Y$的长度最长的公共子序列。例如,序列$X={A,B,C,B,D,A,B}$和$Y={B,D,C,A,B,A}$的最长公共子序列为${B,C,B,A}$,长度为4。
本文将具体阐释如何用动态规划法(Dynamic Programming)来求解最长公共子序列(LCS)问题。
给定一个序列$X=
(LCS的子结构)令$X=
如果$x_m=y_n,$则$z_k=x_m=y_n$且$Z_{k-1}$是$X_{m-1}$和$Y_{n-1}$的一个LCS。
如果$x_m eq y_n,$则$z_k eq x_m$意味着$Z_{k-1}$是$X_{m-1}$和$Y$的一个LCS。
如果$x_m eq y_n,$则$z_k eq y_n$且$Z_{k-1}$是$X$和$Y_{n-1}$的一个LCS。
2. 构造递归解 在求$X=
定义$c[i,j]$表示$X_i$和$Y_j$的LCS的长度。如果$i=0$或$j=0$,则$c[i,j]=0.$利用LCS的子结构,可以得到如下公式:
$$ c[i,j]=left{ egin{array}{lr} 0,qquad 若i=0或j=0 c[i-1, j-1]+1,qquad 若i,j>0且x_i=y_j max(c[i, j-1], c[i-1, j]),qquad 若i,j>0且x_i eq y_j end{array} ight. $$
3. 计算LCS的长度 计算LCS长度的伪代码为LCS-LENGTH. 过程LCS-LENGTH接受两个子序列$X=
LCS-LENGTH(X, Y): m = X.length n = Y.length let b[1...m, 1...n] and c[0...m, 0...n] be new table for i = 1 to m c[i, 0] = 0 for j = 1 to n c[0, j] = 0 for i = 1 to m for j = 1 to n if x[i] == y[j] c[i,j] = c[i-1, j-1]+1 b[i,j] = "diag" elseif c[i-1, j] >= c[i, j-1] c[i,j] = c[i-1, j] b[i,j] = "up" else c[i,j] = c[i, j-1] b[i,j] = "left" return c and b4. 寻找LCS
为了寻找$X$和$Y$的一个LCS, 我们需要用到LCS-LENGTH过程中的表$b$,只需要简单地从$b[m, n]$开始,并按箭头方向追踪下去即可。当在表项$b[i,j]$中遇到一个"diag"时,意味着$x_i=y_j$是LCS的一个元素。按照这种方法,我们可以按逆序依次构造出LCS的所有元素。伪代码PRINT-LCS如下:
PRINT-LCS(b, X, i, j): if i == 0 or j == 0 return if b[i,j] == "diag" PRINT-LCS(b, X, i-1, j-1) print x[i] elseif b[i,j] == "up": PRINT-LCS(b, X, i-1, j) else PRINT-LCS(b, X, i, j-1)程序实现
有了以上对LCS问题的算法分析,我们不难写出具体的程序来实现它。下面将会给出Python代码和Java代码,供读者参考。
完整的Python代码如下:
import numpy as np # using dynamic programming to solve LCS problem # parameters: X,Y -> list def LCS_LENGTH(X, Y): m = len(X) # length of X n = len(Y) # length of Y # create two tables, b for directions, c for solution of sub-problem b = np.array([[None]*(n+1)]*(m+1)) c = np.array([[0]*(n+1)]*(m+1)) # use DP to sole LCS problem for i in range(1, m+1): for j in range(1, n+1): if X[i-1] == Y[j-1]: c[i,j] = c[i-1,j-1]+1 b[i,j] = "diag" elif c[i-1,j] >= c[i, j-1]: c[i,j] = c[i-1,j] b[i,j] = "up" else: c[i,j] = c[i,j-1] b[i,j] = "left" #print(b) #print(c) return b,c # print longest common subsequence of X and Y def print_LCS(b, X, i, j): if i == 0 or j == 0: return None if b[i,j] == "diag": print_LCS(b, X, i-1, j-1) print(X[i-1], end=" ") elif b[i,j] == "up": print_LCS(b, X, i-1, j) else: print_LCS(b, X, i, j-1) X = "conservatives" Y = "breather" b,c = LCS_LENGTH(X,Y) print_LCS(b, X, len(X), len(Y))
输出结果如下:
e a t e
完整的Java代码如下:
package DP_example; import java.util.Arrays; import java.util.List; public class LCS { // 主函数 public static void main(String[] args) { // 两个序列X和Y ListX = Arrays.asList("A","B","C","B","D","A","B"); List Y = Arrays.asList("B","D","C","A","B","A"); int m = X.size(); //X的长度 int n = Y.size(); // Y的长度 String[][] b = LCS_length(X, Y); //获取维护表b的值 print_LCS(b, X, m, n); // 输出LCS } /* 函数LCS_length:获取维护表b的值 传入参数: 两个序列X和Y 返回值: 维护表b */ public static String[][] LCS_length(List X, List Y){ int m = X.size(); //X的长度 int n = Y.size(); // Y的长度 int[][] c = new int[m+1][n+1]; String[][] b = new String[m+1][n+1]; // 对表b和表c进行初始化 for(int i=1; i = c[i][j-1]){ c[i][j] = c[i-1][j]; b[i][j] = "up"; } else{ c[i][j] = c[i][j-1]; b[i][j] = "left"; } } } return b; } // 输出最长公共子序列 public static int print_LCS(String[][] b, List X, int i, int j){ if(i == 0 || j == 0) return 0; if(b[i][j].equals("diag")){ print_LCS(b, X, i-1, j-1); System.out.print(X.get(i-1)+" "); } else if(b[i][j].equals("up")) print_LCS(b, X, i-1, j); else print_LCS(b, X, i, j-1); return 1; } }
输出结果如下:
B C B A参考文献
算法导论(第三版) 机械工业出版社
https://www.geeksforgeeks.org...
注意:本人现已开通两个微信公众号: 因为Python(微信号为:python_math)以及轻松学会Python爬虫(微信号为:easy_web_scrape), 欢迎大家关注哦~~
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/41852.html
摘要:最长公共子序列问题指的是求解两个序列和的长度最长的公共子序列。当然,可以看出,问题容易出现重叠子问题,这时候,就需要用动态规划法来解决。 问题介绍 给定一个序列$X=$,另一个序列$Z=$满足如下条件时称为X的子序列:存在一个严格递增的X的下标序列${i_1,i_2,...,i_k}$,对所有的$j=1,2,...,k$满足$x_{i_j}=z_j.$ 给定两个序列$X$和$Y$...
摘要:若且,则是和的最长公共子序列若且,则是和的最长公共子序列。递归结构容易看到最长公共子序列问题具有子问题重叠性质。例如,在计算和的最长公共子序列时,可能要计算出和及和的最长公共子序列。 虽是读书笔记,但是如转载请注明出处 http://segmentfault.com/blog/exploring/ .. 拒绝伸手复制党 本章讲解: 1. LCS(最长公共子序列)O(n^2)的时间复杂...
摘要:最长公共子序列动态规划问题,局部最小单元两值是否相等,相等则从对角线上个位置处的数值,继续状态延续不相等则从上下两个过去的位置找值保持延续,在上下两个过去位置中保持着之前的最长子序列。 最长公共子序列 动态规划问题,局部最小单元:两值是否相等,相等则从对角线上个位置处的数值+1,继续状态延续; 不相等则从上下两个过去的位置找值保持延续,在上下两个过去位置中保持着之前的最长子序列。 ...
摘要:但不是和的最长公共子序列,而序列和也均为和的最长公共子序列,长度为,而和不存在长度大于等于的公共子序列。最长公共子序列给定序列和,从它们的所有公共子序列中选出长度最长的那一个或几个。为和的最长公共子序列长度。 最长公共子序列(Longest Common Subsequence LCS)是从给定的两个序列X和Y中取出尽可能多的一部分字符,按照它们在原序列排列的先后次序排列得到。LCS问...
摘要:遇到问题查查,看看,大神的讲解问问岛胖君下面是我最近整理出来的关于字符串的文章的怎么翻译汇集目录非常希望强化博客的功能,比如分类,置顶。 虽是读书笔记,但是如转载请注明出处 http://segmentfault.com/blog/exploring/ .. 拒绝伸手复制党 最近在看算法和语言,基本属于看知识 --> java实现 --> 整理blog 这个路线。 遇到问题查查st...
阅读 1070·2023-04-26 02:02
阅读 2410·2021-09-26 10:11
阅读 3565·2019-08-30 13:10
阅读 3755·2019-08-29 17:12
阅读 728·2019-08-29 14:20
阅读 2195·2019-08-28 18:19
阅读 2243·2019-08-26 13:52
阅读 965·2019-08-26 13:43