数据结构与算法之最小生成树数据结构与算法之最小生成树

我们已经掌握了图的概念和基本操作，接下来了解一下图可以解决的问题。图主要用来解决多对多问题，比如有多个起点和终点，或者有多种选择的问题。例如我们要从下图中找到能连通每个顶点的最短路径，或者寻找从顶点v0到顶点v3的最短路径：

文章图片
网现在我们要研究的就是寻找能连通每个顶点的最短路径，我们称这种构造连通网的最小代价生成树为最小生成树。这个问题有两个经典的算法，分别是普里姆算法和克鲁斯卡尔算法。
普里姆（Prim）算法普里姆算法的思想是每次都从未选择的顶点中选择代价最小的顶点，并更新剩余顶点的最小代价值。我们以上图为例，演示普里姆算法的过程。
首先选择一个顶点，比如v0，与v0相连的顶点记它的最小代价值为实际值，其余顶点记为∞，如下所示：

文章图片
选择顶点v0 接下来选择距离v0最近的顶点v1加入已选列表，并更新剩余结点到已选列表的距离值，如下所示：

文章图片
选择顶点v1 接下来再次选择距离已选列表最近的顶点，很显然v5最近，选择后结果如下：

文章图片
选择v5 按照同样的方式，我们选择v8加入已选列表，如下所示：

文章图片
选择v8 重复这一操作，最后我们可以得到如下路径，就是我们要构造的最小生成树：

文章图片
最终结果克鲁斯卡尔（Kruskal）算法普里姆算法是从顶点出发，我们也可以从边出发，克鲁斯卡尔算法就是每次选择合适的最小的边加入已选列表，直至所有顶点都连通。我们依然以上图为例，演示它的过程。
因为要对边进行操作，所以首先应该对所有的边按照代价大小排序，还记得图的边集数组存储方式吗？我们把边排序后就放在一个边集数组中，如下所示：

文章图片
边集数组首先，我们把每个顶点都看作一棵独立的树，这些顶点组成了一个森林，而我们的目的就是把这个森林组合成一棵树，如下所示：

文章图片
顶点组成的森林第一步，我们从边集数组中取最短的边，将森林中的对应顶点连接起来，第一个边就是(v4, v7)，weight为7，如下所示：

文章图片
连接v4和v7 顶点v4和v7现在就属于同一棵树了，接下来我们再找最短的边，它的两个就不能在同一棵树上，第二条边是(v2, v8)，如下所示：

文章图片
连接v2和v8 按照同样的步骤，我们继续连接剩下的边，直到连接完(v3, v7)如下：

文章图片
连接v3和v7 接下来最短的边是(v5, v6)，但是顶点v5和v6在同一棵树上，如果把它们连起来，就会形成一个环，这明显是不对的，所以这个边是无效的。接下来的(v1, v2)同理，所以我们应该连接(v6, v7)，如下所示：

文章图片
连接v6和v7 至此，所有的顶点都连通了，可以看到，结果和普里姆算法是一致的。
代码实现普里姆算法依然以邻接矩阵为例，演示普里姆算法的实现过程，代码如下所示：

public void prim(AMGraph graph) { int len = graph.getVertexNum(); int min = 0; // 相关顶点的坐标 int[] adjvex = new int[len]; // 最小代价 int[] lowcost = new int[len]; // 将位置0的顶点加入生成树，设置lowcost为0 lowcost[0] = 0; adjvex[0] = 0; for (int i = 1; i < len; i++) { // 和v0相连的顶点的权值存入数组 lowcost[i] = graph.getWeight(0, i); // 全部坐标都初始化为v0下标 adjvex[i] = 0; }for (int i = 1; i < len; i++) { // INFINITE是一个不可能的值，这里设置为Int的最大值 min = INFINITE; int j = 1, k = 0; while (j < len) { // 循环剩下的全部顶点，寻找lowcoast if (lowcost[j] != 0 && lowcost[j] < min) { min = lowcost[j]; k = j; } j++; }System.out.println("当前顶点中最小权值的边是：(" + adjvex[k] + ", " + k + ")" + "最小值为：" + min); // 把此顶点的权值设为0 lowcost[k] = 0; for (j = 1; j < len; j++) { // 把当前的k顶点加入已选列表，并更新剩余顶点的权值 if (lowcost[j] != 0 && graph.getWeight(k, j) < lowcost[j]) { lowcost[j] = graph.getWeight(k, j); adjvex[j] = k; } } } }

可以看到，因为双重for循环的原因，普里姆算法的时间复杂度为O(n2)。
克鲁斯卡尔算法

public void kruskal(Edge[] edges) { int len = edges.length; // 定义一个数组，保存每个顶点的父结点，也就是它所在的树结构中的父结点 int[] parent = new int[len]; for (int i = 0; i < len; i++) { parent[i] = 0; }int begin,end; for (int i = 0; i < len; i++) { // begin顶点所在树的根结点 begin = find(parent,edges[i].getBegin()); // end顶点所在树的根结点 end = find(parent,edges[i].getEnd()); // 不在同一棵树上 if (end != begin){ parent[end] = begin; System.out.println("加入边：(" + edges[i].getBegin()+", "+edges[i].getEnd() +") , weight = "+edges[i].getWeight()); } } }private int find(int[] parent, int find){ // 找到这棵树的根结点 while (parent[find]>0){ find = parent[find]; } return find; }

这里省略了把邻接矩阵转为边集数组和对边集数组进行排序的代码。可以看到，克鲁斯卡尔算法的时间复杂度和边的个数有关，记边的个数为e，则其时间复杂度为O(eloge)。
总结普里姆算法和克鲁斯卡尔算法都有其适用范围，虽然克鲁斯卡尔算法的时间复杂度较低，但是它的实际值和边的个数有很大关系，当边数很少时，它的效率十分高。而在边数很多的稠密图中，使用普里姆算法会更好一些。
本文到此就结束了，如果您喜欢我的文章，可以关注我的微信公众号：大大纸飞机
或者扫描下方二维码直接添加：