Leetcode之Union-Find(并查集)

roland_reed 发布于2019-08-15 13:44 / 2417人阅读

摘要：并查集包括查询和联合，主要使用不相交集合查询主要是用来决定不同的成员是否在一个子集合之内联合主要是用来把多个子集合成一个集合的实际运用计算机网络检查集群是否联通电路板检查不同的电路元件是否联通初始化联通与检测与是否联通返回联通的数

并查集(Union-Find)包括查询(Find)和联合(Union)，主要使用不相交集合(Disjoint-Sets)
查询(Find)主要是用来决定不同的成员是否在一个子集合之内
联合(Union)主要是用来把多个子集合成一个集合
Union-Find的实际运用：
1.计算机网络检查集群是否联通 2.电路板检查不同的电路元件是否联通

Union-Find(mainly used for detection of connectivity problem):

Public Class UF:
    UF(int n) //初始化(abstract N sites : list of integers to 0,1,2 .. N-1)
    Void Union(int a, int b) //联通a与b(add connection between a and b)
    int find(int a) //component identifier
    boolean isConnected(int a, int b) //检测a与b是否联通
    int count() //返回联通的数量(return number of connected components)

举个例子：
Given Objects: 0, 1, 2, 3, 4, 5
union(0, 1):
0-1, 2, 3, 4, 5
union(1,3):
0-1-3, 2, 4, 5
union(2,5):
0-1-3, 2-5, 4
union(3, 5):
0-1-3-2-5, 4

Union-Find在计算机算法面试主要用来解决动态图(Dynamic Graph)的一系列问题:
例如：一个由0与1组成的二维矩阵，0可以看成海洋，1可以看成陆地
110101
001011
101011
100110
Q1:有多少岛？4(dfs,bfs),静态图(static graph)
Q2:湖(上下左右不包换对角线被陆地包围)的面积有多少? 2(dfs, bfs),静态图
Q3:如果改变图中的元素有多少岛?(0,0):5; (0,1):5; (0, 5): 6; (1,5): 5, 动态图(Dynamic Graph)

Union-Find的种类：
Quick UnionFind(Quick-Union)

class QuickUnion:
    private int[] ids;
    public QuickUnionFind(int n):
        ids = new int[n];
        for(int i = 0; i < n; i++) {
            ids[i] = i;
        }
    }
    public void union(int a, int b) {
        int idA = ids[a];
        int idB = ids[b];
        for(int i = 0; i < n; i++) {
            if(ids[i] == idB){ //联通所有与A联通的元素
                ids[i] = idA;
            }
        }
    }
    public boolean find(int a, int b) {
        return ids[a] == ids[b];
    }
 }

比如，如果想要连通id[5]与id[9], 需要在union的过程中遍历所有与id5连通的元素将下标改成id9，或者将所有id9的下标改成id5

QuickUnion的遍历需要通过一次的数组读取来找到对应的节点，但是对于新增路径需要需要线性时间找到对应的组号进行修改，所以对于大数据量来说如果新增路径数量是M，节点的数量是N，我们需要O(MN)的时间复杂度来寻找对应的标号然后修改，平方的时间复杂度是非常费时的，所以我们需要提高Union的效率

Tree Union Find
QuickUnion之所以Union的时间复杂度比较高主要是因为对于每个节点的所属的组都是多带带记录，因此需要一种更优化的数据结构来快速更新节点所属的组，因此我们可以用一个parent node来连接所有的sub node形成树来降低Union的时间

使用parent-link将子节点与根节点连接，id[a]的值就是父节点的序号，因此通过查找，总可以从一个子节点查找到根节点(id[a] == a)，因此在处理不同组的时候，我们只需要找到每个元素的根节点然后更新根节点的指向就可以了，就相当于将其中一个根节点所代表的树变成另外一个根节点的子树

class TreeUnionFind:
    private int[] ids;
    public TreeUnionFind(int n) {
        ids = new int[n];
        for(int i = 0; i < n; i++) {
            ids[i] = i;
        }
    }
    public int root(int a) {
        int root = a;
        while(ids[root] != root) {
                ids[root] = root;
        }
    }
    public boolean find(int a, int b) {
        return root(a) == root(b);
    }
    public void union(int a, int b) {
        int rootA = ids[a];
        int rootB = ids[b];
        ids[rootA] = rootB;
    }
}

但是树这种数据结果经常会根据输入数据本身的性质而变化，如果输入数据是有序的相对应的树会变成一个单一链表因而不具备范性的运用情况

Weighted Quick Union Find

根据Quick-Union Find:

    public void union(int a, int b) {
        int idA = ids[a];
        int idB = ids[b];
        for(int i = 0; i < n; i++) {
            if(ids[i] == idB){ 
                ids[i] = idA;
            }
        }
    }

ids[i] = idA是一种hard code的习惯，因为random assign一棵树是另外一棵树的子树没有考虑输入数据的规模，如果输入数据p与q，如果p数据所在树的规模比q数据所在树的规模大得多，p与q新形成的树不是平衡树

因此，需要总是需要用小的size的树与大的size的树合并从而尽量达到树的平衡

class WeightedQuickUnionFind{
    private int[] ids;
    private int[] sizes;
    public WeightedQuickUnionFind(int n) {
        ids = new int[n];
        sizes = new int[n]; //在quickUnion的基础上增加一个记录size的变量
        for(int i = 0; i < n; i++) {
            ids[i] = i;
            sizes[i] = 1;//初始化size的大小为1
        }
    }
    public int root(int a, int b) {
        int root = a;
        while(ids[root] != root) {
            root = ids[root];
        }
        return root;
    }
    public void union(int a, int b) {
        int rootA = ids[a];
        int rootB = ids[b];
        if(sizes[rootA] > sizes[rootB]) { //判断size的大小来更新root
            ids[rootB] = rootA;
            sizes[rootA] += sizes[rootB];
        } else {
            ids[rootA] = rootB;
            sizes[rootB] += sizes[rootA];
        } 
    }
 }

通过weightedQuickUnion, 可以通过O(logn)的时间复杂度来分别Union和Find所需要的元素

Weighted QuickUnion With Path Compression
在Weighted QuickUnion的基础上我们可以通过路径压缩(path compression)就是把所有的元素下标直接连接到父节点来达到降低Union和Find时间复杂度的目的

class weightedQuickUnionWithPathCompression{
    private int[] ids;
    private int[] sizes;
    public weightedQuickUnionWithPathCompression(int n) {
        ids = new int[n];
        sizes = new int[n];
        for(int i = 0; i < n; i++) {
            ids[i] = i;
            sizes[i] = 1;
        }
    }
    public int root(int a, int b) {
        int root = a;
        while(ids[root] != root) {
            root = ids[root];
        }
        while(a != root) { //connect sub element directly to root
            int temp = ids[a];
            ids[a] = root;
            a = temp;
        }
        return root;
    }
    public boolean find(int a, int b) {
        return root(a) == root(b);
    }
    public boolean union(int a, int b) {
        int rootA = ids[a];
        int rootB = ids[b];
        if(sizes[rootA] > sizes[rootB]) {
            ids[rootB] = rootA;
            sizes[rootA] += sizes[rootB];
        } else {
            ids[rootA] = ids[rootB];
            sizes[rootB] += sizes[rootA];
        }
    }
 }

由此，以上就是所有关于动态连接的UnionFind的介绍，下图是不同思路并查集的算法时间复杂度对比：
Algorithm
Quick UnionFind: Construct: O(n); Find: O(1); Union:O(n)
Tree UnionFind: Construct: O(n); Find: O(tree height); Union:O(n)
Weighted QuickUnionFind:Construct: O(n); Find: O(logn); Union:O(logn)
Weighted QuickUnionFind with Path Compression: Construct: O(n); Find: amortizedO(1); Union:amortizedO(1)

leetcode里使用UnionFind的题主要有:Number of Islands(lc200), LongestConsecutiveSequence(lc128), SurroundedRegion(lc130)

Surrounded Region:
Given a 2D board containing "X" and "O" (the letter O), capture all regions surrounded by "X".A region is captured by flipping all "O"s into "X"s in that surrounded region.
For Example:
XXXX
XOOX
XXOX
XOXX
After should become:
XXXX
XXXX
XXXX
XOXX

class Solution{
    public void solve(char[][] board) {
        //sanity check
        if(board == null || board.length == 0) return;
        int row = board.length;
        int col = board[0].length;
        int dummy = row * col; //create a dummy node to represent list of nodes
        UnionFind uf = new UnionFind(row * col + 1);
        for(int i = 0; i < row; i++) {
            for(int j = 0; j < col; j++) {
                if(board[i][j] == "O") {
                    if(i == 0 || i == row - 1 || j == 0 || j == col - 1) {
                        uf.union(node(i, j), dummy); //connect corner nodes
                    } else {
                        if(i > 0 && board[i-1][j] == "O") uf.union(node(i, j), node(i-1, j));
                        if(i > 0 && board[i+1][j] == "O") uf.union(node(i, j), node(i-1, j));
                        if(j > 0 && board[i][j-1] == "O") uf.union(node(i, j), node(i, j-1));
                        if(j > 0 && board[i][j+1] == "O") uf.union(node(i, j), node(i, j+1));
                    }
                }
            }
         }
         for(int i = 0; i < row; i++) {
             for(int j = 0; j < col; j++) {
                 if(uf.isConnected(board[i][j], dummy)) board[i][j] = "O";
                 else board[i][j] = "X";
             }
         }
      }
      public int node(int i, int j) {
          return i * col + j;//convert 2d dimension to 1d
      }
 }
 class UnionFind{
     int[] parents;
     public UnionFind(int[] n) {
         parents = new int[n];
         for(int i = 0; i < n; i++) {
             parents[i] = i;
         }
     }
     public void union(int i, int j) {
         int rootA = find(i);
         int rootB = find(j);
         if(rootA != rootB) {
             parents[rootA] = rootB;
         }
     }
     public int find(int node) {
         if(parents[node] == node) return node;
         parents[node] = find(parents[node]);
         return parents[node];
     }
     public boolean isConnected(int n1, int n2) {
         return find(n1) == find(n2);
     }
}

References:
1.https://algs4.cs.princeton.ed...

2.http://blog.csdn.net/dm_vince...

GPU云服务器云服务器并查集 union-find LeetCode LeetCode_String

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/68283.html

leetcode200. Number of Islands

摘要：题目要求提供一个二维数组表示一张地图，其中代表陆地，代表海洋。这里使用一个新的二维数组来表示对应地图上的元素属于哪个并查集。在合并的时候先进行判断，如果二者为已经相连的陆地，则无需合并，否则将新的二维数组上的元素指向所在的并查集。题目要求 Given a 2d grid map of 1s (land) and 0s (water), count the number of isla...

Zoom 2019-08-16 10:45 评论0 收藏0
Union-Find并查集算法学习笔记

摘要：算法链接学习工具，，环境搭建在小伙伴的推荐下，这个学期开始上普林斯顿的算法课。一系列的整数对代表与相互连接，比如等，每一个整数代表了一个。我觉得这个可能也是并查集相关应用。这学期继续学习深入理解了就能明白了。《算法》链接：1.5 Case Study: Union-Find学习工具：mac，java8，eclipse,coursera 环境搭建在小伙伴的推荐下，这个学期开始上普林斯顿...

hzc 2019-08-14 17:08 评论0 收藏0
[Leetcode] Graph Valid Tree 图与树

摘要：这样就将一个集合的节点归属到同一个集合号下了。最后如果并查集中只有一个集合，则说明可以构建树。 Graph Valid Tree Given n nodes labeled from 0 to n - 1 and a list of undirected edges (each edge is a pair of nodes), write a function to check w...

luqiuwen 2019-08-14 12:36 评论0 收藏0
Tensorflow代码解析（四）

摘要：联合查找算法是并查集数据结构一种应用。并查集是一种树型的数据结构，其保持着用于处理一些不相交集合的合并及查询问题。的特征是删除节点。目前就职于腾讯事业部，从事神经机器翻译工作。 5. TF - Graph模块TF把神经网络模型表达成一张拓扑结构的Graph，Graph中的一个节点表示一种计算算子。Graph从输入到输出的Tensor数据流动完成了一个运算过程，这是对类似概率图、神经网络等连接...

马龙驹 2019-04-25 18:10 评论0 收藏0
[Leetcode] Graph Valid Tree 判断一个图是否为树

摘要：只有一个连通分量还没有环，就是树，无根树。无向图边的两端是对称的，无向图讲究连通这个概念，没有方向，没有拓扑，很像集合，所以非常适合用并查集来解决。并查集写法参考注意方法用找的老大哥，合并的是的老大哥。 Graph Valid Tree Given n nodes labeled from 0 to n - 1 and a list of undirected edges (each...

xbynet 2019-08-14 14:04 评论0 收藏0