资讯专栏INFORMATION COLUMN

数据结构-哈希表

BingqiChen / 2540人阅读

摘要:代码实现表的长度,即具体有多少个位置选择一个合适的素数取的绝对值修改添加即除以由于在方法中有对进行操作,在往新哈希表中存数据时应该用计算相应的值哈希表的均摊复杂度为,有这么好的性能其中一个原因是它牺牲了顺序性。

哈希冲突的解决方法 链地址法

在Java8开始,当哈希冲突达到一定的程度,每一个位置从链表转化为红黑树。

时间复杂度分析

哈希表的动态空间处理

平均每个地址承载的元素多过一定程度,即扩容(N/M >= upperTol)

平均每个地址承载的元素少过一定程度,即缩容(N/M <= lowerTol)

哈希表复杂度分析

刚开始我们在扩容的时候直接是2*M,它可能造成扩容后的哈希表分布不均匀,可以按着下面这个表格来设置M值。

代码实现
public class HashTable {

    private final int[] capacity
        = {53, 97, 193, 389, 769, 1543, 3079, 6151, 12289, 24593,
        49157, 98317, 196613, 393241, 786433, 1572869, 3145739, 6291469, 
        12582917, 25165843, 50331653, 100663319, 201326611, 402653189, 805306457, 1610612741 };
    
    private static final int upperTol = 10;
    private static final int lowerTol = 2;
    private static final int initCapacity = 7;
    private int CapacityIndex = 0;
    
    private TreeMap[] hashtable;
    private int size;
    private int M;    //hash表的长度,即具体有多少个位置(选择一个合适的素数)

    public HashTable(){
        //this.M = M;
        this.M = capacity[CapacityIndex];
        size = 0;
        hashtable = new TreeMap[M];
        for(int i = 0 ; i < M ; i ++)
            hashtable[i] = new TreeMap<>();
    }

    /*public HashTable(){
        this(initCapacity);
    }*/

    private int hash(K key){
        //key.hashCode() & 0x7fffffff 取key.hashCode()的绝对值
        return (key.hashCode() & 0x7fffffff) % M;
    }

    public int getSize(){
        return size;
    }

    public void add(K key, V value){
        TreeMap map = hashtable[hash(key)];
        if(map.containsKey(key))    //修改
            map.put(key, value);
        else{                        //添加
            map.put(key, value);
            size ++;
            
            if(size >= upperTol * M && CapacityIndex+1 < capacity.length)    //即size除以M >=upperTol
                //resize(2 * M);
                CapacityIndex ++;
                resize(capacity[CapacityIndex]);
        }
    }

    public V remove(K key){
        V ret = null;
        TreeMap map = hashtable[hash(key)];
        if(map.containsKey(key)){
            ret = map.remove(key);
            size --;
            
            if(size < lowerTol * M && CapacityIndex-1 >= 0)
                CapacityIndex --;
                //resize(M / 2);
                resize(capacity[CapacityIndex]);
        }
        return ret;
    }

    public void set(K key, V value){
        TreeMap map = hashtable[hash(key)];
        if(!map.containsKey(key))
            throw new IllegalArgumentException(key + " doesn"t exist!");

        map.put(key, value);
    }

    public boolean contains(K key){
        return hashtable[hash(key)].containsKey(key);
    }

    public V get(K key){
        return hashtable[hash(key)].get(key);
    }
    
    private void resize(int newM){
        TreeMap[] newHashTable = new TreeMap[newM];
        for(int i = 0 ; i < newM ; i ++)
            newHashTable[i] = new TreeMap<>();
            
        //由于在hash()方法中有对M进行操作,在往新哈希表中存数据时应该用newM计算hash相应的hash值
        int oldM = M;
        this.M = newM;
        
        for(int i = 0 ; i < oldM ; i ++){
            TreeMap map = hashtable[i];
            for(K key: map.keySet())
                newHashTable[hash(key)].put(key, map.get(key));
        }

        this.hashtable = newHashTable;
    }
}

哈希表的均摊复杂度为O(1),有这么好的性能其中一个原因是它牺牲了顺序性

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/74733.html

相关文章

  • 跟着大彬读源码 - Redis 8 - 对象编码之字典

    摘要:属性记录了哈希表目前已有节点键值对的数量。字典字典的结构类型特定函数私有数据哈希表两个记录进度的标志。此外,字典在进行时,删除查找更新等操作会在两个哈希表上进行。在对哈希表进行扩容或收缩操作时,使用渐进式完成。 字典,是一种用于保存键值对的抽象数据结构。由于 C 语言没有内置字典这种数据结构,因此 Redis 构建了自己的字典实现。 在 Redis 中,就是使用字典来实现数据库底层的。...

    kun_jian 评论0 收藏0
  • Nginx 源码分析:ngx_hash_t(上)

    摘要:现在使用的各种哈希函数基本上只能保证较小概率出现两个不同的其相同的情况。而出现两个值对应的相同的情况,称为哈希冲突。中的哈希表需要指出的是,中自造的哈希表属于内部使用的数据结构,因此,并不是一个通用的哈希表。 源文件路径 版本:1.8.0 csrccoreNgx_hash.h srccoreNgx_hash.c 关于hash表 Nginx实现的hash表和常见的hash表大体...

    waruqi 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<