jdk7中HashMap知识点整理

AJie 发布于2019-08-14 12:25 / 1184人阅读

摘要：再最坏的情况下，链表查找的时间复杂度为而红黑树一直是这样会提高的效率。中的中定义了一个变量，当节点个数时，将采用红黑树存储参考资料和的区别和的区别

HashMap中的几个重要变量

默认初始容量,必须是2的n次方 
static final int DEFAULT_INITIAL_CAPACITY = 16;

最大容量，当通过构造方法传入的容量比它还大时，就用这个最大容量，必须是2的n次方
static final int MAXIMUM_CAPACITY = 1 << 30;

默认负载因子
static final float DEFAULT_LOAD_FACTOR = 0.75f;

用来存储键值对，可以看到键值对都是存储在Entry中的
transient Entry[] table;

//capacity * load factor,超过这个数就会进行再哈希
int threshold;

HashMap中的元素是用名为table的Entry数组来保存的，默认大小是16

capacity:数组的容量
load_factor:负载因子
threshold：实际能承载的容量，等于上面两个相乘，当size大于threshold时，就会进行rehash

jdk7中在面对key为String的时候采用了区别对待，会有alternative hashing，但是这个在jdk8中已经被删除了

存储结构

Entry是一个链表结构，不仅包含key和value，还有可以指向下一个的next

static class Entry implements Map.Entry {
        final K key;
        V value;
        Entry next;
        int hash;

        /**
         * Creates new entry.
         */
        Entry(int h, K k, V v, Entry n) {
            value = v;
            next = n;
            key = k;
            hash = h;
        }
        ...

put方法

public V put(K key, V value) {
        if (key == null)
            return putForNullKey(value);
        int hash = hash(key);
        int i = indexFor(hash, table.length);
        for (Entry e = table[i]; e != null; e = e.next) {
            Object k;
            if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }

        modCount++;
        addEntry(hash, key, value, i);
        return null;
    }

首先通过hash方法对hashcode进行处理：

final int hash(Object k) {
        int h = 0;
        h ^= k.hashCode();

        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

可以看到只是在key的hashcode值上做了一些处理，通过hash计算出来的值将会使用indexFor方法找到它应该所在的table下标：

static int indexFor(int h, int length) {
        return h & (length-1);
    }

这个方法其实相当于对table.length取模。

当需要插入的key为null时，调用putForNullKey方法处理：

 private V putForNullKey(V value) {
        for (Entry e = table[0]; e != null; e = e.next) {
            if (e.key == null) {
                V oldValue = e.value;
                e.value = value;
                e.recordAccess(this);
                return oldValue;
            }
        }
        modCount++;
        addEntry(0, null, value, 0);
        return null;
    }

putForNullKey方法只从table[0]这个位置开始遍历，因为key为null只放在table中的第一个位置，下标为0，在遍历中如果发现已经有key为null了，则替换新value，返回旧value，结束；如果还没有key为null，调用addEntry方法增加一个Entry:

void addEntry(int hash, K key, V value, int bucketIndex) {
        if ((size >= threshold) && (null != table[bucketIndex])) {
            resize(2 * table.length);
            hash = (null != key) ? hash(key) : 0;
            bucketIndex = indexFor(hash, table.length);
        }

        createEntry(hash, key, value, bucketIndex);
    }

可以看到jdk7中resize的条件已经发生改变了，只有当 size>=threshold并且 table中的那个槽中已经有Entry时，才会发生resize。即有可能虽然size>=threshold，但是必须等到每个槽都至少有一个Entry时，才会扩容。还有注意每次resize都会扩大一倍容量

void createEntry(int hash, K key, V value, int bucketIndex) {
        Entry e = table[bucketIndex];
        table[bucketIndex] = new Entry<>(hash, key, value, e);
        size++;
    }

最后看createEntry，它先保存这个桶中的第一个Entry，创建新的Entry放入第一个位置，将原来的Entry接在后面。这里采用的是头插法插入元素。

get方法

其实get方法和put方法如出一辙，怎么放的怎么拿

public V get(Object key) {
        if (key == null)
            return getForNullKey();
        Entry entry = getEntry(key);

        return null == entry ? null : entry.getValue();
    }

key为null时，还是去table[0]去取：

private V getForNullKey() {
        for (Entry e = table[0]; e != null; e = e.next) {
            if (e.key == null)
                return e.value;
        }
        return null;
    }

否则调用getEntry方法：

final Entry getEntry(Object key) {
        int hash = (key == null) ? 0 : hash(key);
        for (Entry e = table[indexFor(hash, table.length)];
             e != null;
             e = e.next) {
            Object k;
            if (e.hash == hash &&
                ((k = e.key) == key || (key != null && key.equals(k))))
                return e;
        }
        return null;
    }

这个方法也是通过key的hashcode计算出它应该所在的下标，再遍历这个下标的Entry链，如果key的内存地址相等（即同一个引用）或者equals相等，则说明找到了

hash的原则

A、等幂性。不管执行多少次获取Hash值的操作，只要对象不变，那么Hash值是固定的。如果第一次取跟第N次取不一样，那就用起来很麻烦.

B、对等性。若两个对象equal方法返回为true，则其hash值也应该是一样的。举例说明：若你将objA作为key存入HashMap中，然后new了一个objB。在你看来objB和objA是一个东西（因为他们equal），但是使用objB到hashMap中却取不出来东西。

C、互异性。若两个对象equal方法返回为false，hash值有可能相同，但最好是不同的，这个不是必须的，只是这样做会提高hash类操作的性能（碰撞几率低）。

解决hash碰撞的方法：
开放地址法
链地址法

hashmap采用的就是链地址法，这种方法好处是无堆积现象，但是next指针会占用额外空间

和jdk8中的HashMap区别

在jdk8中，仍然会根据key.hashCode()计算出hash值，再通过这个hash值去定位这个key，但是不同的是，当发生冲突时，会采用链表和红黑树两种方法去处理，当结点个数较少时用链表（用Node存储），个数较多时用红黑树（用TreeNode存储），同时结点也不叫Entry了，而是分成了Node和TreeNode。再最坏的情况下，链表查找的时间复杂度为O(n),而红黑树一直是O(logn),这样会提高HashMap的效率。
jdk8中的HashMap中定义了一个变量TREEIFY_THRESHOLD，当节点个数>= TREEIFY_THRESHOLD - 1时，HashMap将采用红黑树存储

参考资料：jdk8 HashMap

和Hashtable的区别

Hashtable 和 HashMap的区别

GPU云服务器云服务器 linux中进程知识 jdk7 jdk7.0帮助文档 HashMap

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/64464.html

《阿里巴巴 Java开发手册》读后感

摘要：回到家才发现当时买了一堆书，这堆书还有没撕包装的呢于是我翻出了最薄的一本阿里巴巴开发手册这本书一共就多页，一天就可以通读完了，看完之后我又来水博文了。为了保证单元测试稳定可靠且便于维护，单元测试之间不能互相调用，也不能依赖执行的先后顺序。前言只有光头才能变强前一阵子一直在学Redis，结果在黄金段位被虐了，暂时升不了段位了，每天都拿不到首胜(好烦)。趁着学校校运会，合理地给自己...

young.li 2019-08-16 13:43 评论0 收藏0
Java--JDK7与JDK8的HashMap的区别

摘要：简介本文介绍与的的区别。复杂度数组链表红黑树链表节点数大于时，链表转为红黑树，复杂度降至插入位置插入链表头部插入链表尾部算法复杂简单。红黑树效率高，提高查询效率的地方由红黑树实现，没必要像那么复杂。简介本文介绍JDK7与JDK8的HashMap的区别。JDK7与...

姘存按 2021-11-23 09:51 评论0 收藏0
Java经典

摘要：请注意，我们在聊聊单元测试遇到问题多思考多查阅多验证，方能有所得，再勤快点乐于分享，才能写出好文章。单元测试是指对软件中的最小可测试单元进行检查和验证。 JAVA容器-自问自答学HashMap 这次我和大家一起学习HashMap，HashMap我们在工作中经常会使用，而且面试中也很频繁会问到，因为它里面蕴含着很多知识点，可以很好的考察个人基础。但一个这么重要的东西，我为什么没有在一开始...

xcold 2019-08-16 10:59 评论0 收藏0
深入分析——HashSet是否真的无序？（JDK8）

摘要：但是，如果像上例中只取最后几位的时候，这可不是什么好事，即使我的数据分布很散乱，但是哈希冲突仍然会很严重。由于我们所创建的是类型的，这也是最巧的一点，类型的返回值就是其值本身，而存储的时候元素通过一些运算后会得出自己在数组中所处的位置。 HashSet 是否无序 (一) 问题起因：《Core Java Volume I—Fundamentals》中对HashSet的描述是这样的： H...

everfight 2019-08-16 18:30 评论0 收藏0
前百度面试官整理的——Java后端面试题（一）

摘要：发生了线程不安全情况。本来在中，发生哈希冲突是可以用链表法或者红黑树来解决的，但是在多线程中，可能就直接给覆盖了。中，当同一个值上元素的链表节点数不小于时，将不再以单链表的形式存储了，会被调整成一颗红黑树。 showImg(https://segmentfault.com/img/bVbsVLk?w=288&h=226); List 和 Set 的区别 List , Set 都是继承自...

JessYanCoding 2019-08-16 17:33 评论0 收藏0