HashMap源码解析(JDK1.7)

svtter 发布于2019-08-16 18:37 / 3293人阅读

摘要：取模主要是为了能够平均的落在每个数组上面。在多线程的情况下，会造成死循环。把先暂存单线程情况，创建一个对象参见方法，然后把引入给数组的位置。队头插入的效率高，如果队尾插入，还要遍历链表。此时，线程执行以下代码。

数据结构

table，Entry类型数组的数据

Entry，包括了key，value，Entry，以及hash

final K key;
V value;
Entry next;
int hash;

put方法

public V put(K key, V value) {
    if (table == EMPTY_TABLE) {
        inflateTable(threshold);
    }
    if (key == null)
        return putForNullKey(value);//见putForNullKey方法
    int hash = hash(key);
    int i = indexFor(hash, table.length);//见indexFor方法，取模
    for (Entry e = table[i]; e != null; e = e.next) {//遍历落在取模的数组上，遍历链表
        Object k;
        if (e.hash == hash && ((k = e.key) == key || key.equals(k))) {//判断hash值一样，并且key也要一样
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }

    modCount++;
    addEntry(hash, key, value, i);//见addEntry方法
    return null;
}

putForNullKey方法

key为空的情况，在数组的第一个位置的链表遍历查找，如果有key为空，返回相应的值，如果没有，添加到链表后面。

private V putForNullKey(V value) {
    for (Entry e = table[0]; e != null; e = e.next) {
        if (e.key == null) {
            V oldValue = e.value;
            e.value = value;
            e.recordAccess(this);
            return oldValue;
        }
    }
    modCount++;
    addEntry(0, null, value, 0);
    return null;
}

indexFor方法

注释已经提醒了，length长度必须是2的非0幂数，h & (length-1)是对h%length的意思（length长度为2的非0幂数时有效）。比如123243423 % 16的值是15，123243423 & 15也是15，当然123243423是我随便打的。取模主要是为了能够平均的落在每个数组上面。

static int indexFor(int h, int length) {
    // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2";
    return h & (length-1);
}

addEntry方法

void addEntry(int hash, K key, V value, int bucketIndex) {
    //扩容为2倍长度，跟上面取模要求的一样，乘以2也是2的非0幂数
    if ((size >= threshold) && (null != table[bucketIndex])) {
        resize(2 * table.length);
        hash = (null != key) ? hash(key) : 0;
        bucketIndex = indexFor(hash, table.length);
    }

    createEntry(hash, key, value, bucketIndex);//见createEntry方法
}

createEntry方法

void createEntry(int hash, K key, V value, int bucketIndex) {
    Entry e = table[bucketIndex];//取到数组的位置的entry
    table[bucketIndex] = new Entry<>(hash, key, value, e);//新entry加到链表的头部，并把数组指向新entry
    size++;
}
/**
 * Creates new entry.
 */
Entry(int h, K k, V v, Entry n) {
    value = v;
    next = n;
    key = k;
    hash = h;
}

get方法

public V get(Object key) {
    if (key == null)
        return getForNullKey();
    Entry entry = getEntry(key);//见getEntry方法

    return null == entry ? null : entry.getValue();
}

getForNullKey方法

private V getForNullKey() {
    if (size == 0) {
        return null;
    }
    for (Entry e = table[0]; e != null; e = e.next) {//因为put的时候，直接放数组的第一个，所以查询的时候，也查询第一个
        if (e.key == null)
            return e.value;
    }
    return null;
}

getEntry方法

final Entry getEntry(Object key) {
    if (size == 0) {
        return null;
    }

    int hash = (key == null) ? 0 : hash(key);//先取hash
    for (Entry e = table[indexFor(hash, table.length)];//取模，找到数组位置，然后遍历链表
         e != null;
         e = e.next) {
        Object k;
        if (e.hash == hash &&
            ((k = e.key) == key || (key != null && key.equals(k))))//判断hash和key都相等
            return e;
    }
    return null;
}

transfer方法

这个方法在调用put的时候，在resize扩容的时候调用。在多线程的情况下，会造成死循环。

void transfer(Entry[] newTable, boolean rehash) {
    int newCapacity = newTable.length;
    for (Entry e : table) {
        while(null != e) {
            Entry next = e.next;//把next先暂存
            if (rehash) {
                e.hash = null == e.key ? 0 : hash(e.key);
            }
            int i = indexFor(e.hash, newCapacity);
            e.next = newTable[i];
            newTable[i] = e;
            e = next;
        }
    }
}

单线程情况：

1、put("a",1)，创建一个entry对象（参见createEntry方法），然后把引入给数组0的位置。

2、put("b",1)，再创建一个entry对象，然后新对象的next指向旧的entry对象，最后数组指向新entry。队头插入的效率高，如果队尾插入，还要遍历链表。

3、如果扩容到4，参加transfer方法，依然采用队头插入，也就是说，如果链表是1，2，3，4，那么插入后就变成4，3，2，1。
现创建一个表，取到链表数据，开始遍历。这里假设都到index为3的数组。

Entry next = e.next;//把next先暂存
e.next = newTable[i]时，这个e是key为b的entry
newTable[i] = e;执行完后，index为3的数组执行b。

现在执行暂存的a
继续执行上面几个步骤，完成扩容，结果如下：

多线程死循环情况：

我们设想一下，如果两个线程同时进行扩容，A线程获取key为b的entry的时候，时间分片到了，现在线程B线程执行，完成上面单线程的情况。
此时，A线程执行以下代码。

e.next = newTable[i];
newTable[i] = e;
e = next;

e.next = newTable[i];的时候，此时b的next指向a

newTable[i] = e;的时候

可以看到，index为3的指向b，b的next指向a，a的next指向b。当有get操作，并且hash也落在index为3的时候，就死循环了。

GPU云服务器云服务器 jdk1.7 linux 64 镜像 HashMap解析源码解析 webrtc源码解析

文章版权归作者所有，未经允许请勿转载,若此文章存在违规行为，您可以联系管理员删除。

转载请注明本文地址：https://www.ucloud.cn/yun/75461.html

Java集合之HashMap源码解析

摘要：之前，其内部是由数组链表来实现的，而对于链表长度超过的链表将转储为红黑树。非线程安全，即任一时刻可以有多个线程同时写，可能会导致数据的不一致。有时两个会定位到相同的位置，表示发生了碰撞。原文地址 HashMap HashMap 是 Map 的一个实现类，它代表的是一种键值对的数据存储形式。大多数情况下可以直接定位到它的值，因而具有很快的访问速度，但遍历顺序却是不确定的。 HashM...

lindroid 2019-08-15 18:12 评论0 收藏0
集合源码学习之路---hashMap(jdk1.8)

摘要：值得位数有的次方，如果直接拿散列值作为下标访问主数组的话，只要算法比较均匀，一般是很难出现碰撞的。但是内存装不下这么大的数组，所以计算数组下标就采取了一种折中的办法，就是将得到的散列值与数组长度做一个与操作。 hashMap简单介绍 hashMap是面试中的高频考点，或许日常工作中我们只需把hashMap给new出来，调用put和get方法就完了。但是hashMap给我们提供了一个绝佳...

kamushin233 2019-08-16 10:56 评论0 收藏0
一篇搞定基于JDK1.7,JDK1.8 HashMap、ConcurrentHashMap原理分析

摘要：但是还会有统计数问题和数据丢失问题。中使用了保证线程安全，但是在中又把它优化掉了，直接使用一、开篇 HashMap、CurrentHashMap 面试时都要问烂了，用也用烂了。但是网上的解析要不就是不够全面，要么就是copy来copy去，连基于JDK版本有的都很混乱。这篇文章带你解析基于jdk1.7、jdk1.8不同的hashMap和ConcurrentHashMap简略分析（很多...

Genng 2019-08-19 10:59 评论0 收藏0
前百度面试官整理的——Java后端面试题（一）

摘要：发生了线程不安全情况。本来在中，发生哈希冲突是可以用链表法或者红黑树来解决的，但是在多线程中，可能就直接给覆盖了。中，当同一个值上元素的链表节点数不小于时，将不再以单链表的形式存储了，会被调整成一颗红黑树。 showImg(https://segmentfault.com/img/bVbsVLk?w=288&h=226); List 和 Set 的区别 List , Set 都是继承自...

JessYanCoding 2019-08-16 17:33 评论0 收藏0