HashMap底层原理全面详解面试绝对不慌 HashMap底层原理全面详解面试绝

快速入门
技术的本质——底层结构
结构构成
为什么要用链表
哈希算法
手写HashMap
HashMap底层的实现
什么情况下用红黑树?

快速入门存储：put 方法 put(key,value)
查询 : get 方法 get(key)
java 代码如下

import java.util.HashMap; import java.util.Map; public class App {public static void main(String[] args) {Map map = new HashMap<>(); map.put("刘一","刘一"); map.put("陈二","陈二"); map.put("张三","张三"); map.put("李四","李四"); map.put("王五","王五"); map.put("Money","我是猴哥Money老师"); System.out.println(map.get("Money")); }}//输出结果：我是猴哥Money老师

技术的本质——底层结构程序是等于我们的数据结构和算法

文章图片

HashMap 其实就是做存储的，做存储的就是数据结构

在JDK7 : HashMap 是由数组，链表组成的
在JDK8: HashMap 是由数组，链表，红黑树组成的

存储是按上面的规则存储的，那查询是怎么查的了

算法：哈希算法

结构构成既然要了解HashMap 的组成，就谈谈它的结构组成
首先我们来说下数组，数组在java 中是怎么定义的了

//数组：采用一段连续的存储单元来存储数据的//数组的特点: 查询时间复杂度:0(1) ,删除,插入,时间负责度0(N),总结：查询块，插入慢public static void main(String [] args){//数组的定义：初始化长度为10，数据类型Integer ,Integer integer[] = new Integer[10]; //指定下标，复制integer[0]=0; //指定下标，复制integer[1]=1; //指定下标，复制integer[9]=2; //指定下标，复制integer[9]=400; System.out.println(integer[9]); }// 输出结果：400

数组结构如图：

文章图片

查询：时间复杂度 0（1）,查询非常快的
删除，插入：时间复杂度0（N）非常慢的，效率没有查询那么快
为什么查询快，插入，删除慢了？
查询快

是因为我们数组了都有一个序号,如图，0,1,2,3,4,5,… ，如果要找到下标为3的数据值, 这些序号其实就是他们的下标地址，可以理解为他们的一个下标索引，这个下标是连续的，是自增的，所以我们立马可以确定3个这个位置，根据这个索引3 找到它对应的节点。

文章图片

插入，删除慢

假如我现在要出入一个Monkey 的数据，插入到3和4之间，如图

文章图片

存在这个位置我们是没有下标的，则我们的下标4 则要移到 Monkey 那个位置，5下标就移到4那个位置，如图：

文章图片

类似，我们后面的下标都要向左移动，这样我后面的数据是不是要做很大的改动，这样时间复杂度则为0（N），这样就保证了我们数组的连续性，同理删除的话如图：

文章图片

数组后面数据的下标，都要还原成之前插入前的下标，后面的节点都要改变，这样我们可以看出，这就是数组，删除，插入为什么这么慢！
除非是插入，删除，数组的最后一个元素，大家懂了吗？还不懂那就私聊！
扩充：
大家知道我们java 哪一个类，底层用的就是数组？
在我们的java.util 包下面有一个ArrayList 类，如图

文章图片

怎么验证了？
我们查看它的add 方法

public boolean add(E var1) {this.ensureCapacityInternal(this.size + 1); this.elementData[this.size++] = var1; return true; }

如果面试被问到ArrayList 的特性，直接回答查询快，插入，删除慢

为什么要用链表为什么HashMap 用到数组存储了，还要用到链表了？
谈谈什么是链表？
在java 中是这么定义的：

package node; import com.sun.org.apache.bcel.internal.generic.IMPDEP1; public class Node {public Node next; private Object data; public Node(Object next) {this.data = https://www.it610.com/article/next; }//链表：链表是一种物理存储单元上非连续，非顺序的存储结构//特点: 插入，删除时间复杂度0(1) 查找遍历时间复杂度0(N) 总结：插入快,查询慢public static void main(String[] args){Node head =new Node("monkey"); head.next =new Node("张三"); head.next.next =new Node("刘一"); System.out.println(head.data); System.out.println(head.next.data); System.out.println(head.next.next.data); }}//输出结果://monkey//张三//刘一

链表：链表是一种物理存储单元上非连续，非顺序的存储结构,如图：

文章图片

为什么它插入，删除快，查询慢了？
删除某个节点，只需要上一个节点 head.next =null
插入某个几点，只需要上一个节点 head.next 指向插入的节点，插入的节点指向下一个节点
查询某个节点：链表查询都要通过头节点，比如我们要查‘刘一'，我们则要先查头monkey,再查张三，再查到刘一，
虽然只有3个节点，但是我们要查到刘一要查三次，把整个链表都遍历了一次，所以查询慢！

文章图片

扩充
在我们java 中，哪一个util 类采用的链表来实现的?

文章图片

我们来查看它的add 方法

public boolean add(E var1) {this.linkLast(var1); return true; }//看上面有一个linkLast,如下:void linkLast(E var1) {LinkedList.Node var2 = this.last; LinkedList.Node var3 = new LinkedList.Node(var2, var1, (LinkedList.Node)null); this.last = var3; if (var2 == null) {this.first = var3; } else {var2.next = var3; }++this.size; ++this.modCount; }//看上面有一个Node,如下:private static class Node {E item; LinkedList.Node next; LinkedList.Node prev; Node(LinkedList.Node var1, E var2, LinkedList.Node var3) {this.item = var2; this.next = var3; this.prev = var1; }}//上面有一个next,有一个prev //这是一个双向链表

双向链表如图: 类似与分页，上一页，下一页，下面的对象也可以获取上面对象的数据（head.prev）

文章图片

现在大家都已经了解JDK7 HashMap 数据结构了，开始了解下算法！

哈希算法那么HashMap 是怎么去存储的了？他是如何将数据放到我们的数组和链表上的？
用的就是哈希算法，你们知道哈希算法的底层是怎么实现的？
哈希表
什么是哈希算法？
哈希算法（也叫散列），就是把任意长度值（key）通过散列算法变换成固定长度的key(地址)，通过这个地址进行访问的数据结构，
它通过把关键码值映射到表中一个位置来访问记录，以加快查找速度。

文章图片

例如图中的John Smith 通过散列算法变换成固定长度的key:152 （永远是152），然后通过152 变成John Smith 是不可能的，哈希算法是不可逆的。
HashCode: 通过字符串算出它的ascii 码，进行mod(取模)，算出哈希表中的下标
【HashMap底层原理全面详解面试绝对不慌】

文章图片

代码如下：

public class AsciiCode {public static void main(String[] args) {char c [] ="lies".toCharArray(); for (int i = 0; i < c.length; i++) {System.out.println((c[i])+":" +(int)c[i]); }}}//输出结果：//l:108//i:105//e:101//s:115

将 lies 算出来的ascii 码相加然后除以10 取模（为什么取模不直接存储 429了）
为什么取模不直接存储 429了？
//数组是采用一段连续的存储单元来存储数据的，那存lies 数据将如图：

文章图片

如果你要存lies 则需要300 个这样的内存空间，所以我们取模为10，算出来的值为 9，则节省了很多空间，我们取模的目的就是节省内存空间！
如果我们取模会出现什么问题
会出现hash 冲突(碰撞)的一个问题,
什么是hash冲突
lies 的值通过ascii 码计算的总和为 429foes 的值通过ascii 码计算的总和也为 429

文章图片

两个单词取模后的值都是 9 ，则lies 会存在下标为9 的这个位置，foes 也存在下标为9 的这个位置，而数组存在同一个下标下面是会覆盖的（上面代码讲数组的时候Intergers[9]=400,会覆盖Intergers[9]=2 的值，最终Intergers[9] =400）,同样我们先存的是lies 后存的是foes,则lies
将会被覆盖，lies 和foes 是不同的key, 我们HashMap 是可以存这两个值的，为什么没有被覆盖了？这个地方就叫做哈希碰撞！
Hash冲突怎么解决了
我们用链表来解决这个问题, 链表是有一个指针的，我们可以让这个lies 指向这个foes,我们让foes 去匹配下标为9 的这个节点，如果匹配lies 不相等，则去匹配下一个节点foes,最终就会找到这个foes,这就是我们hash 算法底层的原理及解决冲突。

手写HashMap 不调用JDK7 的HashMap,自己手动写一个HashMap

public class App {public static void main(String[] args) {//Map map = new HashMap<>(); App map = new App(); map.put("刘一","刘一"); map.put("陈二","陈二"); map.put("张三","张三"); map.put("李四","李四"); map.put("王五","王五"); map.put("Money","我是猴哥Money老师"); //System.out.println(map.get("Money")); }public void put(String key,String value){ System.out.printf("key:%s:::::::::::::::; ::hash值:%s:::::::::::::::::::存储位置:%s\r\n",key,key.hashCode(),Math.abs(key.hashCode() % 15)); }}//输出结果://key:刘一:::::::::::::::; ::hash值:671464:::::::::::::::::::存储位置:4//key:陈二:::::::::::::::; ::hash值:1212740:::::::::::::::::::存储位置:5//key:张三:::::::::::::::; ::hash值:774889:::::::::::::::::::存储位置:4//key:李四:::::::::::::::; ::hash值:842061:::::::::::::::::::存储位置:6//key:王五:::::::::::::::; ::hash值:937065:::::::::::::::::::存储位置:0//key:Monkey:::::::::::::::; ::hash值:-1984628749:::::::::::::::::::存储位置:4

我们多次运行，运行的结果还是这样，这就是hash 算法的一个特点：它是一个幂等性的一个算法

模拟我们是怎么存值的
我们一组数据就是 key,value , 可以用string,int 来存吗？这里显然不能，我们一般存这种值一般用对象来存值，我在这里随便命名用个Object或者叫Entry 对象，其实我们还要存另外两个值？（hash和next），当发生hash 冲突的时候（存储位置4） next 可以指向下一个节点，hash 值是用来比较的,比较hashCode 值是否相等！

存取结构图如下：

文章图片

文章图片

上面的图形结构，我们就知道如何存数据了！
那我们该如何取数据了？
-假如我们要取‘刘一' 的值
我们通过get(key) 方法获取数据的模，然后根据key,与hashCode 的值去比较下标为4 的key 和hashCode,查看是否相等，如果不相等我们通过next 方法比较下一个节点的数据，直到 key 与hashCode 对比的值都相等，此时，获取value的值就是当前key 所对应的value!

HashMap底层的实现 HashMap 底层如何实现的了？我们用写源码的方式验证
模拟java HashMap
定义一个Map 接口

/** * 自己手动定义Map * @param * @param */public interface Map {V put(K k,V v); V get(K k); int size(); interfaceEntry{K getKey(); V getValue(); }}

定义一个实现Map 的HashMap

import sun.management.snmp.jvmmib.JvmRTInputArgsTableMeta; /** * 自己定义HashMap * @param * @param */public class HashMap implements Map{//存储元素对象private Entry table[] = null; //扩容初始化int size =0; //初始化存储元素对象大小public HashMap() {this.table = new Entry[16]; }/*** 1.通过key hash 算法算出hash值,然后取模* 2.取模后就有对应的index 数组下标,然后存储对象* 3.判断当前对象是否为空，如果空，直接存储，* 4.如果不为空，我们就要用到next 链表* 5.返回当前这个节点* @param k* @param v* @return*/@Overridepublic V put(K k, V v) {int index = hash(k); Entry entry = table[index]; if(null ==entry){//刘一，陈二，李四，王五就开始存在这个entry,每个entry 对象则存储到了对应table 中table[index] = new Entry<>(k, v, index, null); size++; }else{//冲突了，张三，Monkeytable[index] = new Entry<>(k, v, index, entry); }return table[index].getValue(); }private int hash(K k) {//HashMap 底层用到的是移位的操作，性能高很多 >>,我们这里就直接取模int index =k.hashCode() % 16; //Math.abs(index); return index>0?index:-index; }/*** 1.通过 key 进行hash 运算，取模，找到数组对应的下标 index* 2.判断当前对象是否为空,如果不为空* 3.判断是否相等，如果不相等* 4.判断next 是否为空，如果不为空，* 5.再判断相等，知道相等为止，或者为空为止* 6.然后返回**** @param k* @return*/@Overridepublic V get(K k) {//如果没有存储数据那size 为0，也不用查了，直接返回nullif(size ==0){return null; }int index = hash(k); Entry entry = findValue(table[index], k); //通过index 找打这个对象return entry==null?null:entry.getValue(); }/**** @param entry* @param k 查询刘一* @return*/private Entry findValue(Entry entry,K k) {//存的可能是数值类型，也可能是字符串类型if (k.equals(entry.getKey()) || k == entry.getKey()) {return entry; //如果不相等，估计这个节点是个链表，判断它next 数据是否匹配} else {if(entry.next !=null){//用到递归，在链表里面一直查询这个k,值是否相等return findValue(entry.next,k); }}return null; }@Overridepublic int size() {return size++; }class Entry implements Map.Entry{//存四个值K k; V v; int hash; Entry next; public Entry(K k, V v, int hash, Entry next) {this.k = k; this.v = v; this.hash = hash; this.next = next; }@Overridepublic K getKey() {return k; }@Overridepublic V getValue() {return v; }}}

定义一个测试类

public class Test {public static void main(String[] args) {Map map = new HashMap<>(); map.put("Monkey","我是moneky老师"); map.put("东山再起","东山再起是位好同学"); System.out.println(map.get("Monkey")); System.out.println(map.get("东山再起")); }//输出结果://我是moneky老师//东山再起是位好同学}

查看到测试结果，我们就能看到HashMap ，是怎么存储的，和获取值的！
但是JDK8 用的是红黑树，为什么了？
举个代码的例子

import com.sun.xml.internal.ws.api.model.wsdl.WSDLOutput; public class Test {public static void main(String[] args) {Map map = new HashMap<>(); for (int i = 0; i < 1000; i++) {map.put("Monkey"+i,"我是moneky老师"+i); }System.out.println(map); }}

可以看到这个map 的size 只有16，却存了很多的数据：

文章图片

容量不够，我们就只能把这个数据放到链表上，链表无线延长，这种hash冲突是十分严重的，而链表的特性是查询慢，而链表又无线延长，我们查询链表末端的数据，这样性能就很低了，所以JDK8 就用红黑树了！
总结：解决链表过长查询效率过低的问题

什么情况下用红黑树? 前提条件
阈值 8
HashMap 类下面有个这个：