Java面试:集合框架体系
一、ArrayList
1.数组(Array)
是一种用连续的内存空间存储相同数据类型数据的线性数据结构
数组如何获取其他元素的地址值?
寻址公式:a[i] = baseAddress + i * dataTypeSize
- baseAddress:数组的首地址
- dataTypeSize:代表数组中元素类型的大小,例如int型,dataTypeSize = 4个字节
面试题1:为什么数组索引从0开始呢?假如从1开始不行吗?
- 在根据数组索引获取元素的时候,会用索引和寻址公式来计算内存所对应的元素数据,寻址公式是:数组的首地址+索引 * 存储数据的类型大小
- 如果数组的索引从1开始,寻址公式中就需要增加一次减法操作,对于CPU来说就多了一次指令,影响性能
面试题2:操作数组的时间复杂度
- 查找:随机查询(根据索引查询) O(1)
- 查找:未知索引查询 O(n)
- 查找:未知索引查询(将数组排序后) 二分查找O(log n)
- 插入/删除:O(n)
2.ArrayList源码分析
(1)成员变量
(2)构造方法
(3)添加和扩容操作
面试题1:ArrayList底层的实现原理是什么?
- ArrayList底层是用动态的数组实现的
- ArrayList初始容量为0,当第一次添加数据的时候才会初始化容量为10
- ArrayList在进行扩容的时候是原来容量的1.5倍,每次扩容都需要拷贝数组
- ArrayList在添加数据的时候:
- 确保数组已使用长度(size)加1之后足够存下下一个数据;
- 计算数组的容量,如果当前数组已使用长度+1后的长度大于当前的数组长度,则调用grow方法扩容(原来的1.5倍);
- 确保新增的数据有地方存储之后,则将新元素添加到位于size的位置上;
- 返回添加成功布尔值。
面试题2:ArrayList list = new ArrayList(10)中的list扩容几次?
- 该语句只是声明和实例了一个ArrayList,指定了容量为10,未扩容
面试题3:如何实现数组和List之间的转换?
- 数组转List,使用JDK中java.util.Arrays工具类的asList方法
- List转数组,使用List的toArray方法。无参toArray方法返回Object数组,传入初始化长度的数组对象,返回该对象数组
追问:用Arrays.asList转List后,如果修改了数组内容,list受影响吗?List用toArray转数组后,如果修改了List内容,数组受影响吗?
- Arrays.asList转换List之后,如果修改了数组的内容,list会受影响,因为它的底层使用的是Arrays类中的一个内部类ArrayList来构造的集合,在这个集合的构造器中,把我们传入的这个集合进行了包装而已,最终指向的都是同一个内存地址
- list用了toArray转数组后,如果修改了list内容,数组不会影响,当调用了toArray以后,在底层是其进行了数组的拷贝,与原来的元素无关,所以即使list修改了以后,数组也不受影响
二、LinkedList
1.链表
查询 | 新增删除 | |
单向链表 | 头O(1),其他O(n) | 头O(1),其他O(n) |
双向链表 | 头尾O(1),其他O(n), 给定节点O(1) | 头尾O(1),其他O(n), 给定节点O(1) |
2.LinkedList源码分析
面试题1:ArrayList和LinkedList的区别是什么?
(1)底层数据结构
- ArrayList是动态数组的数据结构实现
- LinkedList是双向链表的数据结构实现
(2)操作数据效率
- ArrayList按照下标查询的时间复杂度O(1)【内存是连续的,根据寻址公式】,LinkedList不支持下表查询
- 查找(未知索引):ArrayList需要遍历,链表也需要遍历,时间复杂度都是O(n)
- 新增和删除:
- ArrayList尾部插入和删除为O(1),其他为O(n)
- LinkedList头尾节点增删为O(1),其他为O(n)
(3)内存空间占用
- ArrayList底层是数组,内存连续,节省内存
- LinkedList是双向链表需要存储数据,和两个指针,更占用内存
(4)线程安全
- ArrayList和LinkedList都不是线程安全的
- 如果需要保证线程安全,有两种方案:
- 在方法内使用,局部变量则是线程安全的
- 使用线程安全的ArrayList和LinkedList
补充:线程安全是编程中的术语,指某个函数、函数库在并发环境中被调用时,能够正确地处理多个线程之间的共享变量,使程序功能正确完成。
三、HashMap
1.二叉树
2.红黑树
3.散列表
4.HashMap源码分析
(1)常见属性
(2)添加数据
(3)扩容
(4)寻址(不会)
面试题1:说一下HashMap的实现原理?
- 数据结构:底层使用hash表,即数组和链表或红黑树
- 当我们往HashMap中put元素时,利用key的hashCode重新hash计算出当前对象的元素在数组中的下标
- 存储时,如果出现hash值相同的key:
- 如果key相同,则覆盖原始值;
- 如果key不同(出现冲突),则将当前的key-value放入链表或红黑树中
- 获取时,直接找到hash值对应的下标。在进一步判断key是否相同,从而找到对应值
补充:链表的长度大于8且数组长度大于64时,转换为红黑树
追问:HashMap的jdk1.7和jdk1.8有什么区别?
- JDK1.8之前采用的是拉链法。拉链法:将链表和数组相结合。也就是说创建一个链表数组,数组中每一格就是一个链表。若遇到哈希冲突,则将冲突的值加到链表中即可
- jdk1.8在解决哈希冲突时,当链表长度大于阈值(默认为8)且数组长度达到64时,将链表转化为红黑树,以减少搜索时间。扩容resize()时,红黑树拆分成的树的结点数小于等于临界值6个,则退化成链表
面试题2:HashMap的put方法的具体流程?
- 判断键值对数组table是否为空或为null,否则执行resize()进行扩容(初始化)
- 根据键值key计算hash值得到数组索引
- 判断table[i] == null条件成立,直接新建节点添加
- 如果table[i] == null不成立:
- 判断table[i]的首个元素是否和key一样,如果相同直接覆盖value
- 判断table[i]是否为treeNode(即红黑树),如果是红黑树,则直接在树中插入键值对
- 遍历table[i],链表的尾部插入数据,然后判断链表长度是否大于8,如果大于8,将链表转换为红黑树,在红黑树中执行插入操作,遍历过程中若发现key已经存在则直接覆盖value
- 插入成功后,判断实际存在的键值对数量size是否超过了最大容量,如果超过,进行扩容
面试题3:讲一讲HashMap的扩容机制
- 在添加元素或初始化的时候需要调用resize方法进行扩容,第一次添加数据初始化数组长度为16,以后每次扩容都是达到了扩容阈值(数组长度*0.75)
- 每次扩容的时候,都是扩容之前容量的两倍
- 扩容之后,会新创建一个数组,需要把老数组中的数据挪动到新的数组中:
- 没有hash冲突的节点,则直接使用e.hash&(newCap - 1)计算新数组的索引位置
- 如果是红黑树,进行红黑树的添加
- 如果是链表,则需要遍历链表,可能需要拆分链表,判断(e.hash&oldCap)是否为0,该元素的位置要么停留在原始位置,要么移动到(原始位置+增加的数组大小)这个位置上
面试题4:hashMap的寻址算法(不会)