ArrayList源码实现(一)
ArrayList源码实现(一)
1. ArrayList的大小是如何自动增加的?
- 初始化
- 在构造函数中,可以设定列表的初始值大小,如果没有的话默认使用,提供的静态数据
public ArrayList(int initialCapacity) {
if (initialCapacity > 0) {
this.elementData = new Object[initialCapacity];
} else if (initialCapacity == 0) {
this.elementData = EMPTY_ELEMENTDATA;
} else {
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
}
}
注意:elementData 变量是 transient
关键字修饰的。
- 动态扩容
重点关注 ensureCapacityInternal
函数,
实际的扩容函数
总结:在每次添加add 新的数据时,会进行一次 数组长度大小 的判断;
- 如果是数组为 空 时,最小长度就是 10,否则的话,带扩容的最小长度时 size(此时保存了多少数据)+1 (
*calculateCapacity*
) - 当最小容量 大于 数组的总长度时,进行扩容(
ensureExplicitCapacity
) - 数组的最大长度就是
Integer.*MAX_VALUE
* - 注意:扩容是创建了一个新的数组,将
elementData
指向了新的数组(elementData = Arrays.*copyOf*(elementData, newCapacity);
)
2. ArrayList的增加或者删除某个对象的对象为什么效率很低?
在ArraysList中 add、addAll与remove等方法,底层主要依赖于 System.*arraycopy
,这个是一个*native
方法,在ArrayList 对外提供的方法中,大量的使用了这个API,当频繁的对列表中的元素进行 add/remove 操作是,会比较费资源。
附录
1. transient
是什么
transient
关键字在 Java 中的作用是指定某个类的成员变量不参与序列化过程。序列化是将对象的状态转换为字节流的过程,常用于将对象保存到文件中或通过网络传输。而使用 transient
关键字修饰的变量在对象被序列化时不会被保存,这样可以防止不必要或敏感的数据被序列化。
具体作用如下:
- 防止序列化敏感数据:某些类的字段可能包含敏感数据(如密码、个人信息),你不希望它们被序列化并保存到磁盘或通过网络传输。在这种情况下,可以使用
transient
关键字修饰该字段,序列化时就会跳过这个字段。 - 节省存储空间:对于某些不需要序列化的字段(例如缓存、临时变量等),使用
transient
可以避免不必要的数据占用存储空间。 - 防止不合法的数据:某些字段可能在对象被反序列化之后重新计算或初始化,如果这些字段被序列化了,可能会导致不合法的状态。在这种情况下,也可以使用
transient
来避免这些字段的序列化。
2. list中定义的最大长度为什么会减8
/**
* The maximum size of array to allocate.
* Some VMs reserve some header words in an array.
* Attempts to allocate larger arrays may result in
* OutOfMemoryError: Requested array size exceeds VM limit
*/
private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8
的设置是为了处理 JVM 中数组分配的一些特定限制和内存管理问题。Integer.MAX_VALUE
是 2^31 - 1
,即 2147483647,是 Java 中 int
类型的最大值。但在实际中,JVM 为数组分配内存时,最大数组大小会比这个理论值略小。以下是为什么减去 8 的原因:
原因分析:
- JVM 的内存管理和数组头部:
- 在 JVM 中,数组对象除了存储数组的数据本身外,还需要存储一些额外的信息,比如数组的长度、类型信息等。这些信息占用了一部分内存,通常被称为数组的头部(header words)。
- 具体需要多少字节来存储这些头部信息,依赖于 JVM 实现和对象内存布局。虽然不同 JVM 实现可能有所不同,但大多数 JVM 可能会保留几个字节(如 8 字节)用于这部分元数据。
- 避免
OutOfMemoryError
:- 通过减去 8,确保在数组分配时有足够的空间容纳这些头部信息,避免超出 JVM 对数组对象大小的限制。如果不进行这个调整,分配接近
Integer.MAX_VALUE
大小的数组可能会导致OutOfMemoryError
,因为 JVM 不能同时为数据和头部信息分配足够的内存。 - 这个限制还可以避免一些边界情况下的问题,比如内存碎片或者其他 JVM 的内部管理机制的需求。
- 通过减去 8,确保在数组分配时有足够的空间容纳这些头部信息,避免超出 JVM 对数组对象大小的限制。如果不进行这个调整,分配接近
- 系统和实现的差异:
- 不同的 JVM 和平台可能有不同的数组大小限制。尽管理论上 Java 数组可以拥有
Integer.MAX_VALUE
个元素(即 2147483647 个),但在实际中,JVM 往往需要一些额外的空间来管理数组的结构。因此,MAX_ARRAY_SIZE
设置为Integer.MAX_VALUE - 8
是一个安全边界,可以确保数组不会因为接近最大值而触发异常。
- 不同的 JVM 和平台可能有不同的数组大小限制。尽管理论上 Java 数组可以拥有
总结:
MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8
是为了确保在 JVM 中分配接近最大容量的数组时,不会因为数组头部信息或 JVM 内存管理的限制而导致 OutOfMemoryError
。减去的 8 字节主要是预留给数组的头部信息或其他内存管理开销。
3. System.arraycopy
方法
System.arraycopy(a, 0, elementData, size, numNew)
是 Java 中用于执行数组复制的代码,使用了 System.arraycopy
方法。这个方法能够快速、高效地复制数组中的元素。让我们详细解释这个调用的作用:
参数解析:
System.arraycopy(a, 0, elementData, size, numNew);
a
:源数组,表示要从中复制元素的数组。0
:源数组a
中复制的起始位置,表示从a
数组的第一个元素(索引 0)开始复制。elementData
:目标数组,表示将元素复制到的数组。size
:目标数组elementData
中开始粘贴元素的位置,表示将从目标数组的size
索引开始粘贴数据。numNew
:要复制的元素数量,表示从源数组a
中复制多少个元素到目标数组。