当前位置: 首页 > article >正文

Java 容器之 List

在 Java 的集合框架中,ListCollection 的重要子接口,以其有序、可重复的特点广泛应用于开发中。本文将详细探讨 List 的核心概念、主要实现类(如 ArrayListLinkedList)的底层原理,以及使用中需要注意的常见问题。


List 简介

List 是一个接口,继承自 Collection,代表一个有序队列,允许元素重复。其核心特点是按照插入顺序存储元素,并支持通过索引快速访问。List 的抽象实现包括:

  • AbstractList:继承自 AbstractCollection,实现了 List 接口的大部分方法(除 size()get(int) 外),为具体实现类提供基础支持。
  • AbstractSequentialList:继承自 AbstractList,专注于链表操作,实现了基于索引的全部功能,适合顺序访问的场景。

常见的 List 实现类包括 ArrayListLinkedListVectorStack,其中 ArrayListLinkedList 是日常开发中最常用的两种。

ArrayList 和 LinkedList

  • ArrayList

    • 基于动态数组实现,容量有限,超出时自动扩容(默认初始容量为 10,扩容为原大小的 1.5 倍)。
    • 随机访问快(时间复杂度 O(1)),但插入和删除较慢(受位置影响,可能需要移动大量元素)。
    • 非线程安全
  • LinkedList

    • 基于双向链表实现,无容量限制。
    • 插入和删除快(头尾操作 O(1),中间操作 O(n)),但随机访问慢(需遍历,O(n))。
    • 非线程安全

Vector 和 Stack

  • Vector:与 ArrayList 类似,但通过 synchronized 方法实现线程安全,适用于并发场景。
  • Stack:继承自 Vector,通过同步方法实现栈功能(LIFO,后进先出),也是线程安全的。

ArrayList 详解

基本特性

ArrayList 是基于动态数组的实现,其定义如下:

public class ArrayList<E> extends AbstractList<E>
        implements List<E>, RandomAccess, Cloneable, java.io.Serializable
  • 实现 List 接口,支持所有列表操作。
  • 实现 RandomAccess 接口,支持快速随机访问。
  • 实现 CloneableSerializable,支持浅拷贝和序列化。
  • 非线程安全。

数据结构

ArrayList 的核心字段包括:

private static final int DEFAULT_CAPACITY = 10; // 默认初始容量
transient Object[] elementData; // 存储元素的数组
private int size; // 当前元素个数
  • elementDataObject[] 数组,实际存储元素,支持随机访问。
  • size:记录当前元素数量,默认初始容量为 10,超出时扩容。

构造方法

ArrayList 提供三种构造方式:

public ArrayList() { // 默认构造,初始化空数组
    this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}

public ArrayList(int initialCapacity) { // 指定初始容量
    if (initialCapacity > 0) {
        this.elementData = new Object[initialCapacity];
    } else if (initialCapacity == 0) {
        this.elementData = EMPTY_ELEMENTDATA;
    } else {
        throw new IllegalArgumentException("Illegal Capacity: " + initialCapacity);
    }
}

建议:初始化时指定容量,避免频繁扩容带来的性能开销。

扩容机制

添加元素时,若容量不足,ArrayList 会调用 grow() 方法扩容:

private void grow(int minCapacity) {
    int oldCapacity = elementData.length;
    int newCapacity = oldCapacity + (oldCapacity >> 1); // 扩容为 1.5 倍
    if (newCapacity - minCapacity < 0) newCapacity = minCapacity;
    elementData = Arrays.copyOf(elementData, newCapacity); // 数组复制
}

扩容涉及数组复制,性能开销较大,因此合理设置初始容量非常重要。

操作效率

  • 访问get(int index) 通过数组下标直接访问,时间复杂度 O(1)。
  • 添加
    • add(E e)(尾部添加):若无需扩容,O(1);若扩容,O(n)。
    • add(int index, E element)(指定位置):需移动后续元素,O(n)。
  • 删除remove(int index) 需移动后续元素,O(n),位置越靠前开销越大。

Fail-Fast 机制

ArrayList 使用 modCount 记录结构变更次数(增删操作或扩容)。迭代或序列化时,若 modCount 变化,则抛出 ConcurrentModificationException,这就是 fail-fast 机制。


LinkedList 详解

基本特性

LinkedList 基于双向链表实现,其定义如下:

public class LinkedList<E>
    extends AbstractSequentialList<E>
    implements List<E>, Deque<E>, Cloneable, java.io.Serializable
  • 实现 ListDeque,可用作列表、队列或栈。
  • 支持浅拷贝和序列化。
  • 非线程安全。

数据结构

LinkedList 使用双向链表,核心字段包括:

transient int size = 0; // 节点数
transient Node<E> first; // 头节点
transient Node<E> last; // 尾节点

private static class Node<E> { // 节点定义
    E item; // 数据
    Node<E> next; // 后继
    Node<E> prev; // 前驱
    ...
}

操作效率

  • 访问get(int index) 需从头或尾遍历至目标位置,O(n)。建议使用迭代器遍历。
  • 添加
    • addFirst(E e)addLast(E e):头尾操作,O(1)。
    • add(int index, E element):需定位,O(n)。
  • 删除remove(Object o)remove(int index) 需遍历定位,O(n),但调整指针开销为 O(1)。

序列化

ArrayList 类似,LinkedList 使用 transient 修饰字段,并重写 writeObjectreadObject,仅序列化有效节点。


ArrayList vs. LinkedList

特性ArrayListLinkedList
线程安全
底层结构动态数组 (Object[])双向链表
随机访问O(1),支持 RandomAccessO(n),不支持
插入/删除尾部 O(1),其他 O(n)头尾 O(1),其他 O(n)
内存占用预留空间浪费每个节点存储指针,占用更多

使用建议ArrayList 适用于随机访问频繁的场景;LinkedList 适合频繁头尾操作的场景。但实际开发中,ArrayList 通常更常用,甚至 LinkedList 作者 Josh Bloch 也表示很少使用它。


List 使用中的常见问题

Arrays.asList 的陷阱

问题 1:基本类型数组转换异常
int[] arr = {1, 2, 3};
List list = Arrays.asList(arr);
// 输出: [[I@...], size=1

Arrays.asListint[] 视为单一对象,而非元素集合。解决方法

  • 使用 Arrays.stream(Java 8+):
    List<Integer> list = Arrays.stream(arr).boxed().collect(Collectors.toList());
    
  • 使用包装类型数组:
    Integer[] arr = {1, 2, 3};
    List<Integer> list = Arrays.asList(arr);
    
问题 2:不支持增删操作

Arrays.asList 返回的 ListArrays 内部类 ArrayList,未实现 addremove,调用时抛出 UnsupportedOperationException

问题 3:原始数组修改影响 List
String[] arr = {"1", "2", "3"};
List<String> list = Arrays.asList(arr);
arr[1] = "4"; // list 同步变为 ["1", "4", "3"]

解决方法:新建 ArrayList 包装:

List<String> list = new ArrayList<>(Arrays.asList(arr));

List.subList 的陷阱

subList 返回的子列表与原列表共享存储,修改一方会影响另一方,且原列表结构变更可能导致 ConcurrentModificationException

示例:内存泄漏
List<Integer> rawList = IntStream.rangeClosed(1, 100000).boxed().collect(Collectors.toList());
List<Integer> subList = rawList.subList(0, 1);
// rawList 无法被 GC 回收

解决方法:新建独立列表:

List<Integer> subList = new ArrayList<>(rawList.subList(0, 1));
示例:并发修改异常
List<Integer> list = IntStream.rangeClosed(1, 10).boxed().collect(Collectors.toList());
List<Integer> subList = list.subList(1, 4);
list.add(0); // 修改原列表
subList.forEach(System.out::println); // 抛出 ConcurrentModificationException

解决方法

  • 使用 new ArrayList<>(subList)
  • 使用 Stream API:
    List<Integer> subList = list.stream().skip(1).limit(3).collect(Collectors.toList());
    

总结

List 作为 Java 集合框架的重要组成部分,其实现类 ArrayListLinkedList 各有优劣,开发者需根据场景选择合适的实现。同时,使用 Arrays.asListsubList 时需注意其潜在问题,避免踩坑。通过深入理解其底层原理和特性,我们可以更高效地编写健壮代码。


http://www.kler.cn/a/568519.html

相关文章:

  • 2024年时间序列预测领域的SOTA模型总结
  • 代数结构—笔记
  • swift 开发效率提升工具
  • Oracle 数据库基础入门(四):分组与联表查询的深度探索(上)
  • 内存管理c/c++
  • 鸿蒙项目实战:PR#39888中解决的ACE引擎具体问题及技术方案赏析
  • Android 端侧运行 LLM 框架 MNN 及其应用
  • 【Linux】消息队列和信号量
  • 问题修复-后端返给前端的时间展示错误
  • Pytorch使用手册—Raspberry Pi 4 上的实时推理(30 FPS!)(专题三十六)
  • QEMU源码全解析 —— 内存虚拟化(23)
  • 语法Object.defineProperty()
  • YashanDB简介
  • Java 设计模式:软件开发的精髓与艺
  • FunPapers[3]:WWW‘25「快手」生成式回归预测观看时长
  • Makefile、Make和CMake:构建工具的三剑客
  • 字符串的原理
  • 水果识别系统 | BP神经网络水果识别系统,含GUI界面(Matlab)
  • 数学建模:MATLAB极限学习机解决回归问题
  • 大白话页面加载速度优化的工具与实践案例