Java 编码系列:集合框架(List、Set、Map 及其常用实现类)
引言
在 Java 开发中,集合框架是不可或缺的一部分,它提供了存储和操作一组对象的工具。Java 集合框架主要包括 List
、Set
和 Map
接口及其常用的实现类。正确理解和使用这些集合类不仅可以提高代码的可读性和性能,还能避免一些常见的错误。本文将深入探讨 Java 集合框架的底层原理,并结合大厂的最佳实践,帮助读者掌握这些核心概念。
1. List 接口及其常用实现类
1.1 基本概念
List
接口表示一个有序的集合,允许重复元素。List
中的每个元素都有一个索引,可以通过索引来访问和修改元素。
1.2 常用实现类
ArrayList
:基于动态数组实现,支持快速随机访问,但在中间位置插入或删除元素时性能较差。LinkedList
:基于双向链表实现,支持快速插入和删除操作,但在随机访问时性能较差。Vector
:类似于ArrayList
,但线程安全,性能较差。Stack
:继承自Vector
,实现了栈数据结构。
1.3 底层原理
-
ArrayList
:- 内部实现:
ArrayList
内部使用一个动态数组Object[] elementData
来存储元素。 - 扩容机制:当数组容量不足时,会自动扩容,新容量通常是原容量的 1.5 倍。
ArrayList<String> list = new ArrayList<>(); list.add("A"); list.add("B"); list.add("C"); System.out.println(list); // [A, B, C] System.out.println(list.get(1)); // B
- 内部实现:
-
LinkedList
:- 内部实现:
LinkedList
内部使用双向链表来存储元素,每个节点包含一个元素值、一个指向前一个节点的引用和一个指向后一个节点的引用。 - 插入和删除:在链表头部或尾部插入和删除元素的时间复杂度为 O(1),但在中间位置插入和删除元素的时间复杂度为 O(n)。
LinkedList<String> list = new LinkedList<>(); list.addFirst("A"); list.addLast("C"); list.add(1, "B"); System.out.println(list); // [A, B, C] System.out.println(list.get(1)); // B
- 内部实现:
1.4 常见操作
-
添加元素:
add(E e)
:在列表末尾添加元素。add(int index, E e)
:在指定位置插入元素。
ArrayList<String> list = new ArrayList<>(); list.add("A"); list.add(0, "B"); System.out.println(list); // [B, A]
-
删除元素:
remove(int index)
:删除指定位置的元素。remove(Object o)
:删除第一个匹配的元素。
ArrayList<String> list = new ArrayList<>(Arrays.asList("A", "B", "C")); list.remove(1); list.remove("C"); System.out.println(list); // [A]
-
获取元素:
get(int index)
:获取指定位置的元素。
ArrayList<String> list = new ArrayList<>(Arrays.asList("A", "B", "C")); String element = list.get(1); System.out.println(element); // B
-
遍历元素:
- 使用
for
循环: - 使用
Iterator
:
ArrayList<String> list = new ArrayList<>(Arrays.asList("A", "B", "C")); // 使用 for 循环 for (int i = 0; i < list.size(); i++) { System.out.println(list.get(i)); } // 使用 Iterator Iterator<String> iterator = list.iterator(); while (iterator.hasNext()) { System.out.println(iterator.next()); }
- 使用
1.5 最佳实践
-
选择合适的实现类:
ArrayList
:适用于需要频繁随机访问的场景。LinkedList
:适用于需要频繁插入和删除操作的场景。
-
初始化容量:
ArrayList
:如果已知元素数量,可以初始化容量,减少扩容次数。
ArrayList<String> list = new ArrayList<>(100);
-
使用
List
接口:- 代码复用:在方法签名中使用
List
接口,而不是具体的实现类,提高代码的复用性。
public void printList(List<String> list) { for (String s : list) { System.out.println(s); } }
- 代码复用:在方法签名中使用
2. Set 接口及其常用实现类
2.1 基本概念
Set
接口表示一个不包含重复元素的集合。Set
不保证元素的顺序,也不允许插入重复元素。
2.2 常用实现类
HashSet
:基于哈希表实现,不保证元素的顺序,不允许重复元素。LinkedHashSet
:基于哈希表和链表实现,保持元素的插入顺序,不允许重复元素。TreeSet
:基于红黑树实现,保持元素的自然顺序或自定义排序,不允许重复元素。
2.3 底层原理
-
HashSet
:- 内部实现:
HashSet
内部使用HashMap
来存储元素,键为元素本身,值为一个常量对象。 - 哈希冲突:通过哈希函数计算元素的哈希值,如果发生哈希冲突,使用链地址法解决。
HashSet<String> set = new HashSet<>(); set.add("A"); set.add("B"); set.add("C"); System.out.println(set); // [A, B, C]
- 内部实现:
-
LinkedHashSet
:- 内部实现:
LinkedHashSet
内部使用LinkedHashMap
来存储元素,保持元素的插入顺序。 - 链表:每个元素不仅有一个哈希桶,还有一个双向链表节点。
LinkedHashSet<String> set = new LinkedHashSet<>(); set.add("A"); set.add("B"); set.add("C"); System.out.println(set); // [A, B, C]
- 内部实现:
-
TreeSet
:- 内部实现:
TreeSet
内部使用TreeMap
来存储元素,保持元素的自然顺序或自定义排序。 - 红黑树:
TreeSet
使用红黑树实现,保证元素的有序性。
TreeSet<String> set = new TreeSet<>(); set.add("C"); set.add("A"); set.add("B"); System.out.println(set); // [A, B, C]
- 内部实现:
2.4 常见操作
-
添加元素:
add(E e)
:添加元素,如果元素已存在,则不添加。
HashSet<String> set = new HashSet<>(); set.add("A"); set.add("B"); set.add("A"); // 不会添加重复元素 System.out.println(set); // [A, B]
-
删除元素:
remove(Object o)
:删除指定的元素。
HashSet<String> set = new HashSet<>(Arrays.asList("A", "B", "C")); set.remove("B"); System.out.println(set); // [A, C]
-
检查元素:
contains(Object o)
:检查集合中是否包含指定的元素。
HashSet<String> set = new HashSet<>(Arrays.asList("A", "B", "C")); boolean contains = set.contains("B"); System.out.println(contains); // true
-
遍历元素:
- 使用
for-each
循环: - 使用
Iterator
:
HashSet<String> set = new HashSet<>(Arrays.asList("A", "B", "C")); // 使用 for-each 循环 for (String s : set) { System.out.println(s); } // 使用 Iterator Iterator<String> iterator = set.iterator(); while (iterator.hasNext()) { System.out.println(iterator.next()); }
- 使用
2.5 最佳实践
-
选择合适的实现类:
HashSet
:适用于不需要保持元素顺序的场景。LinkedHashSet
:适用于需要保持元素插入顺序的场景。TreeSet
:适用于需要保持元素有序的场景。
-
使用
Set
接口:- 代码复用:在方法签名中使用
Set
接口,而不是具体的实现类,提高代码的复用性。
public void printSet(Set<String> set) { for (String s : set) { System.out.println(s); } }
- 代码复用:在方法签名中使用
-
重写
equals
和hashCode
方法:- 确保唯一性:如果自定义对象需要存储在
Set
中,必须重写equals
和hashCode
方法,确保对象的唯一性。
class Person { private String name; private int age; public Person(String name, int age) { this.name = name; this.age = age; } @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Person person = (Person) o; return age == person.age && Objects.equals(name, person.name); } @Override public int hashCode() { return Objects.hash(name, age); } }
- 确保唯一性:如果自定义对象需要存储在
3. Map 接口及其常用实现类
3.1 基本概念
Map
接口表示一个键值对的集合,每个键最多只能映射到一个值。Map
不保证键值对的顺序,除非使用特定的实现类。
3.2 常用实现类
HashMap
:基于哈希表实现,不保证键值对的顺序,允许一个null
键和多个null
值。LinkedHashMap
:基于哈希表和链表实现,保持键值对的插入顺序,允许一个null
键和多个null
值。TreeMap
:基于红黑树实现,保持键值对的自然顺序或自定义排序,不允许null
键。Hashtable
:类似于HashMap
,但线程安全,性能较差,不允许null
键和null
值。
3.3 底层原理
-
HashMap
:- 内部实现:
HashMap
内部使用一个数组Node<K,V>[] table
来存储键值对,每个节点包含一个键、一个值、一个哈希值和一个指向下一个节点的引用。 - 哈希冲突:通过哈希函数计算键的哈希值,如果发生哈希冲突,使用链地址法解决。
HashMap<String, Integer> map = new HashMap<>(); map.put("A", 1); map.put("B", 2); map.put("C", 3); System.out.println(map); // {A=1, B=2, C=3}
- 内部实现:
-
LinkedHashMap
:- 内部实现:
LinkedHashMap
内部使用HashMap
和双向链表来存储键值对,保持键值对的插入顺序。 - 链表:每个节点不仅有一个哈希桶,还有一个双向链表节点。
LinkedHashMap<String, Integer> map = new LinkedHashMap<>(); map.put("A", 1); map.put("B", 2); map.put("C", 3); System.out.println(map); // {A=1, B=2, C=3}
- 内部实现:
-
TreeMap
:- 内部实现:
TreeMap
内部使用TreeMap
来存储键值对,保持键值对的自然顺序或自定义排序。 - 红黑树:
TreeMap
使用红黑树实现,保证键值对的有序性。
TreeMap<String, Integer> map = new TreeMap<>(); map.put("C", 3); map.put("A", 1); map.put("B", 2); System.out.println(map); // {A=1, B=2, C=3}
- 内部实现:
3.4 常见操作
-
添加键值对:
put(K key, V value)
:添加键值对,如果键已存在,则更新对应的值。
HashMap<String, Integer> map = new HashMap<>(); map.put("A", 1); map.put("B", 2); map.put("A", 3); // 更新键 "A" 的值 System.out.println(map); // {A=3, B=2}
-
删除键值对:
remove(Object key)
:删除指定键的键值对。
HashMap<String, Integer> map = new HashMap<>(Map.of("A", 1, "B", 2, "C", 3)); map.remove("B"); System.out.println(map); // {A=1, C=3}
-
获取值:
get(Object key)
:获取指定键的值。
HashMap<String, Integer> map = new HashMap<>(Map.of("A", 1, "B", 2, "C", 3)); int value = map.get("B"); System.out.println(value); // 2
-
检查键或值:
containsKey(Object key)
:检查集合中是否包含指定的键。containsValue(Object value)
:检查集合中是否包含指定的值。
HashMap<String, Integer> map = new HashMap<>(Map.of("A", 1, "B", 2, "C", 3)); boolean containsKey = map.containsKey("B"); boolean containsValue = map.containsValue(2); System.out.println(containsKey); // true System.out.println(containsValue); // true
-
遍历键值对:
- 使用
for-each
循环: - 使用
Iterator
:
HashMap<String, Integer> map = new HashMap<>(Map.of("A", 1, "B", 2, "C", 3)); // 使用 for-each 循环 for (Map.Entry<String, Integer> entry : map.entrySet()) { System.out.println(entry.getKey() + ": " + entry.getValue()); } // 使用 Iterator Iterator<Map.Entry<String, Integer>> iterator = map.entrySet().iterator(); while (iterator.hasNext()) { Map.Entry<String, Integer> entry = iterator.next(); System.out.println(entry.getKey() + ": " + entry.getValue()); }
- 使用
3.5 最佳实践
-
选择合适的实现类:
HashMap
:适用于不需要保持键值对顺序的场景。LinkedHashMap
:适用于需要保持键值对插入顺序的场景。TreeMap
:适用于需要保持键值对有序的场景。
-
使用
Map
接口:- 代码复用:在方法签名中使用
Map
接口,而不是具体的实现类,提高代码的复用性。
public void printMap(Map<String, Integer> map) { for (Map.Entry<String, Integer> entry : map.entrySet()) { System.out.println(entry.getKey() + ": " + entry.getValue()); } }
- 代码复用:在方法签名中使用
-
重写
equals
和hashCode
方法:- 确保唯一性:如果自定义对象作为键存储在
Map
中,必须重写equals
和hashCode
方法,确保键的唯一性。
class Person { private String name; private int age; public Person(String name, int age) { this.name = name; this.age = age; } @Override public boolean equals(Object o) { if (this == o) return true; if (o == null || getClass() != o.getClass()) return false; Person person = (Person) o; return age == person.age && Objects.equals(name, person.name); } @Override public int hashCode() { return Objects.hash(name, age); } }
- 确保唯一性:如果自定义对象作为键存储在
4. 大厂最佳实践
4.1 集合框架
-
阿里巴巴《Java开发手册》:
- 使用
ArrayList
而不是LinkedList
:除非确实需要频繁的插入和删除操作,否则使用ArrayList
。 - 初始化容量:如果已知元素数量,可以初始化容量,减少扩容次数。
- 使用
Set
接口:在方法签名中使用Set
接口,而不是具体的实现类,提高代码的复用性。
- 使用
-
Google Java Style Guide:
- 使用
for-each
循环:在遍历集合时,优先使用for-each
循环,提高代码的可读性。 - 使用
Map
接口:在方法签名中使用Map
接口,而不是具体的实现类,提高代码的复用性。
- 使用
-
Oracle 官方文档:
- 重写
equals
和hashCode
方法:如果自定义对象需要存储在集合中,必须重写equals
和hashCode
方法,确保对象的唯一性。 - 选择合适的实现类:根据具体需求选择合适的集合实现类,提高代码的性能。
- 重写
5. 总结
本文深入探讨了 Java 集合框架的 List
、Set
和 Map
接口及其常用实现类的底层原理,并结合大厂的最佳实践,帮助读者掌握这些核心概念。正确理解和使用这些集合类不仅可以提高代码的可读性和性能,还能避免一些常见的错误。希望本文对你有所帮助,如果你有任何问题或建议,欢迎留言交流。
希望这篇文章能够满足你的需求,如果有任何进一步的问题或需要更多内容,请随时告诉我!