Java 教程是为 JDK 8 编写的。本页中描述的示例和实践未利用在后续版本中引入的改进。
Collection 表示一组称为其元素的对象。Collection 接口用于传递需要最大泛型性的对象集合。例如,按照规范,所有泛型集合实现都有一个带有 Collection 参数的构造函数。此构造函数(称为 conversion constructor (转换构造函数))初始化新集合以包含指定集合中的所有元素,无论给定集合的子接口或实现类型如何。换句话说,它允许你 convert (转换) 集合的类型。
例如,假设你有一个 Collection<String> c,它可能是 List,Set,或者是另一种 Collection。这个习惯用法创建一个新的 ArrayList(List 接口的实现),最初包含 c 中的所有元素。
List<String> list = new ArrayList<String>(c);
List<String> list = new ArrayList<>(c);
Collection 接口包含执行基本操作的方法,例如 int size(),boolean isEmpty(),boolean contains(Object element),boolean add(E element),boolean remove(Object element),Iterator<E> iterator()。
它还包含对整个集合进行操作的方法,例如 boolean containsAll(Collection<?> c),boolean addAll(Collection<? extends E> c),boolean removeAll(Collection<?> c),boolean retainAll(Collection<?> c),void clear()。
还存在用于数组操作的其他方法(例如 Object[] toArray() 和 <T> T[] toArray(T[] a)。
在 JDK 8 及更高版本中,Collection 接口还公开方法 Stream<E> stream() 和 Stream<E> parallelStream(),从底层集合中获取顺序或并行流。(有关使用流的更多信息,请参阅标题为 Aggregate Operations 的课程。)
如果 Collection 表示一组对象,Collection 接口会执行你的预期。它有方法告诉你集合中有多少元素(size,isEmpty),有方法检查给定对象是否在集合中(contains),有从集合中添加和移除元素的方法(add,remove),以及在集合上提供迭代器的方法(iterator)。
add 方法的定义足够通用,因此对于允许重复的集合以及不重复的集合都有意义。它保证在调用完成后 Collection 将包含指定的元素,并且如果 Collection 因调用而发生更改,则返回 true。类似地,remove 方法旨在从 Collection 中移除指定元素的单个实例,假设它包含要开始的元素,并且如果 Collection 被修改了,则返回 true 。
遍历集合的方法有三种:(1)使用聚合操作(2)使用 for-each 结构,(3)使用 Iterator。
在 JDK 8 及更高版本中,迭代集合的首选方法是获取流并对其执行聚合操作。聚合操作通常与 lambda 表达式结合使用,以使用较少的代码行,使编程更具表现力。以下代码按顺序遍历一组形状并打印出红色对象:
myShapesCollection.stream() .filter(e -> e.getColor() == Color.RED) .forEach(e -> System.out.println(e.getName()));
同样,你可以轻松地请求并行流,如果集合足够大并且你的计算机具有足够的核心,这可能是有意义的:
myShapesCollection.parallelStream() .filter(e -> e.getColor() == Color.RED) .forEach(e -> System.out.println(e.getName()));
使用此 API 收集数据的方法有很多种。例如,你可能希望将 Collection 的元素转换为 String 对象,然后将它们连接起来,用逗号分隔:
String joined = elements.stream()
.map(Object::toString)
.collect(Collectors.joining(", "));
或者累计一下所有员工的工资:
int total = employees.stream() .collect(Collectors.summingInt(Employee::getSalary)));
这些只是你可以使用流和聚合操作执行的一些示例。有关更多信息和示例,请参阅标题为 Aggregate Operations 的课程。
Collections 框架一直提供许多所谓的“批量操作”作为其 API 的一部分。这些包括对整个集合进行操作的方法,例如 containsAll,addAll,removeAll 等。不要将这些方法与 JDK 8 中引入的聚合操作混淆。新聚合操作与现有批量操作(containsAll,addAll 等)之间的主要区别在于旧版本都是 mutative (变化的),意味着它们都修改了底层集合。相反,新的聚合操作 不会 修改底层集合。使用新的聚合操作和 lambda 表达式时,必须注意避免突变,以免将来引入问题,如果你的代码稍后从并行流运行。
for-each 结构允许你使用 for 循环简洁地遍历集合或数组 参见 The for Statement。以下代码使用 for-each 结构在单独的行上打印出集合的每个元素。
for (Object o : collection)
System.out.println(o);
Iterator 是一个对象,使你可以遍历集合并有选择地从集合中移除元素(如果需要)。通过调用 iterator 方法,你可以获得集合的 Iterator。以下是 Iterator 接口。
public interface Iterator<E> {
boolean hasNext();
E next();
void remove(); //optional
}
如果迭代对象具有更多元素,则 hasNext 方法返回 true,next 方法返回迭代中的下一个元素。remove 方法从基础 Collection 中移除 next 返回的最后一个元素。每次调用 next 时,只能调用一次 remove 方法,如果违反此规则,则会抛出异常。
请注意,Iterator.remove 是在迭代期间修改集合的 only (唯一) 安全方式;如果在迭代进行过程中以任何其他方式修改基础集合,则行为未指定。
当你需要完成以下操作时,请使用 Iterator 而不是 for-each 构造:
for-each 构造隐藏了迭代器,因此你无法调用 remove。因此,for-each 结构不可用于过滤。以下方法介绍如何使用 Iterator 过滤任意 Collection 也就是说,遍历集合移除特定元素。
static void filter(Collection<?> c) {
for (Iterator<?> it = c.iterator(); it.hasNext(); )
if (!cond(it.next()))
it.remove();
}
这段简单的代码是多态的,这意味着无论实现如何,它都适用于 any (任何) Collection。此示例演示了使用 Java 集合框架编写多态算法是多么容易。
Bulk operations (批量操作) 对整个 Collection 执行操作。你可以使用基本操作实现这些速记(译注:shorthand)操作,但在大多数情况下,此类实现效率较低。以下是批量操作:
containsAll 如果目标 Collection 包含指定 Collection 中的所有元素,则返回 true。addAll 将指定的 Collection 中的所有元素添加到目标 Collection。removeAll 从目标 Collection 中移除也包含在指定的 Collection 中的所有元素。retainAll 从目标 Collection 中移除 不 包含在指定的 Collection 中的所有元素。也就是说,它仅保留目标 Collection 中也包含在指定的 Collection 中的那些元素。clear 从 Collection 中移除所有元素。如果目标 Collection 在 addAll,removeAll 和 retainAll 方法执行操作的进程中被修改,则这些方法都返回 true。
作为批量操作功能的一个简单示例,请考虑以下习惯用法从 Collection c 中移除指定元素 e 的 所有 实例。
c.removeAll(Collections.singleton(e));
更具体地说,假设你要从 Collection 中移除所有 null 元素。
c.removeAll(Collections.singleton(null));
这个习惯用法使用 Collections.singleton,这是一个静态工厂方法,它返回一个只包含指定元素的不可变 Set。
toArray 方法是作为集合和旧 API 之间的桥梁提供的,这些 API 在输入时期望数组。数组操作允许将 Collection 的内容转换为数组。不带参数的简单形式会创建一个新的 Object 数组。更复杂的形式允许调用者提供数组或选择输出数组的运行时类型。
例如,假设 c 是 Collection。以下代码段将 c 的内容转储到新分配的 Object 数组中,其长度与 c 中的元素数相同。
Object[] a = c.toArray();
假设 c 仅包含字符串(可能因为 c 的类型为 Collection<String>)。以下代码段将 c 的内容转储到新分配的 String 数组中,其长度与 c 中的元素数相同。
String[] a = c.toArray(new String[0]);