Java 教程是为 JDK 8 编写的。本页中描述的示例和实践未利用在后续版本中引入的改进。
fork/join 框架是 ExecutorService
接口的一个实现,可帮助你利用多处理器。它专为可以递归分解成小块的工作而设计。目标是使用所有可用的处理能力来提高应用程序的性能。
与任何 ExecutorService
实现一样,fork/join 框架将任务分配给线程池中的工作线程。fork/join 框架是不同的,因为它使用 work-stealing (工作窃取) 算法。完成要做的事情的工作线程可以从仍然忙碌的其他线程中窃取任务。
fork/join 框架的核心是 ForkJoinPool
类,它是 AbstractExecutorService
类的扩展。ForkJoinPool
实现核心工作窃取算法,可以执行 ForkJoinTask
进程。
使用 fork/join 框架的第一步是编写执行一部分工作的代码。你的代码应类似于以下伪代码:
if (my portion of the work is small enough) do the work directly else split my work into two pieces invoke the two pieces and wait for the results
将此代码包装在 ForkJoinTask
子类中,通常使用其中一种更专业的类型,RecursiveTask
(可以返回结果)或 RecursiveAction
。
在 ForkJoinTask
子类就绪后,创建表示要完成的所有工作的对象,并将其传递给 ForkJoinPool
实例的 invoke()
方法。
为了帮助你了解 fork/join 框架的工作原理,请考虑以下示例。假设你想模糊一张图像。原始 source (源) 图像由整数数组表示,其中每个整数包含单个像素的颜色值。模糊的 destination (目标) 图像也由与源相同大小的整数数组表示。
通过一次一个像素地处理源阵列来完成模糊。每个像素与周围像素进行平均(红色,绿色和蓝色分量被平均),结果放在目标数组中。由于图像是很大的数组,因此此过程可能需要很长时间。通过使用 fork/join 框架实现算法,你可以利用多处理器系统上的并发处理。这是一个可能的实现:
public class ForkBlur extends RecursiveAction { private int[] mSource; private int mStart; private int mLength; private int[] mDestination; // Processing window size; should be odd. private int mBlurWidth = 15; public ForkBlur(int[] src, int start, int length, int[] dst) { mSource = src; mStart = start; mLength = length; mDestination = dst; } protected void computeDirectly() { int sidePixels = (mBlurWidth - 1) / 2; for (int index = mStart; index < mStart + mLength; index++) { // Calculate average. float rt = 0, gt = 0, bt = 0; for (int mi = -sidePixels; mi <= sidePixels; mi++) { int mindex = Math.min(Math.max(mi + index, 0), mSource.length - 1); int pixel = mSource[mindex]; rt += (float)((pixel & 0x00ff0000) >> 16) / mBlurWidth; gt += (float)((pixel & 0x0000ff00) >> 8) / mBlurWidth; bt += (float)((pixel & 0x000000ff) >> 0) / mBlurWidth; } // Reassemble destination pixel. int dpixel = (0xff000000 ) | (((int)rt) << 16) | (((int)gt) << 8) | (((int)bt) << 0); mDestination[index] = dpixel; } } ...
现在实现抽象 compute()
方法,该方法直接执行模糊或将其拆分为两个较小的任务。简单的数组长度阈值有助于确定是执行还是拆分工作。
protected static int sThreshold = 100000; protected void compute() { if (mLength < sThreshold) { computeDirectly(); return; } int split = mLength / 2; invokeAll(new ForkBlur(mSource, mStart, split, mDestination), new ForkBlur(mSource, mStart + split, mLength - split, mDestination)); }
如果前面的方法位于 RecursiveAction
类的子类中,那么将任务设置为在 ForkJoinPool
中运行很简单,并涉及以下步骤:
创建一个代表要完成的所有工作的任务。
// source image pixels are in src // destination image pixels are in dst ForkBlur fb = new ForkBlur(src, 0, src.length, dst);
创建将运行任务的 ForkJoinPool
。
ForkJoinPool pool = new ForkJoinPool();
运行任务。
pool.invoke(fb);
有关完整源代码(包括创建目标图片文件的一些额外代码),请参阅
示例。ForkBlur
除了使用 fork/join 框架来实现在多处理器系统上同时执行的任务的自定义算法(例如上一节中的 ForkBlur.java
示例)之外,Java SE 中还有一些通用的功能已经使用 fork/join 框架实现。在 Java SE 8 中引入的一种这样的实现是 java.util.Arrays
类用于其 parallelSort()
方法。这些方法类似于 sort()
,但通过 fork/join 框架利用并发性。在多处理器系统上运行时,大型数组的并行排序比顺序排序更快。但是,这些方法如何利用 fork/join 框架超出了 Java Tutorials 的范围。有关此信息,请参阅 Java API 文档。
fork/join 框架的另一个实现由 java.util.streams
包中的方法使用,该包是为 Java SE 8 发行版计划的 Project Lambda 的一部分。有关更多信息,请参阅 Lambda Expressions 部分。