概述

本文尝试回答以下几个问题：
1、核心线程池是如何保持住的？
2、当没有任务时，超过核心线程数的线程是如何回收的？
3、线程队列为什么必须是BlockingQueue，普通队列行不行？

背景知识

以下是一些背景知识，方便后面分析问题，如果明白可以跳过，否则建议重温下。

线程参数

corePoolSize：核心线程数。
maximumPoolSize：最大线程数。
keepAliveTime：空闲线程存活时间。
TimeUnit：时间单位。
BlockingQueue：线程池任务队列。
ThreadFactory：创建线程的工厂。
RejectedExecutionHandler：拒绝策略，包括Abort、callRuns，discard，discardOld.

线程池结构

以ThreadPoolExecutor为例，它的结构如下所示：

最重要的两个类就是我们的ThreadPoolExecutor和Worker，其中ThreadPoolExecutor就是线程池本池了，Worker是对Thread的一个简单封装，它实现了Runnable接口，我们可以把它当作线程Thread本身。我们需要知道这些字段的含义是怎样的：

提交任务做了什么？

创建线程池没有任何有价值的东西，就是对ThreadPoolExecutor的属性进行赋值，例如我们刚才提到的那几个重要的属性，所以我们从execute提交任务开始探索内部。
![在这里插入图片描述](https://img-blog.csdnimg.cn/b8b29d220ece460798819a451e1a34b4.png
当我们创建了线程池，调用execute提交一个Runnable任务，执行流程如下所示：

执行流程
1、任务到来时，看CORE线程数有没有满，如果没有满则新创建线程处理。
2、如果core线程数量满了，则放入队列中。
3、如果队列也满了，则看看线程数量是否达到了maxPoolSize值，如果没有则创建新线程处理。
4、如果已经达到了maxPoolSize的值，则根据拒绝策略处理任务。
所以当有人问execute做了什么时候，可以回答这个执行流程，这是面试时经常问的问题。知道这个流程后，我们再来看下代码是怎么写的(按照惯例，省略了无关代码)：

public void execute(Runnable command) {int c = ctl.get();if (workerCountOf(c) < corePoolSize) { // 当线程数量小于核心线程数时，创建新的线程，请注意这里给了command，也就是我们自定义的Runnable任务，后面会再次提到它！if (addWorker(command, true))return;c = ctl.get();}if (isRunning(c) && workQueue.offer(command)) { // 上面没有走到，说明核心线程数量已经满了，则尝试将任务添加到任务队列中，也就是这里的workQueueint recheck = ctl.get();if (! isRunning(recheck) && remove(command))reject(command);else if (workerCountOf(recheck) == 0)addWorker(null, false);}else if (!addWorker(command, false)) // 添加队列失败，说明队列满了。尝试依赖maxPoolSize创建线程，如果失败则根据拒绝策略处理任务reject(command);}

是不清晰多了？不过我们需要继续深挖，看看addWorker()干了什么？第二个boolean参数又是干嘛用的？

private boolean addWorker(Runnable firstTask, boolean core) {retry:for (;;) { // for循环主要通过cas更新线程worker数量int c = ctl.get(); // 拿到线程数量 for (;;) {int wc = workerCountOf(c);if (wc >= CAPACITY ||wc >= (core " />: maximumPoolSize)) // 因为核心线程数和最大线程数控制着线程的上限，这个boolean参数就是检查是不是还能创建线程。return false;if (compareAndIncrementWorkerCount(c))// 线程数量+1break retry;c = ctl.get();// Re-read ctlif (runStateOf(c) != rs)continue retry;// else CAS failed due to workerCount change; retry inner loop}}// 创建workerboolean workerStarted = false;boolean workerAdded = false;Worker w = null;try {w = new Worker(firstTask); // 看清楚了！这里就是真正的创建线程了，并把任务作为参数传递进去final Thread t = w.thread;if (t != null) {final ReentrantLock mainLock = this.mainLock;mainLock.lock();try {int rs = runStateOf(ctl.get());if (rs < SHUTDOWN ||(rs == SHUTDOWN && firstTask == null)) {if (t.isAlive()) // precheck that t is startablethrow new IllegalThreadStateException();workers.add(w); // 把worker添加到worker集合中int s = workers.size();if (s > largestPoolSize)largestPoolSize = s;workerAdded = true;}} finally {mainLock.unlock();}if (workerAdded) {t.start(); // 启动线程workerStarted = true;}}} finally {if (! workerStarted)addWorkerFailed(w);}return workerStarted;}

我们用流程图表示下：

从上面的流程图我们可以知道，addworker做了3件事情：
1、更新worker数量
2、创建worker对象，其中包括创建Thread对象并设置好runnable任务
3、启动线程
第二个boolean参数，实际上就是控制创建worker对线程数量做检查时，需要和什么对比，是和核心线程数量配置对比还是和最大线程数量配置做比对。

worker启动干了什么？

worker实现了Rnnable接口，所以线程启动后，会调用run方法：

我们需要看看runWorker()做了什么：

final void runWorker(Worker w) {Thread wt = Thread.currentThread();// 获取当前线程Runnable task = w.firstTask; // 需要执行的任务w.firstTask = null;w.unlock(); // allow interruptsboolean completedAbruptly = true;try {while (task != null || (task = getTask()) != null) { // 这里非常重要！！！w.lock();try {beforeExecute(wt, task);Throwable thrown = null;try {task.run(); // 执行任务} catch (RuntimeException x) {thrown = x; throw x;} catch (Error x) {thrown = x; throw x;} catch (Throwable x) {thrown = x; throw new Error(x);} finally {afterExecute(task, thrown);}} finally {task = null;w.completedTasks++;w.unlock();}}completedAbruptly = false;} finally {processWorkerExit(w, completedAbruptly);}}

实际上这里最关键的就两步：
1、获取任务
2、执行任务

获取任务是从worker中拿到的，我们注意到有一行非常重要的判断：

什么情况下task为空，什么情况下需要调用getTask()去获取任务？
请回想一下我们线程池execute的执行流程，其中1，2步骤就曾经说过：
1、任务到来时，看CORE线程数有没有满，如果没有满则新创建线程处理。这个时候创建worker的调用是：

addWorker(command, true)

这就保证我们运行获取任务时是非空的。
2、如果core线程数量满了，则放入队列中。这个时候调用的是：

workQueue.offer(command)

这就保证我们getTask（）时能取到任务！

现在重点来了，我们今天要回答的问题就和这个getTask有莫大的关系！在理解下面的代码前，我们先假设corePoolSize < 线程数量 < MaxPoolSize 并且队列里面已经没有任务了，也就是没有任务的时候，有一些线程需要被回收。

private Runnable getTask() {boolean timedOut = false; // 上一次通过poll从任务队列获取任务是否超时，如果超时说明任务队列没有任务了for (;;) {// 这是一个循环int c = ctl.get();int rs = runStateOf(c);int wc = workerCountOf(c); // 获取线程数量// Are workers subject to culling" />boolean timed = allowCoreThreadTimeOut || wc > corePoolSize; // 我们先撇开allowCoreThreadTimeOut这个参数，当线程数量大于核心线程数配置，说明在没有任务的时候可以对一些剩余的线程去做回收操作。if ((wc > maximumPoolSize || (timed && timedOut))&& (wc > 1 || workQueue.isEmpty())) {// timed=true,timeOut=true，队列也空了，对线程数量-1if (compareAndDecrementWorkerCount(c))return null;continue;}try {Runnable r = timed ?workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :workQueue.take();// 这里就是重点了！当线程数量>核心线程数时，走的是poll代码块if (r != null)return r;timedOut = true; // 因为take会阻塞线程直到有任务到达，所以这里只能是poll没有拿到任务，也就是任务队列是空，然后返回循环去做线程-1} catch (InterruptedException retry) {timedOut = false;}}}

如果是核心线程获取任务（核心非核心没有标记区别，这里是做个假设），因为timed为false，会走到workQueue.take()方法，如果任务队列为空，线程会被阻塞。非核心线程获取任务会走到workQueue.poll()，尝试在超时时间内获取任务，然后返回。

到此为止我们可以回答“核心线程池是如何保持住的？”答案就是通过workQueue.take()方法对线程进行阻塞，让我们线程保持住不被数量-1而回收掉。
然后我们可以回答“线程队列为什么必须是BlockingQueue，普通队列行不行？”答案就是不行，我们需要通过阻塞队列对线程进行阻塞，保证线程不会被回收掉。关于BlockingQueue怎么实现阻塞的，建议温习下java阻塞队列原理。这也是面试经常会被问到的。
我们知道需要回收条件触发时（当线程数量大于核心线程数配置，任务队列中没有任务），线程数量会被 – 1，那么回收具体时怎么操作的呢？
回到我们的任务执行方法runWorker中，最后有一步processWorkerExit调用：

private void processWorkerExit(Worker w, boolean completedAbruptly) {final ReentrantLock mainLock = this.mainLock;mainLock.lock();try {completedTaskCount += w.completedTasks;workers.remove(w); // 把线程从线程集合中删除，通过jvm回收} finally {mainLock.unlock();}int c = ctl.get();if (runStateLessThan(c, STOP)) {if (!completedAbruptly) { // 线程异常时，completedAbruptly会被设置为trueint min = allowCoreThreadTimeOut " />0 : corePoolSize;if (min == 0 && ! workQueue.isEmpty())min = 1;if (workerCountOf(c) >= min) // 线程数本身就大于核心线程数量，不用补偿return; // replacement not needed}addWorker(null, false); // 线程异常后的一种补偿，重新创建一个线程替换异常线程}}

到此我们可以回答“当没有任务时，超过核心线程数的线程是如何回收的？”，答案是先将线程数-1，然后将woker从worker列表中删除，通过jvm回收。

总结

通过对线程池的学习，我们知道了线程池的执行流程：
1、任务到来时，看CORE线程数有没有满，如果没有满则新创建线程处理。
2、如果core线程数量满了，则放入队列中。
3、如果队列也满了，则看看线程数量是否达到了maxPoolSize值，如果没有则创建新线程处理。
4、如果已经达到了maxPoolSize的值，则根据拒绝策略处理任务。

然后我们可以回答这些问题：
1、核心线程池是如何保持住的？

通过workQueue.take()方法对线程进行阻塞，让我们线程保持住不被数量-1而回收掉

2、当没有任务时，超过核心线程数的线程是如何回收的？

先将线程数-1，然后将woker从worker列表中删除，通过jvm回收

3、线程队列为什么必须是BlockingQueue，普通队列行不行？

不行，我们需要通过阻塞队列对线程进行阻塞，保证线程不会被回收掉。

如果我们看的仔细，我们实际上还可以回答诸如下面的问题：
1、如果我想在任务执行前后做一些诸如打日志看耗时的操作，有办法吗？
2、核心线程池的线程永远都是这些线程吗？会不会变化？
3、如果线程池运行中动态设置了corePoolSize > 原始corePoolSize，现有线程数量小于新的corePoolSize，任务队列中还有任务，会自动创建线程吗？是怎么做的？
4、keepAliveTime是空闲线程超时时间，是有定时任务回收空闲线程吗？
5、为什么获取任务时，workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS)写死了NANOSECONDS，明明创建线程的时候是可以指定时间单位的？

大家可以尝试自行回答下，答案进行了base64编码，可在base64解码解码后查看。

MeOAgeWmguaenOaIkeaDs+WcqOS7u+WKoeaJp+ihjOWJjeWQjuWBmuS4gOS6m+ivuOWmguaJk+aXpeW/l+eci+iAl+aXtueahOaTjeS9nO+8jOacieWKnuazleWQl++8nwoKPiDmnInlip7ms5XjgILnur/nqIvmiafooYznmoTml7blgJnkvJrmnInliY3nva7lkI7nva7mianlsZXngrnvvIzlj6/ku6XlnKjlrZDnsbvkuK3ov5vooYzlrp7njrDjgIIKCjLjgIHmoLjlv4Pnur/nqIvmsaDnmoTnur/nqIvmsLjov5zpg73mmK/ov5nkupvnur/nqIvlkJfvvJ/kvJrkuI3kvJrlj5jljJbvvJ8KCj4g5LiN5piv44CC5b2T57q/56iL5omn6KGM5byC5bi45pe277yM5Lya5pyJ6KGl5YG/5py65Yi277yM5Yib5bu65paw55qE57q/56iL5pu/5o2i44CCCgoz44CB5aaC5p6c57q/56iL5rGg6L+Q6KGM5Lit5Yqo5oCB6K6+572u5LqGY29yZVBvb2xTaXplID4g5Y6f5aeLY29yZVBvb2xTaXpl77yM546w5pyJ57q/56iL5pWw6YeP5bCP5LqO5paw55qEY29yZVBvb2xTaXpl77yM5Lu75Yqh6Zif5YiX5Lit6L+Y5pyJ5Lu75Yqh77yM5Lya6Ieq5Yqo5Yib5bu657q/56iL5ZCX77yf5piv5oCO5LmI5YGa55qE77yfCgo+IOS8muOAguS5n+aYr+mAmui/h2FkZFdvcmtlcuWIm+W7uuOAggoKNOOAgWtlZXBBbGl2ZVRpbWXmmK/nqbrpl7Lnur/nqIvotoXml7bml7bpl7TvvIzmmK/mnInlrprml7bku7vliqHlm57mlLbnqbrpl7Lnur/nqIvlkJfvvJ8KCj4g5rKh5pyJ44CC5LuO5Lu75Yqh6Zif5YiX6I635Y+W5Lu75Yqh5pe277yM5pyJ6LaF5pe25pe26Ze077yM5bCx5piv6L+Z5Liqa2VlcEFsaXZlVGltZe+8jOi2heaXtuayoeacieiOt+WPluWIsOS7u+WKoe+8jOS8mui/lOWbnm51bGzvvIznhLblkI7lvIDlp4vlm57mlLbnur/nqIvjgIIKCjXjgIHkuLrku4DkuYjojrflj5bku7vliqHml7bvvIx3b3JrUXVldWUucG9sbChrZWVwQWxpdmVUaW1lLCBUaW1lVW5pdC5OQU5PU0VDT05EUynlhpnmrbvkuoZOQU5PU0VDT05EU++8jOaYjuaYjuWIm+W7uue6v+eoi+eahOaXtuWAmeaYr+WPr+S7peaMh+WumuaXtumXtOWNleS9jeeahO+8nwoKPiDliJvlu7rnur/nqIvmsaDnmoTml7blgJnvvIzpgJrov4d1bml0LnRvTmFub3Moa2VlcEFsaXZlVGltZSnovazmjaLlpb3kuobml7bpl7TljZXkvY3jgII=

线程池核心线程是如何保持住的？

概述

背景知识

线程参数

线程池结构

提交任务做了什么？

worker启动干了什么？

总结

最新关注

热文推荐

go语言–区块链学习（二）

分布式 – 消息队列Kafka：Kafka消费者的分区分配策略

Web3 solidity编写交易所合约编写ETH和自定义代币存入逻辑并带着大家手动测试

【C语言数据结构】二叉树的遍历

2023年了该了解下WebComponent使用教程

第六章-Python数据可视化–2

线程池核心线程是如何保持住的？

概述

背景知识

线程参数

线程池结构

提交任务做了什么？

worker启动干了什么？

总结

相关文章

最新关注

热文推荐