前言
在上一篇文章深入淺出Java線程池:理論篇中,已經(jīng)介紹了什么是線程池以及基本的使用。(本來寫作的思路是使用篇,但經(jīng)網(wǎng)友建議后,感覺改為理論篇會更加合適)。本文則深入線程池的源碼,主要是介紹ThreadPoolExecutor內(nèi)部的源碼是如何實現(xiàn)的,對ThreadPoolExecutor有一個更加清晰的認識。
ThreadPoolExecutor的源碼相對而言比較好理解,沒有特別難以讀懂的地方。相信沒有閱讀源碼習(xí)慣的讀者,跟著本文,也可以很輕松地讀懂ThreadPoolExecutor的核心源碼邏輯。
本文源碼jdk版本為8,該類版本為jdk1.5,也就是在1.5之后,ThreadPoolExecutor的源碼沒有做修改。
線程池家族
Java中的線程池繼承結(jié)構(gòu)如下圖:(類圖中只寫了部分方法且省略參數(shù))
- 頂層接口Executor表示一個執(zhí)行器,他只有一個接口:
execute(),表示可以執(zhí)行任務(wù) - ExecutorService在Executor的基礎(chǔ)上拓展了更多的執(zhí)行方法,如
submit()shutdown()等等,表示一個任務(wù)執(zhí)行服務(wù)。 - AbstarctExecutorService是一個抽象類,他實現(xiàn)了ExecutorService的部分核心方法,如submit等
- ThreadPoolExecutor是最核心的類,也就是線程池,他繼承了抽象類AbstarctExecutorService
- 此外還有ScheduledExecutorService接口,他表示一個可以按照指定時間或周期執(zhí)行的執(zhí)行器服務(wù),內(nèi)部定義了如
schedule()等方法來執(zhí)行任務(wù) - ScheduledThreadPoolExecutor實現(xiàn)了ScheduledExecutorService接口,同時繼承于ThreadPoolExecutor,內(nèi)部的線程池相關(guān)邏輯使用自ThreadPoolExecutor,在此基礎(chǔ)上拓展了延遲、周期執(zhí)行等功能特性
ScheduledThreadPoolExecutor相對來說用的是比較少。延時任務(wù)在我們Android中有更加熟悉的方案:Handler;而周期任務(wù)則用的非常少?,F(xiàn)在android的后臺限制非常嚴格,基本上一退出應(yīng)用,應(yīng)用進程很容易被系統(tǒng)干掉。當然ScheduledThreadPoolExecutor也不是完全沒有用處,例如桌面小部件需要設(shè)置定時刷新,那么他就可以派上用場了。
因此,我們本文的源碼,主要針對ThreadPoolExecutor。在閱讀源碼之前,我們先來看一下ThreadPoolExecutor內(nèi)部的結(jié)構(gòu)以及關(guān)鍵角色。
內(nèi)部結(jié)構(gòu)
閱讀源碼前,我們先把ThreadPoolExecutor整個源碼結(jié)構(gòu)講解一下,形成一個整體概念,再閱讀源碼就不會迷失在源碼中了。先來看一下ThreadPoolExecutor的內(nèi)部結(jié)構(gòu):
- ThreadPoolExecutor內(nèi)部有三個關(guān)鍵的角色:阻塞隊列、線程、以及RejectExecutionHandler(這里寫個中文名純粹因為不知道怎么翻譯這個名字),他們的作用在理論篇有詳細介紹,這里不再贅述。
- 在ThreadPoolExecutor中,一個線程對應(yīng)一個worker對象,工人,非常形象。每個worker內(nèi)部有一個獨立的線程,他會不斷去阻塞隊列獲取任務(wù)來執(zhí)行,也就是調(diào)用阻塞隊列的
poll或者take方法,他們區(qū)別后面會講。如果隊列沒有任務(wù)了,那么就會阻塞在這里。 - workQueue,就是阻塞隊列,當核心線程已滿之后,任務(wù)就會被放置在這里等待被工人worker領(lǐng)取執(zhí)行
- RejectExecutionHandler本身是一個接口,ThreadPoolExecutor內(nèi)部有這樣的一個接口對象,當任務(wù)無法被執(zhí)行會調(diào)用這個對象的方法。ThreadPoolExecutor提供了該接口的4種實現(xiàn)方案,我們可以直接拿來用,或者自己繼承接口,實現(xiàn)自定義邏輯。在構(gòu)造線程池的時候可以傳入RejectExecutionHandler對象。
- 整個ThreadPoolExecutor中最核心的方法就是execute,他會根據(jù)具體的情況來選擇不同的執(zhí)行方案或者拒絕執(zhí)行。
這樣,我們就清楚ThreadPoolExecutor的內(nèi)部結(jié)構(gòu)了,然后,我們開始 Read the fucking code 吧。
源碼分析
內(nèi)部關(guān)鍵屬性
ThreadPoolExecutor內(nèi)部有很多的變量,他們包含的信息非常重要,先來了解一下。
ThreadPoolExecutor的狀態(tài)和線程數(shù)整合在同一個int變量中,類似于view測量中MeasureSpec。他的高三位表示線程池的狀態(tài),低29位表示線程池中線程的數(shù)量,如下:
// AtomicInteger對象可以利用CAS實現(xiàn)線程安全的修改,其中包含了線程池狀態(tài)和線程數(shù)量信息
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
// COUNT_BITS=29,(對于int長度為32來說)表示線程數(shù)量的字節(jié)位數(shù)
private static final int COUNT_BITS = Integer.SIZE - 3;
// 狀態(tài)掩碼,高三位是1,低29位全是0,可以通過 ctl&COUNT_MASK 運算來獲取線程池狀態(tài)
private static final int COUNT_MASK = (1 << COUNT_BITS) - 1;
線程池的狀態(tài)一共有5個:
- 運行running:線程池創(chuàng)建之后即是運行狀態(tài)
- 關(guān)閉shutdown:調(diào)用shutdown方法之后線程池處于shutdown狀態(tài),該狀態(tài)會停止接收任何任務(wù),阻塞隊列中的任務(wù)執(zhí)行完成之后會自動終止線程池
- 停止stop:調(diào)用shutdownNow方法之后線程池處于stop狀態(tài)。和shutdown的區(qū)別是這個狀態(tài)下的線程池不會去執(zhí)行隊列中剩下的任務(wù)
- 整理tidying:在線程池stop之后,進入tidying狀態(tài),然后執(zhí)行
terminated()方法,再進入terminated狀態(tài) - 終止terminated:線程池中沒有任何線程在執(zhí)行任務(wù),線程池完全終止。
在源碼中這幾個狀態(tài)分別對應(yīng):
// runState is stored in the high-order bits
private static final int RUNNING = -1 << COUNT_BITS;
private static final int SHUTDOWN = 0 << COUNT_BITS;
private static final int STOP = 1 << COUNT_BITS;
private static final int TIDYING = 2 << COUNT_BITS;
private static final int TERMINATED = 3 << COUNT_BITS;
上面的位操作不夠直觀,轉(zhuǎn)化后如下:
private static final int RUNNING = 111 00000 00000000 00000000 00000000;
private static final int SHUTDOWN = 000 00000 00000000 00000000 00000000;
private static final int STOP = 001 00000 00000000 00000000 00000000;
private static final int TIDYING = 010 00000 00000000 00000000 00000000;
private static final int TERMINATED = 011 00000 00000000 00000000 00000000;
可以看到除了running是負數(shù),其他的狀態(tài)都是正數(shù),且狀態(tài)越靠后,數(shù)值越大。因此我們可以通過判斷 ctl&COUNT_MASK > SHUTDOWN 來判斷狀態(tài)是否處于 stop、tidying、terminated之一。后續(xù)源碼中會有很多的這樣的判斷,舉其中的一個方法:
// 這里來判斷線程池的狀態(tài)
if(runStateAtLeast(ctl,SHUTDOWN)) {
...
}
// 這里執(zhí)行邏輯,直接判斷兩個數(shù)的大小
private static boolean runStateAtLeast(int c, int s) {
return c >= s;
}
ps:這里怎么沒有使用掩碼COUNT_MASK ?因為狀態(tài)是處于高位,低位的數(shù)值不影響高位的大小判斷。當然如果要判斷相等,就還是需要使用掩碼COUNT_MASK的。
接下來是ThreadPoolExecutor內(nèi)部的三個關(guān)鍵角色對象:
// 阻塞隊列
private final BlockingQueue<Runnable> workQueue;
// 存儲worker的hashSet,worker被創(chuàng)建之后會被存儲到這里
private final HashSet<Worker> workers = new HashSet<>();
// RejectedExecutionHandler默認的實現(xiàn)是AbortPolicy
private volatile RejectedExecutionHandler handler;
private static final RejectedExecutionHandler defaultHandler =
new AbortPolicy();
內(nèi)部使用的鎖對象:
// 這里是兩個鎖。ThreadPoolExecutor內(nèi)部并沒有使用Synchronize關(guān)鍵字來保持同步
// 而是使用Lock;和Synchronize的區(qū)別就是他是應(yīng)用層的鎖,而synchronize是jvm層的鎖
private final ReentrantLock mainLock = new ReentrantLock();
private final Condition termination = mainLock.newCondition();
最后是內(nèi)部一些參數(shù)的配置,前面都介紹過,把源碼貼出來再回顧一下:
// 線程池歷史達到的最大線程數(shù)
private int largestPoolSize;
// 線程池完成的任務(wù)數(shù)。
// 該數(shù)并不是實時更新的,在獲取線程池完成的任務(wù)數(shù)時,需要去統(tǒng)計每個worker完成的任務(wù)并累加起來
// 當一個worker被銷毀之后,他的任務(wù)數(shù)就會被累加到這個數(shù)據(jù)中
private long completedTaskCount;
// 線程工廠,用于創(chuàng)建線程
private volatile ThreadFactory threadFactory;
// 空閑線程存儲的時間
private volatile long keepAliveTime;
// 是否允許核心線程被回收
private volatile boolean allowCoreThreadTimeOut;
// 核心線程數(shù)限額
private volatile int corePoolSize;
// 線程總數(shù)限額
private volatile int maximumPoolSize;
不是吧sir?源碼還沒看到魂呢,整出來這么無聊的變量?
咳咳,別急嘛,源碼解析馬上來。這些變量會貫穿整個源碼過程始終,先對他們有個印象,后續(xù)閱讀源碼就會輕松暢通很多。
關(guān)鍵方法:execute()
這個方法的主要任務(wù)就是根據(jù)線程池的當前狀態(tài),選擇任務(wù)的執(zhí)行策略。該方法的核心邏輯思路是:
-
在線程數(shù)沒有達到核心線程數(shù)時,會創(chuàng)建一個核心線程來執(zhí)行任務(wù)
public void execute(Runnable command) { // 不能傳入空任務(wù) if (command == null) throw new NullPointerException(); // 獲取ctl變量,就是上面我們講的將狀態(tài)和線程數(shù)合在一起的一個變量 int c = ctl.get(); // 判斷核心線程數(shù)是否超過限額,否則創(chuàng)建一個核心線程來執(zhí)行任務(wù) if (workerCountOf(c) < corePoolSize) { // addWorker方法是創(chuàng)建一個worker,也就是創(chuàng)建一個線程,參數(shù)true表示這是一個核心線程 // 如果添加成功則直接返回 // 否則意味著中間有其他的worker被添加了,導(dǎo)致超出核心線程數(shù);或者線程池被關(guān)閉了等其他情況 // 需要進入下一步繼續(xù)判斷 if (addWorker(command, true)) return; c = ctl.get(); } ... } 當線程數(shù)達到核心線程數(shù)時,新任務(wù)會被放入到等待隊列中等待被執(zhí)行
當?shù)却犃幸呀?jīng)滿了之后,如果線程數(shù)沒有到達總的線程數(shù)上限,那么會創(chuàng)建一個非核心線程來執(zhí)行任務(wù)
-
當線程數(shù)已經(jīng)到達總的線程數(shù)限制時,新的任務(wù)會被拒絕策略者處理,線程池?zé)o法執(zhí)行該任務(wù)。
public void execute(Runnable command) { ... // 如果線程池還在運行,則嘗試添加任務(wù)到隊列中 if (isRunning(c) && workQueue.offer(command)) { int recheck = ctl.get(); // 再次檢查如果線程池被關(guān)閉了,那么把任務(wù)移出隊列 // 如果移除成功則拒絕本次任務(wù) // 這里主要是判斷在插入隊列的過程中,線程池有沒有被關(guān)閉了 if (! isRunning(recheck) && remove(command)) reject(command); // 否則再次檢查線程數(shù)是否為0,如果是,則創(chuàng)建一個沒有任務(wù)的非主線程worker // 這里對應(yīng)核心線程為0的情況,指定任務(wù)為null,worker會去隊列拿任務(wù)來執(zhí)行 // 這里表示線程池至少有一個線程來執(zhí)行隊列中的任務(wù) else if (workerCountOf(recheck) == 0) addWorker(null, false); } // 如果上面添加到隊列中失敗,則嘗試創(chuàng)建一個非核心線程來執(zhí)行任務(wù) // 如果創(chuàng)建失敗,則拒絕任務(wù) else if (!addWorker(command, false)) reject(command); }
源碼中還設(shè)計到兩個關(guān)鍵方法:addWorker創(chuàng)建一個新的worker,也就是創(chuàng)建一個線程;reject拒絕一個任務(wù)。后者比較簡單我們先看一下。
拒絕任務(wù):reject()
// 拒絕任務(wù),調(diào)用rejectedExecutionHandler來處理
final void reject(Runnable command) {
handler.rejectedExecution(command, this);
}
默認的實現(xiàn)類有4個,我們依次來看一下:
-
AbortPolicy是默認實現(xiàn),會拋出一個RejectedExecutionException異常:
public static class AbortPolicy implements RejectedExecutionHandler { public void rejectedExecution(Runnable r, ThreadPoolExecutor e) { throw new RejectedExecutionException("Task " + r.toString() + " rejected from " + e.toString()); } } -
DiscardPolicy最簡單,就是:什么都不做,直接拋棄任務(wù)。(這是非常渣男不負責(zé)任的行為,咱們不能學(xué)他,所以也不要用它 [此處狗頭] )
public static class DiscardPolicy implements RejectedExecutionHandler { public void rejectedExecution(Runnable r, ThreadPoolExecutor e) { } } -
DiscardOldestPolicy會刪除隊列頭的一個任務(wù),然后再次執(zhí)行自己(擠掉原位,自己上位,綠茶行為?)
public static class DiscardOldestPolicy implements RejectedExecutionHandler { public void rejectedExecution(Runnable r, ThreadPoolExecutor e) { if (!e.isShutdown()) { e.getQueue().poll(); e.execute(r); } } } -
CallerRunsPolicy最猛,他干脆在自己的線程執(zhí)行run方法,不依靠線程池了,自己動手豐衣足食。
public static class CallerRunsPolicy implements RejectedExecutionHandler { public void rejectedExecution(Runnable r, ThreadPoolExecutor e) { if (!e.isShutdown()) { r.run(); } } }
上面4個ThreadPoolExecutor已經(jīng)幫我們實現(xiàn)了,他的靜態(tài)內(nèi)部類,在創(chuàng)建ThreadPoolExecutor的時候我們可以直接拿來用。也可以自己繼承接口實現(xiàn)自己的邏輯。具體選擇哪個需要根據(jù)實際的業(yè)務(wù)需求來決定。
那么接下來看創(chuàng)建worker的方法。
創(chuàng)建worker:addWorker()
方法的目的很簡單:創(chuàng)建一個worker。前面我們講到,worker內(nèi)部創(chuàng)建了一個線程,每一個worker則代表了一個線程,非常類似android中的looper。looper的loop()方法會不斷地去MessageQueue獲取message,而Worker的run()方法會不斷地去阻塞隊列獲取任務(wù),這個我們后面講。
addWorker() 方法的邏輯整體上分為兩個部分:
-
檢查線程狀態(tài)和線程數(shù)是否滿足條件:
// 第一個參數(shù)是創(chuàng)建的線程首次要執(zhí)行的任務(wù),可以是null,則表示初始化一個線程 // 第二參數(shù)表示是否是一個核心線程 private boolean addWorker(Runnable firstTask, boolean core) { retry: for (int c = ctl.get();;) { // 還記不記得我們前面講到線程池的狀態(tài)控制? // runStateAtLeast(c, SHUTDOWN)表示狀態(tài)至少為shutdown,后面類同 // 如果線程池處于stop及以上,不會再創(chuàng)建worker // 如果線程池狀態(tài)在shutdown時,如果隊列不為空或者任務(wù)!=null,則還會創(chuàng)建worker if (runStateAtLeast(c, SHUTDOWN) && (runStateAtLeast(c, STOP) || firstTask != null || workQueue.isEmpty())) // 其他情況返回false,表示拒絕創(chuàng)建worker return false; // 這里采用CAS輪詢,也就是循環(huán)鎖的策略來讓線程總數(shù)+1 for (;;) { // 檢查是否超出線程數(shù)限制 // 這里根據(jù)core參數(shù)判斷是核心線程還是非核心線程 if (workerCountOf(c) >= ((core ? corePoolSize : maximumPoolSize) & COUNT_MASK)) return false; // 利用CAS讓ctl變量自增,表示worker+1 // 如果CAS失敗,則表示發(fā)生了競爭,則再來一次 if (compareAndIncrementWorkerCount(c)) // 成功則跳出最外層循環(huán) break retry; // 如果這個期間ctl被改變了,則獲取ctl,再嘗試一次 c = ctl.get(); // 如果線程池被shutdown了,那么重復(fù)最外層的循環(huán),重新判斷狀態(tài)是否可以創(chuàng)建worker if (runStateAtLeast(c, SHUTDOWN)) // 繼續(xù)最外層循環(huán) continue retry; } } // 創(chuàng)建worker邏輯 ... }不知道讀者對于源碼中的
retry:有沒有疑惑,畢竟平時很少用到。他的作用是標記一個循環(huán),這樣我們在內(nèi)層的循環(huán)就可以跳轉(zhuǎn)到任意一個外層的循環(huán)。這里的retry只是一個名字,改成repeat:甚至a:都是可以的。他的本質(zhì)就是:一個循環(huán)的標記 。
-
創(chuàng)建worker對象,并調(diào)用其內(nèi)部線程的start()方法來啟動線程:
private boolean addWorker(Runnable firstTask, boolean core) { ... boolean workerStarted = false; boolean workerAdded = false; Worker w = null; try { // 創(chuàng)建一個新的worker // 創(chuàng)建的過程中內(nèi)部會創(chuàng)建一個線程 w = new Worker(firstTask); final Thread t = w.thread; if (t != null) { // 獲得全局鎖并加鎖 final ReentrantLock mainLock = this.mainLock; mainLock.lock(); try { // 獲取鎖之后,需要再次檢查狀態(tài) int c = ctl.get(); // 只有運行狀態(tài)或者shutDown&&task==null才會被執(zhí)行 if (isRunning(c) || (runStateLessThan(c, STOP) && firstTask == null)) { // 如果這個線程不是剛創(chuàng)建的,則拋出異常 if (t.getState() != Thread.State.NEW) throw new IllegalThreadStateException(); // 添加到workerSet中 workers.add(w); workerAdded = true; int s = workers.size(); // 跟蹤線程池到達的最多線程數(shù)量 if (s > largestPoolSize) largestPoolSize = s; } } finally { // 釋放鎖 mainLock.unlock(); } // 如果添加成功,啟動線程 if (workerAdded) { t.start(); workerStarted = true; } } } finally { // 如果線程沒有啟動,表示添加worker失敗,可能在添加的過程中線程池被關(guān)閉了 if (! workerStarted) // 把worker從workerSet中移除 addWorkerFailed(w); } return workerStarted; }
經(jīng)過前面兩步,如果沒有出現(xiàn)異常,則創(chuàng)建worker成功。最后還涉及到一個方法: addWorkerFailed(w) ,他的內(nèi)容比較簡答,順便提一下吧:
// 添加worker失敗
private void addWorkerFailed(Worker w) {
final ReentrantLock mainLock = this.mainLock;
// 加鎖
mainLock.lock();
try {
if (w != null)
workers.remove(w);
// 這里會讓線程總數(shù)-1
decrementWorkerCount();
// 嘗試設(shè)置線程池的狀態(tài)為terminad
// 因為添加失敗有可能是線程池在添加worker的過程中被shutdown
// 那么這個時候如果沒有任務(wù)正在執(zhí)行就需要設(shè)置狀態(tài)為terminad
// 這個方法后面會詳細講
tryTerminate();
} finally {
mainLock.unlock();
}
}
那么到這里,execute()方法中的一些調(diào)用方法就分析完了。阻塞隊列相關(guān)的方法不屬于本文的范疇,就不展開了。那么還有一個問題:worker是如何工作的呢?worker內(nèi)部有一個線程,當線程啟動時,初始化線程的runnable對象的run方法會被調(diào)用,那么這個runnable對象是什么?我直接來看worker。
打工人:Worker
首先我們看到他的構(gòu)造方法:
Worker(Runnable firstTask) {
setState(-1); // inhibit interrupts until runWorker
this.firstTask = firstTask;
this.thread = getThreadFactory().newThread(this);
}
源碼很簡單,把傳進來的任務(wù)設(shè)置給內(nèi)部變量firstTask,然后把自己傳給線程工廠去創(chuàng)建一個線程。所以線程啟動時,Worker本身的run方法會被調(diào)用,那么我們看到Worker的 run()方法。
public void run() {
runWorker(this);
}
Worker是ThreadPoolExecutor的內(nèi)部類,這里直接調(diào)用到了ThreadPoolExecutor的方法: runWorker()來開始執(zhí)行。那么接下來,我們就看到這個方法。
啟動worker:runWorker()
這個方法是worker執(zhí)行的方法,在線程被銷毀前他會一直執(zhí)行,類似于Handler的looper,不斷去隊列獲取消息來執(zhí)行:
final void runWorker(Worker w) {
Thread wt = Thread.currentThread();
// 獲取worker初始化時設(shè)置的任務(wù),可以為null。如果為null則表示僅僅創(chuàng)建線程
Runnable task = w.firstTask;
w.firstTask = null;
w.unlock();
// 這個參數(shù)的作用后面解釋,需要結(jié)合其他的源碼
boolean completedAbruptly = true;
try {
// 如果自身的task不為null,那么會執(zhí)行自身的task
// 否則調(diào)用getTask去隊列獲取一個task來執(zhí)行
// 這個getTask最終會去調(diào)用隊列的方法來獲取任務(wù)
// 而隊列如果為空他的獲取方法會進行阻塞,這里也就阻塞了,后面深入講
while (task != null || (task = getTask()) != null) {
try{
// 執(zhí)行任務(wù)
...
} finally {
// 任務(wù)執(zhí)行完成,把task設(shè)置為null
task = null;
// 任務(wù)總數(shù)+1
w.completedTasks++;
// 釋放鎖
w.unlock();
}
}
// 這里設(shè)置為false,先記住他
completedAbruptly = false;
} finally {
// 如果worker退出,那么需要執(zhí)行后續(xù)的善后工作
processWorkerExit(w, completedAbruptly);
}
}
可以看到這個方法的整體框架還是比較簡單的,核心就在于 while (task != null || (task = getTask()) != null) 這個循環(huán)中,如果 getTask() 返回null,則表示線程該結(jié)束了,這和Handler機制也是一樣的。
上面的源碼省略了具體執(zhí)行任務(wù)的邏輯,他的邏輯也是很簡單:判斷狀態(tài)+運行任務(wù)。我們來看一下:
final void runWorker(Worker w) {
...;
try {
while (task != null || (task = getTask()) != null) {
w.lock();
// 如果線程池已經(jīng)設(shè)置為stop狀態(tài),那么保證線程是interrupted標志
// 如果線程池沒有在stop狀態(tài),那么保證線程不是interrupted標志
if ((runStateAtLeast(ctl.get(), STOP) ||
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) &&
!wt.isInterrupted())
wt.interrupt();
try {
// 回調(diào)方法,這個方法是一個空實現(xiàn)
beforeExecute(wt, task);
try {
// 運行任務(wù)
task.run();
// 回調(diào)方法,也是一個空實現(xiàn)
afterExecute(task, null);
} catch (Throwable ex) {
afterExecute(task, ex);
throw ex;
}
}
...
}
completedAbruptly = false;
} finally {
processWorkerExit(w, completedAbruptly);
}
}
在獲取到一個任務(wù)后,就會去執(zhí)行該任務(wù)的run方法,然后再回去繼續(xù)獲取新的任務(wù)。
我們會發(fā)現(xiàn)其中有很多的空實現(xiàn)方法,他是給子類去實現(xiàn)的,有點類似于Activity的生命周期,子類需要重寫這些方法,在具體的情況做一些工作。當然,一般的使用是不需要去重寫這些方法。接下來需要來看看 getTask() 是如何獲取任務(wù)的。
獲取任務(wù):getTask()
這個方法的內(nèi)容可以分為兩個部分:判斷當前線程池的狀態(tài)+阻塞地從隊列中獲取一個任務(wù)。
第一部分是判斷當前線程池的狀況,如果處于關(guān)閉狀態(tài)那么直接返回null來讓worker結(jié)束,否則需要判斷當前線程是否超時或者超出最大限制的線程數(shù):
private Runnable getTask() {
boolean timedOut = false;
// 內(nèi)部使用了CAS,這里需要有一個循環(huán)來不斷嘗試
for (;;) {
int c = ctl.get();
// 如果處于shutdown狀態(tài)而且隊列為空,或者處于stop狀態(tài),返回null
// 這和前面我們討論到不同的線程池的狀態(tài)的不同行為一致
if (runStateAtLeast(c, SHUTDOWN)
&& (runStateAtLeast(c, STOP) || workQueue.isEmpty())) {
// 這里表示讓線程總數(shù)-1,記住他,后面會繼續(xù)聊到
decrementWorkerCount();
return null;
}
// 獲取目前的線程總數(shù)
int wc = workerCountOf(c);
// 判斷該線程在空閑情況是否可以被銷毀:允許核心線程為null或者當前線程超出核心線程數(shù)
// 可以看到這里并沒有去區(qū)分具體的線程是核心還是非核心,只有線程數(shù)量處于核心范圍還是非核心范圍
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
// 超出最大線程數(shù)或者已經(jīng)超時;
// 這里可能是用戶通過 setMaximumPoolSize 改動了數(shù)據(jù)才會導(dǎo)致這里超出最大線程數(shù)
// 同時還必須保證當前線程數(shù)量大于1或者隊列已經(jīng)沒有任務(wù)了
// 這樣就確保了當有任務(wù)存在時,一定至少有一個線程在執(zhí)行任務(wù)
if ((wc > maximumPoolSize || (timed && timedOut))
&& (wc > 1 || workQueue.isEmpty())) {
// 使用CAS嘗試讓當前線程總數(shù)-1,失敗則從來一次上面的邏輯
if (compareAndDecrementWorkerCount(c))
return null;
continue;
}
// 獲取任務(wù)邏輯
...
}
}
第二部分是獲取一個任務(wù)并執(zhí)行。獲取任務(wù)使用的是阻塞隊列的方法,如果隊列中沒有任務(wù),則會被阻塞:
private Runnable getTask() {
boolean timedOut = false;
// 內(nèi)部使用了CAS,這里需要有一個循環(huán)來不斷嘗試
for (;;) {
// 判斷線程池狀態(tài)邏輯
...
try {
// 獲取一個任務(wù)
// poll方法等待具體時間之后如果沒有獲取到對象,會返回null
// take方法會一直等到獲取新對象,除非被interrupt
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
if (r != null)
return r;
// r==null,說明超時了,重新循環(huán)
timedOut = true;
} catch (InterruptedException retry) {
// 被interrupt,說明可能線程池被關(guān)閉了,重新判斷情況
timedOut = false;
}
}
}
這里需要重點關(guān)注的是阻塞隊列的 poll() 和 take() 方法,他們都會去隊列中獲取一個任務(wù);但是,poll() 方法會阻塞指定時間后返回,而 take() 則是無限期阻塞。這里對應(yīng)的就是有存活時間的線程和不會被銷毀的核心線程。
同時注意 timedOut = true 是在這一部分被賦值的,當賦值為true之后需要再執(zhí)行一次循環(huán),在上面的判斷中就會被攔截下來并返回false,這在第一部分邏輯介紹了。而如果線程在等待的時候被 interrupt 了,說明線程池被關(guān)閉了,此時也會重走一次上面判斷狀態(tài)的邏輯。
到這里關(guān)于執(zhí)行的邏輯就講得差不多了,下面聊一聊線程池關(guān)閉以及worker結(jié)束的相關(guān)邏輯。
worker退出工作:processWorkerExit
前面已經(jīng)介紹 runWorker() 了方法,這個方法的主要任務(wù)就是讓worker動起來,不斷去隊列獲取任務(wù)。而當獲取任務(wù)的時候返回了null,則表示該worker可以結(jié)束了,最后會調(diào)用 processWorkerExit() 方法,如下:
final void runWorker(Worker w) {
...
try {
...
} finally {
// 如果worker退出,那么需要執(zhí)行后續(xù)的善后工作
processWorkerExit(w, completedAbruptly);
}
}
processWorkerExit() 會完成worker退出的善后工作。具體的內(nèi)容是:
- 把完成的任務(wù)數(shù)合并到總的任務(wù)數(shù),移除worker,嘗試設(shè)置線程池的狀態(tài)為terminated:
private void processWorkerExit(Worker w, boolean completedAbruptly) {
// 如果不是經(jīng)過getTask方法返回null正常退出的,那么需要讓線程總數(shù)-1
// 這個參數(shù)前面一直讓你們注意一下不知道你們還記不記得
// 如果是在正常情況下退出,那么在getTask() 方法中就會執(zhí)行decrementWorkerCount()了
// 而如果出現(xiàn)一些特殊的情況突然結(jié)束了,并不是通過在getTask返回null結(jié)束
// Abruptly就是突然的意思,那么completedAbruptly就為true,正常情況下在runWorker方法中會被設(shè)置為false
// 那什么叫突然結(jié)束?用戶的任務(wù)拋出了異常,這個時候線程就突然結(jié)束了,沒有經(jīng)過getTask方法
// 這里就需要讓線程總數(shù)-1
if (completedAbruptly)
decrementWorkerCount();
// 獲取鎖,并累加完成的任務(wù)總數(shù),從set中移除worker
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
completedTaskCount += w.completedTasks;
workers.remove(w);
} finally {
mainLock.unlock();
}
// 嘗試設(shè)置線程池的狀態(tài)為terminated
// 這個方法前面我們addWorker失敗的時候提到過,后面再展開
tryTerminate();
...
}
- 移除worker之后,如果線程池還沒有被stop,那么最后必須保證隊列任務(wù)至少有一個線程在執(zhí)行隊列中的任務(wù):
private void processWorkerExit(Worker w, boolean completedAbruptly) {
...
int c = ctl.get();
// stop及以上的狀態(tài)不需要執(zhí)行剩下的任務(wù)
if (runStateLessThan(c, STOP)) {
// 如果線程是突然終止的,那肯定需要重新創(chuàng)建一個
// 否則進行判斷是否要保留一個線程
if (!completedAbruptly) {
int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
if (min == 0 && ! workQueue.isEmpty())
min = 1;
if (workerCountOf(c) >= min)
return;
}
// 如果此時線程數(shù)<=核心線程數(shù),或者當核心線程可被銷毀時,線程數(shù)==0且隊列不為空
// 那么需要創(chuàng)建一個線程來執(zhí)行任務(wù)
addWorker(null, false);
}
}
代碼雖然看起來很多,但是具體的邏輯內(nèi)容還是比較簡單的。前面一直提到一個方法 tryTerminate() 但一直沒有展開解釋,下面來介紹一下。
嘗試終止線程池:tryTerminate()
這個方法出現(xiàn)在任何可能讓線程池進入終止狀態(tài)的地方。如添加worker失敗時,那么這個時候可能線程池已經(jīng)處于stop狀態(tài),且已經(jīng)沒有任何正在執(zhí)行的worker了,那么此時可以進入terminated狀態(tài);再如worker被銷毀的時候,可能這是最后一個被銷毀的worker,那么此時線程池需要進入terminated狀態(tài)。
根據(jù)這個方法的使用情況其實就已經(jīng)差不多可以推斷出這個方法的內(nèi)容:判斷當前線程池的狀態(tài),如果符合條件則設(shè)置線程池的狀態(tài)為terminated 。如果此時不能轉(zhuǎn)換為terminated狀態(tài),則什么也不做,直接返回。
- 首先判斷當前線程池狀態(tài)是否符合轉(zhuǎn)化為terminated。如果處于運行狀態(tài)或者tidying以上狀態(tài),則肯定不需要進行狀態(tài)轉(zhuǎn)換。因為running需要先進入stop狀態(tài),而tidying其實已經(jīng)是準備進入terminated狀態(tài)了。如果處于shutdown狀態(tài)且隊列不為空,那么需要執(zhí)行完隊列中的任務(wù),所以也不適合狀態(tài)轉(zhuǎn)換:
final void tryTerminate() {
for (;;) {
int c = ctl.get();
// 如果處于運行狀態(tài)或者tidying以上狀態(tài)時,直接返回,不需要修改狀態(tài)
// 如果處于stop以下狀態(tài)且隊列不為空,那么需要等隊列中的任務(wù)執(zhí)行完成,直接返回
if (isRunning(c) ||
runStateAtLeast(c, TIDYING) ||
(runStateLessThan(c, STOP) && ! workQueue.isEmpty()))
return;
// 到這里說明線程池肯定處于stop狀態(tài)
// 線程的數(shù)量不等于0,嘗試中斷一個空閑的worker線程
// 這里他只中斷workerSet中的其中一個,當其中的一個線程停止時,會再次調(diào)用tryTerminate
// 然后又會再去中斷workerSet中的一個worker,不斷循環(huán)下去直到剩下最后一個,workercount==0
// 這就是 鏈式反應(yīng) 。
if (workerCountOf(c) != 0) {
interruptIdleWorkers(ONLY_ONE);
return;
}
// 設(shè)置狀態(tài)為terminated邏輯
...
}
}
- 經(jīng)過上面的判斷,能到第二部分邏輯,線程池肯定是具備進入terminated狀態(tài)的條件了。剩下的代碼就是把線程池的狀態(tài)設(shè)置為terminated:
final void tryTerminate() {
for (;;) {
// 上一部分邏輯
...
// 首先獲取全局鎖
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// 嘗試把線程池的狀態(tài)從stop修改為tidying
// 如果修改失敗,說明狀態(tài)已經(jīng)被修改了,那么外層循環(huán)再跑一個
if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
try {
// 這個方法是一個空實現(xiàn),需要子類繼承重寫
terminated();
} finally {
// 最后再設(shè)置狀態(tài)為terminated
ctl.set(ctlOf(TERMINATED, 0));
// 喚醒所有等待終止鎖的線程
termination.signalAll();
}
return;
}
} finally {
// 釋放鎖
mainLock.unlock();
}
// CAS修改線程池的狀態(tài)失敗,重新進行判斷
}
}
當線程池被標記為terminated狀態(tài)時,那么這個線程池就徹底地終止了。
好了到這里,恭喜你,關(guān)于ThreadPoolExecutor的源碼解析理解得差不多了。接下來剩下幾個常用的api方法:submit() 、 shutdown()/shutdownNow() 順便看一下吧,他們的邏輯也是都非常簡單。
關(guān)閉線程池:shutdown/shutdownNow
關(guān)閉線程池有兩個方法:
- shutdown:設(shè)置線程池的狀態(tài)為shutdown,同時嘗試中斷所有空閑線程,但是會等待隊列中的任務(wù)執(zhí)行結(jié)束再終止線程池。
- shutdownNow:設(shè)置線程池的狀態(tài)為stop,同時嘗試中斷所有空閑線程,不會等待隊列中的任務(wù)完成,正在執(zhí)行中的線程執(zhí)行結(jié)束,線程池馬上進入terminated狀態(tài)。
我們各自來看一下:
// 關(guān)閉后隊列中的任務(wù)依舊會被執(zhí)行,但是不會再添加新的任務(wù)
public void shutdown() {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
// 設(shè)置狀態(tài)為shutdown
advanceRunState(SHUTDOWN);
// 嘗試中斷所有空閑的worker
interruptIdleWorkers();
// 回調(diào)方法,這個方法是個空方法,ScheduledThreadPoolExecutor中重寫了該方法
onShutdown();
} finally {
mainLock.unlock();
}
// 嘗試設(shè)置線程池狀態(tài)為terminated
tryTerminate();
}
再看一下另一個方法shutdownNow:
// 關(guān)閉后隊列中剩余的任務(wù)不會被執(zhí)行
// 會把剩下的任務(wù)返回交給開發(fā)者去處理
public List<Runnable> shutdownNow() {
List<Runnable> tasks;
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// 檢查是否可以關(guān)閉線程
checkShutdownAccess();
// 設(shè)置狀態(tài)為stop
advanceRunState(STOP);
// 嘗試中斷所有線程
interruptWorkers();
// 返回隊列中剩下的任務(wù)
tasks = drainQueue();
} finally {
mainLock.unlock();
}
tryTerminate();
return tasks;
}
最后再來看一下和 execute()不同的提交任務(wù)方法:submit。
提交任務(wù):submit()
submit方法并不是ThreadPoolExecutor實現(xiàn)的,而是AbstractExecutorService,如下:
// runnable沒有返回值,創(chuàng)建FutureTask的返回參數(shù)傳入null
public Future<?> submit(Runnable task) {
if (task == null) throw new NullPointerException();
RunnableFuture<Void> ftask = newTaskFor(task, null);
execute(ftask);
return ftask;
}
// 有參數(shù)返回值的runnable
// 最終也是構(gòu)造一個callable來執(zhí)行,把返回值設(shè)置為result
public <T> Future<T> submit(Runnable task, T result) {
if (task == null) throw new NullPointerException();
RunnableFuture<T> ftask = newTaskFor(task, result);
execute(ftask);
return ftask;
}
// callable本身就擁有返回值
public <T> Future<T> submit(Callable<T> task) {
if (task == null) throw new NullPointerException();
RunnableFuture<T> ftask = newTaskFor(task);
execute(ftask);
return ftask;
}
他們的邏輯都幾乎一樣:調(diào)用newTaskFor方法來構(gòu)造一個Future對象并返回。我們看到newTaskFor方法:
// 創(chuàng)建一個FutureTask來返回
protected <T> RunnableFuture<T> newTaskFor(Runnable runnable, T value) {
return new FutureTask<T>(runnable, value);
}
protected <T> RunnableFuture<T> newTaskFor(Callable<T> callable) {
return new FutureTask<T>(callable);
}
可以看到這個方法很簡單:構(gòu)造一個FutureTask并返回,F(xiàn)utureTask也是Future接口目前唯一的實現(xiàn)類。
更加具體關(guān)于Future的內(nèi)容就不展開了,有興趣的讀者可以去了解一下。
最后
好了到這里,關(guān)于ThreadPoolExecutor的源碼分析內(nèi)容就講完了。最后讓我們再回顧一下吧:
- ThreadPoolExecutor的整個執(zhí)行流程從execute方法開始,他會根據(jù)具體的情況,采用合適的執(zhí)行方案
- 線程被封裝在worker對象中,worker對象通過runWorker方法,會一直不斷地調(diào)用getTask方法來調(diào)用隊列的poll或take方法獲取任務(wù)
- 當需要退出一個worker時,只要getTask方法返回null即可退出
- 當線程池關(guān)閉時,會根據(jù)不同的關(guān)閉方法,等待所有的線程執(zhí)行完成,然后關(guān)閉線程池。
線程池整體的模型和handler是十分類似的:一個生產(chǎn)者-消費者模型。但和Handler不同的是,ThreadPoolExecutor不支持延時任務(wù),這點在ScheduledThreadPoolExecutor得到了實現(xiàn);Handler的線程安全采用synchronize關(guān)鍵字,而ThreadPoolExecutor采用的是Lock和一些利用CAS實現(xiàn)線程安全的整型變量;Handler無法拒絕任務(wù),線程池可以;Handler拋出異常會直接程序崩潰,而線程池不會等等。
了解了線程池的內(nèi)部源碼,對于他更加了解后,那么可以根據(jù)具體的問題,做出更加合適的解決方案。ThreadPoolExecutor還有一些源碼沒有講到,以及ScheduledThreadPoolExecutor、阻塞隊列的源碼,有興趣讀者可以自行去深入了解一下,拓展關(guān)于線程池的一切。
全文到此,假期肝文不容易啊,如果文章對你有幫助,求一個大拇指,贊一下再走唄。
參考文獻
- 《Java并發(fā)編程的藝術(shù)》:并發(fā)編程必讀,作者對一些原理講的很透徹
- 《Java核心技術(shù)卷》:這系列的書主要是講解框架的使用,不會深入原理,適合入門
- javaGuide:javaGuide,對java知識總結(jié)得很不錯的一個博客
- Java并發(fā)編程:線程池的使用:博客園上一位很優(yōu)秀的博主,文章寫得通俗易懂且不失深度
全文到此,原創(chuàng)不易,覺得有幫助可以點贊收藏評論轉(zhuǎn)發(fā)。
筆者才疏學(xué)淺,有任何想法歡迎評論區(qū)交流指正。
如需轉(zhuǎn)載請評論區(qū)或私信交流。另外歡迎光臨筆者的個人博客:傳送門