一 為什么要使用線程池
- 降低資源消耗。
- 提高響應速度。
- 提高線程的可管理性。線程是稀缺資源,使用線程池可以避免線程無限制的創建,并進行統一分配,調優和管理。
二 線程池實現原理
- 當前線程數小于corePoolSize,則創建新線程來執行任務。
- 當前線程數大于等于corePoolSize,則將任務加入BlockingQueue。
- 若隊列已滿,則創建新線程處理任務。
- 若線程數超過maxinumPoolsize, 則任務將被拒絕,并調用RejectExecutionHandler.rejectedExecution() 方法。
三 線程池使用
3.1 創建
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {
}
** corePoolSize **:核心池的大小,該參數與之后的線程池實現原理有很大的關系。在創建了線程池后,默認情況下,線程池中并沒有任何線程,而是等待有任務到來才創建線程去執行任務,除非調用prestartAllCoreThreads()和prestartCoreThread()方法,從方法名字可以看出,是預創建線程的意思,即在沒有任務到來之前,就創建corePoolSize個線程或1個線程。默認情況下,在創建了線程池后,線程池中的線程數為0,當有任務來之后,就會創建一個線程去執行任務,當線程池中的線程數目達到corePoolSize后,就會把到達的任務放到緩存隊列當中;
** maximumPoolSize **:線程池中的最大線程數,表示線程池中最多能創建多少個線程。
** keepAliveTime **:表示線程沒有任務執行時最多存活多久。默認情況下,只有當線程池中的線程數大于corePoolSize時,keepAliveTime才會起作用,知道線程池中的線程不大于corePoolSize,即當線程池中的線程數大于corePoolSize時,如果一個線程空閑的時間達到keepAliveTime,則會終止,直到線程池中的線程數不超過corePoolSize。但是如果調用了allowCoreThreadTimeOut(boolean value)方法,在線程池中的線程數不大于corePoolSize時,keepAliveTime參數也會起作用,直到線程池中的線程數為0;
** unit **:參數keepAliveTime的時間單位,有7種取值,在TimeUnit類中有7種靜態屬性:
TimeUnit.DAYS; // 天
TimeUnit.HOURS; // 時
TimeUnit.MINUTES; // 分
TimeUnit.SECONDS; // 秒
TimeUnit.MILLISECONDS; // 毫秒
TimeUnit.MICROSECONDS; // 微妙
TimeUnit.NANOSECONDS; // 納秒
- ** workQueue **: 一個阻塞隊列,用來存儲等待執行的任務。該參數也很重要,會對線程池的運行過程產生巨大影響,一般而言,有一下幾種選擇:
ArrayBlockingQueue:是一個基于數組結構的有界阻塞隊列,此隊列按 FIFO(先進先出)原則對元素進行排序;
LinkedBlockingQueue:一個基于鏈表結構的阻塞隊列,此隊列按FIFO (先進先出) 排序元素,吞吐量通常要高于ArrayBlockingQueue。靜態工廠方法Executors.newFixedThreadPool()使用了這個隊列;
SynchronousQueue:一個不存儲元素的阻塞隊列。每個插入操作必須等到另一個線程調用移除操作,否則插入操作一直處于阻塞狀態,吞吐量通常要高于LinkedBlockingQueue,靜態工廠方法Executors.newCachedThreadPool使用了這個隊列;
PriorityBlockingQueue:一個具有優先級的無限阻塞隊列;
** threadFactory **:線程工廠,主要用于創建線程;
** handler **:飽和策略,即當隊列和線程池都滿了,說明線程池處于飽和狀態,那么必須采取一種策略處理提交的新任務。這個策略默認情況下是AbortPolicy,表示無法處理新任務時拋出異常。以下是JDK1.5提供的四種策略:
ThreadPoolExecutor.AbortPolicy:
丟棄任務并拋出RejectedExecutionException異常;
ThreadPoolExecutor.DiscardPolicy:也是丟棄任務,但是不拋出異常;
ThreadPoolExecutor.DiscardOldestPolicy:丟棄隊列最前面的任務,然后重新嘗試執行任務(重復此過程);
ThreadPoolExecutor.CallerRunsPolicy:由調用線程處理該任務;
每個變量的作用都已經標明出來了,這里要重點解釋一下corePoolSize、maximumPoolSize、largestPoolSize三個變量。
corePoolSize在很多地方被翻譯成核心池大小,其實我的理解這個就是線程池的大小。舉個簡單的例子:
假如有一個工廠,工廠里面有10個工人,每個工人同時只能做一件任務。
因此只要當10個工人中有工人是空閑的,來了任務就分配給空閑的工人做;
當10個工人都有任務在做時,如果還來了任務,就把任務進行排隊等待;
如果說新任務數目增長的速度遠遠大于工人做任務的速度,那么此時工廠主管可能會想補救措施,比如重新招4個臨時工人進來;
然后就將任務也分配給這4個臨時工人做;
如果說著14個工人做任務的速度還是不夠,此時工廠主管可能就要考慮不再接收新的任務或者拋棄前面的一些任務了。
當這14個工人當中有人空閑時,而新任務增長的速度又比較緩慢,工廠主管可能就考慮辭掉4個臨時工了,只保持原來的10個工人,畢竟請額外的工人是要花錢的。
這個例子中的corePoolSize就是10,而maximumPoolSize就是14(10+4)。
也就是說corePoolSize就是線程池大小,maximumPoolSize在我看來是線程池的一種補救措施,即任務量突然過大時的一種補救措施。
不過為了方便理解,在本文后面還是將corePoolSize翻譯成核心池大小。
largestPoolSize只是一個用來起記錄作用的變量,用來記錄線程池中曾經有過的最大線程數目,跟線程池的容量沒有任何關系。不過,在分析問題時,可以知道線程池是否滿過。
3.2 提交任務
兩種方式:
// 不需要返回值
threadpool.execute(new Runnable() {
@Override
public void run() {
// do something
}
});
// 需要返回值
Future<Object> future = threadpool.submit(new Callable<Object>() {
@Override
public Object call() throws Exception {
return null;
}
});
try {
Object result = future.get();
} catch (InterruptedException e) {
// 處理中斷異常
} catch (ExecutionException e) {
// 處理無法執行任務異常
} finally {
// 關閉線程池
threadpool.shutdown();
}
3.3 關閉線程池
可以通過調用shutdown或shutdownNow方法來關閉線程池。
他們的原理都是遍歷線程池中的工作線程,然后逐個調用線程的interrupt方法來中斷線程,所以,無法響應中斷的任務可能永遠無法停止。
區別在于,shutdownNow首先將線程池的狀態設置成STOP,然后嘗試停止所有正在執行或者暫停任務的線程,并返回等待執行任務的列表,而shutdown只是將線程池的狀態設置成SHUTDOWN狀態,然后中斷所有沒有正在執行任務的線程。
只要調用這兩個方法中的任意一個,isShutdown方法都會返回true。當所有任務都關閉后,才表示線程池關閉成功,這時調用isTerminated方法會返回true。
3.4 合理配置線程池
根據任務的性質來配置
- 任務性質:CPU密集型,IO密集型,混合型。
CPU密集型應配置盡可能小的線程,如N(CPU) + 1;IO密集型任務應配置盡可能多的線程,如2 * N(CPU);可通過Runtime.getRuntime().availableProcessors();
- 任務優先級:高,中,低。
可使用優先級隊列。
- 任務執行時間:長,中,短。
可用不同規模的線程池處理。
- 任務的依賴性:是否依賴其他系統資源,如數據庫連接。
依賴數據庫連接池的任務,因為線程提交SQL后需要等待數據庫返回結果,CPU空閑較多,線程數應設置大些。
建議使用有界隊列
增加系統穩定性和預警能力。
線程池的監控
- taskCount 返回過去任務的大概總數(包含queue size)。
- completedTaskCount 已完成任務數量,<= taskCount
- largestPoolSize 曾創建過的最大線程數
- getPoolSize 線程池的線程數量
- getActiveCount 活動線程數
可擴展線程池進行監控,如,任務平均執行時間,最大執行時間等。通過重寫,beforeExecute, afterExecute等方法。