前言
在各大公司招聘筆試和面試題題中,都遇到了很多ThreadLocal的問題,最近博主在面試的時(shí)候也被兩次問到過這個(gè)問題,之前也在網(wǎng)上看到過一些此類的文章,其中有很多文章將ThreadLocal與線程同步機(jī)制混為一談,特別注意的是ThreadLocal與線程同步無關(guān),并不是為了解決多線程共享變量問題,我們今天就來研究一下ThreadLocal的原理
ThreadLocal是什么
我們首先來看一下JDK中的源碼是怎么寫的
This class provides thread-local variables. These variables differ from their normal counterparts in that each thread that accesses one (via its {@code get} or {@code set} method) has its own, independently initialized copy of the variable. {@code ThreadLocal} instances are typically private static fields in classes that wish to associate state with a thread (e.g., a user ID or Transaction ID
翻譯過來就是:
ThreadLocal類用來提供線程內(nèi)部的局部變量。這種變量在多線程環(huán)境下訪問(通過get或set方法訪問)時(shí)能保證各個(gè)線程里的變量相對(duì)獨(dú)立于其他線程內(nèi)的變量。ThreadLocal實(shí)例通常來說都是private static類型的,用于關(guān)聯(lián)線程和線程的上下文。
總結(jié)來說就是:ThreadLocal的作用是提供線程內(nèi)的局部變量,這種變量在線程的生命周期內(nèi)起作用,減少同一個(gè)線程內(nèi)多個(gè)函數(shù)或者組件之間一些公共變量的傳遞的復(fù)雜度。
ThreadLocal不是為了解決多線程訪問共享變量,而是為每個(gè)線程創(chuàng)建一個(gè)單獨(dú)的變量副本,提供了保持對(duì)象的方法和避免參數(shù)傳遞的復(fù)雜性。
ThreadLocal的主要應(yīng)用場(chǎng)景為按線程多實(shí)例(每個(gè)線程對(duì)應(yīng)一個(gè)實(shí)例)的對(duì)象的訪問,并且這個(gè)對(duì)象很多地方都要用到。例如:同一個(gè)網(wǎng)站登錄用戶,每個(gè)用戶服務(wù)器會(huì)為其開一個(gè)線程,每個(gè)線程中創(chuàng)建一個(gè)ThreadLocal,里面存用戶基本信息等,在很多頁面跳轉(zhuǎn)時(shí),會(huì)顯示用戶信息或者得到用戶的一些信息等頻繁操作,這樣多線程之間并沒有聯(lián)系而且當(dāng)前線程也可以及時(shí)獲取想要的數(shù)據(jù)。
實(shí)現(xiàn)原理
ThreadLocal可以看做是一個(gè)容器,容器里面存放著屬于當(dāng)前線程的變量。ThreadLocal類提供了四個(gè)對(duì)外開放的接口方法,這也是用戶操作ThreadLocal類的基本方法:
public void set(Object value)設(shè)置當(dāng)前線程的線程局部變量的值。public Object get()該方法返回當(dāng)前線程所對(duì)應(yīng)的線程局部變量。public void remove()將當(dāng)前線程局部變量的值刪除,目的是為了減少內(nèi)存的占用,該方法是JDK 5.0新增的方法。需要指出的是,當(dāng)線程結(jié)束后,對(duì)應(yīng)該線程的局部變量將自動(dòng)被垃圾回收,所以顯式調(diào)用該方法清除線程的局部變量并不是必須的操作,但它可以加快內(nèi)存回收的速度。protected Object initialValue()返回該線程局部變量的初始值,該方法是一個(gè)protected的方法,顯然是為了讓子類覆蓋而設(shè)計(jì)的。這個(gè)方法是一個(gè)延遲調(diào)用方法,在線程第1次調(diào)用get()或set(Object)時(shí)才執(zhí)行,并且僅執(zhí)行1次,ThreadLocal中的缺省實(shí)現(xiàn)直接返回一個(gè)null。
可以通過上述的幾個(gè)方法實(shí)現(xiàn)ThreadLocal中變量的訪問,數(shù)據(jù)設(shè)置,初始化以及刪除局部變量,那ThreadLocal內(nèi)部是如何為每一個(gè)線程維護(hù)變量副本的呢?
其實(shí)在ThreadLocal類中有一個(gè)靜態(tài)內(nèi)部類ThreadLocalMap(其類似于Map),用鍵值對(duì)的形式存儲(chǔ)每一個(gè)線程的變量副本,ThreadLocalMap中元素的key為當(dāng)前ThreadLocal對(duì)象,而value對(duì)應(yīng)線程的變量副本,每個(gè)線程可能存在多個(gè)ThreadLocal。
源代碼
get()方法
public T get() {
Thread t = Thread.currentThread();//當(dāng)前線程
ThreadLocalMap map = getMap(t);//獲取當(dāng)前線程對(duì)應(yīng)的ThreadLocalMap
if (map != null) {
ThreadLocalMap.Entry e = map.getEntry(this);//獲取對(duì)應(yīng)ThreadLocal的變量值
if (e != null) {
@SuppressWarnings("unchecked")
T result = (T)e.value;
return result;
}
}
return setInitialValue();//若當(dāng)前線程還未創(chuàng)建ThreadLocalMap,則返回調(diào)用此方法并在其中調(diào)用createMap方法進(jìn)行創(chuàng)建并返回初始值。
}
set()方法
//設(shè)置變量的值
public void set(T value) {
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null)
map.set(this, value);
else
createMap(t, value);
}
setInitialValue()方法
private T setInitialValue() {
T value = initialValue();
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null)
map.set(this, value);
else
createMap(t, value);
return value;
}
createMap()方法
/**
為當(dāng)前線程創(chuàng)建一個(gè)ThreadLocalMap的threadlocals,并將第一個(gè)值存入到當(dāng)前map中
@param t the current thread
@param firstValue value for the initial entry of the map
*/
void createMap(Thread t, T firstValue) {
t.threadLocals = new ThreadLocalMap(this, firstValue);
}
remove()方法
//刪除當(dāng)前線程中ThreadLocalMap對(duì)應(yīng)的ThreadLocal
public void remove() {
ThreadLocalMap m = getMap(Thread.currentThread());
if (m != null)
m.remove(this);
}
ThreadLocalMap
ThreadLocalMap是定制的hashMap,僅用于維護(hù)當(dāng)前線程的本地變量值。僅ThreadLocal類對(duì)其有操作權(quán)限,是Thread的私有屬性。為避免占用空間較大或生命周期較長(zhǎng)的數(shù)據(jù)常駐于內(nèi)存引發(fā)一系列問題,hash table的key是弱引用WeakReferences。當(dāng)空間不足時(shí),會(huì)清理未被引用的entry。
getMap(t)返回當(dāng)前線程的成員變量ThreadLocalMap(Thread的成員變量有ThreadLocalMap,這一點(diǎn)可以查看Thread的源碼,如下)很明確的說明了ThreadLocal屬于線程,ThreadLocalMap由ThreadLocal持有,說到底,ThreadLocalMap 也是線程所持有。每個(gè)線程Thread都有自己的ThreadLocalMap。
下面看一下該類的源代碼:
static class ThreadLocalMap {
//map中的每個(gè)節(jié)點(diǎn)Entry,其鍵key是ThreadLocal并且還是弱引用,這也導(dǎo)致了后續(xù)會(huì)產(chǎn)生內(nèi)存泄漏問題的原因。
static class Entry extends WeakReference<ThreadLocal<?>> {
Object value;
Entry(ThreadLocal<?> k, Object v) {
super(k);
value = v;
}
/**
* 初始化容量為16,以為對(duì)其擴(kuò)充也必須是2的指數(shù)
*/
private static final int INITIAL_CAPACITY = 16;
/**
* 真正用于存儲(chǔ)線程的每個(gè)ThreadLocal的數(shù)組,將ThreadLocal和其對(duì)應(yīng)的值包裝為一個(gè)Entry。
*/
private Entry[] table;
///....其他的方法和操作都和map的類似
注意問題
- ThreadLocal并未解決多線程訪問共享對(duì)象的問題;
- ThreadLocal并不是每個(gè)線程拷貝一個(gè)對(duì)象,而是直接new(新建)一個(gè);
- 如果ThreadLocal.set()的對(duì)象是多線程共享的,那么還是涉及并發(fā)問題。
ThreadLocal的內(nèi)存泄漏
在上面提到過,每個(gè)thread中都存在一個(gè)map, map的類型是ThreadLocal.ThreadLocalMap. Map中的key為一個(gè)threadlocal實(shí)例. 這個(gè)Map的確使用了弱引用,不過弱引用只是針對(duì)key. 每個(gè)key都弱引用指向threadlocal. 當(dāng)把threadlocal實(shí)例置為null以后,沒有任何強(qiáng)引用指向threadlocal實(shí)例,所以threadlocal將會(huì)被gc回收. 但是,我們的value卻不能回收,因?yàn)榇嬖谝粭l從current thread連接過來的強(qiáng)引用. 只有當(dāng)前thread結(jié)束以后, current thread就不會(huì)存在棧中,強(qiáng)引用斷開, Current Thread, Map, value將全部被GC回收。
所以得出一個(gè)結(jié)論就是只要這個(gè)線程對(duì)象被gc回收,就不會(huì)出現(xiàn)內(nèi)存泄露,但在threadLocal設(shè)為null和線程結(jié)束這段時(shí)間不會(huì)被回收的,就發(fā)生了我們認(rèn)為的內(nèi)存泄露。其實(shí)這是一個(gè)對(duì)概念理解的不一致,也沒什么好爭(zhēng)論的。最要命的是線程對(duì)象不被回收的情況,這就發(fā)生了真正意義上的內(nèi)存泄露。比如使用線程池的時(shí)候,線程結(jié)束是不會(huì)銷毀的,會(huì)再次使用的。就可能出現(xiàn)內(nèi)存泄露。