Python的垃圾回收機(jī)制
什么是GC(垃圾回收機(jī)制),出現(xiàn)的原因
GC:說白了就是內(nèi)存自動管理機(jī)制.它的出現(xiàn)的原因是為了完成兩件事:
- 1.找到內(nèi)存中無用的垃圾資源
- 2.清除這些垃圾并把內(nèi)存讓出來給其他的對應(yīng)使用
好處是什么
- 程序員有了GC之后,就不用過多的關(guān)注內(nèi)存管理方面的問題,而把自己的主要精力和時間放到業(yè)務(wù)邏輯的實(shí)現(xiàn)上.大大提高了開發(fā)的效率
- 避免了程序員在編寫程序的時候手動的不合理的創(chuàng)建和分配內(nèi)存造成的內(nèi)存泄漏.
Python的GC機(jī)制是怎么完成的,也就是所Python的垃圾回收是各什么玩意
總體來講Python的垃圾回收機(jī)制是引用計(jì)數(shù)為主,標(biāo)記清除和分代回收為輔的一種垃圾回收機(jī)制.
引用計(jì)數(shù)
引用計(jì)數(shù)法的原理是:每個對象維護(hù)一個變量來記錄當(dāng)前對象被引用的次數(shù),每當(dāng)新的引用指向該對象的時候,該引用計(jì)數(shù)就加1.當(dāng)該對象的引用計(jì)數(shù)失效時,就減1.一旦引用計(jì)數(shù)為0,該對象就會被回收.
引用計(jì)數(shù)的缺點(diǎn):
它需要額外的空間來維護(hù)引用計(jì)數(shù),這個還是次要的.最主要的是它不能完美的解決循環(huán)引用的問題.
循環(huán)引用
A 和 B 相互引用,這樣再沒有外部對象應(yīng)用A和B的時候,它們理應(yīng)被回收,但是他們的引用計(jì)數(shù)依然為1
a = { } #對象A的引用計(jì)數(shù)為 1
b = { } #對象B的引用計(jì)數(shù)為 1
a['b'] = b #B的引用計(jì)數(shù)增1
b['a'] = a #A的引用計(jì)數(shù)增1
del a #A的引用減 1,最后A對象的引用為 1
del b #B的引用減 1, 最后B對象的引用為 1

在這個例子中程序執(zhí)行完del語句后,A、B對象已經(jīng)沒有任何引用指向這兩個對象,但是這兩個對象各包含一個對方對象的引用,雖然最后兩個對象都無法通過其它變量來引用這兩個對象了,這對GC來說就是兩個非活動對象或者說是垃圾對象,但是他們的引用計(jì)數(shù)并沒有減少到零。因此如果是使用引用計(jì)數(shù)法來管理這兩對象的話,他們并不會被回收,它會一直駐留在內(nèi)存中,就會造成了內(nèi)存泄漏(內(nèi)存空間在使用完畢后未釋放)。為了解決對象的循環(huán)引用問題,Python引入了標(biāo)記-清除和分代回收兩種GC機(jī)制。
標(biāo)記清除
『標(biāo)記清除(Mark—Sweep)』算法是一種基于追蹤回收(tracing GC)技術(shù)實(shí)現(xiàn)的垃圾回收算法。它分為兩個階段:第一階段是標(biāo)記階段,GC會把所有的『活動對象』打上標(biāo)記,第二階段是把那些沒有標(biāo)記的對象『非活動對象』進(jìn)行回收。那么GC又是如何判斷哪些是活動對象哪些是非活動對象的呢?
對象之間通過引用(指針)連在一起,構(gòu)成一個有向圖,對象構(gòu)成這個有向圖的節(jié)點(diǎn),而引用關(guān)系構(gòu)成這個有向圖的邊。從根對象(root object)出發(fā),沿著有向邊遍歷對象,可達(dá)的(reachable)對象標(biāo)記為活動對象,不可達(dá)的對象就是要被清除的非活動對象。根對象就是全局變量、調(diào)用棧、寄存器。

在上圖中,我們把小黑圈視為全局變量,也就是把它作為root object,從小黑圈出發(fā),對象1可直達(dá),那么它將被標(biāo)記,對象2、3可間接到達(dá)也會被標(biāo)記,而4和5不可達(dá),那么1、2、3就是活動對象,4和5是非活動對象會被GC回收。
標(biāo)記清除算法作為Python的輔助垃圾收集技術(shù)主要處理的是一些容器對象,比如list、dict、tuple,instance等,因?yàn)閷τ谧址?、?shù)值對象是不可能造成循環(huán)引用問題。Python使用一個雙向鏈表將這些容器對象組織起來。不過,這種簡單粗暴的標(biāo)記清除算法也有明顯的缺點(diǎn):清除非活動的對象前它必須順序掃描整個堆內(nèi)存,哪怕只剩下小部分活動對象也要掃描所有對象。
分代回收
分代回收是一種以空間換時間的操作方式,Python將內(nèi)存根據(jù)對象的存活時間劃分為不同的集合,每個集合稱為一個代,Python將內(nèi)存分為了3“代”,分別為年輕代(第0代)、中年代(第1代)、老年代(第2代),他們對應(yīng)的是3個鏈表,它們的垃圾收集頻率與對象的存活時間的增大而減小。新創(chuàng)建的對象都會分配在年輕代,年輕代鏈表的總數(shù)達(dá)到上限時,Python垃圾收集機(jī)制就會被觸發(fā),把那些可以被回收的對象回收掉,而那些不會回收的對象就會被移到中年代去,依此類推,老年代中的對象是存活時間最久的對象,甚至是存活于整個系統(tǒng)的生命周期內(nèi)。同時,分代回收是建立在標(biāo)記清除技術(shù)基礎(chǔ)之上。分代回收同樣作為Python的輔助垃圾收集技術(shù)處理那些容器對象
可變類型
列表 字典 可變集合
不可變類型
數(shù)字 字符串 元組 不可變集合