什么是堆和棧

摘自http://blog.jobbole.com/75321/

問(wèn)題描述

編程語(yǔ)言書(shū)籍中經(jīng)常解釋值類型被創(chuàng)建在棧上,引用類型被創(chuàng)建在堆上,但是并沒(méi)有本質(zhì)上解釋這堆和棧是什么。我僅有高級(jí)語(yǔ)言編程經(jīng)驗(yàn),沒(méi)有看過(guò)對(duì)此更清晰的解釋。我的意思是我理解什么是棧,但是它們到底是什么,在哪兒呢(站在實(shí)際的計(jì)算機(jī)物理內(nèi)存的角度上看)?

在通常情況下由操作系統(tǒng)(OS)和語(yǔ)言的運(yùn)行時(shí)(runtime)控制嗎?

它們的作用范圍是什么?

它們的大小由什么決定?

哪個(gè)更快?

答案一

棧是為執(zhí)行線程留出的內(nèi)存空間。當(dāng)函數(shù)被調(diào)用的時(shí)候,棧頂為局部變量和一些 bookkeeping 數(shù)據(jù)預(yù)留塊。當(dāng)函數(shù)執(zhí)行完畢,塊就沒(méi)有用了,可能在下次的函數(shù)調(diào)用的時(shí)候再被使用。棧通常用后進(jìn)先出(LIFO)的方式預(yù)留空間;因此最近的保留塊(reserved block)通常最先被釋放。這么做可以使跟蹤堆棧變的簡(jiǎn)單;從棧中釋放塊(free block)只不過(guò)是指針的偏移而已。

堆(heap)是為動(dòng)態(tài)分配預(yù)留的內(nèi)存空間。和棧不一樣,從堆上分配和重新分配塊沒(méi)有固定模式;你可以在任何時(shí)候分配和釋放它。這樣使得跟蹤哪部分堆已經(jīng)被分配和被釋放變的異常復(fù)雜;有許多定制的堆分配策略用來(lái)為不同的使用模式下調(diào)整堆的性能。

每一個(gè)線程都有一個(gè)棧,但是每一個(gè)應(yīng)用程序通常都只有一個(gè)堆(盡管為不同類型分配內(nèi)存使用多個(gè)堆的情況也是有的)。

直接回答你的問(wèn)題: 1. 當(dāng)線程創(chuàng)建的時(shí)候,操作系統(tǒng)(OS)為每一個(gè)系統(tǒng)級(jí)(system-level)的線程分配棧。通常情況下,操作系統(tǒng)通過(guò)調(diào)用語(yǔ)言的運(yùn)行時(shí)(runtime)去為應(yīng)用程序分配堆。 2. 棧附屬于線程,因此當(dāng)線程結(jié)束時(shí)棧被回收。堆通常通過(guò)運(yùn)行時(shí)在應(yīng)用程序啟動(dòng)時(shí)被分配,當(dāng)應(yīng)用程序(進(jìn)程)退出時(shí)被回收。 3. 當(dāng)線程被創(chuàng)建的時(shí)候,設(shè)置棧的大小。在應(yīng)用程序啟動(dòng)的時(shí)候,設(shè)置堆的大小,但是可以在需要的時(shí)候擴(kuò)展(分配器向操作系統(tǒng)申請(qǐng)更多的內(nèi)存)。 4. 棧比堆要快,因?yàn)樗嫒∧J绞顾梢暂p松的分配和重新分配內(nèi)存(指針/整型只是進(jìn)行簡(jiǎn)單的遞增或者遞減運(yùn)算),然而堆在分配和釋放的時(shí)候有更多的復(fù)雜的 bookkeeping 參與。另外,在棧上的每個(gè)字節(jié)頻繁的被復(fù)用也就意味著它可能映射到處理器緩存中,所以很快(譯者注:局部性原理)。

答案二

Stack:

和堆一樣存儲(chǔ)在計(jì)算機(jī) RAM 中。

在棧上創(chuàng)建變量的時(shí)候會(huì)擴(kuò)展,并且會(huì)自動(dòng)回收。

相比堆而言在棧上分配要快的多。

用數(shù)據(jù)結(jié)構(gòu)中的棧實(shí)現(xiàn)。

存儲(chǔ)局部數(shù)據(jù),返回地址,用做參數(shù)傳遞。

當(dāng)用棧過(guò)多時(shí)可導(dǎo)致棧溢出(無(wú)窮次(大量的)的遞歸調(diào)用,或者大量的內(nèi)存分配)。

在棧上的數(shù)據(jù)可以直接訪問(wèn)(不是非要使用指針訪問(wèn))。

如果你在編譯之前精確的知道你需要分配數(shù)據(jù)的大小并且不是太大的時(shí)候,可以使用棧。

當(dāng)你程序啟動(dòng)時(shí)決定棧的容量上限。

Heap:

和棧一樣存儲(chǔ)在計(jì)算機(jī)RAM。

在堆上的變量必須要手動(dòng)釋放,不存在作用域的問(wèn)題。數(shù)據(jù)可用 delete, delete[] 或者 free 來(lái)釋放。

相比在棧上分配內(nèi)存要慢。

通過(guò)程序按需分配。

大量的分配和釋放可造成內(nèi)存碎片。

在 C++ 中,在堆上創(chuàng)建數(shù)的據(jù)使用指針訪問(wèn),用 new 或者 malloc 分配內(nèi)存。

如果申請(qǐng)的緩沖區(qū)過(guò)大的話,可能申請(qǐng)失敗。

在運(yùn)行期間你不知道會(huì)需要多大的數(shù)據(jù)或者你需要分配大量的內(nèi)存的時(shí)候,建議你使用堆。

可能造成內(nèi)存泄露。

答案三

堆和棧是兩種內(nèi)存分配的兩個(gè)統(tǒng)稱??赡苡泻芏喾N不同的實(shí)現(xiàn)方式,但是實(shí)現(xiàn)要符合幾個(gè)基本的概念:

1.對(duì)棧而言,棧中的新加數(shù)據(jù)項(xiàng)放在其他數(shù)據(jù)的頂部,移除時(shí)你也只能移除最頂部的數(shù)據(jù)(不能越位獲?。?。

2.對(duì)堆而言,數(shù)據(jù)項(xiàng)位置沒(méi)有固定的順序。你可以以任何順序插入和刪除,因?yàn)樗麄儧](méi)有“頂部”數(shù)據(jù)這一概念。

上面上個(gè)圖片很好的描述了堆和棧分配內(nèi)存的方式。

在通常情況下由操作系統(tǒng)(OS)和語(yǔ)言的運(yùn)行時(shí)(runtime)控制嗎?

如前所述,堆和棧是一個(gè)統(tǒng)稱,可以有很多的實(shí)現(xiàn)方式。計(jì)算機(jī)程序通常有一個(gè)棧叫做調(diào)用棧,用來(lái)存儲(chǔ)當(dāng)前函數(shù)調(diào)用相關(guān)的信息(比如:主調(diào)函數(shù)的地址,局部變量),因?yàn)楹瘮?shù)調(diào)用之后需要返回給主調(diào)函數(shù)。棧通過(guò)擴(kuò)展和收縮來(lái)承載信息。實(shí)際上,程序不是由運(yùn)行時(shí)來(lái)控制的,它由編程語(yǔ)言、操作系統(tǒng)甚至是系統(tǒng)架構(gòu)來(lái)決定。

堆是在任何內(nèi)存中動(dòng)態(tài)和隨機(jī)分配的(內(nèi)存的)統(tǒng)稱;也就是無(wú)序的。內(nèi)存通常由操作系統(tǒng)分配,通過(guò)應(yīng)用程序調(diào)用 API 接口去實(shí)現(xiàn)分配。在管理動(dòng)態(tài)分配內(nèi)存上會(huì)有一些額外的開(kāi)銷,不過(guò)這由操作系統(tǒng)來(lái)處理。

它們的作用范圍是什么?

調(diào)用棧是一個(gè)低層次的概念,就程序而言,它和“作用范圍”沒(méi)什么關(guān)系。如果你反匯編一些代碼,你就會(huì)看到指針引用堆棧部分。就高級(jí)語(yǔ)言而言,語(yǔ)言有它自己的范圍規(guī)則。一旦函數(shù)返回,函數(shù)中的局部變量會(huì)直接直接釋放。你的編程語(yǔ)言就是依據(jù)這個(gè)工作的。

在堆中,也很難去定義。作用范圍是由操作系統(tǒng)限定的,但是你的編程語(yǔ)言可能增加它自己的一些規(guī)則,去限定堆在應(yīng)用程序中的范圍。體系架構(gòu)和操作系統(tǒng)是使用虛擬地址的,然后由處理器翻譯到實(shí)際的物理地址中,還有頁(yè)面錯(cuò)誤等等。它們記錄那個(gè)頁(yè)面屬于那個(gè)應(yīng)用程序。不過(guò)你不用關(guān)心這些,因?yàn)槟銉H僅在你的編程語(yǔ)言中分配和釋放內(nèi)存,和一些錯(cuò)誤檢查(出現(xiàn)分配失敗和釋放失敗的原因)。

它們的大小由什么決定?

依舊,依賴于語(yǔ)言,編譯器,操作系統(tǒng)和架構(gòu)。棧通常提前分配好了,因?yàn)闂1仨毷沁B續(xù)的內(nèi)存塊。語(yǔ)言的編譯器或者操作系統(tǒng)決定它的大小。不要在棧上存儲(chǔ)大塊數(shù)據(jù),這樣可以保證有足夠的空間不會(huì)溢出,除非出現(xiàn)了無(wú)限遞歸的情況(額,棧溢出了)或者其它不常見(jiàn)了編程決議。

堆是任何可以動(dòng)態(tài)分配的內(nèi)存的統(tǒng)稱。這要看你怎么看待它了,它的大小是變動(dòng)的。在現(xiàn)代處理器中和操作系統(tǒng)的工作方式是高度抽象的,因此你在正常情況下不需要擔(dān)心它實(shí)際的大小,除非你必須要使用你還沒(méi)有分配的內(nèi)存或者已經(jīng)釋放了的內(nèi)存。

哪個(gè)更快一些?

棧更快因?yàn)樗械目臻e內(nèi)存都是連續(xù)的,因此不需要對(duì)空閑內(nèi)存塊通過(guò)列表來(lái)維護(hù)。只是一個(gè)簡(jiǎn)單的指向當(dāng)前棧頂?shù)闹羔?。編譯器通常用一個(gè)專門(mén)的、快速的寄存器來(lái)實(shí)現(xiàn)。更重要的一點(diǎn)事是,隨后的棧上操作通常集中在一個(gè)內(nèi)存塊的附近,這樣的話有利于處理器的高速訪問(wèn)(譯者注:局部性原理)。

答案四

你問(wèn)題的答案是依賴于實(shí)現(xiàn)的,根據(jù)不同的編譯器和處理器架構(gòu)而不同。下面簡(jiǎn)單的解釋一下:

棧和堆都是用來(lái)從底層操作系統(tǒng)中獲取內(nèi)存的。

在多線程環(huán)境下每一個(gè)線程都可以有他自己完全的獨(dú)立的棧,但是他們共享堆。并行存取被堆控制而不是棧。

堆:

堆包含一個(gè)鏈表來(lái)維護(hù)已用和空閑的內(nèi)存塊。在堆上新分配(用 new 或者 malloc)內(nèi)存是從空閑的內(nèi)存塊中找到一些滿足要求的合適塊。這個(gè)操作會(huì)更新堆中的塊鏈表。這些元信息也存儲(chǔ)在堆上,經(jīng)常在每個(gè)塊的頭部一個(gè)很小區(qū)域。

堆的增加新快通常從地地址向高地址擴(kuò)展。因此你可以認(rèn)為堆隨著內(nèi)存分配而不斷的增加大小。如果申請(qǐng)的內(nèi)存大小很小的話,通常從底層操作系統(tǒng)中得到比申請(qǐng)大小要多的內(nèi)存。

申請(qǐng)和釋放許多小的塊可能會(huì)產(chǎn)生如下?tīng)顟B(tài):在已用塊之間存在很多小的空閑塊。進(jìn)而申請(qǐng)大塊內(nèi)存失敗,雖然空閑塊的總和足夠,但是空閑的小塊是零散的,不能滿足申請(qǐng)的大小,。這叫做“堆碎片”。

當(dāng)旁邊有空閑塊的已用塊被釋放時(shí),新的空閑塊可能會(huì)與相鄰的空閑塊合并為一個(gè)大的空閑塊,這樣可以有效的減少“堆碎片”的產(chǎn)生。

棧:

棧經(jīng)常與 sp 寄存器(譯者注:”stack pointer”,了解匯編的朋友應(yīng)該都知道)一起工作,最初 sp 指向棧頂(棧的高地址)。

CPU 用 push 指令來(lái)將數(shù)據(jù)壓棧,用 pop 指令來(lái)彈棧。當(dāng)用 push 壓棧時(shí),sp 值減少(向低地址擴(kuò)展)。當(dāng)用 pop 彈棧時(shí),sp 值增大。存儲(chǔ)和獲取數(shù)據(jù)都是 CPU 寄存器的值。

當(dāng)函數(shù)被調(diào)用時(shí),CPU使用特定的指令把當(dāng)前的 IP (譯者注:“instruction pointer”,是一個(gè)寄存器,用來(lái)記錄 CPU 指令的位置)壓棧。即執(zhí)行代碼的地址。CPU 接下來(lái)將調(diào)用函數(shù)地址賦給 IP ,進(jìn)行調(diào)用。當(dāng)函數(shù)返回時(shí),舊的 IP 被彈棧,CPU 繼續(xù)去函數(shù)調(diào)用之前的代碼。

當(dāng)進(jìn)入函數(shù)時(shí),sp 向下擴(kuò)展,擴(kuò)展到確保為函數(shù)的局部變量留足夠大小的空間。如果函數(shù)中有一個(gè) 32-bit 的局部變量會(huì)在棧中留夠四字節(jié)的空間。當(dāng)函數(shù)返回時(shí),sp 通過(guò)返回原來(lái)的位置來(lái)釋放空間。

如果函數(shù)有參數(shù)的話,在函數(shù)調(diào)用之前,會(huì)將參數(shù)壓棧。函數(shù)中的代碼通過(guò) sp 的當(dāng)前位置來(lái)定位參數(shù)并訪問(wèn)它們。

函數(shù)嵌套調(diào)用和使用魔法一樣,每一次新調(diào)用的函數(shù)都會(huì)分配函數(shù)參數(shù),返回值地址、局部變量空間、嵌套調(diào)用的活動(dòng)記錄都要被壓入棧中。函數(shù)返回時(shí),按照正確方式的撤銷。

棧要受到內(nèi)存塊的限制,不斷的函數(shù)嵌套/為局部變量分配太多的空間,可能會(huì)導(dǎo)致棧溢出。當(dāng)棧中的內(nèi)存區(qū)域都已經(jīng)被使用完之后繼續(xù)向下寫(xiě)(低地址),會(huì)觸發(fā)一個(gè) CPU 異常。這個(gè)異常接下會(huì)通過(guò)語(yǔ)言的運(yùn)行時(shí)轉(zhuǎn)成各種類型的棧溢出異常。(譯者注:“不同語(yǔ)言的異常提示不同,因此通過(guò)語(yǔ)言運(yùn)行時(shí)來(lái)轉(zhuǎn)換”我想他表達(dá)的是這個(gè)含義)

*函數(shù)的分配可以用堆來(lái)代替棧嗎?

不可以的,函數(shù)的活動(dòng)記錄(即局部或者自動(dòng)變量)被分配在棧上, 這樣做不但存儲(chǔ)了這些變量,而且可以用來(lái)嵌套函數(shù)的追蹤。

堆的管理依賴于運(yùn)行時(shí)環(huán)境,C 使用 malloc ,C++ 使用 new ,但是很多語(yǔ)言有垃圾回收機(jī)制。

棧是更低層次的特性與處理器架構(gòu)緊密的結(jié)合到一起。當(dāng)堆不夠時(shí)可以擴(kuò)展空間,這不難做到,因?yàn)榭梢杂袔?kù)函數(shù)可以調(diào)用。但是,擴(kuò)展棧通常來(lái)說(shuō)是不可能的,因?yàn)樵跅R绯龅臅r(shí)候,執(zhí)行線程就被操作系統(tǒng)關(guān)閉了,這已經(jīng)太晚了。

譯者注

關(guān)于堆棧的這個(gè)帖子,對(duì)我來(lái)說(shuō),收獲非常多。我之前看過(guò)一些資料,自己寫(xiě)代碼的時(shí)候也常常思考。就這方面,也和祥子(我的大學(xué)舍友,現(xiàn)在北京郵電讀研,技術(shù)牛人)探討過(guò)多次了。但是終究是一個(gè)一個(gè)的知識(shí)點(diǎn),這個(gè)帖子看完之后,豁然開(kāi)朗,把知識(shí)點(diǎn)終于連接成了一個(gè)網(wǎng)。這種感覺(jué),經(jīng)歷過(guò)的一定懂得,期間的興奮不言而喻。

這個(gè)帖子跟帖者不少,我選了評(píng)分最高的四個(gè)。這四個(gè)之間也有一些是重復(fù)的觀點(diǎn)。個(gè)人鐘愛(ài)第四個(gè)回答者,我看的時(shí)候,瞬間高潮了,有木有?不過(guò)需要一些匯編語(yǔ)言、操作系統(tǒng)、計(jì)算機(jī)組成原理的的基礎(chǔ),知道那幾個(gè)寄存器是干什么的,要知道計(jì)算機(jī)的流水線指令工作機(jī)制,保護(hù)/恢復(fù)現(xiàn)場(chǎng)等概念。三個(gè)回復(fù)者都涉及到了操作系統(tǒng)中虛擬內(nèi)存;在比較速度的時(shí)候,大家一定要在腦中對(duì)“局部性原理”和計(jì)算機(jī)高速緩存有一個(gè)概念。

如果你把這篇文章看懂了,我相信你收獲的不只是堆和棧,你會(huì)理解的更多!

興奮之余,有幾點(diǎn)還是要強(qiáng)調(diào)的,翻譯沒(méi)有逐字逐詞翻譯,大部分是通過(guò)我個(gè)人的知識(shí)積累和對(duì)回帖者的意圖揣測(cè)而來(lái)的。請(qǐng)大家不要咬文嚼字,逐個(gè)推敲,我們的目的在于技術(shù)交流,不是么?達(dá)到這一目的就夠了。

下面是一些不確定點(diǎn):

我沒(méi)有聽(tīng)過(guò) bookkeeping data 這種說(shuō)法,故沒(méi)有翻譯。從上下文理解來(lái)看,可以想成是用來(lái)寄存器值?函數(shù)參數(shù)?返回地址?如果有了解具體含義的朋友,煩請(qǐng)告知。

棧和堆棧是一回事,英文表達(dá)是 stack,堆是 heap。

調(diào)用棧的概念,我是第一次聽(tīng)說(shuō),不太熟悉。大家可以去查查資料研究一下。

以上,送給大家,本文結(jié)束。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容