雖然Golang的GC自打一開始,就被人所詬病,但是經(jīng)過這么多年的發(fā)展,Golang的GC已經(jīng)改善了非常多,變得非常優(yōu)秀了。
以下是Golang GC算法的里程碑:
- v1.1 STW
- v1.3 Mark STW, Sweep 并行
- v1.5 三色標(biāo)記法
- v1.8 hybrid write barrier
經(jīng)典的GC算法有三種: 引用計數(shù)(reference counting)
、 標(biāo)記-清掃(mark sweep)
、 復(fù)制收集(Copy and Collection)
。
Golang的GC算法主要是基于 標(biāo)記-清掃(mark and sweep)
算法,并在此基礎(chǔ)上做了改進(jìn)。因此,在此主要介紹一下 標(biāo)記-清掃(mark and sweep)算法
,關(guān)于 引用計數(shù)(reference counting)
和 復(fù)制收集(copy and collection)
可自行百度。
標(biāo)記-清掃(Mark And Sweep)算法
此算法主要有兩個主要的步驟:
- 標(biāo)記(Mark phase)
- 清除(Sweep phase)
第一步,找出不可達(dá)的對象,然后做上標(biāo)記。
第二步,回收標(biāo)記好的對象。
操作非常簡單,但是有一點需要額外注意: mark and sweep
算法在執(zhí)行的時候,需要程序暫停!即 stop the world
。
也就是說,這段時間程序會卡在哪兒。故中文翻譯成 卡頓
。
我們來看一下圖解:
開始標(biāo)記,程序暫停。程序和對象的此時關(guān)系是這樣的:
然后開始標(biāo)記,process找出它所有可達(dá)的對象,并做上標(biāo)記。如下圖所示:
標(biāo)記完了之后,然后開始清除未標(biāo)記的對象:
然后 垃圾
清除了,變成了下圖這樣。
最后,停止暫停,讓程序繼續(xù)跑。然后循環(huán)重復(fù)這個過程,直到 process
生命周期結(jié)束。
標(biāo)記-清掃(Mark And Sweep)算法存在什么問題?
標(biāo)記-清掃(Mark And Sweep)算法
這種算法雖然非常的簡單,但是還存在一些問題:
- STW,stop the world;讓程序暫停,程序出現(xiàn)卡頓。
- 標(biāo)記需要掃描整個heap
- 清除數(shù)據(jù)會產(chǎn)生heap碎片
這里面最重要的問題就是:mark-and-sweep 算法會暫停整個整個程序。
Go是如何面對并這個問題的呢?
三色并發(fā)標(biāo)記法
我們先來看看Golang的三色標(biāo)記法的大體流程。
首先:程序創(chuàng)建的對象都標(biāo)記為白色。
gc開始:掃描所有可到達(dá)的對象,標(biāo)記為灰色
從灰色對象中找到其引用對象標(biāo)記為灰色,把灰色對象本身標(biāo)記為黑色
監(jiān)視對象中的內(nèi)存修改,并持續(xù)上一步的操作,直到灰色標(biāo)記的對象不存在
此時,gc回收白色對象。
最后,將所有黑色對象變?yōu)榘咨⒅貜?fù)以上所有過程。
好了,大體的流程就是這樣的,讓我們回到剛才的問題:Go是如何解決 標(biāo)記-清除(mark and sweep)
算法中的卡頓(stw,stop the world)問題的呢?
gc和用戶邏輯如何并行操作?
標(biāo)記-清除(mark and sweep)算法的STW(stop the world)操作,就是runtime把所有的線程全部凍結(jié)掉,所有的線程全部凍結(jié)意味著用戶邏輯是暫停的。這樣所有的對象都不會被修改了,這時候去掃描是絕對安全的。
Go如何減短這個過程呢?標(biāo)記-清除(mark and sweep)算法包含兩部分邏輯:標(biāo)記和清除。
我們知道Golang三色標(biāo)記法中最后只剩下的黑白兩種對象,黑色對象是程序恢復(fù)后接著使用的對象,如果不碰觸黑色對象,只清除白色的對象,肯定不會影響程序邏輯。所以: 清除操作和用戶邏輯可以并發(fā)。
標(biāo)記操作和用戶邏輯也是并發(fā)的,用戶邏輯會時常生成對象或者改變對象的引用,那么標(biāo)記和用戶邏輯如何并發(fā)呢?
process新生成對象的時候,GC該如何操作呢?不會亂嗎?
我們看如下圖,在此狀態(tài)下:process程序又新生成了一個對象,我們設(shè)想會變成這樣:
但是這樣顯然是不對的,因為按照三色標(biāo)記法的步驟,這樣新生成的對象A最后會被清除掉,這樣會影響程序邏輯。
Golang為了解決這個問題,引入了 寫屏障
這個機制。
寫屏障:該屏障之前的寫操作和之后的寫操作相比,先被系統(tǒng)其它組件感知。
通俗的講:就是在gc跑的過程中,可以監(jiān)控對象的內(nèi)存修改,并對對象進(jìn)行重新標(biāo)記。(實際上也是超短暫的stw,然后對對象進(jìn)行標(biāo)記)
在上述情況中, 新生成的對象,一律都標(biāo)位灰色!
即下圖:
那么,灰色或者黑色對象的引用改為白色對象的時候,Golang是該如何操作的?
看如下圖,一個黑色對象引用了曾經(jīng)標(biāo)記的白色對象。
這時候,寫屏障機制被觸發(fā),向GC發(fā)送信號,GC重新掃描對象并標(biāo)位灰色。
因此,gc一旦開始,無論是創(chuàng)建對象還是對象的引用改變,都會先變?yōu)榛疑?/p>
參考文獻(xiàn):
Golang's Real-time GC in Theory and Practice
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
您可能感興趣的文章:- go:垃圾回收GC觸發(fā)條件詳解
- django項目用higcharts統(tǒng)計最近七天文章點擊量
- 談?wù)揋o 什么時候會觸發(fā) GC問題