主頁(yè) > 知識(shí)庫(kù) > Python垃圾回收是怎么實(shí)現(xiàn)的

Python垃圾回收是怎么實(shí)現(xiàn)的

熱門標(biāo)簽:銀川電話機(jī)器人電話 電銷機(jī)器人錄音要學(xué)習(xí)什么 煙臺(tái)電話外呼營(yíng)銷系統(tǒng) 如何地圖標(biāo)注公司 長(zhǎng)春極信防封電銷卡批發(fā) 上海正規(guī)的外呼系統(tǒng)最新報(bào)價(jià) 企業(yè)彩鈴地圖標(biāo)注 外賣地址有什么地圖標(biāo)注 預(yù)覽式外呼系統(tǒng)

什么是垃圾回收

垃圾回收(GC) 大家應(yīng)該多多少少都了解過(guò),什么是垃圾回收呢?垃圾回收GC的全拼是 Garbage Collection,在維基百科的定義是:在計(jì)算機(jī)科學(xué)中,垃圾回收(英語(yǔ):Garbage Collection,縮寫為GC)是一種自動(dòng)的內(nèi)存管理機(jī)制。當(dāng)一個(gè)電腦上的動(dòng)態(tài)內(nèi)存不再需要時(shí),就應(yīng)該予以釋放,以讓出內(nèi)存,這種內(nèi)存資源管理,稱為垃圾回收。我們都知道在C/C++里用戶需要自己管理維護(hù)內(nèi)存,自己管理內(nèi)存是很自由,可以隨意申請(qǐng)、釋放內(nèi)存,但是極易會(huì)出現(xiàn)內(nèi)存泄露,懸空指針等問題;像現(xiàn)在的高級(jí)語(yǔ)言Java,Python等,都采用了垃圾回收機(jī)制,自動(dòng)進(jìn)行內(nèi)存管理,而垃圾回收機(jī)制專注于兩件事:① 找到內(nèi)存中無(wú)用的垃圾資源。 ② 清除這些垃圾資源并把內(nèi)存讓出來(lái)給其他對(duì)象使用。

Python作為一門解釋型語(yǔ)言,因?yàn)楹?jiǎn)單易懂的語(yǔ)法,我們可以直接對(duì)變量賦值,而不必聲明變量的類型,變量類型的確定、內(nèi)存空間的分配與釋放都是由Python解釋器在運(yùn)行時(shí)自動(dòng)進(jìn)行的,我們不必關(guān)心;Python這一自動(dòng)管理內(nèi)存的功能極大的減少了開發(fā)者的編碼負(fù)擔(dān),讓開發(fā)者專注于業(yè)務(wù)實(shí)現(xiàn),這也是成就Python自身的重要原因之一。接下來(lái),我們就扒一扒Python的內(nèi)存管理。

Python中的垃圾回收機(jī)制

引用計(jì)數(shù)

Python中一切皆對(duì)象,也就是說(shuō),在Python中你用到的一切變量,本質(zhì)上都是類對(duì)象。實(shí)際上每一個(gè)對(duì)象的核心就是一個(gè)**「結(jié)構(gòu)體PyObject」**,它的內(nèi)部有一個(gè)引用計(jì)數(shù)器ob_refcnt,程序在運(yùn)行的過(guò)程中會(huì)實(shí)時(shí)的更新ob_refcnt的值,來(lái)反映引用當(dāng)前對(duì)象的名稱數(shù)量。當(dāng)某對(duì)象的引用計(jì)數(shù)值為0,說(shuō)明這個(gè)對(duì)象變成了垃圾,那么它會(huì)被回收掉,它所用的內(nèi)存也會(huì)被立即釋放掉。

typedef struct _object {
    int ob_refcnt;//引用計(jì)數(shù)
    struct _typeobject *ob_type;
} PyObject;

以下情況是導(dǎo)致引用計(jì)數(shù)加一的情況:
①對(duì)象被創(chuàng)建,例如a=5
②對(duì)象被引用,b=a
③對(duì)象被作為參數(shù),傳入到一個(gè)函數(shù)中(要注意的是,在函數(shù)調(diào)用發(fā)生的時(shí)候,會(huì)產(chǎn)生額外的兩次引用,一次來(lái)自函數(shù)棧,另一個(gè)是函數(shù)參數(shù))
④對(duì)象作為一個(gè)元素,存儲(chǔ)在容器中(例如存儲(chǔ)在列表中)

下面的情況則會(huì)導(dǎo)致引用計(jì)數(shù)減一:
①對(duì)象別名被顯示銷毀 del a
②對(duì)象別名被賦予新的對(duì)象
③一個(gè)對(duì)象離開它的作用域
④對(duì)象所在的容器被銷毀或者是從容器中刪除對(duì)象

我們還可以通過(guò)sys包中的getrefcount()來(lái)獲取一個(gè)名稱所引用的對(duì)象當(dāng)前的引用計(jì)數(shù)(注意,這里getrefcount()本身會(huì)使得引用計(jì)數(shù)加一)

import sys
a = [1, 2, 3]
print(sys.getrefcount(a))
# 輸出為2,說(shuō)明有兩次引用(一次來(lái)自a的定義,一次來(lái)自getrefcount)

def func(a):
    print(sys.getrefcount(a))
    # 輸出為4,說(shuō)明有四次引用(a的定義、Python的函數(shù)調(diào)用棧,函數(shù)參數(shù),和getrefcount)

func(a)
print(sys.getrefcount(a))
# 輸出為2,說(shuō)明有兩次引用(一次來(lái)自a的定義,一次來(lái)自getrefcount),此時(shí)函數(shù)func調(diào)用已經(jīng)不存在

下面從使用內(nèi)存的角度看一下:

import os
import psutil


def show_memory_info(hint):
    """
    顯示當(dāng)前 python 程序占用的內(nèi)存大小
    :param hint:
    :return:
    """
    pid = os.getpid()
    p = psutil.Process(pid)

    info = p.memory_full_info()
    memory = info.rss / 1024 / 1024
    print('{} 當(dāng)前進(jìn)程的內(nèi)存使用: {} MB'.format(hint, memory))


def func():
    show_memory_info('初始')
    a = [i for i in range(9999999)]
    show_memory_info('創(chuàng)建a之后')


func()
show_memory_info('結(jié)束')

輸出如下:

初始 當(dāng)前進(jìn)程的內(nèi)存使用: 12.125 MB
創(chuàng)建a之后 當(dāng)前進(jìn)程的內(nèi)存使用: 205.15625 MB
結(jié)束 當(dāng)前進(jìn)程的內(nèi)存使用: 12.87890625 MB

可以看出,當(dāng)前進(jìn)程初始的內(nèi)存使用為12.125 MB,當(dāng)調(diào)用了函數(shù)func()創(chuàng)建列表a之后,內(nèi)存占用迅速增加到了205.15625 MB,而在函數(shù)調(diào)用結(jié)束后,內(nèi)存則返回正常。這是因?yàn)?,函?shù)內(nèi)部聲明的列表a是局部變量,在函數(shù)返回后,局部變量的引用會(huì)注銷掉,此時(shí)列表a所指代對(duì)象的引用計(jì)數(shù)為0,Python 便會(huì)執(zhí)行垃圾回收,因此之前占用的大量?jī)?nèi)存就又回來(lái)了。

循環(huán)引用

何為循環(huán)引用?簡(jiǎn)單來(lái)說(shuō)就是兩個(gè)對(duì)象相互引用??聪旅嬉欢纬绦颍?/p>

def func2():
    show_memory_info('初始')
    a = [i for i in range(10000000)]
    b = [x for x in range(10000001, 20000000)]
    a.append(b)
    b.append(a)
    show_memory_info('創(chuàng)建a,b之后')

func2()
show_memory_info('結(jié)束')

輸出如下:

初始 當(dāng)前進(jìn)程的內(nèi)存使用: 12.14453125 MB
創(chuàng)建a,b之后 當(dāng)前進(jìn)程的內(nèi)存使用: 396.6875 MB
結(jié)束 當(dāng)前進(jìn)程的內(nèi)存使用: 396.96875 MB

可以看出,在程序中,a和b互相引用,并且作為局部變量在函數(shù)func2調(diào)用結(jié)束后,a和b從程序意義上已經(jīng)不存在,但從輸出結(jié)果中看到,依然有內(nèi)存占用,這是為什么呢?因?yàn)榛ハ嘁脤?dǎo)致它們的引用數(shù)都不為0。

如果在生產(chǎn)環(huán)境下出現(xiàn)了循環(huán)引用,又沒有其他垃圾回收機(jī)制的情況下,經(jīng)過(guò)長(zhǎng)時(shí)間運(yùn)行后,程序所占用的內(nèi)存一定會(huì)變得越來(lái)越大,如果沒有被及時(shí)處理,一定會(huì)跑滿服務(wù)器的。

如果不得不使用循環(huán)引用的話,我們可以顯式調(diào)用gc.collect() 來(lái)啟動(dòng)垃圾回收:

def func2():
    show_memory_info('初始')
    a = [i for i in range(10000000)]
    b = [x for x in range(10000001, 20000000)]
    a.append(b)
    b.append(a)
    show_memory_info('創(chuàng)建a,b之后')

func2()
gc.collect()
show_memory_info('結(jié)束')

輸出如下:

初始 當(dāng)前進(jìn)程的內(nèi)存使用: 12.29296875 MB
創(chuàng)建a,b之后 當(dāng)前進(jìn)程的內(nèi)存使用: 396.69140625 MB
結(jié)束 當(dāng)前進(jìn)程的內(nèi)存使用: 12.95703125 MB

引用計(jì)數(shù)機(jī)制有高效、簡(jiǎn)單、實(shí)時(shí)性(一旦為零就直接做掉)等優(yōu)點(diǎn),一旦一個(gè)對(duì)象的引用計(jì)數(shù)歸零,內(nèi)存就直接釋放了。不用像其他機(jī)制等到特定時(shí)機(jī)。將垃圾回收隨機(jī)分配到運(yùn)行的階段,處理回收內(nèi)存的時(shí)間分?jǐn)偟搅似綍r(shí),正常程序的運(yùn)行比較平穩(wěn)。但是,引用計(jì)數(shù)也存在著一些缺點(diǎn),通常的缺點(diǎn)有:

① 邏輯雖然簡(jiǎn)單,但維護(hù)起來(lái)有些麻煩。每個(gè)對(duì)象需要分配單獨(dú)的空間來(lái)統(tǒng)計(jì)引用計(jì)數(shù),并且需要對(duì)引用計(jì)數(shù)進(jìn)行維護(hù),這是需要消耗一下資源的。
② 循環(huán)引用。這將是引用計(jì)數(shù)機(jī)制的致命傷,引用計(jì)數(shù)對(duì)此是無(wú)解的,因此必須要使用其它的垃圾回收算法對(duì)其進(jìn)行補(bǔ)充。

事實(shí)上,Python 使用標(biāo)記清除(mark-sweep)算法和分代收集(generational),來(lái)啟用針對(duì)循環(huán)引用的自動(dòng)垃圾回收。

標(biāo)記清除解除循環(huán)引用

Python采用了 標(biāo)記-清除(Mark and Sweep)算法,解決容器對(duì)象可能產(chǎn)生的循環(huán)引用問題。(注意,只有容器類對(duì)象才有可能產(chǎn)生循環(huán)引用,比如列表、字典、用戶自定義類的對(duì)象、元組等。而像數(shù)字,字符串這類簡(jiǎn)單類型不會(huì)出現(xiàn)循環(huán)引用。作為一種優(yōu)化策略,對(duì)于只包含簡(jiǎn)單類型的元組也不在標(biāo)記清除算法的考慮之列)

它分為兩個(gè)階段:第一階段是標(biāo)記階段,GC會(huì)把所有的活動(dòng)對(duì)象打上標(biāo)記,第二階段是把那些沒有標(biāo)記的非活動(dòng)對(duì)象進(jìn)行回收。

那么Python又是如何判斷什么樣的對(duì)象為非活動(dòng)對(duì)象的呢?

對(duì)于任何對(duì)象集合,我們先建個(gè)引用計(jì)數(shù)副本表,來(lái)存它們的引用計(jì)數(shù),然后把集合內(nèi)部的引用都解除掉(內(nèi)部引用是指這個(gè)集合中的某個(gè)對(duì)象引用了本集合內(nèi)部的另一個(gè)對(duì)象),解除的過(guò)程中在副本表減少引用計(jì)數(shù),解除掉所有的內(nèi)部引用后,在副本表引用計(jì)數(shù)依然不為0的,就是根集合,然后開始標(biāo)記過(guò)程,即從跟集合節(jié)點(diǎn)逐步恢復(fù)引用并增加副本表的引用計(jì)數(shù),最后副本表中引用計(jì)數(shù)為0的,就是垃圾對(duì)象了,我們就需要對(duì)它們進(jìn)行垃圾回收。例如:

上面這個(gè)集合中的節(jié)點(diǎn)有外部進(jìn)來(lái)的連接(到a和到b),也有到外部的連接(c引用了外面某個(gè)對(duì)象),右邊是引用計(jì)數(shù)表,然后我們拆掉所有內(nèi)部連接:

那么根集合就是a和b了,然后我們從a和b出發(fā)開始標(biāo)記并恢復(fù)引用計(jì)數(shù):

從a和b出發(fā)可達(dá)的節(jié)點(diǎn)都被恢復(fù)了,引用計(jì)數(shù)還是0的就是這個(gè)集合內(nèi)部循環(huán)引用的垃圾(e和f),如果把所有對(duì)象看做一個(gè)集合,那么可以回收所有垃圾,也可以將所有對(duì)象劃分成一個(gè)個(gè)小的集合,分別回收小集合內(nèi)的垃圾。
但是每次都需要遍歷圖,對(duì)于Python而言是一種巨大的性能浪費(fèi)。

分代回收

分代回收是一種以空間換時(shí)間的操作方式,Python將內(nèi)存根據(jù)對(duì)象的存活時(shí)間劃分為不同的集合,每個(gè)集合稱為一個(gè)代,Python將內(nèi)存分為了3代,分別為年輕代(第0代)、中年代(第1代)、老年代(第2代)。它們對(duì)應(yīng)3個(gè)鏈表,它們的垃圾收集頻率隨對(duì)象的存活時(shí)間的增大而減小。

新創(chuàng)建的對(duì)象都會(huì)分配在年輕代,年輕代鏈表的總數(shù)達(dá)到上限時(shí),即當(dāng)垃圾回收器中新增對(duì)象減去刪除對(duì)象達(dá)到相應(yīng)的閾值時(shí),就會(huì)對(duì)這一代對(duì)象啟動(dòng)垃圾回收,把那些可以被回收的對(duì)象回收掉,而那些不會(huì)回收的對(duì)象就會(huì)被移到中年代去,依此類推,老年代中的對(duì)象是存活時(shí)間最久的對(duì)象,甚至是存活于整個(gè)系統(tǒng)的生命周期內(nèi)。同時(shí),分代回收是建立在標(biāo)記清除技術(shù)基礎(chǔ)之上。事實(shí)上,分代回收基于的思想是,新生的對(duì)象更有可能被垃圾回收,而存活更久的對(duì)象也有更高的概率繼續(xù)存活。因此,通過(guò)這種做法,可以節(jié)約不少計(jì)算量,從而提高Python的性能。

總結(jié)

垃圾回收是Python自帶的機(jī)制,用于自動(dòng)釋放不會(huì)再用到的內(nèi)存空間,在Python中,主要通過(guò)引用計(jì)數(shù)進(jìn)行垃圾回收,通過(guò)標(biāo)記清除解決容器對(duì)象可能產(chǎn)生的循環(huán)引用問題,通過(guò)分代回收以空間換時(shí)間的方法提高垃圾回收效率。

到此這篇關(guān)于Python垃圾回收是怎么實(shí)現(xiàn)的的文章就介紹到這了,更多相關(guān)Python垃圾回收內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python中垃圾回收和del語(yǔ)句詳解
  • python的內(nèi)存管理和垃圾回收機(jī)制詳解
  • 理解Python垃圾回收機(jī)制
  • Python的垃圾回收機(jī)制深入分析
  • python對(duì)象銷毀實(shí)例(垃圾回收)
  • 淺談Python的垃圾回收機(jī)制
  • python垃圾回收機(jī)制(GC)原理解析
  • Python的垃圾回收機(jī)制詳解
  • python中的垃圾回收(GC)機(jī)制
  • 詳細(xì)分析Python垃圾回收機(jī)制
  • Python小白垃圾回收機(jī)制入門

標(biāo)簽:湖北 上饒 珠海 潮州 佳木斯 盤錦 宜昌 西寧

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《Python垃圾回收是怎么實(shí)現(xiàn)的》,本文關(guān)鍵詞  Python,垃圾,回收,是,怎么,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《Python垃圾回收是怎么實(shí)現(xiàn)的》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于Python垃圾回收是怎么實(shí)現(xiàn)的的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章