每個(gè)熟悉python的人都知道,python提供給了我們各種各樣原生的數(shù)據(jù)結(jié)構(gòu),如list、tuple、set、dict等等。這些形形色色的數(shù)據(jù)結(jié)構(gòu)為我們程序猿提供了業(yè)務(wù)支持。但是要用好這些對(duì)象,可就要理解這些結(jié)構(gòu)的特點(diǎn)。
比如簡(jiǎn)單的區(qū)分:可變與不可變、有序與無(wú)序。
那么本文就想和大家分享一下,這個(gè)無(wú)序中的細(xì)節(jié)。
在開(kāi)始之前,本蟒蛇嚴(yán)重申明,集合和字典是無(wú)序的??!集合和字典是無(wú)序的!!集合和字典是無(wú)序的??!不要看完本蛇說(shuō)完,然后得到了什么奇奇怪怪的結(jié)論!本文基于python3.6進(jìn)行講解,什么你還是2.7?兄弟醒醒,都2018年了o(∩_∩)o 哈哈
字典和集合是無(wú)序的,只要你懂一點(diǎn)點(diǎn)python的皮毛,你都熟知這句話(huà)。大家在初識(shí)python時(shí)就學(xué)習(xí)過(guò),什么是可迭代對(duì)象(分清楚這個(gè)多半是想知道到底啥能被for循環(huán)遍歷),什么是可變可迭代對(duì)象,什么是不可變可迭代對(duì)象,什么是無(wú)序什么是有序。但大家有想過(guò)證明無(wú)序嘛?自然會(huì)想,本蟒蛇也不例外。那么如何證明無(wú)序性呢?簡(jiǎn)單暴力的解決辦法,隨便寫(xiě)個(gè)兩行代碼,定義一個(gè)set然后print看結(jié)果唄!
我的測(cè)試代碼如下:
s = {'a','b','c'}
print(s)
真的是簡(jiǎn)單暴力又直接,看到這兩行代碼不經(jīng)感嘆,人生苦短,我用python(本蟒蛇大學(xué)學(xué)的java)。好了,當(dāng)我瘋狂運(yùn)行這個(gè)程序的時(shí)候輸出結(jié)果自然也不唯一。
無(wú)序嘛!就是這個(gè)意思~
但是事情沒(méi)有那么簡(jiǎn)單,我無(wú)意又用int類(lèi)型試了一試,如下:
猜猜發(fā)生了什么?這種情況下,無(wú)論我怎么瘋狂輸出,瘋狂運(yùn)行這段代碼,我得到的結(jié)果卻是唯一的,那就是print了{1,2,3}
通過(guò)反復(fù)嘗試我發(fā)現(xiàn),只要是int類(lèi)型,那么set好像就變成有序了,無(wú)論聲明這個(gè)set時(shí)數(shù)字如何擺放,輸出結(jié)果總是以一種固定的順序!同樣我將dict字典的key值設(shè)為int類(lèi)型,這時(shí)候字典也變成了固定的排序方式。
這是為什么呢?
講到這里,本蛇需要繼續(xù)聲明set和dict是無(wú)序的!別懷疑你的專(zhuān)業(yè)知識(shí)。那么為什么出現(xiàn)這種現(xiàn)象呢,答案只需要從底層源碼中就能找到。
簡(jiǎn)單來(lái)說(shuō),就是字典和集合的無(wú)序性在python是如何實(shí)現(xiàn)的?
字典和集合無(wú)序的實(shí)現(xiàn)方式是hash表。沒(méi)錯(cuò),他們是通過(guò)hash值來(lái)將對(duì)象放入hash表中,從而達(dá)到無(wú)序的操作(眾所周知對(duì)象的hash值是不斷變化的)。
代碼如下:
s = {'A','B','C'}
print(hash('A'))
print(hash('B'))
print(hash('C'))
print(s)
通過(guò)打印出hash值,結(jié)果也就一目了然啦~
就像上圖顯示一樣,每次的hash值都不同,那么字符ABC在hash表中的位置也不同,然而set就是依據(jù)hash表來(lái)進(jìn)行排列的,這就實(shí)現(xiàn)了集合的無(wú)序。
那么同樣的操作我們放在int類(lèi)型上呢?
s = {1,2,3}
print(hash(1))
print(hash(2))
print(hash(3))
print(s)
到這一步,可能有些猿們就知道結(jié)果了,沒(méi)錯(cuò)結(jié)果如下:
無(wú)論我多努力的輸出,123的hash值卻那么任性就是123。是的,python中int型的hash值就是它本身,那么set或dict中的排序方式又是通過(guò)hash表實(shí)現(xiàn)的,所以自然順序就不會(huì)變。
所以,問(wèn)題解決啦~就是因?yàn)閔ash的原因,導(dǎo)致了這一怪異現(xiàn)象。提到了hash表不得不佩服python的精妙,dict是原生數(shù)據(jù)結(jié)構(gòu)中常用來(lái)儲(chǔ)存大量復(fù)雜數(shù)據(jù)的工具,類(lèi)似數(shù)據(jù)庫(kù)。
這種情況下,查詢(xún)效率真的是很關(guān)鍵的存在。利用了hash表,空間換時(shí)間的方式大大提高了查詢(xún)效率,妙呀~
所以!不知道大家在做列表隨機(jī)的時(shí)候會(huì)不會(huì)這樣操作,反正本蟒蛇是干過(guò)(年少不懂事~),就是類(lèi)似下面的代碼:
L = ['a','b','c']
L = list(set(L))
print(L)
有沒(méi)有??完美!精簡(jiǎn)!做隨機(jī)我甚至都沒(méi)導(dǎo)入random模塊!在沒(méi)有重復(fù)對(duì)象的情況下轉(zhuǎn)為集合在轉(zhuǎn)回來(lái)不就隨機(jī)了嘛~那么通過(guò)上面的分析,當(dāng)出現(xiàn)int類(lèi)型時(shí)這個(gè)隨機(jī)就失去了意義啦~避免這樣使用喲。而且在真正的生產(chǎn)過(guò)程中,你用到列表隨機(jī)說(shuō)明就有重復(fù)值呀~如果沒(méi)有。。為什么不直接就用set呢。。。Σ( ° △ °|||)︴可別忘了set還帶去重呢!
所以!記住set是無(wú)序的!也千萬(wàn)別鉆int值是有序的這個(gè)空子!因?yàn)楹?jiǎn)單的說(shuō),我運(yùn)行時(shí)是CPython作為解釋器的,別的結(jié)果可能不一樣喲~而且python是一門(mén)膠水語(yǔ)言,百搭的中央空調(diào),和什么都能配~所以不能保證你的代碼絕對(duì)只用cPython作為解釋器。
所以set與dict是無(wú)序的~但是無(wú)序的世界里也有小驚喜等著我們發(fā)現(xiàn)~
補(bǔ)充:Python中關(guān)于dict和set的比較
語(yǔ)法 |
dict |
set |
定義 |
通過(guò)鍵-值儲(chǔ)存的字典 |
只儲(chǔ)存list值的集合 |
性質(zhì) |
鍵和值一一對(duì)應(yīng) |
儲(chǔ)存的值不能重復(fù) |
用法 |
存入:字典名[‘鍵'] = 值 刪除:字典名.pop(‘鍵') 替換:字典名[‘鍵'] = 新值 |
存入集合名.add(內(nèi)容) 刪除:集合名.remove(值) 交并補(bǔ)運(yùn)算: |
共同點(diǎn):
set的原理和dict一樣,所以,同樣不可以放入可變對(duì)象,因?yàn)闊o(wú)法判斷兩個(gè)可變對(duì)象是否相等,也就無(wú)法保證set內(nèi)部“不會(huì)有重復(fù)元素”。
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
您可能感興趣的文章:- Python 實(shí)現(xiàn)list,tuple,str和dict之間的相互轉(zhuǎn)換
- 詳解Python 中的 defaultdict 數(shù)據(jù)類(lèi)型
- python的dict判斷key是否存在的方法
- Python字典dict常用方法函數(shù)實(shí)例
- python Yaml、Json、Dict之間的轉(zhuǎn)化
- Python xmltodict模塊安裝及代碼實(shí)例
- python 中dict的元素取值操作