集合是一些有共同特征的獨立數(shù)據(jù)項組成的,通過集合,我們可以可以使用相同的調(diào)用代碼來處理一個集合的所有元素,而不用單獨處理每一個單獨的項。.net的集合諸如(System.Array類以及 System.Collections命名空間)數(shù)組、列表、隊列、堆棧、哈希表、字典甚至(System.Data下)DataSet、DataTable,還有2.0中加入的集合的泛型版本(System.Collections.Generic和 System.Collections.ObjectModel),4.0中引入的有效線程安全操作的集合(System.Collections.Concurrent)。
面對這么多的集合,你了解各個集合有哪些優(yōu)勢,在一個特定的場景中使用哪個集合嗎?本文試圖探討一下這個問題,泛泛而談,不涉及深入的內(nèi)存數(shù)據(jù)結(jié)構(gòu)的追究,希望能給大家?guī)硪恍┮嫣帯?/P>
集合接口
在分別討論各種集合之前,我們先討論一下集合的共性,整個集合體系的繼承層次。
ICollection 接口是 System.Collections 命名空間中類的基接口,而相應(yīng)的ICollectionT>是所有泛型版本集合的基接口。所有的的集合類都直接或間接的繼承他們。
ICollection又繼承IEnumerable,來提供方便的枚舉功能,不過更值得注意ICollection提供同步訪問的線程安全性控制:
IsSynchronized:獲取一個值,該值指示是否同步對 ICollection 的訪問(線程安全)。
SyncRoot:獲取可用于同步對 ICollection 的訪問的對象。
例如,我們可以通過以下來對集合進(jìn)行線程安全訪問,不過有些集合提供Synchronized方法來提供線程安全集合的封裝。
復(fù)制代碼 代碼如下:
ICollection myCollection = someCollection;
lock(myCollection.SyncRoot)
{
// Insert your code here.
}
不過默認(rèn)情況下集合不是線程安全的。如果需要對集合進(jìn)行可伸縮的且高效的多線程訪問,請使用System.Collections.Concurrent命名空間中的某個類。
而與非泛型版本不同的是,泛型版本的集合除了實現(xiàn)了泛型的接口外,也實現(xiàn)了非泛型的相應(yīng)的接口。如ICollectionT>實現(xiàn)了IEnumerable和IEnumerableT>,但是泛型集合卻沒有提供同步訪問的線程安全控制,也就是說泛型集合的同步訪問,我們必須自己去處理同步或使用System.Collections.Concurrent命名空間中的某個類。
另外,IList和IDictionary分別繼承自ICollection,IList的實現(xiàn)者(如Array、ArrayList 或 ListT>等)和ICollection的實現(xiàn)者(例如 Queue、ConcurrentQueueT>、Stack、 ConcurrentStackT>或 LinkedListT>)的每個元素都是一個值,而IDictionary的實現(xiàn)者(例如 Hashtable 和 SortedList 類、DictionaryTKey, TValue> 和 SortedListTKey, TValue> 泛型類)每個元素都是一個鍵值對。
接下來,我們將分別討論和比較下一些常用的集合。
數(shù)組Array
Array不是System.Collections的一部分,但是它繼承自IList接口。.net的Array可以有多維數(shù)組、交錯數(shù)組,甚至創(chuàng)建下限不是0是數(shù)組,默認(rèn)情況下推薦使用下限是0的一維數(shù)組,這常用的數(shù)組是經(jīng)過優(yōu)化的,性能最高。
與System.Collections集合不同的是,Array具有固定的容量,若要增加容量,您必須創(chuàng)建具有所需容量的新 Array 對象,將舊 Array 對象中的元素復(fù)制到新對象中,然后刪除該舊 Array。而System.Collections下的集合在達(dá)到當(dāng)前容量時可自動擴充容量:內(nèi)存被重新分配,元素從舊集合復(fù)制到新集合中。 這減少了使用集合所需的代碼,但是,集合的性能可能仍受到消極影響。 因此我們應(yīng)將初始容量設(shè)置為集合的估計的大小以避免因多次重新分配導(dǎo)致的不佳性能。
System.Collections下的集合類
該類型的集合都具有排序功能且大多數(shù)經(jīng)過了索引。能自動處理內(nèi)存管理,容量按需擴大。
ArrayList和ListT>:ListT>是ArrayList的泛型版本,它們和Array一樣都是基于索引訪問,每個數(shù)據(jù)項只保存一個數(shù)據(jù)值,但是它們提供比Array更強大的功能和操作,使得它們也更容易使用。性能方面,泛型版本總是比非泛型更優(yōu)先采用,除非成員類型是object類型,因為泛型版本免除了裝箱和拆箱的操作;在不需要重新分配集合容量的情況下,ListT>的性能與同類型的數(shù)組十分相近。另外,ArrayList可以很方便的創(chuàng)建同步版本,但Array和ListT>的同步工作必須有自己完成。
Hashtable 和 Dictionary 集合類型:這些集合每個項是一個鍵值對。DictionaryTkey,Tvalue>是Hashtable的泛型版本。Hashtable對象是由包含集合元素的存儲桶組成的,每個存儲桶與使用元素鍵基于哈希函數(shù)生成的一個哈希碼關(guān)聯(lián),包含多個元素。因此這類集合比其它的大多數(shù)集合在搜索和檢索數(shù)據(jù)上更快捷。而同樣的DictionaryTkey,Tvalue>總是比Hashtable性能更好,因此推薦使用,多線程同步使用ConcurrentDictionaryTKey, TValue>類。
已排序的集合類型:System.Collections.SortedList 類、System.Collections.Generic.SortedListTKey, TValue> 泛型類和System.Collections.Generic.SortedDictionaryTKey, TValue> 泛型類,它們都實現(xiàn) IDictionary 接口,兩個泛型類還實現(xiàn)了System.Collections.Generic.IDictionaryTKey, TValue>,與Hashtable類似每個元素都是一個鍵值對,但是它們以基于鍵的排序順序維護元素,并沒有哈希表的 O(1) 插入和檢索特性。非泛型的枚舉項是DictionaryEntry 對象,而兩個泛型類型返回 KeyValuePairTKey, TValue> 對象。它們最重要的重點是它們是按照System.Collections.IComparer實現(xiàn)或System.Collections.Generic.IComparerT>的實現(xiàn)排好序的。SortedList允許我們通過索引和鍵訪問,而SortedDictionary只能通過鍵訪問,SortedList還更省內(nèi)存。
隊列和堆棧:就不多做介紹了,如果要臨時存儲數(shù)據(jù),數(shù)據(jù)只在訪問一次后就放棄,就可以使用這類集合。隊列和堆棧的差別就在于訪問的先后不一樣,相信大家都很清楚了。他們也分別有各自的泛型版本和線程安全版本:System.Collections.Queue 類、System.Collections.Generic.QueueT> 類和System.Collections.Concurrent.ConcurrentQueueT>,System.Collections.Stack類以及 System.Collections.Generic.StackT> 和System.Collections.Concurrent.ConcurrentStackT>。
Set集合:該類型集合的兩個類型HashSetT> 和 SortedSetT>,都實現(xiàn)了ISetT>接口。Set集合最接近于數(shù)學(xué)中的集合,專門用于實現(xiàn)了數(shù)學(xué)的Set操作,如并集、交集等運算。其中HashsetT>沒有排序,不能有重復(fù)元素,可以視為DictionaryTKey,TValue>的不包含值的版本,基于哈希鍵提供高性能的Set運算。而SortedSetT>提供排好序的Set操作的集合。這里要提的是有些集合也提供了Set運算的擴展方法和LINQ也提供的Set運算,不過它們都返回新 的IEnumerableT>集合,而Set集合的Set操作都是修改當(dāng)前集合,并且提供一個更大、更可靠的運算集合。
這并不是.net集合的全部,它還有位集合和專用集合。
位集合
它的每個元素是一個標(biāo)識位,而不是對象。其中有BitVector32和BitArray。
BitVector32是一個結(jié)構(gòu),只能存儲32位數(shù)據(jù),可用來存儲位標(biāo)識或小整數(shù),它是值類型,因此性能更好。
而BitArray是引用類型,它的容量始終與計數(shù)相同,可以通過Length屬性來分配或刪除元素。
專用集合
NameValueCollection 基于 NameObjectCollectionBase;但NameValueCollection 接受一鍵多值,而 NameObjectCollectionBase 只接受一鍵一值。
System.Collections.Specialized 命名空間中的一些強類型集合包括 StringCollection 和 StringDictionary,它們都包含完全是字符串的值集合和字典。
CollectionsUtil 類提供一系列靜態(tài)方法可以用來創(chuàng)建不區(qū)分大小寫的Hashtable或SortedList集合的實例。
有些集合可以轉(zhuǎn)換。例如,HybridDictionary 類起初是 ListDictionary,增大后就變?yōu)?Hashtable。
另外,KeyedCollectionTKey, TItem> 是介于列表和字典之間的混合類型,它提供了一種存儲包含自己鍵的對象的方法,當(dāng)元素數(shù)目達(dá)到指定閾值時,它也可以創(chuàng)建查找字典。
ListDictionary:使用單向鏈接列表實現(xiàn) IDictionary。建議為通常包括少于 10 個項目的集合,當(dāng)數(shù)據(jù)項較少時,提供比Hashtable更好的性能。
LINQ to Objects
我們可以使用 LINQ 查詢來訪問內(nèi)存中的實現(xiàn)了System.Collections.IEnumerable 或 System.Collections.Generic.IEnumerableT> 接口對象。
它提供了一種通用的數(shù)據(jù)訪問模式;與標(biāo)準(zhǔn) foreach 循環(huán)相比,它通常更加簡潔,可讀性更高;提供了強大的篩選、排序和分組功能。
如何抉擇
我們首先要明確,如果存在泛型版本,優(yōu)先使用。
選擇之前請先確定幾個問題:
是否需要按序列訪問,元素在訪問后放棄?
訪問的順序是先進(jìn)先出或后進(jìn)先出、隨機訪問?
是基于索引的訪問,還是基于鍵的訪問?
是只有值,還是鍵值對形式?
是一對一,還是一對多?
是否允許重復(fù)?
是按進(jìn)入的順序保存,還是需要按一定的規(guī)則排好序的,還是無所謂?
是否需要更快速度的檢索和訪問?
您可能感興趣的文章:- .Net中的集合排序可以這么玩你知道嗎
- 分享下Asp.Net面試題目及答案集合
- ASP.NET4 GridView的四種排序樣式詳解
- asp.net下實現(xiàn)輸入數(shù)字的冒泡排序
- .Net集合排序的一種高級玩法實例教程