前言
MongoDB是由C++語言所編寫的一種面向文檔的非關(guān)系型數(shù)據(jù)庫(是一種NoSql數(shù)據(jù)庫實現(xiàn)),也是介于關(guān)系型數(shù)據(jù)庫和非關(guān)系型數(shù)據(jù)庫之間的數(shù)據(jù)存儲產(chǎn)品,而眾所周知SQL與NoSQL最大的不同之一就是不支持JOIN,在傳統(tǒng)的數(shù)據(jù)庫中,SQL JOIN子句允許你使用普通的字段,在兩個或者是更多表中的組合表中的每行數(shù)據(jù)。例如,如果你有表books和publishers,你可以像下面這樣寫命令:
SELECT book.title, publisher.name
FROM book
LEFT JOIN book.publisher_id ON publisher.id;
換句話說,book表中的publisher_id字段引用了publishers表中的id字典。這些都是很常見的例子:對于每個publisher都可以擁有成千上萬本書,如果你想更新publisher的信息的時候,我們只需要更改一條記錄。數(shù)據(jù)的冗余是很小的,因為我們不需要為每本書來重復更新他的publisher信息,這種技術(shù)已基本當做一種規(guī)范化的東西了。SQL數(shù)據(jù)庫提供了一些列的規(guī)范與約束條件來保障數(shù)據(jù)關(guān)聯(lián)性。
--------------------------------------------------------------------------------
NoSQL == No JOIN?
并不都是這樣吧。。。。。
--------------------------------------------------------------------------------
面向文檔的數(shù)據(jù)庫,例如MongoDB,被設(shè)計用來存儲非結(jié)構(gòu)化的數(shù)據(jù),理想情況下,這些數(shù)據(jù)是在數(shù)據(jù)集合中是相互沒有關(guān)聯(lián)的,如果一條數(shù)據(jù)包含兩次或者更多次,那數(shù)據(jù)就重復了。因為大部分情況下我們還是需要數(shù)據(jù)關(guān)聯(lián)的,只有很少的情況下才會不需要關(guān)聯(lián)數(shù)據(jù),看來NoSQL這些特性看來讓人失望啊。幸運的是MongoDB 3.2 介紹了一個新的$lookup操作,這個操作可以提供一個類似于LEFT OUTER JOIN的操作在兩個或者是更多的條件下。
--------------------------------------------------------------------------------
MongoDB Aggregation
$lookup僅僅在 aggregation操作中才被允許使用,想想他作為一個管道操作:查詢,過濾,組合結(jié)果。一個操作的輸出被作為下一個的輸入。Aggregation比簡單的查詢操作更難于理解,而且這些操作通常運行很慢,然而他們很高效,Aggregation可以使用一個很好的例子來解釋,假設(shè)我們使用user數(shù)據(jù)集合來創(chuàng)建一個社交平臺,在每個獨立的文檔中存儲沒個用戶的信息,例如:
{
"_id": ObjectID("45b83bda421238c76f5c1969"),
"name": "User One",
"email: "userone@email.com",
"country": "UK",
"dob": ISODate("1999-09-13T00:00:00.000Z")
}
我們可以向user這個集合中添加足夠多的用戶,但是每個MongoDB文檔都必須有一個為一個_id字段值,這個_id字段值就像SQL中的鍵,在我們沒有明確指定_id的時候會被自動的加入到文檔中。我們的社交網(wǎng)站現(xiàn)在需要一個post集合,這個結(jié)合存儲用戶的評論,這個文檔存儲純文本,時間,評分,一個被寫到user_id字段的玩家引用。
{
"_id": ObjectID("17c9812acff9ac0bba018cc1"),
"user_id": ObjectID("45b83bda421238c76f5c1969"),
"date: ISODate("2016-09-05T03:05:00.123Z"),
"text": "My life story so far",
"rating": "important"
}
我們現(xiàn)在想要顯示最近具有important評論的二十條數(shù)據(jù),這些數(shù)據(jù)來自所有的用戶,并且是按照時間排序的。每一個返回的文檔中應該包含評論的文本,發(fā)布評論的時間,以及相關(guān)的用戶的名字和國家。
MongoDB數(shù)據(jù)庫的aggregate查詢是通過傳遞管道操作的數(shù)組,這個數(shù)組中順序的定了每個操作。首先,我們需要從所有的post集合中提取出所有的文檔,這些文檔使用$match記性準確rating過濾。
{ "$match": { "rating": "important" } }
我們現(xiàn)在需要對過濾出來的文檔按照時間,使用$sort操作進行排序。
{ "$sort": { "date": -1 } }
因為我們要僅僅返回二十條數(shù)據(jù),我們可以使用$limit來限制我們需要處理的文檔數(shù)量。
我們現(xiàn)在使用$lookup操作從user集合中連接數(shù)據(jù),這個操作需要一個四個參數(shù)的對象:
1、localField:在輸入文檔中的查找字段
2、from:需要連接的集合
3、foreignField:需要在from集合中查找的字段
4、as:輸出的字段名字
所以我們的操作是這樣的:
{ "$lookup": {
"localField": "user_id",
"from": "user",
"foreignField": "_id",
"as": "userinfo"
} }
在我們的輸出中將會創(chuàng)建一個名為userinfo的新字段,他是一個數(shù)組,其中每個元素都是在user集合中匹配的元素。
"userinfo": [
{ "name": "User One", ... }
]
在post.user_id與user._id之間,我們具有一對一的關(guān)系,因為對于每一個post只有一個用戶。因此我們的userinfo數(shù)組將會僅僅包含一個元素,我們可以說使用 $unwind操作來解構(gòu)他并插入到一個自文檔中。
{ "$unwind": "$userinfo" }
現(xiàn)在的輸出將會轉(zhuǎn)化成更加常用的結(jié)構(gòu):
"userinfo": {
"name": "User One",
"email: "userone@email.com",
…
}
最終我們可以在管道中使用 $project操作返回評論信息,評論的時間,評論的用戶名,國家等。
{ "$project": {
"text": 1,
"date": 1,
"userinfo.name": 1,
"userinfo.country": 1
} }
合并上面所有的操作
我們最終的聚合查詢匹配的評論,按照順序排序,限制最新的二十條信息,連接用戶的數(shù)據(jù),扁平用戶數(shù)組,最后只返回我們需要的必須數(shù)據(jù),總的命令如下:
db.post.aggregate([
{ "$match": { "rating": "important" } },
{ "$sort": { "date": -1 } },
{ "$limit": 20 },
{ "$lookup": {
"localField": "user_id",
"from": "user",
"foreignField": "_id",
"as": "userinfo"
} },
{ "$unwind": "$userinfo" },
{ "$project": {
"text": 1,
"date": 1,
"userinfo.name": 1,
"userinfo.country": 1
} }
]);
結(jié)果是一個擁有二十個文檔的集合,例如:
[
{
"text": "The latest post",
"date: ISODate("2016-09-27T00:00:00.000Z"),
"userinfo": {
"name": "User One",
"country": "UK"
}
},
{
"text": "Another post",
"date: ISODate("2016-09-26T00:00:00.000Z"),
"userinfo": {
"name": "User One",
"country": "UK"
}
}
...
]
MongoDB的$lookup很好用而且很高效,但是上面這個基礎(chǔ)的例子只是一個組合的集合查詢。他不是一個對SQL中的更加高效的JOIN子句的替代。而且MongoDB也提供了一些限制,如果user集合被刪除了,post文檔還是會保留。
理想情況下,這個$lookup操作應該不會經(jīng)常使用,如果你需要經(jīng)常使用它,那么你就使用了錯誤的數(shù)據(jù)存儲了(數(shù)據(jù)庫):如果你有相關(guān)聯(lián)的數(shù)據(jù),應該使用關(guān)聯(lián)數(shù)據(jù)庫(SQL)。
也就是說$lookup是一個MongoDB 3.2新加入的,他解決了當在Nosql數(shù)據(jù)庫中使用一些小的相關(guān)聯(lián)的數(shù)據(jù)查詢的時候一些令人失望的問題。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學習或者工作能帶來一定的幫助,如果有疑問大家可以留言交流,謝謝大家對腳本之家的支持。
您可能感興趣的文章:- MongoDB 語法使用小結(jié)
- windows下mongodb安裝與使用圖文教程(整理)
- MongoDB索引使用詳解
- MongoDB入門教程(包含安裝、常用命令、相關(guān)概念、使用技巧、常見操作等)
- MongoDB 使用Skip和limit分頁
- CentOS 6.5系統(tǒng)中使用yum安裝MongoDB 2.6 教程
- MongoDB中的bson介紹和使用實例
- mongodb數(shù)據(jù)庫游標的使用淺析
- mongodb使用心得簡單總結(jié)
- mongodb BSON的基本使用教程