国产av无码亚洲一区二区,国产午夜无码精品免费看

主頁(yè) > 知識(shí)庫(kù) > Mongodb實(shí)戰(zhàn)之全文搜索功能

Mongodb實(shí)戰(zhàn)之全文搜索功能

前言

眾所周知在傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)中，我們通常將數(shù)據(jù)結(jié)構(gòu)化，通過一系列表關(guān)聯(lián)、聚合來查詢我們所需的結(jié)果。而在非結(jié)構(gòu)化的數(shù)據(jù)中，缺少這種預(yù)定義的結(jié)構(gòu)，因而如何快速查詢定位到我們所需要的結(jié)果，不是一件容易的事。

Mongodb作為一種NoSQL數(shù)據(jù)庫(kù)，非常適合存儲(chǔ)和管理非結(jié)構(gòu)化數(shù)據(jù)，例如互聯(lián)網(wǎng)上的各種文本數(shù)據(jù)。假如我們用Mongodb存儲(chǔ)了很多博客文章，那么如何快速找到所有關(guān)于“nodejs”這個(gè)主題的文章呢？Mongodb內(nèi)建的全文搜索可以幫助我們完成這個(gè)功能。下面話不多說了，來一起看看詳細(xì)的介紹：

在本篇博文中，將要介紹的是我使用Mongdb text search的一些經(jīng)驗(yàn)。

Mongodb text search是什么？

Mongodb text search是Mongodb對(duì)數(shù)據(jù)庫(kù)進(jìn)行搜索的功能模塊，類似于數(shù)據(jù)庫(kù)內(nèi)建的搜索引擎。有些人可能會(huì)疑問，查數(shù)據(jù)庫(kù)為什么還需要搜索引擎？直接用條件查詢不就得了。例如在前面的文章主題搜索中，我們不可能事先提取出每篇文章的主題，然后用專門的字段存儲(chǔ)，因此沒辦法進(jìn)行條件查詢。并且同一個(gè)主題詞，有多種不同的表達(dá)方式，例如”node”、”nodejs”可視為同一個(gè)主題。

Mongodb text search可以自動(dòng)地對(duì)大段的文本數(shù)據(jù)進(jìn)行分詞處理、模糊匹配、同義詞匹配，解決文本搜索的問題。

建立文本索引

要使Mongodb能夠進(jìn)行全文搜索，首先要對(duì)搜索的字段建立文本索引。建立文本索引的關(guān)鍵字是text，我們既可以建立單個(gè)字段的文本索引，也可以建立包含多個(gè)字段的復(fù)合文本索引。需要注意的是，每個(gè)collection只能建立一個(gè)文本索引，且只能對(duì)String或String數(shù)組的字段建立文本索引。

我們可以通過以下命令，建立一個(gè)文本索引：

db.collection.createIndex({ subject: "text", content: "text" })

在mongoose中我們可以通過以下代碼，創(chuàng)建文本索引：

schema.index({ subject: "text", content: "text" })

需要注意的是：由于每個(gè)collection只支持一個(gè)文本索引，所以當(dāng)你需要在schema中添加或刪除文本索引字段時(shí)，往往不起作用。這時(shí)候你需要到數(shù)據(jù)庫(kù)中，手動(dòng)刪除已經(jīng)建立的文本索引。

文本搜索示例

文本搜索的語(yǔ)法為：

{
 $text:
  {
   $search: string>,
   $language: string>,
   $caseSensitive: boolean>,
   $diacriticSensitive: boolean>
  }
}

在mongoose中，我們可以通過以下語(yǔ)句進(jìn)行文本搜索：

var query = model.find({ $text: { $search: "hello world" } })

$search后面的關(guān)鍵詞可以有多個(gè)，關(guān)鍵詞之間的分隔符可以是多種字符，例如空格、下劃線、逗號(hào)、加號(hào)等，但不能是-和\"，因?yàn)檫@兩個(gè)符號(hào)會(huì)有其他用途。搜索的多個(gè)關(guān)鍵字是or的關(guān)系，除非你的關(guān)鍵字包含-。例如hello world會(huì)包含所有匹配hello或world的文本，而hello -world只會(huì)匹配包含hello且不包含world的文本。

$language指示搜索的語(yǔ)言類型，在最新的Mongodb 3.2 enterprise版本中，已經(jīng)增加了對(duì)中文文本的搜索。

$caseSensitive設(shè)置是否區(qū)分大小寫。

$diacriticSensitive設(shè)置是否區(qū)別發(fā)音符號(hào)，CAFÉ于Café是同一語(yǔ)義，只是重音不一樣。

我們還可以對(duì)搜索的結(jié)果按匹配度進(jìn)行排序：

db.posts.find(
  { $text: { $search: "hello world" } },
  { score: { $meta: "textScore" } }
).sort( { score: { $meta: "textScore" } } )

注意事項(xiàng)

Mongodb建立文本索引時(shí)，會(huì)對(duì)提取所有文本的關(guān)鍵字建立索引，因而會(huì)造成一定的性能問題。所以對(duì)于結(jié)構(gòu)化的字段，建議用普通的關(guān)系查詢，如果需要對(duì)大段的文本進(jìn)行搜索，才考慮用全文搜索。

總結(jié)

以上就是這篇文章的全部?jī)?nèi)容了，希望本文的內(nèi)容對(duì)大家的學(xué)習(xí)或者工作能帶來一定的幫助，如果有疑問大家可以留言交流，謝謝大家對(duì)腳本之家的支持

您可能感興趣的文章:

MongoDB 使用Skip和limit分頁(yè)
利用node.js+mongodb如何搭建一個(gè)簡(jiǎn)單登錄注冊(cè)的功能詳解
mac下安裝和配置mongodb的步驟詳解
Windows下MongoDb簡(jiǎn)單配置教程
在Linux服務(wù)器中配置mongodb環(huán)境的步驟
Mongodb實(shí)現(xiàn)的關(guān)聯(lián)表查詢功能【population方法】
MongoDB 中Limit與Skip的使用方法詳解

標(biāo)簽：遼陽(yáng) 興安盟廈門泰安自貢無錫雞西玉林

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《Mongodb實(shí)戰(zhàn)之全文搜索功能》，本文關(guān)鍵詞 Mongodb,實(shí)戰(zhàn),之,全文,搜索,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。