主頁(yè) > 知識(shí)庫(kù) > MongoDB實(shí)現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)

MongoDB實(shí)現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)

熱門標(biāo)簽:機(jī)器人外呼系統(tǒng)軟件存在問(wèn)題 智能電銷機(jī)器人銷售話術(shù) 福州電銷機(jī)器人源代碼 兗州電話外呼營(yíng)銷系統(tǒng) 南京400電話怎樣辦理 徐州ai電銷機(jī)器人原理 沈陽(yáng)營(yíng)銷電銷機(jī)器人招商 企業(yè)智能外呼系統(tǒng)價(jià)格多少 高德地圖標(biāo)注商戶位置

我的實(shí)現(xiàn)目標(biāo)是:

可以通過(guò)一個(gè)或多個(gè)關(guān)鍵詞搜索到文章。

可以通過(guò)文章的關(guān)鍵詞列表查詢到其相關(guān)文章。

查詢到的結(jié)果依據(jù)相關(guān)程度降序排列。

查詢速度要夠快。(理論上關(guān)鍵詞檢索比全文檢索要快很多的)

在網(wǎng)上找了一大圈,就沒(méi)有一個(gè)靠譜的方法,基本都是只能傳入單詞來(lái)檢索,而且基本都沒(méi)有提供C#驅(qū)動(dòng)版本的代碼,于是乎自己研究出了這個(gè)實(shí)現(xiàn)方案:

首先要求使用標(biāo)簽、分詞、關(guān)鍵詞提取組件對(duì)文章對(duì)應(yīng)的關(guān)鍵詞進(jìn)行提取,然后作為數(shù)組格式,存入文章的Keywords字段中。

核心檢索代碼:

/// summary>
/// 根據(jù)關(guān)鍵詞獲取文章編號(hào)與標(biāo)題映射。
/// 注意:此方法會(huì)返回最為匹配的若干個(gè)項(xiàng)目,并根據(jù)匹配程度降序排列,即使是沒(méi)有任何關(guān)鍵詞匹配項(xiàng),也會(huì)返回若干個(gè)結(jié)果的。
/// 另需注意:如果是根據(jù)文章關(guān)鍵詞來(lái)查詢,一般來(lái)說(shuō)其中一定包含原文章,所以應(yīng)該把期望獲得的數(shù)量加1,并在結(jié)果中移除原文。
/// /summary>
/// param name="limitNum">數(shù)量上限/param>
/// param name="keywords">關(guān)鍵詞集合/param>
/// returns>文章編號(hào)與標(biāo)題映射字典/returns>
public async TaskDictionaryGuid, string>> GetArticleDicByKeywordsAsync(int limitNum, IEnumerablestring> keywords)
{
var list =
await
Database.GetCollectionDomain.Entity.Article>("Article").Aggregate()
.Match(q => !q.IsDeleted  q.Keywords != null)
.Project(q => new { q.Id, q.Title, Count = q.Keywords.Count(t => keywords.Contains(t)) })
.SortByDescending(q => q.Count)
.Limit(limitNum)
.ToListAsync();
return list.ToDictionary(f => f.Id, f => f.Title);
}

注意:這里一定要用Aggregate()方法做聚合,而不是常用的Find()方法做查詢,F(xiàn)ind()方法后面跟Project()方法也不會(huì)改變方法鏈中操作的對(duì)象類型,這樣后面的SortByDescending()方法的目標(biāo)對(duì)象還是Article類,而不是Project()方法中定義的匿名類,而SortByDescending()方法中傳入的表達(dá)式又僅允許用來(lái)選擇對(duì)象屬性,不允許進(jìn)行任何計(jì)算,所以就根本無(wú)法實(shí)現(xiàn)我們的需求,我在發(fā)現(xiàn)Aggregate()方法之前就在這里一直卡著很久~

用作關(guān)鍵詞搜索時(shí)一般就是把關(guān)鍵詞傳入就可以了,不過(guò)傳回的結(jié)果也有可能壓根沒(méi)有匹配到任何關(guān)鍵詞,所以最好在發(fā)給用戶前再檢查一遍項(xiàng)目的匹配程度,把沒(méi)有任何匹配的結(jié)果濾掉。

用作相關(guān)文章搜索時(shí),直接把原文章的Keywords屬性值傳入,獲取數(shù)量要比你預(yù)計(jì)的數(shù)量多1,因?yàn)榉浅?赡苣愕脑恼戮驮讷@取到的列表中,而且是前列,獲取后濾掉原文章的ID,再執(zhí)行Take方法返回你需要數(shù)量的項(xiàng)目即可(執(zhí)行Take方法是為了以防你的原文沒(méi)出現(xiàn)在列表中,這概率極小但也是有的)。

為了增進(jìn)查詢效率,還可以預(yù)設(shè)好索引,代碼如下:

var c=Database.GetCollectionDomain.Entity.Article>("Article");
c.Indexes.DropAll();
await c.Indexes.CreateOneAsync(
BuildersDomain.Entity.Article>.IndexKeys.Ascending(q => q.Keywords));
//參考自:http://mongodb.github.io/mongo-csharp-driver/2.2/reference/driver/admin/#creating-an-index

所使用的C#官方驅(qū)動(dòng)版本是:MongoDB.Driver.2.2.3

您可能感興趣的文章:
  • C#簡(jiǎn)單操作MongoDB的步驟全紀(jì)錄
  • C#中如何將MongoDB->RunCommand結(jié)果映射到業(yè)務(wù)類的方法總結(jié)
  • Mongodb在CSharp里實(shí)現(xiàn)Aggregate實(shí)例
  • C#中使用1.7版本驅(qū)動(dòng)操作MongoDB簡(jiǎn)單例子
  • MongoDB入門教程之C#驅(qū)動(dòng)操作實(shí)例
  • C# 對(duì)MongoDB 進(jìn)行增刪改查的簡(jiǎn)單操作實(shí)例
  • 關(guān)于C#生成MongoDB中ObjectId的實(shí)現(xiàn)方法
  • C#基于Mongo的官方驅(qū)動(dòng)手?jǐn)]一個(gè)Super簡(jiǎn)易版MongoDB-ORM框架

標(biāo)簽:景德鎮(zhèn) 大理 邯鄲 本溪 吉安 昭通 鶴崗 丹東

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《MongoDB實(shí)現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)》,本文關(guān)鍵詞  MongoDB,實(shí)現(xiàn),基于,關(guān)鍵詞,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《MongoDB實(shí)現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于MongoDB實(shí)現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章