主頁 > 知識庫 > 搜索引擎的分詞技術(shù)的簡單測試

搜索引擎的分詞技術(shù)的簡單測試

熱門標(biāo)簽:自動語音電話機(jī)器人 廣州400電話號辦理 外呼手機(jī)卡和線路卡哪個好用 新鄉(xiāng)智能外呼系統(tǒng)好處 宿遷手機(jī)外呼系統(tǒng)排名 西寧人工智能電銷機(jī)器人 廊坊外呼系統(tǒng)平臺 濟(jì)源防封號電銷機(jī)器人銷售 百度地圖標(biāo)注錯誤修改

第一個問題就是百度最近算法調(diào)整的影響,讓很多朋友都沒有了頭緒。其實這次最大的調(diào)整在分詞上,很多朋友也都注意到了。就像前幾天說的,原來大家只要把干詞做好,周圍輔助做好長尾詞就OK了,不管你用什么詞搜,排名就像百度競價一樣牢牢不可動搖.

因為種種原因,已經(jīng)有很長時間沒有發(fā)過東西了。天刃今天抽時間,把大家最近反應(yīng)最多的問題整理下,和大家聊聊。

第一個問題就是百度最近算法調(diào)整的影響,讓很多朋友都沒有了頭緒。其實這次最大的調(diào)整在分詞上,很多朋友也都注意到了。就像前幾天說的,原來大家只要把干詞做好,周圍輔助做好長尾詞就OK了,不管你用什么詞搜,排名就像百度競價一樣牢牢不可動搖。但是貌似這次百度算法調(diào)整后就不是這么回事了,你做的主詞還一樣可以排好,但那些長尾詞卻很少可以搜到了……

那么這次的分詞算法改在哪兒呢?天刃就拿最基本的TITLE撰寫來給大家說明一下。百度31漢字的TITLE里,相信SEOER們都會充分利用的。朋友們都知道,在TITLE里將關(guān)鍵詞隔開我們常會用到英文半角的逗號,或是“|”來區(qū)分,而百度這次分詞算法調(diào)整之后,雖然還是會把這些認(rèn)為是分隔符,但用法已經(jīng)沒有原來那么規(guī)范了。原因很簡單,百度對它的分詞越來越自信,已經(jīng)慢慢放棄或減輕對傳統(tǒng)分隔符的依賴了。

現(xiàn)在的百度,可以很容易的識別整個句子中的特定分詞,而刻意的將我們想要的關(guān)鍵詞用分隔符進(jìn)行強(qiáng)調(diào)有的時候收到的效果是相反的,一個很明顯的現(xiàn)象就是,你的TITLE里將你想要的各個關(guān)鍵詞用分隔符清清楚楚的列出來,但最后你在搜索結(jié)果看到的情況卻是:明明這個句子里很明顯的有這個分詞(兩個分開的關(guān)鍵詞),但卻沒有給你加紅。也就是說百度根本沒有認(rèn)出你這個句子里的關(guān)鍵詞。

這是怎么回事呢?不是百度分詞技術(shù)垃圾,而是百度放棄了這個句子。(說到這里可能朋友們有些暈了,那我就簡單的舉個例子。關(guān)鍵詞“AAABBB”其中“AAA”“BBB”分別是百度分詞庫里的獨立關(guān)鍵詞,而這個時候,你的TITLE這樣寫:“AAA長尾BBB長尾,AAABBB長尾”,結(jié)果你搜索“AAABBB”時,百度的搜索結(jié)果里有時竟是:“AAA長尾BBB長尾,AAABBB長尾”,前面句子里的AAA和BBB并沒有被百度認(rèn)為是關(guān)鍵詞。)

當(dāng)然,百度并沒有自大到否認(rèn)一切分隔符,而是根據(jù)中文的使用習(xí)慣對不符合中文撰寫習(xí)慣的作法進(jìn)行淘汰?;蛘咭部梢詮牧硪粋€角度去理解,百度這個更改有針對SEO的原因,一個中英文混寫的TITLE,避免不了優(yōu)化的嫌疑。(也就是很多SEOER朋友開玩笑時說的,百度有的時候允許你作弊,但也不會允許你優(yōu)化)

那么,現(xiàn)在我們該如何來撰寫TITLE呢?天刃通過最近一段時間的琢磨,TITLE的撰寫,我們要放棄原來為了給僅有的31個漢字節(jié)省字符來刻意使用英文符號的作法,這種作法雖還沒有完全被百度擯棄,但這個趨勢朋友們應(yīng)該可以看的出來。“英文半角逗號,英文中間杠(占半個字符)”,這些符號可以換成中文的符號,哪怕?lián)p失了放長尾詞的字符也是值得的。“|”這個分隔符現(xiàn)在 已經(jīng)介乎字符與分隔符之間了,所以這個符號現(xiàn)在應(yīng)該完全的淘汰了。難道我們以后TITLE的分隔符就沒有合適的了嗎?當(dāng)然不是。通過對百度自身產(chǎn)品以及新浪的觀察,現(xiàn)在最合適的分隔符是只占半個字符的“_”下杠,以后大家可以試著考慮用下這個。當(dāng)然,必須要照顧中文句子的語法。

關(guān)于分詞,這里就說下TITLE的撰寫,其他的就不一一細(xì)說了。TITLE的分詞算法絕對不適用用其他元素,這點大家不要混淆。

標(biāo)簽:合肥 廣東 江西 ???/a> 黑龍江 駐馬店 定州 韶關(guān)

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《搜索引擎的分詞技術(shù)的簡單測試》,本文關(guān)鍵詞  搜索引擎,的,分詞技術(shù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《搜索引擎的分詞技術(shù)的簡單測試》相關(guān)的同類信息!
  • 本頁收集關(guān)于搜索引擎的分詞技術(shù)的簡單測試的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章