POST TIME:2018-12-03 21:45
搜索誕生于互聯(lián)網(wǎng)早期時(shí)代,在漫長(zhǎng)的迭代演化中,搜索誕生了很多業(yè)界尺度功能。本篇文章會(huì)盤(pán)點(diǎn)搜索交互的尺度功能,同時(shí)也會(huì)介紹這些功能背后的邏輯。
前情提要一下,上一期介紹了搜索的基來(lái)源根基理:五分鐘了解搜索原理
搜索有系統(tǒng)詞庫(kù)和內(nèi)容索引兩大部分,其中系統(tǒng)詞庫(kù)可以快速關(guān)聯(lián)到內(nèi)容索引中,這是搜索的基礎(chǔ)。用戶進(jìn)行一次搜索查詢,之后會(huì)經(jīng)歷三個(gè)步驟:第一步,對(duì)用戶輸入信息的解讀:通過(guò)分詞,停用詞等處理方法,搜索系統(tǒng)首先把用戶的非尺度的輸入詞關(guān)聯(lián)到尺度的詞庫(kù);第二步,按照用戶輸入信息對(duì)內(nèi)容進(jìn)行篩選:并不是所有關(guān)聯(lián)到的內(nèi)容都會(huì)被篩選出來(lái),搜索系統(tǒng)需要綜合考慮準(zhǔn)確率和召回率,篩選出需要展示的內(nèi)容;第三步,對(duì)篩選后的結(jié)果進(jìn)行排序:搜索系統(tǒng)在考慮文本內(nèi)容相關(guān)度和各個(gè)內(nèi)容業(yè)務(wù)數(shù)據(jù)的表示之后,通過(guò)打分給出最終排序,呈現(xiàn)給用戶。這個(gè)綜合排序的原理,我們以基于Lucene的Solr系統(tǒng)進(jìn)行了解釋。
本期的搜索,PC端主要拔取了Bing搜索作為案例,同時(shí)也兼顧了一些大用戶量的移動(dòng)端的產(chǎn)品進(jìn)行了增補(bǔ)說(shuō)明。
那么,,搜索交互功能大盤(pán)點(diǎn)現(xiàn)在開(kāi)始:
1. 自動(dòng)補(bǔ)全自動(dòng)補(bǔ)全,就是用戶在輸入框敲字符時(shí)候,會(huì)彈出下拉列表提示候選詞給用戶,便利用戶輸入,提升用戶體驗(yàn)。一方面幫手用戶優(yōu)化搜索條件,一方面也能夠減少用戶的輸入錯(cuò)誤。自動(dòng)補(bǔ)全的素質(zhì)是按照用戶現(xiàn)有的輸入詞,去檢索當(dāng)?shù)卦~庫(kù)中的詞,同時(shí)根據(jù)查詢量凹凸進(jìn)行排序。
當(dāng)然,令人欣喜的是,之后也看到了一些自動(dòng)補(bǔ)全的變種,差別的搜索按照自身業(yè)務(wù),調(diào)整了自動(dòng)補(bǔ)全的展示。好比下圖某電商搜索,在自動(dòng)補(bǔ)全的基礎(chǔ)上,進(jìn)一步擴(kuò)展了篩選條件,減少用戶操作。
2. 歷史記錄使用Bing輸入“知識(shí)就是力量”之后,瀏覽器當(dāng)?shù)貢?huì)生存我的輸入記錄。下一次輸入“”知”的時(shí)候,差別于之前,搜索系統(tǒng)會(huì)在自動(dòng)補(bǔ)全的聯(lián)想詞之前,增加能夠匹配我歷史搜索的輸入詞。因?yàn)樗刭|(zhì)上,人在查找信息的時(shí)候,會(huì)存在多次查找相同內(nèi)容的需求。歷史記錄也是減少用戶輸入成本的有效手段。
3. 自動(dòng)糾錯(cuò)自動(dòng)糾錯(cuò),顧名思義,檢測(cè)到用戶輸入詞錯(cuò)誤,搜索系統(tǒng)會(huì)自動(dòng)糾正為正確的結(jié)果展示。這個(gè)是系統(tǒng)的容錯(cuò)性,減少了用戶輸入錯(cuò)誤或者自己記憶錯(cuò)誤(不知道某個(gè)字怎么寫(xiě),不知道單詞怎么拼)引起的問(wèn)題。
內(nèi)部機(jī)制為同義詞的判定。詞庫(kù)中存儲(chǔ)的詞不是孤立的,同時(shí)也有彼此之間的關(guān)聯(lián),這其中有關(guān)聯(lián)詞和同義詞展示。詞庫(kù)在不停的搜索查詢中,對(duì)于低搜索量高跳出的詞會(huì)不停歸并為高搜索量低跳出的詞的關(guān)聯(lián)詞甚至同義詞。
自動(dòng)糾錯(cuò)也分類(lèi)兩種類(lèi)型:一種是直接展示系統(tǒng)判定正確的結(jié)果;一種是展示判定正確的結(jié)果,但是頂部展示系統(tǒng)判定錯(cuò)誤入口。其實(shí)第二種更好一些,可以防止系統(tǒng)判定錯(cuò)誤,而不是直接褫奪用戶的選擇(Bing就屬于第二種)。
4. 高亮顯示對(duì)于搜索結(jié)果展示時(shí)候,需要對(duì)于用戶的搜索詞進(jìn)行高亮處理,主要是為了表白搜索的依據(jù),減少用戶選擇成本。內(nèi)部原理是展示輸入的原始文本和分詞。
移動(dòng)端如果搜索主體為文本內(nèi)容的話,大部分產(chǎn)品也是保存了這種機(jī)制。但是內(nèi)容主題非文本的搜索系統(tǒng)(商品,圖片),高亮并沒(méi)有太大意義。
5. 聯(lián)想保舉搜索的查詢一般而言是多次查詢的過(guò)程,在每次的查詢過(guò)程中用戶會(huì)不停的縮小范圍或者搜索相關(guān)內(nèi)容。實(shí)現(xiàn)機(jī)制是query的關(guān)聯(lián)性,保舉的邏輯也分為兩種:一種是關(guān)聯(lián)保舉 ,保舉相關(guān)的搜索詞;一種是擴(kuò)展保舉,因?yàn)橛脩羲阉鞯牟粔蚓唧w,會(huì)保舉該搜索詞更細(xì)的分類(lèi)。好比下圖右側(cè)的人物和事件:
在移動(dòng)時(shí)代手機(jī)屏幕資源比較緊張的情況下,一般不會(huì)直接列出來(lái)聯(lián)想保舉。但也有其他解決方案,好比在用戶有必然瀏覽深度的時(shí)候進(jìn)行聯(lián)想保舉。淘寶在15個(gè)商品之后會(huì)有搜索詞的擴(kuò)展保舉,如下圖所示:
7. 命中詞定制