移動(dòng)互聯(lián)網(wǎng)的興起讓我們能夠更加簡單和便利地獲取信息,但更多的選擇也帶來更多的困擾??面對這些層出不窮的信息和辦事帶來的困擾,個(gè)性化保舉技術(shù)迅速崛起。達(dá)不雅觀數(shù)據(jù)在這方面做了很多提升保舉質(zhì)量、保舉效率和系統(tǒng)可靠性的工作,并為企業(yè)客戶提供了包孕私有化安排、SaaS等靈活的接入方式。目前,達(dá)不雅觀數(shù)據(jù)個(gè)性化保舉引擎已經(jīng)辦事幾百家企業(yè),對改善用戶體驗(yàn)、增加用戶停留時(shí)長和粘性、提高用戶轉(zhuǎn)化都有顯著的效果。
互聯(lián)網(wǎng)越發(fā)展,越需要個(gè)性化保舉
隨著互聯(lián)網(wǎng)時(shí)代的到來,新聞資訊行業(yè)中,有三大核心特點(diǎn)日漸突出。
一是資訊更新極其頻繁且層出不窮,全國各地乃至全球,每時(shí)每刻都在產(chǎn)生八門五花、包含萬象的資訊,諸如娛樂八卦、國內(nèi)國際民生、前沿技術(shù)解讀、行業(yè)動(dòng)態(tài)等等。不但種類繁多,并且數(shù)量極大。日積月累,數(shù)據(jù)量更是到了令人咋舌的地步。
二是用戶群體十分龐大,移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來,讓人們史無前例的感受到了獲取信息是是如此的簡單快捷。手指一觸,便能打開信息的大門。用戶瀏覽新聞資訊時(shí),用戶行為也多種多樣,包孕點(diǎn)擊、深度閱讀、轉(zhuǎn)發(fā)、評論、點(diǎn)贊、不喜歡、保藏等。
三是用戶興趣變革也很劇烈,用戶閱讀口味隨著一天傍邊時(shí)間段的差別、表情的差異,對新聞資訊也有明顯的閱讀便好。所以在新聞資訊的業(yè)務(wù)場景中,信息過載和物品長尾的問題尤其嚴(yán)重。
當(dāng)個(gè)人所接受的信息超過了個(gè)人所能有效處理的范圍,會(huì)導(dǎo)致無所適從,這種現(xiàn)象稱為“信息過載”;同時(shí),如此多樣豐富的信息中,大部分是冷門信息,沒有曝光的機(jī)會(huì),,這就是物品的“長尾問題”。對于處于移動(dòng)互聯(lián)網(wǎng)的今天,這兩個(gè)問題異常突出。在大量的實(shí)踐中發(fā)現(xiàn),個(gè)性化保舉能夠有效解決上述兩個(gè)問題。在 新聞資訊行業(yè)中,個(gè)性化保舉引擎不但隨處可見,并且個(gè)性化保舉的內(nèi)容被放置在非常醒目的流量入口位置。這和新聞資訊的實(shí)際業(yè)務(wù)場景密不成分。
新聞資訊中的個(gè)性化保舉是按照用戶的歷史行為數(shù)據(jù)進(jìn)行深層興趣點(diǎn)挖掘,讓每一個(gè)用戶都感覺到有一個(gè)私人的貼身管家在照顧本身,從大量的新聞資訊中找出本身最感興趣的保舉給他。這樣的話,不但滿足了用戶素質(zhì)的信息訴求,改善了用戶體驗(yàn),顯著提升了用戶粘性和停留時(shí)長。同時(shí)大量的新聞資訊也有了曝光的機(jī)會(huì),找到本身的受眾群體,制止了流量的浪費(fèi)。最終對于企業(yè)而言,也最大化了自身利益。
達(dá)不雅觀數(shù)據(jù)個(gè)性化保舉技術(shù)實(shí)現(xiàn)
如安在海量數(shù)據(jù)中挖掘用戶的興趣偏好、如何保證保舉結(jié)果的精準(zhǔn)性、如何快速準(zhǔn)確的響應(yīng)用戶興趣的變革?這些對于企業(yè)都是巨大的挑戰(zhàn)。達(dá)不雅觀數(shù)據(jù)在這方面做了很多提升保舉質(zhì)量、保舉效率和系統(tǒng)可靠性的工作,下面結(jié)合我們的實(shí)踐做一些介紹。
在新聞資訊行業(yè)中,如何進(jìn)行精準(zhǔn)個(gè)性化保舉呢?首先從新聞資訊信息說起。新聞資訊自身有很多豐富的信息,一般包孕標(biāo)題、分類、標(biāo)簽、發(fā)布時(shí)間、作者、是否原創(chuàng)、字?jǐn)?shù)等信息。同時(shí)結(jié)合用戶歷史行為數(shù)據(jù),可以生成“動(dòng)態(tài)信息”以評估文章自己的質(zhì)量或者熱門程度。這些動(dòng)態(tài)信息可以是全局的,也可以是細(xì)分維度的,好比基于一段時(shí)間的用戶點(diǎn)擊行為得到新聞資訊的點(diǎn)擊次數(shù),從高得到低排序得到點(diǎn)擊維度上的熱門排行榜。當(dāng)然,如果將用戶的各種行為進(jìn)行加權(quán)計(jì)算處理,可以得到新聞資訊的全局熱門榜單。同時(shí),也可以動(dòng)態(tài)生成每篇資訊的點(diǎn)擊數(shù)、分享數(shù)、保藏?cái)?shù)、點(diǎn)贊數(shù)等用以生成資訊畫像,用于后續(xù)的保舉算法中。
快速解決冷啟動(dòng)問題
當(dāng)一個(gè)用戶到來時(shí),如果這個(gè)用戶之前沒有任何行為數(shù)據(jù),這時(shí)的保舉就要面臨用戶“冷啟動(dòng)”問題。解決方法也有很多,首先可以考慮基于用戶的人口統(tǒng)計(jì)學(xué)信息進(jìn)行保舉,包孕性別、地域、職業(yè)、婚否等,好比上海的話保舉一些上海的新聞資訊、男生保舉一些體育資訊、職業(yè)是互聯(lián)網(wǎng)行業(yè)的話保舉一些科技資訊等。其次可以引導(dǎo)用戶選擇本身的興趣標(biāo)簽和分類,好比對娛樂感興趣的話可以保舉一些明星八卦。當(dāng)然還可以在新用戶啟動(dòng)時(shí),保舉各種各樣的高質(zhì)量新聞資訊,讓用戶用本身的手進(jìn)行投票,然后實(shí)時(shí)更新保舉結(jié)果迎合用戶的閱讀興趣。