午夜福利理论片高清在线观看,亚洲欧美va在线播放,在线无码观看

主頁 > 知識庫 > 深入剖析美團網(wǎng)站推薦算法的研發(fā)思路

深入剖析美團網(wǎng)站推薦算法的研發(fā)思路

前言
推薦系統(tǒng)并不是新鮮的事物，在很久之前就存在，但是推薦系統(tǒng)真正進入人們的視野，并且作為一個重要的模塊存在于各個互聯(lián)網(wǎng)公司，還是近幾年的事情。

隨著互聯(lián)網(wǎng)的深入發(fā)展，越來越多的信息在互聯(lián)網(wǎng)上傳播，產(chǎn)生了嚴(yán)重的信息過載。如果不采用一定的手段，用戶很難從如此多的信息流中找到對自己有價值的信息。

解決信息過載有幾種手段：一種是搜索，當(dāng)用戶有了明確的信息需求意圖后，將意圖轉(zhuǎn)換為幾個簡短的詞或者短語的組合（即query），然后將這些詞或短語組合提交到相應(yīng)的搜索引擎，再由搜索引擎在海量的信息庫中檢索出與query相關(guān)的信息返回給用戶；另外一種是推薦，很多時候用戶的意圖并不是很明確，或者很難用清晰的語義表達，有時甚至連用戶自己都不清楚自己的需求，這種情況下搜索就顯得捉襟見肘了。尤其是近些年來，隨著電子商務(wù)的興起，用戶并非一定是帶著明確的購買意圖去瀏覽，很多時候是去“逛”的，這種情景下解決信息過載，理解用戶意圖，為用戶推送個性化的結(jié)果，推薦系統(tǒng)便是一種比較好的選擇。

美團作為國內(nèi)發(fā)展較快的o2o網(wǎng)站，有著大量的用戶和豐富的用戶行為，這些為推薦系統(tǒng)的應(yīng)用和優(yōu)化提供了不可或缺的條件，接下來介紹美團在推薦系統(tǒng)的構(gòu)建和優(yōu)化過程中的一些做法，與大家共享。

框架

從框架的角度看，推薦系統(tǒng)基本可以分為數(shù)據(jù)層、觸發(fā)層、融合過濾層和排序?qū)?。?shù)據(jù)層包括數(shù)據(jù)生成和數(shù)據(jù)存儲，主要是利用各種數(shù)據(jù)處理工具對原始日志進行清洗，處理成格式化的數(shù)據(jù)，落地到不同類型的存儲系統(tǒng)中，供下游的算法和模型使用。候選集觸發(fā)層主要是從用戶的歷史行為、實時行為、地理位置等角度利用各種觸發(fā)策略產(chǎn)生推薦的候選集。候選集融合和過濾層有兩個功能，一是對出發(fā)層產(chǎn)生的不同候選集進行融合，提高推薦策略的覆蓋度和精度；另外還要承擔(dān)一定的過濾職責(zé)，從產(chǎn)品、運營的角度確定一些人工規(guī)則，過濾掉不符合條件的item。排序?qū)又饕抢脵C器學(xué)習(xí)的模型對觸發(fā)層篩選出來的候選集進行重排序。

同時，對與候選集觸發(fā)和重排序兩層而言，為了效果迭代是需要頻繁修改的兩層，因此需要支持ABtest。為了支持高效率的迭代，美團對候選集觸發(fā)和重排序兩層進行了解耦，這兩層的結(jié)果是正交的，因此可以分別進行對比試驗，不會相互影響。同時在每一層的內(nèi)部，美團會根據(jù)用戶將流量劃分為多份，支持多個策略同時在線對比。

數(shù)據(jù)應(yīng)用
數(shù)據(jù)乃算法、模型之本。美團作為一個交易平臺，同時具有快速增長的用戶量，因此產(chǎn)生了海量豐富的用戶行為數(shù)據(jù)。當(dāng)然，不同類型的數(shù)據(jù)的價值和反映的用戶意圖的強弱也有所不同。

用戶主動行為數(shù)據(jù)記錄了用戶在美團平臺上不同的環(huán)節(jié)的各種行為，這些行為一方面用于候選集觸發(fā)算法（在下一部分介紹）中的離線計算（主要是瀏覽、下單），另外一方面，這些行為代表的意圖的強弱不同，因此在訓(xùn)練重排序模型時可以針對不同的行為設(shè)定不同的回歸目標(biāo)值，以更細地刻畫用戶的行為強弱程度。此外，用戶對deal的這些行為還可以作為重排序模型的交叉特征，用于模型的離線訓(xùn)練和在線預(yù)測。
負反饋數(shù)據(jù)反映了當(dāng)前的結(jié)果可能在某些方面不能滿足用戶的需求，因此在后續(xù)的候選集觸發(fā)過程中需要考慮對特定的因素進行過濾或者降權(quán)，降低負面因素再次出現(xiàn)的幾率，提高用戶體驗；同時在重排序的模型訓(xùn)練中，負反饋數(shù)據(jù)可以作為不可多得的負例參與模型訓(xùn)練，這些負例要比那些展示后未點擊、未下單的樣本顯著的多。
用戶畫像是刻畫用戶屬性的基礎(chǔ)數(shù)據(jù)，其中有些是直接獲取的原始數(shù)據(jù)，有些是經(jīng)過挖掘的二次加工數(shù)據(jù)，這些屬性一方面可以用于候選集觸發(fā)過程中對deal進行加權(quán)或降權(quán)，另外一方面可以作為重排序模型中的用戶維度特征。
通過對UGC數(shù)據(jù)的挖掘可以提取出一些關(guān)鍵詞，然后使用這些關(guān)鍵詞給deal打標(biāo)簽，用于deal的個性化展示。

策略觸發(fā)
上文中美團提到了數(shù)據(jù)的重要性，但是數(shù)據(jù)的落腳點還是算法和模型。單純的數(shù)據(jù)只是一些字節(jié)的堆積，美團必須通過對數(shù)據(jù)的清洗去除數(shù)據(jù)中的噪聲，然后通過算法和模型學(xué)習(xí)其中的規(guī)律，才能將數(shù)據(jù)的價值最大化。在本節(jié)中，將介紹推薦候選集觸發(fā)過程中用到的相關(guān)算法。

##1. 協(xié)同過濾

提到推薦，就不得不說協(xié)同過濾，它幾乎在每一個推薦系統(tǒng)中都會用到。基本的算法非常簡單，但是要獲得更好的效果，往往需要根據(jù)具體的業(yè)務(wù)做一些差異化的處理。

清除作弊、刷單、代購等噪聲數(shù)據(jù)。這些數(shù)據(jù)的存在會嚴(yán)重影響算法的效果，因此要在第一步的數(shù)據(jù)清洗中就將這些數(shù)據(jù)剔除。
合理選取訓(xùn)練數(shù)據(jù)。選取的訓(xùn)練數(shù)據(jù)的時間窗口不宜過長，當(dāng)然也不能過短。具體的窗口期數(shù)值需要經(jīng)過多次的實驗來確定。同時可以考慮引入時間衰減，因為近期的用戶行為更能反映用戶接下來的行為動作。
user-based與item-based相結(jié)合。

嘗試不同的相似度計算方法。在實踐中，美團采用了一種稱作loglikelihood ratio[1]的相似度計算方法。在mahout中，loglikelihood ratio也作為一種相似度計算方法被采用。
下表表示了Event A和Event B之間的相互關(guān)系，其中：
k11 ：Event A和Event B共現(xiàn)的次數(shù)
k12 ：Event B發(fā)生，Event A未發(fā)生的次數(shù)
k21 ：Event A發(fā)生，Event B未發(fā)生的次數(shù)
k22 ：Event A和Event B都不發(fā)生的次數(shù)、

則logLikelihoodRatio=2 * (matrixEntropy - rowEntropy - columnEntropy)

其中
rowEntropy = entropy(k11, k12) + entropy(k21, k22)
columnEntropy = entropy(k11, k21) + entropy(k12, k22)
matrixEntropy = entropy(k11, k12, k21, k22)
(entropy為幾個元素組成的系統(tǒng)的香農(nóng)熵)

##2. location-based

對于移動設(shè)備而言，與PC端最大的區(qū)別之一是移動設(shè)備的位置是經(jīng)常發(fā)生變化的。不同的地理位置反映了不同的用戶場景，在具體的業(yè)務(wù)中可以充分利用用戶所處的地理位置。在推薦的候選集觸發(fā)中，美團也會根據(jù)用戶的實時地理位置、工作地、居住地等地理位置觸發(fā)相應(yīng)的策略。

根據(jù)用戶的歷史消費、歷史瀏覽等，挖掘出某一粒度的區(qū)域（比如商圈）內(nèi)的區(qū)域消費熱單和區(qū)域購買熱單

區(qū)域消費熱單

區(qū)域購買熱單

當(dāng)新的線上用戶請求到達時，根據(jù)用戶的幾個地理位置對相應(yīng)地理位置的區(qū)域消費熱單和區(qū)域購買熱單進行加權(quán)，最終得到一個推薦列表。
此外，還可以根據(jù)用戶出現(xiàn)的地理位置，采用協(xié)同過濾的方式計算用戶的相似度。

##3. query-based
搜索是一種強用戶意圖，比較明確的反應(yīng)了用戶的意愿，但是在很多情況下，因為各種各樣的原因，沒有形成最終的轉(zhuǎn)換。盡管如此，美團認為，這種情景還是代表了一定的用戶意愿，可以加以利用。具體做法如下：

對用戶過去一段時間的搜索無轉(zhuǎn)換行為進行挖掘，計算每一個用戶對不同query的權(quán)重。

計算每個query下不同deal的權(quán)重。

當(dāng)用戶再次請求時，根據(jù)用戶對不同query的權(quán)重及query下不同deal的權(quán)重進行加權(quán)，取出權(quán)重最大的TopN進行推薦。

##4. graph-based
對于協(xié)同過濾而言，user之間或者deal之間的圖距離是兩跳，對于更遠距離的關(guān)系則不能考慮在內(nèi)。而圖算法可以打破這一限制，將user與deal的關(guān)系視作一個二部圖，相互間的關(guān)系可以在圖上傳播。Simrank[2]是一種衡量對等實體相似度的圖算法。它的基本思想是，如果兩個實體與另外的相似實體有相關(guān)關(guān)系，那它們也是相似的，即相似性是可以傳播的。
Let s(A,B) denote the similarity between persons A and B, for A != B

Let s(c,d) denote the similarity between items c and d, for c != d

O(A),O(B): the set of out-neighbors for node A or node B
I(c),I(d): the set of in-neighbors for node c or node d

simrank的計算（采用矩陣迭代的方式）

計算得出相似度矩陣后，可以類似協(xié)同過濾用于線上推薦。

##5. 實時用戶行為
目前美團的業(yè)務(wù)會產(chǎn)生包括搜索、篩選、收藏、瀏覽、下單等豐富的用戶行為，這些是美團進行效果優(yōu)化的重要基礎(chǔ)。美團當(dāng)然希望每一個用戶行為流都能到達轉(zhuǎn)化的環(huán)節(jié)，但是事實上遠非這樣。

當(dāng)用戶產(chǎn)生了下單行為上游的某些行為時，會有相當(dāng)一部分因為各種原因使行為流沒有形成轉(zhuǎn)化。但是，用戶的這些上游行為對美團而言是非常重要的先驗知識。很多情況下，用戶當(dāng)時沒有轉(zhuǎn)化并不代表用戶對當(dāng)前的item不感興趣。當(dāng)用戶再次到達美團的推薦展位時，美團根據(jù)用戶之前產(chǎn)生的先驗行為理解并識別用戶的真正意圖，將符合用戶意圖的相關(guān)deal再次展現(xiàn)給用戶，引導(dǎo)用戶沿著行為流向下游行進，最終達到下單這個終極目標(biāo)。

目前引入的實時用戶行為包括：實時瀏覽、實時收藏。

##6. 替補策略
雖然美團有一系列基于用戶歷史行為的候選集觸發(fā)算法，但對于部分新用戶或者歷史行為不太豐富的用戶，上述算法觸發(fā)的候選集太小，因此需要使用一些替補策略進行填充。

熱銷單：在一定時間內(nèi)銷量最多的item，可以考慮時間衰減的影響等。
好評單：用戶產(chǎn)生的評價中，評分較高的item。
城市單：滿足基本的限定條件，在用戶的請求城市內(nèi)的。

子策略融合
為了結(jié)合不同觸發(fā)算法的優(yōu)點，同時提高候選集的多樣性和覆蓋率，需要將不同的觸發(fā)算法融合在一起。常見的融合的方法有以下幾種[3]：

加權(quán)型：最簡單的融合方法就是根據(jù)經(jīng)驗值對不同算法賦給不同的權(quán)重，對各個算法產(chǎn)生的候選集按照給定的權(quán)重進行加權(quán)，然后再按照權(quán)重排序。
分級型：優(yōu)先采用效果好的算法，當(dāng)產(chǎn)生的候選集大小不足以滿足目標(biāo)值時，再使用效果次好的算法，依此類推。
調(diào)制型：不同的算法按照不同的比例產(chǎn)生一定量的候選集，然后疊加產(chǎn)生最終總的候選集。
過濾型：當(dāng)前的算法對前一級算法產(chǎn)生的候選集進行過濾，依此類推，候選集被逐級過濾，最終產(chǎn)生一個小而精的候選集合。
目前美團使用的方法集成了調(diào)制和分級兩種融合方法，不同的算法根據(jù)歷史效果表現(xiàn)給定不同的候選集構(gòu)成比例，同時優(yōu)先采用效果好的算法觸發(fā)，如果候選集不夠大，再采用效果次之的算法觸發(fā)，依此類推。

候選集重排序
如上所述，對于不同算法觸發(fā)出來的候選集，只是根據(jù)算法的歷史效果決定算法產(chǎn)生的item的位置顯得有些簡單粗暴，同時，在每個算法的內(nèi)部，不同item的順序也只是簡單的由一個或者幾個因素決定，這些排序的方法只能用于第一步的初選過程，最終的排序結(jié)果需要借助機器學(xué)習(xí)的方法，使用相關(guān)的排序模型，綜合多方面的因素來確定。

##1. 模型
非線性模型能較好的捕捉特征中的非線性關(guān)系，但訓(xùn)練和預(yù)測的代價相對線性模型要高一些，這也導(dǎo)致了非線性模型的更新周期相對要長。反之，線性模型對特征的處理要求比較高，需要憑借領(lǐng)域知識和經(jīng)驗人工對特征做一些先期處理，但因為線性模型簡單，在訓(xùn)練和預(yù)測時效率較高。因此在更新周期上也可以做的更短，還可以結(jié)合業(yè)務(wù)做一些在線學(xué)習(xí)的嘗試。在美團的實踐中，非線性模型和線性模型都有應(yīng)用。

非線性模型
目前美團主要采用了非線性的樹模型Additive Groves[4]（簡稱AG），相對于線性模型，非線性模型可以更好的處理特征中的非線性關(guān)系，不必像線性模型那樣在特征處理和特征組合上花費比較大的精力。AG是一個加性模型，由很多個Grove組成，不同的Grove之間進行bagging得出最后的預(yù)測結(jié)果，由此可以減小過擬合的影響。

每一個Grove有多棵樹組成，在訓(xùn)練時每棵樹的擬合目標(biāo)為真實值與其他樹預(yù)測結(jié)果之和之間的殘差。當(dāng)達到給定數(shù)目的樹時，重新訓(xùn)練的樹會逐棵替代以前的樹。經(jīng)過多次迭代后，達到收斂。

線性模型
目前應(yīng)用比較多的線性模型非Logistic Regression莫屬了。為了能實時捕捉數(shù)據(jù)分布的變化，美團引入了online learning，接入實時數(shù)據(jù)流，使用google提出的FTRL[5]方法對模型進行在線更新。

主要的步驟如下：

在線寫特征向量到HBase
Storm解析實時點擊和下單日志流，改寫HBase中對應(yīng)特征向量的label
通過FTRL更新模型權(quán)重
將新的模型參數(shù)應(yīng)用于線上
##2. 數(shù)據(jù)

采樣：對于點擊率預(yù)估而言，正負樣本嚴(yán)重不均衡，所以需要對負例做一些采樣。
負例：正例一般是用戶產(chǎn)生點擊、下單等轉(zhuǎn)換行為的樣本，但是用戶沒有轉(zhuǎn)換行為的樣本是否就一定是負例呢？其實不然，很多展現(xiàn)其實用戶根本沒有看到，所以把這樣樣本視為負例是不合理的，也會影響模型的效果。比較常用的方法是skip-above，即用戶點擊的item位置以上的展現(xiàn)才可能視作負例。當(dāng)然，上面的負例都是隱式的負反饋數(shù)據(jù)，除此之外，美團還有用戶主動刪除的顯示負反饋數(shù)據(jù)，這些數(shù)據(jù)是高質(zhì)量的負例。
去噪：對于數(shù)據(jù)中混雜的刷單等類作弊行為的數(shù)據(jù)，要將其排除出訓(xùn)練數(shù)據(jù)，否則會直接影響模型的效果。
##3. 特征
在美團目前的重排序模型中，大概分為以下幾類特征：

deal(即團購單，下同)維度的特征：主要是deal本身的一些屬性，包括價格、折扣、銷量、評分、類別、點擊率等
user維度的特征：包括用戶等級、用戶的人口屬性、用戶的客戶端類型等
user、deal的交叉特征：包括用戶對deal的點擊、收藏、購買等
距離特征：包括用戶的實時地理位置、常去地理位置、工作地、居住地等與poi的距離
對于非線性模型，上述特征可以直接使用；而對于線性模型，則需要對特征值做一些分桶、歸一化等處理，使特征值成為0~1之間的連續(xù)值或01二值。

總結(jié)
以數(shù)據(jù)為基礎(chǔ)，用算法去雕琢，只有將二者有機結(jié)合，才會帶來效果的提升。對美團而言，以下兩個節(jié)點是美團優(yōu)化過程中的里程碑：

將候選集進行融合：提高了推薦的覆蓋度、多樣性和精度
引入重排序模型：解決了候選集增加以后deal之間排列順序的問題

以上是美團在實踐中的一點總結(jié)，當(dāng)然美團還有還多事情要做。we are still on the way!

注：
本文為美團推薦與個性化團隊集體智慧的結(jié)晶，感謝為此辛苦付出的每一個成員。同時，團隊長期招聘算法工程師與平臺研發(fā)工程師，感興趣的同學(xué)請聯(lián)系hr.tech@meituan.com，郵件標(biāo)題注明“應(yīng)聘推薦系統(tǒng)工程師”。

標(biāo)簽：包頭沈陽江蘇德宏臺灣伊春廊坊雅安

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《深入剖析美團網(wǎng)站推薦算法的研發(fā)思路》，本文關(guān)鍵詞深入,剖析,美團,網(wǎng)站,推薦,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。