HI 您好,歡迎來到巨人電商全國服務(wù)總部!
關(guān)注巨人電商微信客服
一鍵登錄我的賬戶,隨時查看您當前位置 : 首頁 電商百科 為什么今日頭條們,總知道你喜歡看什么?
現(xiàn)在有很多像今日頭條、輕芒閱讀這樣為你個性推薦資訊的 app,為什么同樣是個性推薦,它們卻有著不同的風格?今天分享的這篇文章,從 3 個方面為你簡單介紹,app 是如何為你推薦個性化資訊的。
不了解今日頭條是怎么運作的。不過因為在 Facebook 工作時負責新鮮事(Newsfeed)的個性化推薦與排序,我可以說說 Facebook 是怎么衡量自己推薦和排序的質(zhì)量的。
在具體執(zhí)行層面,主要有 3 個方式,分別是從機器學習模型、產(chǎn)品數(shù)據(jù),和用戶調(diào)查上來考核推薦引擎的效果。
1. 機器學習模型推薦引擎的一大核心就是機器學習(不過現(xiàn)在都說人工智能了,但本質(zhì)上還是 supervised learning)。如果是想考察機器學習模型的質(zhì)量,學術(shù)上早就有一套成熟的實踐方法。
無論是模型的選擇(比如從 decision tree 替換成 neural network),還是迭代改進(比如模型訓練時多用一倍的數(shù)據(jù)),都可以使用基于 supervised learning 的衡量辦法。最常見的就是 AUC。
另一方面,對于某一類特定問題也有更細致的指標。比如說,可以通過模型特征的重要性(feature importance)知道新加的特征是不是有用。
2. 產(chǎn)品數(shù)據(jù)再牛逼的機器學習模型都要經(jīng)歷產(chǎn)品數(shù)據(jù)的實際檢驗。這方面大家就都比較熟悉了,KPI 嘛。不過在 Facebook 特別是 Newsfeed 這種牽一發(fā)動全身的地方,我們會追蹤一系列數(shù)據(jù)來描述產(chǎn)品,而不是依賴某一個單一標準。
這些數(shù)據(jù)包括但不限于:
而且,在日常的快速迭代和 A/B 測試中,只有這些籠統(tǒng)的數(shù)據(jù)是不夠的,我們還需要些更細致的數(shù)據(jù)來真正理解我們的一些改動。比如說:
另外,為了防止短暫的眼球效應(yīng),對每一個重要的產(chǎn)品決策,我們都會維護一個長期的 backtest,用來評估這個決策的長久影響。比如說:
這樣,對每一個可能會有爭議的決策,但未來的每個時間點,我們都能清楚地知道,我們是面臨著怎樣的取舍。有了這層保障,在決策的當下,我們也就敢于冒險些,走得更快些。
3. 用戶調(diào)查大多數(shù)產(chǎn)品數(shù)據(jù)有其局限性,因為它們是顯性而被動的。比如說,你給用戶推送了一個博眼球的低俗內(nèi)容,用戶在當下可能是會去點開看的,所以數(shù)據(jù)上是好的。
但用戶可能心里對這個內(nèi)容的評價是低的,連帶著對作為內(nèi)容平臺的產(chǎn)品也會看輕,長此以往對產(chǎn)品的傷害是巨大的。
KPI 無法完全描述產(chǎn)品質(zhì)量,在硅谷互聯(lián)網(wǎng)圈是有共識的,但如何解決,每個公司答案都不同。
Twitter 系的 CEO 們,無論是 Jack Dorsey 還是 Evan Williams,都傾向于輕視 KPI 而依賴自己主觀想法來決策。
Google 和 Facebook,則采取了另一條路,他們決定把用戶評價納入到 KPI 中。
Google 在這方面的工作開始得比較早,因此公開的資料也比較多。概括地說,他們雇傭大量的普通人,以用戶的角度來對 Google 搜索排序的質(zhì)量和廣告推薦的質(zhì)量做主觀打分。
當打分的量大到一定程度,這些數(shù)據(jù)就足以成為一個穩(wěn)定有效的,且可持續(xù)追蹤并改進的 KPI 了。Facebook 雖然產(chǎn)品領(lǐng)域有所不同,但在個性化推薦上也采取了類似的方法。
回答的最后,還是想重申兩個方法論:
上一篇: 上一篇:抖音認證后還會被封號嗎 抖音藍V認證后封號的原因
下一篇: 下一篇:抖音粉絲有什么用,抖音粉絲多有什么好處