[pCTR]廣告點(diǎn)擊率預(yù)測(cè) [離線部分]


騰訊在Spark上的應(yīng)用與實(shí)踐優(yōu)化圖文百度文庫(kù)
http://wenku.baidu.com/link?url=8J5hg6ASRnyNfJSsALxKKt1QaKO7oHVwRO8sCGDbyYdPHGDl-oj4xydKsy83F_uTtNIeR4WJPcMgCz3QT9Ky1T-Noej0_mk2-jAtbA0pDlS

Case 1:預(yù)測(cè)用戶的廣告點(diǎn)擊概率.png
Paste_Image.png

搜索廣告那點(diǎn)事兒:為什么要預(yù)估點(diǎn)擊率 - 百科教程網(wǎng)_經(jīng)驗(yàn)分享平臺(tái)[上學(xué)吧經(jīng)驗(yàn)教程頻道]
http://www.shangxueba.com/jingyan/750069.html
背景
想到這個(gè)題目是因?yàn)?@lijiefei 某天跟我說(shuō)他有師弟面淘寶時(shí)被問(wèn)到 "點(diǎn)擊率預(yù)估的目標(biāo)到底是什么", 笨狗當(dāng)時(shí)胡亂扯了一通, 發(fā)現(xiàn)要把這個(gè)似乎已經(jīng)是真理的事情掰清楚還沒(méi)那么容易, 于是有此念想寫(xiě)文一篇詳細(xì)分析下原因

我和 jiefei 認(rèn)識(shí)是在百度做搜索廣告的時(shí)候, 那就從搜索廣告開(kāi)始說(shuō)為什么要預(yù)估點(diǎn)擊率, 以及預(yù)估點(diǎn)擊率的目標(biāo). 先申明一些名詞和假定: 1) 每個(gè)廣告 (Ad) 有一個(gè)出價(jià) (Bid), 并有其在某情形下實(shí)際的點(diǎn)擊率 (Click-Through-Rate, CTR) 2) 廣告按點(diǎn)擊收費(fèi) (Charge per Click, CPC), 下面我們會(huì)分別討論一價(jià)計(jì)費(fèi) (First-Price, FP, 即廣告出價(jià)多少則一次點(diǎn)擊計(jì)費(fèi)多少) 和二價(jià)計(jì)費(fèi) (Second-Price, SP, 即廣告按下一位出價(jià)來(lái)支付點(diǎn)擊價(jià)格, 更普遍的是 GSP) 3) 千次展現(xiàn)收費(fèi) (Cost Per Mille, CPM, 或 RPM, R for Revenue), 即對(duì)點(diǎn)擊付費(fèi)廣告其展示一千次情況下的收入 (一價(jià)計(jì)費(fèi)下等價(jià)于 1000CTRBid), 或是展示廣告的千次展現(xiàn)固定價(jià)格 4) 預(yù)估點(diǎn)擊率 (predict CTR, pCTR) 是指對(duì)某個(gè)廣告將要在某個(gè)情形下展現(xiàn)前, 系統(tǒng)預(yù)估其可能的點(diǎn)擊概率

目標(biāo)分類(lèi)
搜索廣告跟自然結(jié)果一個(gè)很大的區(qū)別就是自然結(jié)果只要有一點(diǎn)相關(guān)就應(yīng)該放到所有結(jié)果里去, 至于先后位置那個(gè)再說(shuō), 而廣告, 是有個(gè)相關(guān)性的準(zhǔn)入門(mén)檻的, 不相關(guān)的廣告出價(jià)再高, 丟出來(lái)還是會(huì)被罵死. 那怎么判斷相關(guān)? 用戶會(huì)用鼠標(biāo)點(diǎn)擊來(lái)對(duì)結(jié)果投票, 相關(guān)的廣告會(huì)被點(diǎn)擊, 不相關(guān)的廣告不會(huì)被點(diǎn)擊, 那很自然就能得出 "點(diǎn)擊率和相關(guān)性正相關(guān)" 這個(gè)結(jié)論 (至于描述里寫(xiě) "二十五歲以下免進(jìn)" 但實(shí)際是鋼材廣告的這種誘騙行為后面再說(shuō)怎么處理). 那對(duì)于這種相關(guān)性準(zhǔn)入的場(chǎng)景, 預(yù)估點(diǎn)擊率就是預(yù)估廣告是否相關(guān), 最樸素情況下這是個(gè)二分類(lèi)問(wèn)題, 那不管預(yù)估成怎樣, 只要有一種分割方法能分開(kāi)是否相關(guān)就行了. 此時(shí)預(yù)估點(diǎn)擊率的目標(biāo)是能對(duì)廣告按相關(guān)與否分類(lèi) (或說(shuō)按相關(guān)性排序并給出一個(gè)截?cái)嘀?. 評(píng)估分類(lèi)問(wèn)題好壞, 一般都是看準(zhǔn)確和召回兩個(gè)指標(biāo), 用人工打分的記錄來(lái)做回歸驗(yàn)證就行

總結(jié)

  1. 點(diǎn)擊率預(yù)估是為產(chǎn)品的最終目標(biāo)服務(wù)的, 最終目標(biāo)可以是廣告的收入, 廣告的相關(guān)性, 推薦的接受率等, 看具體場(chǎng)景 2) 點(diǎn)擊率預(yù)估的直接目標(biāo)根據(jù)需求場(chǎng)景不同, 分別是保證預(yù)估值和實(shí)際值分類(lèi)正確, 預(yù)估序和實(shí)際序正確, 預(yù)估值和實(shí)際值是等比縮放的, 預(yù)估值等于實(shí)際值 3) 要保證離線評(píng)估點(diǎn)擊率預(yù)估的效果, 分別可用分類(lèi)的準(zhǔn)確率和召回率, 排序的 AUC, 帶權(quán)排序的 wAUC, 相似度 MAE/MSE 來(lái)評(píng)估
    (原文:http://www.yewen.us/blog/2013/05/why-predict-ctr/

廣告點(diǎn)擊率預(yù)測(cè) [離線部分] - quweiprotoss的日志 - 網(wǎng)易博客
http://quweiprotoss.blog.163.com/blog/static/4088288320144810567471?utm_source=tuicool&utm_medium=referral
廣告點(diǎn)擊率預(yù)測(cè)(pCTR Predict Click-Through Rate)是廣告算法中最核心的技術(shù)了。pCTR要解決的問(wèn)題是預(yù)測(cè)特定用戶在特定廣告位對(duì)特定廣告當(dāng)特定環(huán)境下的點(diǎn)擊概率。為什么pCTR如此重要,因?yàn)閺V告排序的核心是eCPM = pCTR * CPC,CPC是廣告主對(duì)點(diǎn)擊的出價(jià),是個(gè)已知量,所以只有一個(gè)pCTR變量。當(dāng)然在實(shí)際中不可能是如此簡(jiǎn)單的排序公式,比如還有質(zhì)量得分(Quality Score),比如Google的質(zhì)量得分因素。
pCTR一般是從離線數(shù)據(jù)中學(xué)習(xí)得到的,離線數(shù)據(jù)是保存到類(lèi)似Hive的分布式數(shù)據(jù)庫(kù)中,通過(guò)機(jī)器學(xué)習(xí)的算法將Hive中的數(shù)據(jù)進(jìn)行分析,得到一個(gè)pCTR模型,這個(gè)模型就可以預(yù)測(cè)pCTR了,大致流程就是這樣。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容