小結(jié)
點(diǎn)擊率預(yù)估中往往存在點(diǎn)擊位置或者平臺(tái)的bias,一般來(lái)說(shuō),位置越靠前越可能被點(diǎn)擊。在pinterest中不同的平臺(tái)和位置在點(diǎn)擊率上全局來(lái)看就存在差異

點(diǎn)擊率
所以對(duì)點(diǎn)擊率進(jìn)行去偏是一個(gè)比較常見的做法。有一種方法就叫COEC。
COEC來(lái)源
《Comparing Click Logs and Editorial Labels for Training Query
Rewriting》
4.1節(jié)介紹了如何用Expected Clicks來(lái)對(duì)Clicks進(jìn)行標(biāo)準(zhǔn)化
具體做法如下:
- 統(tǒng)計(jì)每一個(gè)位置的全局點(diǎn)擊率
- 對(duì)于一個(gè)集合m,期望的點(diǎn)擊為
- COEC的值即為每一個(gè)位置上實(shí)際的點(diǎn)擊除以期望的點(diǎn)擊
=
COEC在Pinterest上的應(yīng)用
如最上方的圖所示,pinterest在不同的平臺(tái)和不同的位置全局點(diǎn)擊率是有偏的,所以他們采用了COEC。具體的公式為:
其中,
-
是不同平臺(tái)p和位置k的全局點(diǎn)擊率,
-
是pin_r在請(qǐng)求pin_q的不同平臺(tái)p和位置k下的曝光次數(shù)
不僅僅是點(diǎn)擊,對(duì)于其他的行為,比如保存、關(guān)閉等等,pinterest都進(jìn)行了類似的操作來(lái)標(biāo)準(zhǔn)化