本文為閱讀張任宇老師論文《Cold Start on Online Advertising Platforms: Data-Driven Algorithms and Field Experiments》的讀書(shū)筆記。據(jù)張老師分享,該方法目前被應(yīng)用到快手廣告線(xiàn)上冷啟動(dòng),取得了不錯(cuò)的收益。
問(wèn)題背景
信息流廣告冷啟動(dòng)面臨的核心技術(shù)問(wèn)題:
- 新廣告數(shù)據(jù)量不足,其價(jià)值難以準(zhǔn)確預(yù)估
- 合理分配廣告流量,平衡消耗與冷啟動(dòng)價(jià)值
優(yōu)化目標(biāo)
找到合適的廣告推送策略,最大化消耗與冷啟動(dòng)收益之和
符號(hào)說(shuō)明
廣告集合
轉(zhuǎn)化出價(jià)
表示廣告j是否被展現(xiàn)給用戶(hù)t=1,2,3,...,T
表示第t個(gè)用戶(hù)的特征i
在特征i下廣告j的實(shí)際點(diǎn)擊率
用戶(hù)t特征i下廣告j的預(yù)估點(diǎn)擊率
表示冷啟動(dòng)時(shí)單次轉(zhuǎn)化的價(jià)值(設(shè)為
)
冷啟動(dòng)成功的閾值(設(shè)為10)
問(wèn)題建模
其中第一項(xiàng)里面其實(shí)就是,也就是ecpm。
第二項(xiàng)是取當(dāng)前轉(zhuǎn)化數(shù)和冷啟動(dòng)閾值
的最小值,再乘以冷啟動(dòng)單個(gè)轉(zhuǎn)化價(jià)值
得到冷啟動(dòng)總價(jià)值。
約束條件:
第一個(gè)約束是說(shuō)一個(gè)廣告要么曝光要么沒(méi)曝光。
第二個(gè)約束是說(shuō)對(duì)于一個(gè)用戶(hù),假設(shè)所有廣告中總是只有小于等于一個(gè)廣告獲得展現(xiàn)。
對(duì)偶問(wèn)題推導(dǎo)
由于原問(wèn)題維數(shù)為T(mén)*K,即用戶(hù)數(shù)x廣告數(shù),維數(shù)太高不好求解,需要轉(zhuǎn)化到對(duì)偶空間。
先做一次線(xiàn)性化:
其中為廣告離冷啟動(dòng)閾值還差多少個(gè)轉(zhuǎn)化
為簡(jiǎn)化問(wèn)題,忽略其他約束,只考慮最后一個(gè)約束條件,寫(xiě)出其增廣拉格朗日公式
展開(kāi)得
化簡(jiǎn)得
按分類(lèi)討論求
。
當(dāng)時(shí)候,在0處取得sup。又由一個(gè)隊(duì)列只能有一個(gè)展現(xiàn),可以約掉廣告集合的求和項(xiàng),得
否則,為正無(wú)窮。
略去跟自變量無(wú)關(guān)的常數(shù)項(xiàng),得
這個(gè)對(duì)偶問(wèn)題的第一項(xiàng)我們可以看成是調(diào)整后的新ecpm。
我們對(duì)廣告主競(jìng)價(jià)加了一個(gè)“影子出價(jià)”
來(lái)增加新廣告的曝光率以提升長(zhǎng)期冷啟動(dòng)的價(jià)值。
冷啟動(dòng)價(jià)值系數(shù)則是最優(yōu)影子出價(jià)
的上界。
求解對(duì)偶問(wèn)題
主函數(shù)為凸函數(shù),線(xiàn)上使用Sub-Gradient Descent Method(次梯度下降法)對(duì)其進(jìn)行求解。
其次梯度為:
其中,I是示性函數(shù),當(dāng)廣告j的新ecpm排名最高時(shí),I為1,否則I為0。
這里k為迭代次數(shù),為步長(zhǎng)。
迭代終止條件為:
此次更新完成。
線(xiàn)上實(shí)現(xiàn)基本思路
MAB+Linear Programming
Shadow Bidding with Learning(SBI)算法
對(duì)于每個(gè)時(shí)刻:
觀(guān)測(cè)用戶(hù)特征
,以
概率隨機(jī)等可能展示一個(gè)廣告;以
的概率展示廣告
到了需要更新的時(shí)刻,解empirical dual;更新冷啟動(dòng)廣告的影子出價(jià)
更新DNN模型以及對(duì)應(yīng)的pCTR,pCVR.
實(shí)驗(yàn)結(jié)論
SBI算法幾乎能達(dá)到“上帝視角”的最優(yōu)價(jià)值。
AB實(shí)驗(yàn)冷啟動(dòng)成功率+61.62%,冷啟動(dòng)價(jià)值+47.71%,CTR預(yù)測(cè)的AUC+7.84%,短期消耗和超成本情況幾乎不變。