中国精品999,亚洲日韩精品探花,9九av热

一、概要

目標(biāo)：將合適的內(nèi)容，在合適的場(chǎng)景，展示給合適的人
量化指標(biāo)：CTR,Click-Through-Rate,點(diǎn)擊通過率
應(yīng)用場(chǎng)景：廣告展示、推薦、搜索結(jié)果排序
廣告，考慮ECPM指標(biāo)(earning cost per mille)，每1000次曝光帶來(lái)收入，ECPM=1000 x CTR x 點(diǎn)擊出價(jià)。https://36kr.com/p/5150648.html
商品推薦，需要考慮轉(zhuǎn)化率、商品盈利能力等因素。

二、學(xué)習(xí)目標(biāo)
1.分類問題，1-點(diǎn)擊，0-沒點(diǎn)擊
2.回歸問題，具體的ctr數(shù)值
3.多分類問題，根據(jù)ctr數(shù)值分桶？
業(yè)界使用較多的是？幾種方式的優(yōu)劣？適用場(chǎng)景？

三、特征選取&處理
1.item特征
標(biāo)題、封面圖、品牌、分類、tag等等
2.用戶特征
年齡，性別，過往記錄
3.上下文(場(chǎng)景)特征？

特征處理？跟模型有關(guān)，端到端的就不用處理了？
離散值 vs 連續(xù)值？
高維、稀疏、多Field
特征之間的關(guān)聯(lián)關(guān)系，獨(dú)立 vs 交叉？(例：衣服類型與性別?)
1.稀疏->稠密，特征獨(dú)立->特征與特征之間的關(guān)系
one-hot, embedding

如何實(shí)現(xiàn)Embedding
矩陣分解（MF）、因子分解機(jī)（FM)、神經(jīng)網(wǎng)絡(luò)

四、預(yù)估模型(損失函數(shù)，優(yōu)化算法)

經(jīng)典機(jī)器學(xué)習(xí)
*. LR, 一般作為性能的benchmark？線性-二階多項(xiàng)式，LR+正則化+特定優(yōu)化方法
缺點(diǎn)：手工設(shè)計(jì)特征，需對(duì)特征離散化，歸一化，特征離散過程的邊界問題，特征組合。
*. GBDT + LR
Gradient Boosting Decision Tree
能處理連續(xù)值特征？具有一定的特征組合能力，可以對(duì)特征的重要性排序。
*. MLR,阿里，聚類+LR
神經(jīng)網(wǎng)絡(luò)

image

https://www.jiqizhixin.com/articles/2018-07-22-19
https://zhuanlan.zhihu.com/p/32689178
https://zhuanlan.zhihu.com/p/32885978
https://github.com/nzc/dnn_ctr

簡(jiǎn)寫	日期	全稱	中文解釋
FM		Factorization Machines	因子分解機(jī)，二次交叉特征
FFM		Field-aware Factorization Machines	基于領(lǐng)域的因子分解機(jī)
DCN	2017	Deep & Cross Network	深度與交叉神經(jīng)網(wǎng)絡(luò)
FNN	2016	Factorisation Machine supported Neural Network	因子分解機(jī)神經(jīng)網(wǎng)絡(luò)
DeepFM			-
NFM		Neural Factorization Machines	神經(jīng)網(wǎng)絡(luò)因子分解機(jī)
PNN		Product-based Neural Networks	基于向量積的神經(jīng)網(wǎng)絡(luò)
AFM		Attentional Factorization Machine	注意力因子分解模型
MLP			多層感知機(jī)
W&D	2016	wide & deep	寬度與深度模型
DIN		Deep Interest Network	深度興趣網(wǎng)絡(luò)