推薦系統(tǒng)正負(fù)樣本構(gòu)造 在feed場(chǎng)景中,使用曝光(展示)日志時(shí),應(yīng)該選擇APP的SDK埋點(diǎn)的日志,而不是服務(wù)器Web接口返回的日志,因?yàn)閃eb接口返回的日志中的后果是會(huì)增加很...
過(guò)擬合 在訓(xùn)練數(shù)據(jù)不夠多時(shí),或者overtraining時(shí),常常會(huì)導(dǎo)致overfitting(過(guò)擬合)。其直觀的表現(xiàn)如下圖所示,隨著訓(xùn)練過(guò)程的進(jìn)行,模型復(fù)雜度增加,在trai...
我們描述一個(gè)人的喜好一般是在一個(gè)低維空間來(lái)說(shuō)的,比如:小明喜歡看武俠小說(shuō),聽(tīng)搖滾等等。而不需要一一去列出具體的小說(shuō)名字或者是歌曲名字。隱語(yǔ)義模型就是根據(jù)用戶對(duì)物品的偏好信息,...
ALS交替最小二乘算法 ??ALS指使用交替最小二乘法求解的協(xié)同過(guò)濾算法。通過(guò)觀察到的所有用戶給產(chǎn)品打分,來(lái)推斷每個(gè)用戶的喜好并向用戶推薦合適的產(chǎn)品。??具體推薦是 通過(guò)用戶...
生成模型和判別模型是機(jī)器學(xué)習(xí)中兩類基本的模型,在機(jī)器學(xué)習(xí)面試中,經(jīng)常會(huì)被問(wèn)到。能否清晰簡(jiǎn)明地說(shuō)明二者的不同,直接影響到面試官對(duì)求職者基礎(chǔ)知識(shí)掌握程度的判斷。本文試圖給出一個(gè)回...
邏輯回歸作為被廣泛使用的二分類模型,面試中自然是不可缺少的。但要深刻理解邏輯回歸又不是那么容易的,比如說(shuō),邏輯回歸輸出的值是0到1之間的值,這個(gè)值是真實(shí)的概率嗎?邏輯回歸為什...
在前面我們學(xué)習(xí)了一種有監(jiān)督的降維方法——線性判別分析(Linear Dscriminant Analysis,LDA)。LDA不僅是一種數(shù)據(jù)壓縮方法還是一種分類算法,LDA將...