推薦系統(tǒng)正負(fù)樣本構(gòu)造 在feed場(chǎng)景中,使用曝光(展示)日志時(shí),應(yīng)該選擇APP的SDK埋點(diǎn)的日志,而不是服務(wù)器Web接口返回的日志,因?yàn)閃eb接...
過(guò)擬合 在訓(xùn)練數(shù)據(jù)不夠多時(shí),或者overtraining時(shí),常常會(huì)導(dǎo)致overfitting(過(guò)擬合)。其直觀的表現(xiàn)如下圖所示,隨著訓(xùn)練過(guò)程的進(jìn)...
LSH局部敏感哈希 問(wèn)題場(chǎng)景: 快速的從海量高維數(shù)據(jù)集合中找到與某個(gè)數(shù)據(jù)最相似(距離最近)的一個(gè)數(shù)據(jù)或多個(gè)數(shù)據(jù) 局部敏感: 指樣本越相似,經(jīng)過(guò)哈...
我們描述一個(gè)人的喜好一般是在一個(gè)低維空間來(lái)說(shuō)的,比如:小明喜歡看武俠小說(shuō),聽搖滾等等。而不需要一一去列出具體的小說(shuō)名字或者是歌曲名字。隱語(yǔ)義模型...
ALS交替最小二乘算法 ??ALS指使用交替最小二乘法求解的協(xié)同過(guò)濾算法。通過(guò)觀察到的所有用戶給產(chǎn)品打分,來(lái)推斷每個(gè)用戶的喜好并向用戶推薦合適的...
原文鏈接 機(jī)器學(xué)習(xí)面試之偏差方差 在機(jī)器學(xué)習(xí)的面試中,能不能講清楚偏差方差,經(jīng)常被用來(lái)考察面試者的理論基礎(chǔ)。偏差方差看似很簡(jiǎn)單,但真要徹底地說(shuō)明...
資源利用角度 - 基本概念: 這里先簡(jiǎn)單介紹一下partition與core的概念。core為最小的計(jì)算單元,partition為最小的文件對(duì)象...
取某一列的分位數(shù) 取出a_df中有,b_df中沒(méi)有的行 spark json array string spark sql在讀取hive表數(shù)據(jù)結(jié)...
頻繁項(xiàng)集挖掘的基本概念請(qǐng)直接看我參考的文章,我這里只給出頻繁項(xiàng)集單機(jī)版和分布式版本的實(shí)現(xiàn)。通過(guò)單機(jī)版本熟悉算法的基本思想,分布式版本則是用于工業(yè)...