概要
算法 + 數(shù)據(jù)”過渡到“學(xué)件”的形態(tài):
“可重用”的特性能夠獲取大量不同的樣本;“可演進(jìn)”的特性可以適應(yīng)環(huán)境的變化;“可了解”的特性能有效地了解模型的能力;因?yàn)槭菍<一A(chǔ)上建立的,所以比較容易得到專家級(jí)的結(jié)果;因?yàn)楣蚕沓鰜淼氖悄P停员苊饬藬?shù)據(jù)泄露和隱私泄露的問題。
梯度下降
注:步長(zhǎng)設(shè)置需注意,設(shè)置過小收斂變慢,設(shè)置過大無法得到最優(yōu)解
SVD
奇異值往往對(duì)應(yīng)著矩陣中隱含的重要信息,且重要性和奇異值大小正相關(guān);一個(gè)矩陣越“奇異”,其越少的奇異值蘊(yùn)含了更多的矩陣信息,矩陣的信息熵越小。
推薦算法
注:搜索、推薦、廣告本質(zhì)都是匹配用戶需求,都是解決信息過載的手段;但是解決的手段、目標(biāo)不同,因此實(shí)現(xiàn)系統(tǒng)方法也有差異。
三者差異
- 搜索要解決的是精確快速找到想要的結(jié)果。最重要的目標(biāo)是降低延遲和提高相關(guān)性
- 推薦則更關(guān)注用戶體驗(yàn),讓用戶沉浸進(jìn)去
- 廣告則商業(yè)利益最大化為目標(biāo)
- 三者的實(shí)現(xiàn)都可抽象為:過濾候選(filter)+排序候選(ranking)+個(gè)性化輸出(personalization)
不管使用什么方法,協(xié)同過濾或基于物品屬性的推薦,都是不會(huì)被原諒的商業(yè)工具,假陽(yáng)性的錯(cuò)誤會(huì)讓用戶逐漸流失。如果系統(tǒng)過濾掉那些我們一定不喜歡的東西,而不是給我們推薦一堆東西,我們可能會(huì)更加寬容和給予更多的理解。
