機(jī)器學(xué)習(xí)文摘

概要

算法 + 數(shù)據(jù)”過渡到“學(xué)件”的形態(tài):
“可重用”的特性能夠獲取大量不同的樣本;“可演進(jìn)”的特性可以適應(yīng)環(huán)境的變化;“可了解”的特性能有效地了解模型的能力;因?yàn)槭菍<一A(chǔ)上建立的,所以比較容易得到專家級(jí)的結(jié)果;因?yàn)楣蚕沓鰜淼氖悄P停员苊饬藬?shù)據(jù)泄露和隱私泄露的問題。

梯度下降

注:步長(zhǎng)設(shè)置需注意,設(shè)置過小收斂變慢,設(shè)置過大無法得到最優(yōu)解

SVD

奇異值往往對(duì)應(yīng)著矩陣中隱含的重要信息,且重要性和奇異值大小正相關(guān);一個(gè)矩陣越“奇異”,其越少的奇異值蘊(yùn)含了更多的矩陣信息,矩陣的信息熵越小。

推薦算法

注:搜索、推薦、廣告本質(zhì)都是匹配用戶需求,都是解決信息過載的手段;但是解決的手段、目標(biāo)不同,因此實(shí)現(xiàn)系統(tǒng)方法也有差異。


三者差異
  • 搜索要解決的是精確快速找到想要的結(jié)果。最重要的目標(biāo)是降低延遲和提高相關(guān)性
  • 推薦則更關(guān)注用戶體驗(yàn),讓用戶沉浸進(jìn)去
  • 廣告則商業(yè)利益最大化為目標(biāo)
  • 三者的實(shí)現(xiàn)都可抽象為:過濾候選(filter)+排序候選(ranking)+個(gè)性化輸出(personalization)

不管使用什么方法,協(xié)同過濾或基于物品屬性的推薦,都是不會(huì)被原諒的商業(yè)工具,假陽(yáng)性的錯(cuò)誤會(huì)讓用戶逐漸流失。如果系統(tǒng)過濾掉那些我們一定不喜歡的東西,而不是給我們推薦一堆東西,我們可能會(huì)更加寬容和給予更多的理解。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容