@一個(gè)菜鳥(niǎo)的自我修養(yǎng) 感謝作者詳細(xì)的回復(fù),受益匪淺,謝謝!
FM模型的一些理解的實(shí)操原文:https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf??本文僅僅只是對(duì)文章的一些個(gè)人理解。本章先回顧一下...
@一個(gè)菜鳥(niǎo)的自我修養(yǎng) 感謝作者詳細(xì)的回復(fù),受益匪淺,謝謝!
FM模型的一些理解的實(shí)操原文:https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf??本文僅僅只是對(duì)文章的一些個(gè)人理解。本章先回顧一下...
@一個(gè)菜鳥(niǎo)的自我修養(yǎng) 第二個(gè)問(wèn)題,是我理解錯(cuò)了,以為編號(hào)從1開(kāi)始。關(guān)于第一個(gè)問(wèn)題(假設(shè)僅針對(duì)離散特征),按照文中的編碼方式,先把所有特征展開(kāi),再重新編碼,最后進(jìn)行one-hot編碼,這樣有可能導(dǎo)致最終的特征維度相當(dāng)大且稀疏。我比較疑惑,這種編碼方式(特征全展開(kāi),重編碼,再獨(dú)熱)跟其他編碼方式(對(duì)單列特征onehot或label encoding)有什么優(yōu)勢(shì)或劣勢(shì)嗎?我查了相關(guān)資料,這些做法應(yīng)該都有。另外,想問(wèn)下,作者是如何考慮連續(xù)特征不做處理還是進(jìn)行分桶離散化的情況
FM模型的一些理解的實(shí)操原文:https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf??本文僅僅只是對(duì)文章的一些個(gè)人理解。本章先回顧一下...
文中說(shuō)get_feature_dict做了獨(dú)熱編碼,但是并未發(fā)現(xiàn)啊
另外,在get_feature_dict第11行:range(total_feature, total_feature + len(unique_feature)),range的第一個(gè)元素和第二個(gè)元素,是否應(yīng)該+1呢
FM模型的一些理解的實(shí)操原文:https://www.csie.ntu.edu.tw/~b97053/paper/Rendle2010FM.pdf??本文僅僅只是對(duì)文章的一些個(gè)人理解。本章先回顧一下...