近鄰算法又稱為被動(dòng)學(xué)習(xí)算法。這種算法只是將訓(xùn)練集的數(shù)據(jù)保存起來,在收到測(cè)試數(shù)據(jù)時(shí)才會(huì)進(jìn)行計(jì)算。 貝葉斯算法則是一種主動(dòng)學(xué)習(xí)算法,它會(huì)根據(jù)訓(xùn)練集構(gòu)...
投稿
近鄰算法又稱為被動(dòng)學(xué)習(xí)算法。這種算法只是將訓(xùn)練集的數(shù)據(jù)保存起來,在收到測(cè)試數(shù)據(jù)時(shí)才會(huì)進(jìn)行計(jì)算。 貝葉斯算法則是一種主動(dòng)學(xué)習(xí)算法,它會(huì)根據(jù)訓(xùn)練集構(gòu)...
KNN 算法 k 近鄰算法( kNN ):考察新記錄周圍距離最近的 k 條記錄,而不是只看一條。 每個(gè)近鄰都有投票權(quán),程序會(huì)將新紀(jì)錄判定為得票數(shù)...
訓(xùn)練集和測(cè)試集 通常我們將數(shù)據(jù)集分為兩個(gè)部分,第一部分用來構(gòu)造分類器,因此稱為訓(xùn)練集;另一部分用來評(píng)估分類器的結(jié)果,因此稱為測(cè)試集。 訓(xùn)練集和測(cè)...
特征值選取 1、選擇特征值 2、對(duì)特征值相關(guān)度進(jìn)行評(píng)分 3、將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化(最常用的方法時(shí)將所有數(shù)據(jù)都轉(zhuǎn)化為 0 到 1 之間的值,或使用標(biāo)準(zhǔn)...
Slope One 算法是在一篇名為《Slope One:基于在線評(píng)分系統(tǒng)的協(xié)同過濾算法》的論文中提出的,由 Lemire 和 Machlach...
基于用戶的協(xié)同過濾 基于用戶的協(xié)同過濾又稱為內(nèi)存型協(xié)同過濾,需要將所有數(shù)據(jù)都保存在內(nèi)存中進(jìn)行計(jì)算;我們將一個(gè)用戶和其他所有用戶進(jìn)行對(duì)比找到相似的...
找出相似用戶 曼哈頓距離 最簡(jiǎn)單的距離計(jì)算方式; 在二維模型中,每個(gè)目標(biāo)對(duì)象都可以用 (x, y) 的點(diǎn)來表示,我們可以用下標(biāo)來表示不同的對(duì)象,...
聚類 通過物品特征來計(jì)算距離,并自動(dòng)分類到不同的群集或組中。 層次聚類算法 對(duì)于層次聚類算法,我們不需要預(yù)先指定分類的數(shù)量,這個(gè)算方法會(huì)將每條數(shù)...
非結(jié)構(gòu)化文本的分類算法 如身高、體重、對(duì)法案的投票等。具有能用表格來展現(xiàn) 的共性的數(shù)據(jù)我們稱為 “結(jié)構(gòu)化數(shù)據(jù)” 。數(shù)據(jù)集中的每條數(shù)據(jù)(下表中的一...