第五章 無(wú)監(jiān)督學(xué)習(xí):數(shù)據(jù)降維

主成分分析PCA

1.尋找方差最大維度
2.用PCA降維


線性判別分析LDA

1.雙重標(biāo)準(zhǔn)
考慮標(biāo)簽,最大化類(lèi)間樣本的方差,最小化類(lèi)內(nèi)樣本的方差。


多維標(biāo)度法MDS

1.保留距離信息的線性變換
降維前后樣本之間的距離盡量保持一致
2.MDS的重要變形
非計(jì)量MDS
PCA可以看作CMDS使用歐式公式計(jì)算原始樣本距離時(shí)的一種特殊情況


流形學(xué)習(xí)之Isomap

流形是局部具有歐幾里得性質(zhì)的空間,通常嵌入比該局部空間更高維的外圍非歐幾里得空間中。
地球本身是一個(gè)非歐幾里得空間。
流形學(xué)習(xí)的目的是將嵌入在外圍空間中的流形提取到與其內(nèi)蘊(yùn)空間同構(gòu)的新的低維空間中。
測(cè)地線距離:沿著流形內(nèi)蘊(yùn)空間測(cè)量的距離。


流形學(xué)習(xí)之局部嵌入

局部嵌入是一簇只考慮相互鄰近樣本關(guān)系的模型。
1.局部線性嵌入LLE
一種以保持每個(gè)樣本與鄰近樣本之間距離作為降維目標(biāo)的流形學(xué)習(xí)方法。
選擇近鄰-建立權(quán)重系數(shù)矩陣-降維
2.拉普拉斯特征映射LE
LE圍繞保持拉普拉斯的矩陣進(jìn)行降維
3.譜聚類(lèi)
譜聚類(lèi)=拉普拉斯映射+K-means聚類(lèi)


流形學(xué)習(xí)之t-SNE

T分布隨機(jī)近鄰嵌入:使用概率方法建模的流形學(xué)習(xí)降維方法。
1.用Kullback0Leiber衡量分布相似度
用高斯分布表達(dá)高位空間樣本的親緣性
用T分布表達(dá)低維空間樣本親緣性
以兩個(gè)分布的Kullback-Leiber散度作為優(yōu)化目標(biāo)
2.為什么是t-分布
流形學(xué)習(xí)的擁擠問(wèn)題

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容