ICA independent components analysis

ICA的4要素:

  1. X->Y為線性變換
  2. 新特征空間中 Y_i 之間相互統(tǒng)計(jì)獨(dú)立。即I(Y_i,Y_j)=0
  3. 可逆。X->Y,同時(shí) Y->X。
  4. 新特征Y_i 與原始特征X_i有較高的互信息 即I(Y_i,X_i)=正無窮
image.png

應(yīng)用背景

根據(jù)觀察變量X,經(jīng)過線性變化,推測出互相獨(dú)立的隱變量Y。


image.png

Blind source separation 盲源分離demo

如下圖,雞尾酒會(huì)中有3個(gè)人同時(shí)說話,3個(gè)人的聲音經(jīng)過線性疊加(物理學(xué)原理)分別記錄到了3個(gè)麥克風(fēng)中,任務(wù)是:根據(jù)3個(gè)麥克風(fēng)的錄音,獨(dú)立分離出3個(gè)人的說話內(nèi)容。
注意:必須同時(shí)使用3個(gè)麥克風(fēng)才能恢復(fù)出原始聲音,只使用1個(gè)或兩個(gè)麥克風(fēng)是實(shí)現(xiàn)不了的!

image.png

PCA 與 ICA 區(qū)別

image.png

通過例子說明 PCA 與 ICA 區(qū)別

PCA針對(duì)全局找特征,而ICA會(huì)針對(duì)局部找特征,因此:

  1. 針對(duì)人臉數(shù)據(jù)集
    PCA找出的特征代表 亮度臉、平均臉。。。等全局的特征臉;而ICA找出的成分則是:鼻子、嘴巴、眼睛這種信息。
  2. 針對(duì)景觀數(shù)據(jù)集
    PCA還是找到的亮度圖。。ICA會(huì)檢測出edges成分。
  3. 針對(duì)文檔數(shù)據(jù)集
    PCA是找到是?。。ICA會(huì)檢測出topics成分。
image.png

RCA

RCA:隨機(jī)成分分析,也叫隨機(jī)投影。隨機(jī)選擇投影方向(不是向PCA選擇方差最大的方向),因此投影矩陣是隨機(jī)的。實(shí)驗(yàn)表明這種方式很有效,原因沒搞明白,可能就是集成,類比猴子扔飛鏢決策效果優(yōu)于投資者的例子。最大優(yōu)點(diǎn)是隨機(jī)投影運(yùn)行速度極快!

LDA

線性判別分析。
PCA、ICA、RCA都是無監(jiān)督的。LDA是監(jiān)督算法。LDA會(huì)根據(jù)標(biāo)簽,選擇線性投影矩陣,這在分類問題上很適用。

A Survey of Dimension Reduction Techniques

https://e-reports-ext.llnl.gov/pdf/240921.pdf

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容