降維(一)

動(dòng)機(jī)一:壓縮數(shù)據(jù)(Data Compression)

現(xiàn)假設(shè)有如下數(shù)據(jù)集,橫坐標(biāo)為特征變量x1,其單位為厘米(cm);縱坐標(biāo)為特征變量x2,其單位為英寸(inches)。

我們知道這兩個(gè)特征變量均為長(zhǎng)度計(jì)量單位,同時(shí)使用不免重復(fù)。因此,我們需要將這個(gè)二維數(shù)據(jù)集降為一維數(shù)據(jù)集。

對(duì)于該問(wèn)題降維的具體做法為:先找到一條合適的直線,然后將數(shù)據(jù)投影到這條直線上,最后我們將這些投影到直線上的數(shù)據(jù)用z(i)標(biāo)識(shí)。

降維可以將對(duì)存儲(chǔ)、內(nèi)存占用空間減半,使得運(yùn)行這些數(shù)據(jù)的算法運(yùn)行得更快。

下圖為三維數(shù)據(jù)集降為二維數(shù)據(jù)集的例子。

動(dòng)機(jī)二:數(shù)據(jù)可視化

我們將數(shù)據(jù)可視化能讓我們更為直觀地找尋一個(gè)更好的解決方案。但對(duì)于維度較高的數(shù)據(jù)集,我們將其可視化是不可能的。因此,我們可以通過(guò)降維使得數(shù)據(jù)集可視化。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容