內(nèi)容為西瓜書(shū)的第10章特征選擇和第11章特征降維。
1? ?在機(jī)器學(xué)習(xí)工程中,特征工程才是最重要,特征決定著算法的上限。
2? 特征工程中最為重要和最為基礎(chǔ)的兩種技術(shù),就是特征選擇和特征降維。特征選擇和特征降維的目的很簡(jiǎn)單,就是選擇出或變換出更優(yōu)的特征,從而更利于我們學(xué)習(xí)算法的學(xué)習(xí)。
第一節(jié)學(xué)習(xí)內(nèi)容任務(wù)名稱(chēng):
1? 西瓜書(shū)10.1/10.2/10.3任務(wù)詳解:特征降維的意思就是原有的一組特征經(jīng)過(guò)數(shù)學(xué)變換,變換成數(shù)量更少的一組特征。
2? 通常特征降維主要有兩種目的,第一,減少特征維數(shù),使計(jì)算開(kāi)銷(xiāo)更小;第二,使轉(zhuǎn)換后的低維特征更具有特征性,使學(xué)習(xí)器學(xué)習(xí)起來(lái)更容易。
3? ?而特征降維主要包括兩種方法,有監(jiān)督降維和無(wú)監(jiān)督降維,在3.4節(jié)的線性判別分析就是最為典型的監(jiān)督降維,本節(jié)的主成分分析法就是最為典型的無(wú)監(jiān)督降維,請(qǐng)大家對(duì)10.3節(jié)的主成分分析法進(jìn)行重點(diǎn)的學(xué)習(xí)。
PCA 參考:https://blog.csdn.net/program_developer/article/details/80632779
備注
TODO:
1 pca代碼未實(shí)現(xiàn)
2? https://scikit-learn.org/stable/auto_examples/feature_selection/plot_feature_selection.html#sphx-glr-auto-examples-feature-selection-plot-feature-selection-py