016-主成分分析PCA-可視化

在多元統(tǒng)計分析中,主成分分析(英語:Principal components analysis,PCA)是一種分析、簡化數(shù)據(jù)集的技術。主成分分析經常用于減少數(shù)據(jù)集的維數(shù),同時保持數(shù)據(jù)集中的對方差貢獻最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數(shù)據(jù)的最重要方面。

PCA是最簡單的以特征量分析多元統(tǒng)計分布的方法。通常情況下,這種運算可以被看作是揭露數(shù)據(jù)的內部結構,從而更好的解釋數(shù)據(jù)的變量的方法。如果一個多元數(shù)據(jù)集能夠在一個高維數(shù)據(jù)空間坐標系中被顯現(xiàn)出來,那么PCA就能夠提供一幅比較低維度的圖像,這幅圖像即為在訊息最多的點上原對象的一個‘投影’。這樣就可以利用少量的主成分使得數(shù)據(jù)的維度降低了。我們可以通過PCA找出離群樣品、判別相似性高的樣品簇等。

在線PCA分析工具:http://qplot.cn/apps/016-princomp
居于R語言prcomp計算值 ggpot2可視化。

image.png

使用說明

1.導入數(shù)據(jù)

從excel復制粘貼到輸入數(shù)據(jù)框(列為樣本),也可以提供樣本的分組信息(行為樣本,列為分組名)。右側可以看到默認分析結果


數(shù)據(jù)導入.png

2.參數(shù)設置

顯示loading,分組樣本加上圈,字體大小設置。


image.png

3.樣式設置

修改樣式,配色,及其他細節(jié)。下載矢量圖。


樣式設置

4.分析結果 可視化

每個軸的解釋度。


參考:
https://zh.wikipedia.org/wiki/%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容