在多元統(tǒng)計分析中,主成分分析(英語:Principal components analysis,PCA)是一種分析、簡化數(shù)據(jù)集的技術。主成分分析經常用于減少數(shù)據(jù)集的維數(shù),同時保持數(shù)據(jù)集中的對方差貢獻最大的特征。這是通過保留低階主成分,忽略高階主成分做到的。這樣低階成分往往能夠保留住數(shù)據(jù)的最重要方面。
PCA是最簡單的以特征量分析多元統(tǒng)計分布的方法。通常情況下,這種運算可以被看作是揭露數(shù)據(jù)的內部結構,從而更好的解釋數(shù)據(jù)的變量的方法。如果一個多元數(shù)據(jù)集能夠在一個高維數(shù)據(jù)空間坐標系中被顯現(xiàn)出來,那么PCA就能夠提供一幅比較低維度的圖像,這幅圖像即為在訊息最多的點上原對象的一個‘投影’。這樣就可以利用少量的主成分使得數(shù)據(jù)的維度降低了。我們可以通過PCA找出離群樣品、判別相似性高的樣品簇等。
在線PCA分析工具:http://qplot.cn/apps/016-princomp
居于R語言prcomp計算值 ggpot2可視化。

image.png
使用說明
1.導入數(shù)據(jù)
從excel復制粘貼到輸入數(shù)據(jù)框(列為樣本),也可以提供樣本的分組信息(行為樣本,列為分組名)。右側可以看到默認分析結果

數(shù)據(jù)導入.png
2.參數(shù)設置
顯示loading,分組樣本加上圈,字體大小設置。

image.png
3.樣式設置
修改樣式,配色,及其他細節(jié)。下載矢量圖。

樣式設置
4.分析結果 可視化
每個軸的解釋度。

參考:
https://zh.wikipedia.org/wiki/%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90