2021.4.23
持續(xù)更新中。。。
參考:《R語言數(shù)據(jù)可視化之美》、《ggplot2:數(shù)據(jù)分析與圖形藝術(shù)》、《R數(shù)據(jù)可視化手冊》、學術(shù)數(shù)據(jù)分析及可視化
1. ggplot2簡介
????ggplot2是一個用來繪制統(tǒng)計圖形(可視化數(shù)據(jù))的R軟件包。采用圖層的設(shè)計方式,從原始的圖層開始,首先繪制原始數(shù)據(jù),然后不斷地添加圖形注釋和統(tǒng)計匯總結(jié)果。
2. ggplot2的特點
- 采用圖層設(shè)計方式,有明確的起始圖層。圖層之間的疊加用
+實現(xiàn),越往后,圖層越在上方。 - 將表征數(shù)據(jù)和圖形細節(jié)分開,能快速將圖形表現(xiàn)出來。
- 擴展包豐富,有專門調(diào)整顏色、字體和主題等的輔助包。
3. ggplot2基本語法
????整套語法的核心是如何將數(shù)據(jù)(變量)映射到幾何對象(geom,包括點、線、面等)的圖形屬性(aes,包括顏色、形狀、大小等)。此外還包括數(shù)據(jù)的統(tǒng)計變換(stats)、繪制特定坐標系(coord)、形成分面(facet)等過程。
- ggplot():底層繪制函數(shù)。參數(shù)主要是需要可視化的數(shù)據(jù)集(通常是數(shù)據(jù)框),以及一些常規(guī)的控制顏色、形狀、大小等圖形屬性映射。
- geom_xxx:需要轉(zhuǎn)換成的幾何圖形。常用的有:geom_point()、geom_line()、geom_area()等
- stat_xxx:統(tǒng)計變換。對數(shù)據(jù)進行的某種匯總,例如對數(shù)據(jù)分組計數(shù)以創(chuàng)建直方圖。
4. ggplot2語法進階
4.1 圖層的五個組成部分
- 數(shù)據(jù)(data)
- 一組圖形屬性映射(mapping)
- 一種幾何對象
- 一種統(tǒng)計變換
- 一種位置調(diào)整方式,
4.1 繪圖基本過程
第一步:利用ggplot()函數(shù)創(chuàng)建底層圖形
兩個主要參數(shù):數(shù)據(jù)和圖形屬性映射
- 數(shù)據(jù),數(shù)據(jù)框
- 圖形屬性映射
ase()主要參數(shù)
2.1 需要映射到圖形x軸和y軸的第一和第二變量
2.2 需要映射到圖形顏色/形狀/大小等的第三變量
2.3 是否需進行分組的變量
注:
- ggplot()函數(shù)創(chuàng)建的圖形對象在加上其他圖層之前是無法顯示的
aes()的參數(shù)盡量簡單化,可以后續(xù)進行自定義的修改- 當需要使用多個數(shù)據(jù)的時候,底層可直接用不接任何參數(shù)的
ggplot(),但是在后續(xù)繪圖添加數(shù)據(jù)的時候,數(shù)據(jù)的添加需要使用data =的形式。
第二步:利用幾何對象geom_xxx函數(shù)生成圖形
每個幾何對象都有一組它能識別的圖形屬性和一組繪圖所需的值
每個幾何幾何對象都對應(yīng)著一個默認的統(tǒng)計變換和位置參數(shù),可以直接進行修改