ggstatsplot-專(zhuān)為學(xué)術(shù)繪圖而生(一)

作者:白介素2

美圖神器ggstatsplot-專(zhuān)為學(xué)術(shù)論文而生

在CRAN(comprehensive R Achive Netwokrk)中已有13000多個(gè)R包了
簡(jiǎn)單講ggstatsplot能夠提供更為豐富信息的包,其實(shí)就是畫(huà)出高質(zhì)量的圖
不需要我們花費(fèi)過(guò)多的精力去調(diào)整繪圖細(xì)節(jié),舉個(gè)例子
一般的探索性數(shù)據(jù)分過(guò)程析包括數(shù)據(jù)可視化與數(shù)據(jù)統(tǒng)計(jì)兩個(gè)部分,而ggstatsplot正是達(dá)到兩者結(jié)合的目的

舉例說(shuō)明

組間比較-ggbetweenstats

library(ggstatsplot)
library(ggplot2)

p代表參數(shù)檢驗(yàn),np代表非參數(shù)
mpaa是分類(lèi)變量,y是數(shù)值型變量

head(movies_long)
## # A tibble: 6 x 8
##   title                        year length budget rating  votes mpaa  genre
##   <chr>                       <int>  <int>  <dbl>  <dbl>  <int> <fct> <fct>
## 1 Shawshank Redemption, The    1994    142     25    9.1 149494 R     Drama
## 2 Lord of the Rings: The Ret~  2003    251     94    9   103631 PG-13 Acti~
## 3 Lord of the Rings: The Fel~  2001    208     93    8.8 157608 PG-13 Acti~
## 4 Lord of the Rings: The Two~  2002    223     94    8.8 114797 PG-13 Acti~
## 5 Pulp Fiction                 1994    168      8    8.8 132745 R     Drama
## 6 Schindler's List             1993    195     25    8.8  97667 R     Drama
ggbetweenstats(
  data = movies_long,
  x = mpaa, # > 2 groups
  y = rating,
  type = "p", # default
  messages = FALSE
)
image.png

默認(rèn)參數(shù)繪圖

ggbetweenstats(
  data = movies_long,
  x = mpaa,
  y = rating
)
image.png

配對(duì)比較
pairwise.display參數(shù)控制曾現(xiàn)的比較,ns無(wú)意義,all,所有,s有意義的

ggbetweenstats(
  data = movies_long,
  x = mpaa,
  y = rating,
  type = "np",
  mean.ci = TRUE,
  pairwise.comparisons = TRUE,
  pairwise.display = "s",
  p.adjust.method = "fdr",
  messages = FALSE
)
image.png

調(diào)整顏色,主題,可信區(qū)間調(diào)整,突出值標(biāo)記
confi.level:可信區(qū)間調(diào)整,ggtheme主題,pallete:顏色調(diào)用
outlier:超出界限標(biāo)記

ggbetweenstats(
  data = movies_long,
  x = mpaa,
  y = rating,
  type = "r",
  conf.level = 0.99,
  pairwise.comparisons = TRUE,
  pairwise.annotation = "p", 
  outlier.tagging = TRUE,
  outlier.label = title,
  outlier.coef = 2,
  ggtheme = hrbrthemes::theme_ipsum_tw(),
  palette = "Darjeeling2",
  package = "wesanderson",
  messages = FALSE
)
image.png

ggwithinstats組內(nèi)比較

圖還是非常美觀,就不去細(xì)講每個(gè)參數(shù)了,需要時(shí)調(diào)用即可,這也是作者的意圖

ggwithinstats(
  data = WRS2::WineTasting,
  x = Wine, # > 2 groups
  y = Taste,
  pairwise.comparisons = TRUE,
  pairwise.annotation = "p",
  ggtheme = hrbrthemes::theme_ipsum_tw(),
  ggstatsplot.layer = FALSE,
  messages = FALSE
)
image.png

相關(guān)性圖-ggscatterstats

代碼簡(jiǎn)介,細(xì)節(jié)豐富

ggscatterstats(
  data = movies_long,
  x = budget,
  y = rating,
  type = "p", # default #<<<
  conf.level = 0.99,
  marginal=F,
  messages = TRUE
)
image.png

其實(shí)還可以畫(huà)很多其它的圖,顏值都非常高,這里不再過(guò)多介紹,真正做到一圖勝千言

總結(jié)一下這個(gè)包的局限性:

  • 雖然圖的信息量大,但有時(shí)比如presentation,時(shí)間不夠,圖信息過(guò)多反而不利于簡(jiǎn)明扼要的傳達(dá)信息
  • 另外就是計(jì)算的統(tǒng)計(jì)量比較單一

參考資料:官方文檔
本期內(nèi)容就到這里,我是白介素2,下期再見(jiàn)

廣而告之

說(shuō)一個(gè)事,鑒于簡(jiǎn)書(shū)平臺(tái)在信息傳播方面有不足之處,應(yīng)粉絲要求,白介素2的個(gè)人微信平臺(tái)已經(jīng)開(kāi)啟,繼續(xù)聊臨床與科研的故事,R語(yǔ)言,數(shù)據(jù)挖掘,文獻(xiàn)閱讀等內(nèi)容。當(dāng)然也不要期望過(guò)高,微信平臺(tái)目前的定位是作為自己的讀書(shū)筆記,如果對(duì)大家有幫助最好。如果感興趣, 可以?huà)叽a關(guān)注下。


qrcode_for_gh_9eaa04438675_258.jpg

相關(guān)閱讀:
R語(yǔ)言生存分析-02-ggforest
R語(yǔ)言生存分析-01
生存曲線(xiàn)
R語(yǔ)言GEO數(shù)據(jù)挖掘01-數(shù)據(jù)下載及提取表達(dá)矩陣
R語(yǔ)言GEO數(shù)據(jù)挖掘02-解決GEO數(shù)據(jù)中的多個(gè)探針對(duì)應(yīng)一個(gè)基因
R語(yǔ)言GEO數(shù)據(jù)挖掘03-limma分析差異基因
R語(yǔ)言GEO數(shù)據(jù)挖掘04-功能富集分析

如果沒(méi)有時(shí)間精力學(xué)習(xí)代碼,推薦了解:零代碼數(shù)據(jù)挖掘課程

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容