在臨床試驗中,我們常常需要繪制組間比較的基線特征表,也是臨床試驗統(tǒng)計分析的第一步。
今天給大家介紹一款好用的R包——“gtsummary”,不僅可以自定義輸出形式(可以滿足多種輸出形式哦),而且導出方便,那我們接下來就操作一下吧。
案例
安裝及加載“gtsummary”
# Library packages
library(gtsummary)
如果第一次使用這個包,需要先進行安裝然后再加載包:install.packages('gtsummary')
加載數(shù)據(jù)
data(trial)
trial2 <- trial %>% dplyr::select(trt, age, grade)
我們先加載數(shù)據(jù)集“trial”(數(shù)據(jù)集“trial”來自'gtsummary'包),然后只選擇其中3個變量生成數(shù)據(jù)集“trial2”
生成基線資料表
不進行任何設(shè)置結(jié)果如下:
# Example 1 default format ----------------------
trial2 %>%
tbl_summary( )
由上表可知,連續(xù)變量默認展示中位數(shù)(四分位數(shù)),缺失值顯示為“Unknown”;分類變量展示為例數(shù)(百分比),這里Grade變量無缺失,因此未顯示“Unknown”。
接下來我們需要通過設(shè)置,進行組間比較。代碼如下:
# Example 2 add_p----------------------------------
trial2 %>%
tbl_summary(by = trt) %>%
add_p()
這里,“by=trt”明確了分組變量為“trt”,并增加組間比較的P值(add_p()),結(jié)果如下:
這里變量的展示內(nèi)容與我的需求不符合,接下來我們修改一下變量展現(xiàn)內(nèi)容(連續(xù)變量:均值(標準差)、中位數(shù)(四分位數(shù))、(最小值,最大值)、缺失值;分類變量:例數(shù)(百分比)、缺失值),并修改P值的小數(shù)點位數(shù),代碼及結(jié)果如下:
# Example 3 modify display--------------------------
trial2 %>%
tbl_summary(
by = trt,
type = all_continuous() ~ "continuous2",
statistic = all_continuous() ~ c("{mean} ({sd})",
"{median} ({p25}, {p75})",
"{min}, {max}") ,
missing="always",
missing_text='missing')%>%
add_p(pvalue_fun = ~style_pvalue(.x, digits = 2))
type = all_continuous() ~ "continuous2" :將連續(xù)變量統(tǒng)計描述結(jié)果展示為多行,type設(shè)置為"continuous2";
statistic = all_continuous() ~ c("{mean} ({sd})","{median} ({p25}, {p75})", "{min}, {max}") :說明了我們需要展示連續(xù)變量的均值(標準差),中位數(shù)(四分位數(shù)),(最小值,最大值)
missing="always" :對于連續(xù)變量及分類變量的缺失值我們進行了統(tǒng)一設(shè)置, "always" 表示強制展示缺失值
missing_text='missing' :將缺失值標簽修改為“missing”,默認為“Unknow”。
上述結(jié)果中,組間比較,連續(xù)變量默認檢驗方法為秩和檢驗,分類變量為卡方檢驗,接下來我們對檢驗方法進行修改。代碼及結(jié)果如下:
# Example 4 modify test ----------------------------
trial2 %>%
tbl_summary(
by = trt,
type = all_continuous() ~ "continuous2",
statistic =all_continuous() ~ c( "{mean} ({sd})",
"{median} ({p25}, {p75})", "{min}, {max}"),
missing_text='missing') %>%
add_p(pvalue_fun = ~style_pvalue(.x, digits = 2),
list(all_continuous() ~ "t.test",
all_categorical() ~ "fisher.test"))
在add_p()中進行檢驗方法的設(shè)置:
list(all_continuous() ~ "t.test", all_categorical() ~ "fisher.test") :對于連續(xù)變量,組間比較采用T檢驗,對于分類變量,組間比較采用Fisher精確概率檢驗(注:這里的分類變量Grade,還是適合采用卡方檢驗,這里我們只是為了看看設(shè)置后的效果)
接下來我們還想對統(tǒng)計表中數(shù)值保留的小數(shù)點位數(shù)進行設(shè)置,代碼及結(jié)果如下:
# Example 5 modify digits-----------------------------
trial2 %>%
tbl_summary(
by = trt,
type = all_continuous() ~ "continuous2",
statistic =all_continuous() ~ c("{mean} ({sd})",
"{median} ({p25}, {p75})", "{min}, {max}"),
missing_text='missing',
digits = all_continuous() ~ 2) %>%
add_p(pvalue_fun = ~style_pvalue(.x, digits = 3),
list(all_continuous() ~ "t.test",
all_categorical() ~ "fisher.test"))
digits = all_continuous() ~ 2:對于連續(xù)變量,小數(shù)點位數(shù)設(shè)置為2
pvalue_fun = ~style_pvalue(.x, digits = 3):P值的小數(shù)點位數(shù)在add_p中進行設(shè)置,這里我們將P值的小數(shù)點位數(shù)設(shè)置為3。
這個表好像還缺了點啥,對了!表名。那我們再給表增加一下標題,順便修改一下變量標簽,代碼及結(jié)果如下:
# Example 6 add caption and variable labels------------
trial2 %>%
tbl_summary(
by = trt,
type = all_continuous() ~ "continuous2",
statistic =all_continuous() ~ c( "{mean} ({sd})",
"{median} ({p25}, {p75})",
"{min}, {max}"),
missing_text ='missing',
label=list(age~'Patient age'),
digits = all_continuous() ~ 2) %>%
add_p(pvalue_fun = ~style_pvalue(.x, digits = 3),
list(all_continuous() ~ "t.test",
all_categorical() ~ "fisher.test"))%>%
modify_caption("Patient Characteristics")
modify_caption("Patient Characteristics") :增加表名稱
label=list(age~'Patient age') : 將變量“age” 在輸出的結(jié)果表中展示為"Patient age"
最后,我們有時候免不了需要對表再進行一個特殊說明,即添加腳注,代碼為下圖最后2行(在需要添加的文字“This data is simulated”兩邊各加一個* ,最后腳注的格式即變?yōu)樾斌w,見如下結(jié)果圖。
# Example 7 add footnote ------------
trial2 %>%
tbl_summary(
by = trt,
type = all_continuous() ~ "continuous2",
statistic =all_continuous() ~ c( "{mean} ({sd})",
"{median} ({p25}, {p75})",
"{min}, {max}"),
missing_text ='missing',
label=list(age~'Patient age'),
digits = all_continuous() ~ 2) %>%
add_p(pvalue_fun = ~style_pvalue(.x, digits = 3),
list(all_continuous() ~ "t.test",
all_categorical() ~ "fisher.test"))%>%
modify_caption("Patient Characteristics") %>%
as_gt() %>%
gt::tab_source_note(gt::md("*This data is simulated*"))
結(jié)果導出
我們以上述Example1為例,將生成的表格tb1導出為RTF,代碼如下:
# Example 1 default format ----------------------
tb1<-trial2 %>%
tbl_summary( )
# Export results
tb1%>%
as_gt() %>%
gt::gtsave("tab_1.rtf") # use extensions .html .tex .ltx .rtf ;default path
# or
tb1 %>%
as_flex_table() %>%
flextable::save_as_docx(tb1,path='C:/學習/R語言學習/tab_1.docx')
好啦,關(guān)于基線表的制作及導出我們今天就說到這啦!
喜歡請點贊。還可以微信關(guān)注和置頂我的公眾號“danor的學習筆記”哦!
參考資料:
https://www.danieldsjoberg.com/gtsummary/articles/tbl_summary.html