R語言gtsummary包快速制作臨床試驗基線特征表

在臨床試驗中,我們常常需要繪制組間比較的基線特征表,也是臨床試驗統(tǒng)計分析的第一步。
今天給大家介紹一款好用的R包——“gtsummary”,不僅可以自定義輸出形式(可以滿足多種輸出形式哦),而且導出方便,那我們接下來就操作一下吧。

案例

安裝及加載“gtsummary”

# Library packages
library(gtsummary)

如果第一次使用這個包,需要先進行安裝然后再加載包:install.packages('gtsummary')

加載數(shù)據(jù)

data(trial)
trial2 <- trial %>% dplyr::select(trt, age, grade)

我們先加載數(shù)據(jù)集“trial”(數(shù)據(jù)集“trial”來自'gtsummary'包),然后只選擇其中3個變量生成數(shù)據(jù)集“trial2”

生成基線資料表

不進行任何設(shè)置結(jié)果如下:

# Example 1 default format ---------------------- 
 trial2 %>% 
  tbl_summary( )   
image

由上表可知,連續(xù)變量默認展示中位數(shù)(四分位數(shù)),缺失值顯示為“Unknown”;分類變量展示為例數(shù)(百分比),這里Grade變量無缺失,因此未顯示“Unknown”。

接下來我們需要通過設(shè)置,進行組間比較。代碼如下:

# Example 2 add_p----------------------------------
trial2 %>% 
  tbl_summary(by = trt) %>% 
  add_p()

這里,“by=trt”明確了分組變量為“trt”,并增加組間比較的P值(add_p()),結(jié)果如下:


image

這里變量的展示內(nèi)容與我的需求不符合,接下來我們修改一下變量展現(xiàn)內(nèi)容(連續(xù)變量:均值(標準差)、中位數(shù)(四分位數(shù))、(最小值,最大值)、缺失值;分類變量:例數(shù)(百分比)、缺失值),并修改P值的小數(shù)點位數(shù),代碼及結(jié)果如下:

# Example 3 modify display-------------------------- 
trial2 %>%
  tbl_summary(
    by = trt,
    type = all_continuous() ~ "continuous2",
    statistic = all_continuous() ~ c("{mean} ({sd})",
                                     "{median} ({p25}, {p75})", 
                                     "{min}, {max}") , 
    missing="always",
    missing_text='missing')%>% 
add_p(pvalue_fun = ~style_pvalue(.x, digits = 2))
image

type = all_continuous() ~ "continuous2" :將連續(xù)變量統(tǒng)計描述結(jié)果展示為多行,type設(shè)置為"continuous2";
statistic = all_continuous() ~ c("{mean} ({sd})","{median} ({p25}, {p75})", "{min}, {max}") :說明了我們需要展示連續(xù)變量的均值(標準差),中位數(shù)(四分位數(shù)),(最小值,最大值)
missing="always" :對于連續(xù)變量及分類變量的缺失值我們進行了統(tǒng)一設(shè)置, "always" 表示強制展示缺失值
missing_text='missing' :將缺失值標簽修改為“missing”,默認為“Unknow”。
上述結(jié)果中,組間比較,連續(xù)變量默認檢驗方法為秩和檢驗,分類變量為卡方檢驗,接下來我們對檢驗方法進行修改。代碼及結(jié)果如下:

# Example 4 modify test ---------------------------- 
trial2 %>%
  tbl_summary(
    by = trt,
    type = all_continuous() ~ "continuous2",
    statistic =all_continuous() ~ c( "{mean} ({sd})",
            "{median} ({p25}, {p75})",  "{min}, {max}"),
    missing_text='missing') %>%
  add_p(pvalue_fun = ~style_pvalue(.x, digits = 2),
        list(all_continuous() ~ "t.test",
             all_categorical() ~ "fisher.test"))
image

在add_p()中進行檢驗方法的設(shè)置:
list(all_continuous() ~ "t.test", all_categorical() ~ "fisher.test") :對于連續(xù)變量,組間比較采用T檢驗,對于分類變量,組間比較采用Fisher精確概率檢驗(注:這里的分類變量Grade,還是適合采用卡方檢驗,這里我們只是為了看看設(shè)置后的效果)
接下來我們還想對統(tǒng)計表中數(shù)值保留的小數(shù)點位數(shù)進行設(shè)置,代碼及結(jié)果如下:

# Example 5 modify digits----------------------------- 
trial2 %>%
  tbl_summary(
    by = trt,
    type = all_continuous() ~ "continuous2",
    statistic =all_continuous() ~ c("{mean} ({sd})",
              "{median} ({p25}, {p75})", "{min}, {max}"),
    missing_text='missing',
    digits = all_continuous() ~ 2) %>% 
  add_p(pvalue_fun = ~style_pvalue(.x, digits = 3),
        list(all_continuous() ~ "t.test",
             all_categorical() ~ "fisher.test"))
image

digits = all_continuous() ~ 2:對于連續(xù)變量,小數(shù)點位數(shù)設(shè)置為2

pvalue_fun = ~style_pvalue(.x, digits = 3):P值的小數(shù)點位數(shù)在add_p中進行設(shè)置,這里我們將P值的小數(shù)點位數(shù)設(shè)置為3。

這個表好像還缺了點啥,對了!表名。那我們再給表增加一下標題,順便修改一下變量標簽,代碼及結(jié)果如下:

# Example 6 add caption and variable labels------------ 
trial2 %>%
  tbl_summary(
    by = trt,
    type = all_continuous() ~ "continuous2",
    statistic =all_continuous() ~ c( "{mean} ({sd})",
                                          "{median} ({p25}, {p75})", 
                                          "{min}, {max}"),
    missing_text ='missing',
    label=list(age~'Patient age'),
    digits = all_continuous() ~ 2) %>%
  add_p(pvalue_fun = ~style_pvalue(.x, digits = 3),
        list(all_continuous() ~ "t.test",
             all_categorical() ~ "fisher.test"))%>%
  modify_caption("Patient Characteristics")
image

modify_caption("Patient Characteristics") :增加表名稱

label=list(age~'Patient age') : 將變量“age” 在輸出的結(jié)果表中展示為"Patient age"
最后,我們有時候免不了需要對表再進行一個特殊說明,即添加腳注,代碼為下圖最后2行(在需要添加的文字“This data is simulated”兩邊各加一個* ,最后腳注的格式即變?yōu)樾斌w,見如下結(jié)果圖。

# Example 7 add footnote  ------------ 
trial2 %>%
  tbl_summary(
    by = trt,
    type = all_continuous() ~ "continuous2",
    statistic =all_continuous() ~ c( "{mean} ({sd})",
                                     "{median} ({p25}, {p75})", 
                                     "{min}, {max}"),
    missing_text ='missing',
    label=list(age~'Patient age'),
    digits = all_continuous() ~ 2) %>%
  add_p(pvalue_fun = ~style_pvalue(.x, digits = 3),
        list(all_continuous() ~ "t.test",
             all_categorical() ~ "fisher.test"))%>%
  modify_caption("Patient Characteristics") %>%
  as_gt() %>%
gt::tab_source_note(gt::md("*This data is simulated*"))
image

結(jié)果導出

我們以上述Example1為例,將生成的表格tb1導出為RTF,代碼如下:

# Example 1 default format ---------------------- 
tb1<-trial2 %>% 
  tbl_summary( ) 
# Export results
tb1%>%
  as_gt() %>%
  gt::gtsave("tab_1.rtf") # use extensions .html .tex .ltx .rtf ;default path
# or 
tb1 %>%
  as_flex_table() %>%
  flextable::save_as_docx(tb1,path='C:/學習/R語言學習/tab_1.docx')

好啦,關(guān)于基線表的制作及導出我們今天就說到這啦!
喜歡請點贊。還可以微信關(guān)注和置頂我的公眾號“danor的學習筆記”哦!

參考資料:
https://www.danieldsjoberg.com/gtsummary/articles/tbl_summary.html

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容