R可視化:科研繪圖之生存KM曲線圖

歡迎大家關(guān)注全網(wǎng)生信學(xué)習(xí)者系列:

  • WX公zhong號:生信學(xué)習(xí)者
  • Xiao hong書:生信學(xué)習(xí)者
  • 知hu:生信學(xué)習(xí)者
  • CDSN:生信學(xué)習(xí)者2
Snipaste_2024-06-19_13-44-07.png

介紹

ggsurvfit 是一個(gè)基于 R 語言的包,它擴(kuò)展了 survival 包的功能,允許用戶使用 ggplot2 的語法來創(chuàng)建美觀的生存曲線圖。KM曲線,即Kaplan-Meier曲線,是一種非參數(shù)統(tǒng)計(jì)方法,用于估計(jì)生存函數(shù),即在給定時(shí)間點(diǎn)生存下來的概率。

ggsurvfit

  1. 美觀性ggplot2 提供了一種強(qiáng)大的圖形語法,可以創(chuàng)建高度定制化和美觀的圖形。
  2. 易用性ggsurvfit 允許用戶利用熟悉的 ggplot2 語法來繪制生存曲線,使得圖形的創(chuàng)建過程更加直觀和簡單。
  3. 擴(kuò)展性ggsurvfit 可以與 ggplot2 的其他擴(kuò)展包一起使用,例如 ggpubrggthemes,以進(jìn)一步增強(qiáng)圖形的表現(xiàn)力。

KM曲線的意義

  1. 生存分析:KM曲線提供了一種直觀的方式來展示生存數(shù)據(jù)隨時(shí)間的變化,常用于醫(yī)學(xué)研究中評估患者的生存率。
  2. 比較生存率:通過比較不同組別的 KM 曲線,可以觀察到不同治療或條件對生存率的影響。
  3. 非參數(shù)方法:KM 方法不需要對生存時(shí)間的分布做出任何假設(shè),這使得它適用于各種類型的數(shù)據(jù)。

如何閱讀KM曲線

  1. 水平軸:通常表示時(shí)間,可以是天、月、年等。
  2. 垂直軸:表示生存概率,即在特定時(shí)間點(diǎn)生存下來的概率。
  3. 曲線下降:曲線的下降表示隨著時(shí)間的推移,生存概率的減少。
  4. 曲線的階梯狀:每個(gè)臺階代表一個(gè)事件發(fā)生(例如死亡),曲線在事件發(fā)生時(shí)下降。
  5. 比較曲線:如果有多條曲線,可以比較它們以了解不同組別或條件下的生存差異。

加載R包

加載所需要的R包

knitr::opts_chunk$set(message = FALSE, warning = FALSE)

library(ggsurvfit)
library(tidyverse)
library(survival)
library(survminer)
library(gtsummary)

# rm(list = ls())
options(stringsAsFactors = F)
options(future.globals.maxSize = 10000 * 1024^2)

導(dǎo)入數(shù)據(jù)

使用示例數(shù)據(jù)

data("df_lung")

head(df_lung)
inst<dbl> time<dbl> status<dbl> age<dbl> sex<fctr> ph.ecog<fctr>
3 10.053388 2 74 Male Symptomatic and ambulatory
3 14.948665 2 68 Male Asymptomatic
3 33.182752 1 56 Male Asymptomatic
5 6.899384 2 57 Male Symptomatic and ambulatory
1 29.010267 2 60 Male Asymptomatic
12 33.577002 1 74 Male Symptomatic and ambulatory

數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理包含以下部分:代碼見R可視化:科研繪圖之生存KM曲線圖

  • 因子化分組
  • 生存分析提取畫圖數(shù)據(jù)(生存概率和風(fēng)險(xiǎn)表)
  • 計(jì)算風(fēng)險(xiǎn)系數(shù)HR和p值
  • 計(jì)算中位數(shù)生存率對應(yīng)的生存時(shí)間
  • 匯總生存分析的結(jié)果
head(sur_all)
Characteristic<chr> sex_Male<chr> sex_Female<chr>
1 No. of patients sex_Male (n=138) sex_Female (n=90)
2 Events (% of patients) 26 (0.19) 37 (0.41)
3 Median OS, months 8.9 14
4 P value 0.001 0.001
5 Hazard ratio Reference 0.588

畫圖

生存分析的KM圖,代碼見R可視化:科研繪圖之生存KM曲線圖

pl
Snipaste_2024-06-19_13-44-07.png

結(jié)果:這張KM圖比較了兩組數(shù)據(jù):男性(8.9個(gè)月)和女性(14個(gè)月)的生存情況。

  • 生存曲線:圖中的曲線代表了隨時(shí)間變化的生存概率。曲線的下降表示在特定時(shí)間點(diǎn)有個(gè)體死亡或失去生存狀態(tài)。
  • 風(fēng)險(xiǎn)組:圖中顯示了兩組風(fēng)險(xiǎn)組,男性和女性,分別用不同的曲線表示。
  • 風(fēng)險(xiǎn)比(Hazard ratio, HR):圖中給出的風(fēng)險(xiǎn)比是0.59,這表示在相同的時(shí)間點(diǎn),女性的死亡風(fēng)險(xiǎn)是男性的59%。95%置信區(qū)間(0.26-0.92)表示這個(gè)估計(jì)的不確定性范圍,如果置信區(qū)間不包含1,通常認(rèn)為HR有統(tǒng)計(jì)學(xué)意義。
  • P值:P = 0.001,這是一個(gè)非常小的P值,通常小于0.05就認(rèn)為統(tǒng)計(jì)結(jié)果有顯著性,表示男性和女性的生存曲線差異是顯著的。
  • 風(fēng)險(xiǎn)數(shù)量(No. at risk):圖中的表格顯示了每個(gè)時(shí)間點(diǎn)每個(gè)風(fēng)險(xiǎn)組中剩余的風(fēng)險(xiǎn)個(gè)體數(shù)量,隨著時(shí)間的增加,風(fēng)險(xiǎn)數(shù)量逐漸減少,因?yàn)閭€(gè)體可能死亡或失去生存狀態(tài)。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容