從抽象的CRF到具體的SDTM數(shù)據(jù)集

昨天忘記說(shuō)了,能考公務(wù)員就考公務(wù)員!尤其是江浙滬或者是大灣區(qū)的。

對(duì)很多初學(xué)者來(lái)說(shuō),從CRF上的數(shù)據(jù)到SDTM標(biāo)準(zhǔn)數(shù)據(jù)集,這一過(guò)程是怎樣的不是很清楚,今天我就來(lái)講講。

拿下面的一個(gè)空白CRF來(lái)說(shuō),收集的是心電圖的數(shù)據(jù),我們知道這些數(shù)據(jù)肯定要放到EG domain里。

這個(gè)空白CRF上面(我標(biāo)的數(shù)字有7個(gè)),分別對(duì)應(yīng)到raw數(shù)據(jù)集里面有7個(gè)變量。(subjid幾乎每個(gè)數(shù)據(jù)集都是默認(rèn)存在的)

上面顯示的就是我們從DM那邊得到的數(shù)據(jù),一行觀測(cè)可以理解為CRA在CRF上記錄了一頁(yè)數(shù)據(jù),每一個(gè)變量分別代表圖中的7個(gè)數(shù)字,比如1代表“EGPERF”,也就是“是否做心電圖檢查:”=EGPERF。6代表EGRESULT,也就是結(jié) 果:=“EGRESULT”。變量的值就代表CRA勾選了哪些值。

所以圖中有16條觀測(cè),那么可以理解為CRA用了16張關(guān)于EG的CRF來(lái)記錄受試者數(shù)據(jù),然后輸入到EDC系統(tǒng)中,不知道大家能不能抽象過(guò)來(lái)。

假設(shè)上面的數(shù)據(jù)集是經(jīng)過(guò)DM清理之后發(fā)給我們的原始數(shù)據(jù),這時(shí)候的數(shù)據(jù)并不符合CDISC標(biāo)準(zhǔn),所以我們需要經(jīng)過(guò)處理將他們轉(zhuǎn)換成標(biāo)準(zhǔn)的SDTM數(shù)據(jù)結(jié)構(gòu)。

首先就是注釋CRF,將空白CRF上注釋成擁有SDTM變量的CRF,然后寫SPEC的SAS程序員將轉(zhuǎn)換的過(guò)程方法寫在EXCEL上,其他SAS程序員根據(jù)這個(gè)說(shuō)明,結(jié)合aCRF將raw數(shù)據(jù)集轉(zhuǎn)換成標(biāo)準(zhǔn)的EG數(shù)據(jù)集。

而且,注意到raw數(shù)據(jù)集是水平結(jié)構(gòu),但是SDTM一般是垂直結(jié)構(gòu),也就是說(shuō),你看raw數(shù)據(jù)集,HR和QTC都在一條水平線上,但是按照SDTM的要求,必須一個(gè)檢查項(xiàng)一條記錄,下面這個(gè)截圖就是相對(duì)標(biāo)準(zhǔn)的EG數(shù)據(jù)集,符合SDTM標(biāo)準(zhǔn)的數(shù)據(jù)集。(只拿S001來(lái)舉例子,當(dāng)然少了很多其他關(guān)于EG的變量)

你們自己去看看理解吧。阿尼瑪,真的太費(fèi)時(shí)間了給你們舉這些例子,又是截圖又是注釋的。

總之,我們SAS程序員的工作流程就是下面這張圖所示:

然后過(guò)程之間肯定有很多小步驟。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容