昨天忘記說(shuō)了,能考公務(wù)員就考公務(wù)員!尤其是江浙滬或者是大灣區(qū)的。
對(duì)很多初學(xué)者來(lái)說(shuō),從CRF上的數(shù)據(jù)到SDTM標(biāo)準(zhǔn)數(shù)據(jù)集,這一過(guò)程是怎樣的不是很清楚,今天我就來(lái)講講。
拿下面的一個(gè)空白CRF來(lái)說(shuō),收集的是心電圖的數(shù)據(jù),我們知道這些數(shù)據(jù)肯定要放到EG domain里。
這個(gè)空白CRF上面(我標(biāo)的數(shù)字有7個(gè)),分別對(duì)應(yīng)到raw數(shù)據(jù)集里面有7個(gè)變量。(subjid幾乎每個(gè)數(shù)據(jù)集都是默認(rèn)存在的)
上面顯示的就是我們從DM那邊得到的數(shù)據(jù),一行觀測(cè)可以理解為CRA在CRF上記錄了一頁(yè)數(shù)據(jù),每一個(gè)變量分別代表圖中的7個(gè)數(shù)字,比如1代表“EGPERF”,也就是“是否做心電圖檢查:”=EGPERF。6代表EGRESULT,也就是結(jié) 果:=“EGRESULT”。變量的值就代表CRA勾選了哪些值。
所以圖中有16條觀測(cè),那么可以理解為CRA用了16張關(guān)于EG的CRF來(lái)記錄受試者數(shù)據(jù),然后輸入到EDC系統(tǒng)中,不知道大家能不能抽象過(guò)來(lái)。
假設(shè)上面的數(shù)據(jù)集是經(jīng)過(guò)DM清理之后發(fā)給我們的原始數(shù)據(jù),這時(shí)候的數(shù)據(jù)并不符合CDISC標(biāo)準(zhǔn),所以我們需要經(jīng)過(guò)處理將他們轉(zhuǎn)換成標(biāo)準(zhǔn)的SDTM數(shù)據(jù)結(jié)構(gòu)。
首先就是注釋CRF,將空白CRF上注釋成擁有SDTM變量的CRF,然后寫SPEC的SAS程序員將轉(zhuǎn)換的過(guò)程方法寫在EXCEL上,其他SAS程序員根據(jù)這個(gè)說(shuō)明,結(jié)合aCRF將raw數(shù)據(jù)集轉(zhuǎn)換成標(biāo)準(zhǔn)的EG數(shù)據(jù)集。
而且,注意到raw數(shù)據(jù)集是水平結(jié)構(gòu),但是SDTM一般是垂直結(jié)構(gòu),也就是說(shuō),你看raw數(shù)據(jù)集,HR和QTC都在一條水平線上,但是按照SDTM的要求,必須一個(gè)檢查項(xiàng)一條記錄,下面這個(gè)截圖就是相對(duì)標(biāo)準(zhǔn)的EG數(shù)據(jù)集,符合SDTM標(biāo)準(zhǔn)的數(shù)據(jù)集。(只拿S001來(lái)舉例子,當(dāng)然少了很多其他關(guān)于EG的變量)
你們自己去看看理解吧。阿尼瑪,真的太費(fèi)時(shí)間了給你們舉這些例子,又是截圖又是注釋的。
總之,我們SAS程序員的工作流程就是下面這張圖所示:
然后過(guò)程之間肯定有很多小步驟。