假設剛進公司的你經過幾個月的培訓,現(xiàn)在學習完SAS Base了,不要以為可以喘一口氣了,接下來就要進入到我們SAS程序員的重頭戲了---CDISC標準之SDTM,我以前的一篇文章粗略介紹過這個,可以點擊鏈接看看。
接下來的文章我會詳細介紹SDTMIG中的各種domain,一是向你們分享知識,另一方面也是加深自己的印象和理解,當然主要還是以翻譯為主,再加上自己的理解。
在沒有執(zhí)行CDISC標準之前,很多組織或者制藥公司還有一些CRO公司因為并購或者其他一些原因,CRF設計、變量名稱和他們工作的不同化合物的數(shù)據(jù)格式也發(fā)生了變化。
所以當這些公司給監(jiān)管機構提交數(shù)據(jù)時,大量時間都花在了決定用于集成數(shù)據(jù)庫的結構和變量名上。與此同時FDA的審查員不得不處理不同贊助商之間完全不同的數(shù)據(jù)格式和結構。
隨著時間的累積,相關人員開始看到在整個行業(yè)中擁有一個標準的好處。于是在FDA的支持下,一群人就開始研究相關的標準了。這可以說是CDISC標準的來源。
這就像學生做一樣的作業(yè),有的學生喜歡把答案寫在題目后面的括號里;有的學生喜歡把答案寫在題目的前面;還有的學生喜歡把所有答案都寫在作業(yè)的最后面...這樣等老師批改作業(yè)的時候,翻來翻去,頭都要大了,所以老師索性直接規(guī)定你們把答案都給我寫在作業(yè)后面。學生按照這種要求完成作業(yè),老師批改起來速度快了,效率自然高。
作為CDISC標準重要組成之一---SDTM(Study Data Tabulation Model),大致定義了研究數(shù)據(jù)表的標準結構。而這個Model的具體應用、指導準則以及法規(guī)實現(xiàn)則在SDTMIG(Study Data Tabulation Model Implementation Guide)中體現(xiàn)。這個文件的目的是指導(藥廠、CROS .etc)提交給監(jiān)管當局的標準臨床試驗表格數(shù)據(jù)集的組織、結構和格式。
具體文件可以登入CDISC官網下載,或者直接百度CDISC,一般公司資料文件夾也都會配備的。
在這份文件中,規(guī)定了一些domain需要采集的變量,但是你的項目中具體需要哪些變量,一般要根據(jù)申辦方的方案和其他需求來決定,然后制定CRF用于采集受試者數(shù)據(jù)。
下面一張圖是任何方案都需要的一個domain,也就是DM domain,這里面收集的包括受試者的年齡,身高,體重,第一次給藥時間,分組等非常重要的信息,但是不會出現(xiàn)受試者的個人隱私(這在臨床試驗中是很忌諱的,要保證受試者信息安全和知情同意),所以一般用唯一的一個usubjid來代替這個受試者。
假設我們知道要采用哪些變量了,但是放到哪里去呢?這就有專門的excel文件來說明了,也就是specification,簡稱SPEC.下圖是我自己編寫的一個說明文檔,只有幾個domain和從ig上復制過來的幾個變量。(因為臨床項目文件,包括數(shù)據(jù)都是保密的,所以我不可能把公司的數(shù)據(jù)和說明文件直接拿過來用)
每個公司那行灰色的標題取名可能不一樣,但大致內容是相同的。都需要有變量,變量的標簽、長度、類型、控制術語(不是所有變量都有)等。
Notes那一列就是我們SAS程序員要做的事了,將文字用代碼轉換過來,生成我們需要的變量。就像下面一樣:
因為現(xiàn)在我沒有數(shù)據(jù),所以也跑不出來結果,大致流程是這樣的。最后將所有需要的變量集中輸出到一個數(shù)據(jù)集中,我們將這個數(shù)據(jù)集命名為“DM”。
為什么我要rename subjid呢?因為rawdata里面的變量,即使跟你要輸出的變量長得一樣,但是經常因為長度不一樣會報錯,所以才這樣做。
length語句放到set語句前面,這樣輸出數(shù)據(jù)集的時候前幾個展示的變量就是你設定長度的那幾個變量,便于檢查。如果放到set語句后面,你可以去試試看是什么樣的。
今天就介紹到這里,不想寫了,記得當初培訓完SAS Base,然后經理第一次給我們培訓SDTM,當時同事聽完出來一臉懵逼,都不知道講的是什么,一方面是以前沒有從來沒有接觸過,另一方面是經理可能沒有像我這樣一步一步講的通俗好理解吧。
對于從來沒有接觸過這些的你們,也算是有個大致印象了,知道是怎么回事了,不至于輪到你們培訓的時候也是一臉懵逼。
我很想單獨編寫出一套SPEC還有一套對應的數(shù)據(jù),但是對于我個人,是一個浩大的工程,費時費力又費腦,至于最后會不會去做,看心情吧。如果做出來了,我可是要收費的!嘿嘿嘿。。。
/***********************************************************************/
我這個公眾號不像其他那么專業(yè)的公眾號只講臨床知識,我還會穿插自己的生活,感悟,吐槽,八卦等等。你們有些私信(雖然沒幾個私信)問我在哪個公司,工資多少,恕不能告訴你們。
只會講個大致范圍:江浙滬,兩年經驗,沒有月入過萬,只能求個溫飽,生活困難。單身,佛系青年。
要加聯(lián)系方式的,我以前一篇文章有放過,以前會很熱心解答問題,喜歡當人生導師,說些心靈雞湯;現(xiàn)在愛問不問,關我屁事。
無所謂~誰會愛上誰~~~
注:文末的贊賞是我為了看看這個功能怎么用,當然你是個小富婆,又覺得我寫的不錯的話,歡迎贊賞。