為了準備答辯,正在讀自己寫的八萬字論文,覺得不如趁這個機會把論文里的東西來總結一下,興許這是最后一次碰自己寫的論文了,也為了紀念一下自己的四年博士到底都研究出來點啥。國外各種大牛經(jīng)常會寫點學術博客,感覺自己也寫一些,抒發(fā)一些這些年來漲的姿勢 (:D), 也在答辯前梳理一下論文思路。plus, 就當是knowledge exchange and dissemination 啦。
Title: making what counts be counted: evaluating the use of preference-based outcome measures in Parkinson's disease
Chapter 1開篇
帕金森癥狀廣泛。Parkinson's significantly affects patients' health and wellbeing, not just phycially, but also mentally, and general wellbeing. Parkinson's is not life-threatening, but it is life-disabling. wide range of symptoms, each potentially affecting patients' health, QoL and their overall wellbeing. These impacts are not simply tremor, involuntary movement, speech and language problems and depression, but also relate to patients' self-perception, family relationships?and social functioning.
由于癥狀廣泛,其干預措施也多種多樣。而目前并沒有cure,所以提高生活質量是第一要務。這個長期的疾病,患者每一天的daily life都受到影響,吃飯,睡覺,走路,看電視,和人交談,各個方面。而這些方面都需要專門的醫(yī)療干預來對癥實施。
然而,就像其他疾病一樣,不能想實施什么干預就要求醫(yī)療系統(tǒng)提供什么干預。畢竟,在一個全民醫(yī)療系統(tǒng)下,任何的干預都要政府買單。而英國醫(yī)療費用就像各國的醫(yī)療費用一樣,逐年增長。因此,priority setting,資源的優(yōu)化配置,說白了到底什么醫(yī)療干預可以納入醫(yī)保,什么醫(yī)療干預不能納入醫(yī)保,這個問題尤為重要。作為醫(yī)療決策者,到底如何選擇呢?
退一步來說,把醫(yī)療服務如果看作商品,在一個完全市場化的前提下,這完全是由購買者和提供者的行為來決定的,購買者有這個需求,那提供者就提供這個干預,最后達到一種市場平衡 (Pareto efficiency),而technical efficiency, 和allocation efficiency 也同時通過亞當斯密這無形的手來達到。
然而,在醫(yī)療行業(yè)中,市場化是不能達到的,注定是一個Failure. 這就是market failure, 在講全民醫(yī)療系統(tǒng)中一定要提到的。為什么說提供醫(yī)療服務不可市場化呢,原因大概歸為四條: 疾病的不確定性,醫(yī)生患者還有保險公司對病和治療的不對稱信息(患者對自己的癥狀了解,而醫(yī)生對治療干預了解,而保險公司只得依賴雙方),醫(yī)療服務提供者導致的需求(’過度診斷/治療‘)以及外部因素 (像一個vaccination program, 免疫了的人群對周邊人都是一種Benefit, 避免周邊人受感染)。
那既然市場運作在醫(yī)療領域行不通,那再回到之前的問題,到底應該如何選擇醫(yī)療干預來達到最佳的資源優(yōu)化配置, i.e. 效率最大化呢?
這就要說的我的focus了,一直在做的economic evaluation.
在評價醫(yī)療干預的時候,不僅僅要看它是否有效,比如延長了病人多少生命,是否安全,比如是不是有嚴重副作用,也要看一個醫(yī)療干預是否經(jīng)濟。經(jīng)濟學評價考量一個醫(yī)療干預的成本和產(chǎn)出。英國目前的NICE(National Institute of Health and Care Excellence) 是英國醫(yī)療干預是否能夠進入到各大醫(yī)院的決策者,而NICE所考量的一個重要指標就是cost effectiveness. 通常成本cost是比較tangible的(有形,可用金錢量化),而干預的效果(outcomes)卻比較難以定量。干預的效果可以很廣泛,涉及生活方方面面,比如帕金森患者的DBS手術(深腦刺激手術),植入一個小的device之后,很多病人的病情可以緩解很多,從跌倒數(shù)次到跌倒幾次,從手部極度震顫到可以正常操作可以做飯穿衣,etc。所有的這些又會對家庭,日常社交和工作產(chǎn)生非常廣泛的影響。而這些影響都可以算作是這個DBS的效果,可這些效果太多太廣泛,那怎么樣可以測量呢?如果測量不準,又有什么后果呢?
先說后果,測量不準的后果就是應有的outcome沒有納入決策者考量的范圍,而導致一個可能有很大benefit的干預進入不到病人的management體系中,說白了就比如說,這個DBS的手術被拒了,那英國的患者就在正常的醫(yī)療體系下不能做這個手術了。這就是BBC新聞報道里經(jīng)常出現(xiàn)的NICE又把哪些患者的哪些hope給deny了 (想想在輿論壓力之下,NICE好冤枉,在經(jīng)濟學里一切都是trade off,deny一些intervention是為了社會整體的效益最大化,而放在個體身上,就又另當別論了,個人利益和集體利益,想說NICE能做到現(xiàn)在如此公正真的需要有非常健全的社會價值觀來作為基礎).
說完后果,說到底目前是如何測量的呢。英國目前用的指標就是QALY了,quality adjusted life years. 翻譯過來是生活質量調整年。其實就是把生活質量和生命長度相結合的一個指標。一個干預可以延長的生命長度可以用長期的觀測實驗或者模型來推測,而生活質量卻是一個非常tricky的概念,而這也就是諸多在outcome measurement里學術爭辯的核心。
有很多的outcome measures都claim是測量生活質量,但目前被NICE采用的是這個指標叫EQ-5D,測量五個方面:mobility, self-care, usual activities, pain/discomfort, 和 anxiety/depression。這個指標是一個preference based measure, 意思是說它有一套自己的評分系統(tǒng),而這個評分系統(tǒng)的建立是通過測量偏好的Trade off exercise?來完成的。具體的這些在論文的第二章會提到。而重要的問題是,這五個dimension究竟是否可以定義生活質量呢,是不是和所有的疾病都相關呢,那些更廣泛的影響會不會被忽略了呢?
那這個就引出了本論文的題目和rationale。
首先我們要去評測目前的preference-based measures在帕金森領域的應用。英國最大的病人組織,Parkinson's UK已經(jīng)表示過對目前現(xiàn)有EQ-5D based QALY體系的擔憂,認為很多treatment的Value并沒有完全的被NICE所考慮。所以這篇論文會review一下當前的measures,看看這些measure是不是有局限性。
之后,由于帕金森最主要的問題是它的comprehensiveness,病人癥狀的廣泛性,口說無憑,就看看目前存在的condition specific outcomes,這些廣泛的影響在每一個outcome都有所考慮,像self image, role function, family relationship, 所以可見這些broader wellbeing 是患者關注的一個焦點。而這些如何是否和EQ-5D的dimension來掛鉤呢?從EQ-5D里脫離出來,換個角度就是一個非常重要的問題,i.e. 經(jīng)濟學評價如何可以納入broader benefit呢?這就引出了這篇論文的主角ICECAP-O, 這個新的preference-based capability-wellbeing measure.??
ICECAP-O有很多特點,比如是個非常broad的measure,cover生活的各個方面,真正地define了wellbeing,比如role achievement, family attachment, independence, etc. 第二個特點,就是它focus在capability, rather than functioning. 那這兩者啥區(qū)別呢?capability在于我能不能,而functioning在于我做不做。這兩者什么區(qū)別呢,一個經(jīng)典的例子是為了健康而做的斷食vs因為貧窮而忍受的饑餓。兩者都是不吃飯,但這兩個的效用是完全不同的,所反映的一個人的生活狀態(tài)也是不同的。而前者在于我可以吃但我不吃,后者在于我沒錢所有我不能吃。那同理,可以用于買包包。。我有錢我任性我就不買vs.買不起。。
那我要怎么測評這個新指標呢,這就涉及到了psychometric properties。psychometric properties有眾多,而construct validity和responsiveness是兩個尤為重要的指標。這倆是干嘛的呢?construct validity, 說白了就是看這個outcome是不是construct的合理,這個定義其實相當含糊,啥叫合理?其實用其檢測方法來說明定義要更好理解一些。有兩組病人,帕金森早期和帕金森后期,早期病人手只有輕微震顫,還不太影響到生活,而晚期病人每天摔倒數(shù)次,吃飯,吞咽,以及入睡都有困難。那我用這個生活質量的量表給這兩組病人測一測,是不是最后得分會不同呢?答案顧名思義,是的,不然這量表肯定有問題。那這個就是construct validity。而responsiveness可以算是一個construct validity的longitudinal的概念,有一組病人,處于帕金森早期,給他們量表測量一下生活質量分數(shù),然后過20年,再給他們測量一下這個生活質量,這兩個分數(shù)肯定是不同的,因為帕金森是progressive的疾病且沒有治愈的可能,所以20年以后的整體生活質量水平一定是下降的。
construct validity和responsiveness這兩個測評方法就像psychometric properties里的其他很多的測評方法一樣,都可以對outcome measure進行unlimited times的評定,從各種各樣的角度。他們對于economic evaluation的重要性在于economic evaluation講究的是incremental benefit between the groups over time, 而這也正符合這兩個指標的精神,difference for construct validity 和 change for responsiveness。
那這篇論文呢就是通過去測評這兩個屬性來回答上面提到的兩個問題。
waka waka 終于寫完了第一章,28頁。先給自己點個贊。