R數(shù)據(jù)分析:工具變量回歸與孟德爾隨機化,實例解析

原諒我又拖更好久,沒辦法,欸,就是懶,但是所有的單子都是保質(zhì)保量完成的哈。,今天給大家寫工具變量和孟德爾隨機化,文章略微有些長,請大家準(zhǔn)備好清醒的頭腦,和半個小時的閱讀時間哈。

啥是工具變量回歸

Instrumental variable procedures are needed when some regressors are endogenous (correlated with the error term). The procedure for correcting this endogeneity problem involves finding instruments that are correlated with the endogenous regressors but uncorrelated with the error term. Then the two stage least squares procedure can be applied.

在你的研究中有內(nèi)生性問題時(就是你的自變量和殘差有關(guān)系了,這個時候就有內(nèi)生性問題了),這個時候就可以用得到工具變量回歸,或者說你的混雜很多控制不完,這個時候就可以用工具變量回歸。

工具變量回歸是在觀察性研究中控制混雜的利器!

舉例說明工具變量

我現(xiàn)在想探討兩個有相關(guān)的變量之間的因果關(guān)系,比如X和Y吧,我想知道XY是如何相互影響的,現(xiàn)在聰明的我又去找了一個變量Z,我現(xiàn)在肯定地知道Z和Y是沒有直接的關(guān)系的,但是Z會影響X,且只會影響X。

然后我做數(shù)據(jù)分析,如果我的數(shù)據(jù)告訴我本來不可能影響Y的Z竟然對Y有作用,那么這個作用只能是通過X實現(xiàn)的。

大概思想就是這樣的,好簡單吧。繼續(xù)看:

把上面的話放在一個實際的情形下:我現(xiàn)在想研究抑郁depression (X)和?smoking (Y)的關(guān)系,此時我手上恰好還有一個變量:工作機會缺乏Lack of job opportunities (Z),正常人都知道工作機會缺乏是絕對不可能對吸煙有影響的,對吧,因為工作機會是別人或者外部環(huán)境決定的,吸煙是你自己干的,所以Z對Y是絕對不會有影響的,但是我收集到了好多數(shù)據(jù),一分析,發(fā)現(xiàn)工作機會越缺乏的人們吸煙情況越嚴(yán)重,這內(nèi)在的原因有可能就是X(僅在XYZ3個變量的系統(tǒng)中看)。

這個時候Z就可以在研究XY之間關(guān)系的時候作為一個工具變量!

什么是工具變量回歸

工具變量回歸就是把上面的思想用數(shù)據(jù)實現(xiàn),具體的方法就是把你的有內(nèi)生性問題的自變量拆開,一部分和殘差有關(guān),一部分無關(guān),無關(guān)的部分就是工具變量:

Instrumental Variables regression (IV) basically splits your explanatory variable into two parts: one part that could be correlated with ε and one part that probably isn’t

有點不好理解,繼續(xù)看:

還記得我們的一般的回歸模型不?如下圖:

注意模型后面都有一個誤差項e,這個e就代表這除了x之外的那些沒能測著的可能影響y的因素,而工具變量回歸就相當(dāng)于將我們原來的X分解成了兩部分,一部分和誤差項相關(guān),一部分不相關(guān),不相關(guān)的部分的系數(shù)不久是干干凈凈的系數(shù)嘛。所以說一個完美的工具變量就可以將混雜控制的干干凈凈明明白白的。

如何找工具變量

In real life, instrumental variables can be difficult to find and in fact, may not exist at all

很遺憾,現(xiàn)實世界真正的工具變量有可能根本就不存在,最完美工具變量就要求這個工具變量Z和X相關(guān),和Y不相關(guān)。

就是這個“只”,太難了。

回到我們的第一個例子:你說工作機會缺乏本身是不可能和吸煙有影響的,我同意,但是它影響抑郁嗎?不是。

工作機會缺乏有可能還會影響焦慮吧,還會影響幸福感吧,這些說不定都和吸煙有可能有關(guān)吧,所以我們把工作機會缺乏做工具變量回歸,得到的抑郁對吸煙的影響肯定也是不準(zhǔn)的。

我們找工具變量一定是基于理論的,不是說我做個相關(guān)分析就說某某變量滿足工作變量的條件,合格工具變量從理論上考慮要滿足如下兩個條件:

Exogenous?—not affected by other variables in the system (i.e. Cov(z,ε) = 0). This can’t be directly tested; you have to use your knowledge of the system to determine if your system has exogenous variables or not.

Correlated with X, an endogenous explanatory variable (i.e. Cov(Z,X) ≠ 0). A very significant correlation is called a?strong first stage. Weak correlations can lead to misleading estimates for parameters and standard errors.

一是外生性Exogenous,就是說你找的這個工具變量是絕對不應(yīng)該受到你研究的這個系統(tǒng)中的其余變量影響的。

二是一定要和X相關(guān)Correlated with X,最好是強相關(guān)(弱相關(guān)會導(dǎo)致X的系數(shù)估計不準(zhǔn))

比如,我想看接受咨詢對抑郁的效果如何,因為影響抑郁的因素實在太多了,你想一個一個都收集后在模型中控制掉顯然是不現(xiàn)實的,但是我發(fā)現(xiàn)了一個我研究的這個系統(tǒng)中的一個外生變量:離咨詢中心的距離,我們認為離咨詢中心的距離和接受咨詢是有相關(guān)的,有可能還比較強,此時距離就可以在我們的研究中作為一個工具變量。

這個距離變量在理論上是絕對不會影響抑郁的,如果在模型中發(fā)現(xiàn)距離有作用,我們就可以認為其是通過影響咨詢從而影響的抑郁,它的系數(shù)就可以近似認為是咨詢的系數(shù)。

就像上圖表達的一樣,我們現(xiàn)在理解為距離只有通過影響咨詢才能影響抑郁,所以其系數(shù)可以認為是咨詢的系數(shù),但是這個說法成立的前提就是只,就是距離和咨詢之間的相關(guān)性是完美的。

但是實際上是不可能的。

比如,有可能咨詢中心是在社區(qū)服務(wù)中心里面的,那么此時距離其實和人們在社區(qū)服務(wù)中心待的時間有相關(guān)性了,就是離咨詢中心近就越可能在社區(qū)服務(wù)中心待的時間久,從而受到同伴或者別的影響就不容易抑郁,但這并不是咨詢的作用。

所以從這個角度考慮距離作為工具變量也是不完美的,但是科研哪有完美的事呢,發(fā)表的文獻中用距離作為工具變量的文章很多的。大家理解這其中的內(nèi)在邏輯就好。

就是說下圖中紅色的路徑的存在是影響了例子中工具變量的可接受性的。

橫斷面數(shù)據(jù)的因果推斷理論

要推斷因果很多時候是要通過設(shè)計良好的隨機對照試驗進行的,當(dāng)實驗設(shè)計行不通的時候,學(xué)者就會追求通過橫斷面數(shù)據(jù)探討因果,通常我們會將實驗組和對照組的差值直接看作是試驗因素導(dǎo)致的果,但是這樣的做法缺點是顯而易見的:

In most observational studies, inferring effects is problematic, because those choosing different treatments may be different and their responses to the actually received treatments may also be different

于是聰明的學(xué)者們進行了很多的努力,比如說通過給實驗組匹配一些特征一致的對照組(就是在一堆橫斷面觀察數(shù)據(jù)中挑選),最終使得兩組除了實驗因素其余的特征均達到可比,這樣就能解釋因果了。

但是這么樣匹配也是存在問題的:你只能匹配那些你自己知道的變量,有可能好多特征你根本就沒有考慮到或者根本就考慮不到,所以又怎么說明兩組是可比的呢?

還有一種常用的方法是反事實推斷方法,感興趣的可以閱讀下面的文獻:

Rosenbaum, P., Rubin, D: The central role of the propensity score in observational studies for causal effects.?Biometrika,?70, 41–55 (1983)

這兒只給大家簡要介紹,我們已經(jīng)知道用觀察數(shù)據(jù)的實驗組和對照組之間的差異并不能說明是實驗因素導(dǎo)致了這種差異,是因為兩組的某些特征有可能是不同的,有可能正是實驗組具備某些特征所以它更容易成為實驗組,咱們不知道。

those who chose a particular treatment may have had good reasons to choose that treatment (perhaps including a particular response to the treatment), and therefore their responses to different treatments cannot be compared

但是有沒有可能在對照組中真的找出來一個亞組,這個亞組的總的特征和實驗組完全一樣,從而它們接受試驗的可能性也應(yīng)是一樣的,這樣的亞組理論上是可以的!

就是說我們要做的在對照組中找到那些本來應(yīng)該和實驗組一樣可能性接受試驗因素的個體,那么這些個體就是那種本來憑著它自己的特征應(yīng)該會被分到實驗組但卻到了對照組的個體,這些個體除了沒有接受實驗因素,其它的特征我們認為都和實驗組是可比的!

那么怎么樣評價這個接受試驗的可能性呢?就用傾向分propensity score

大家把上面的中文和下面的英文多讀幾遍,體會一番這種反事實思想的高明之處:

the effect size may be estimated by comparing those who have and those who have not received the treatment from among those who would have received the treatment with equal probability. This probability is called the propensity score.

本來兩個人被分到實驗組的可能性都一樣,但現(xiàn)實中一部分卻分到了對照組,那么這些人之間的效果差不就是實驗因素造成的嘛。

以上就是反事實推斷因果的思想。很棒的思想!

再給大家介紹另外一種因果推斷的思想:工具變量,感興趣的同學(xué)可以閱讀下面的文獻:Spirtes, P., Glymour, C, Scheines, R.:?Causation, Prediction and Search. Springer, New York (1993)

這兒依然是給大家簡要說明,因為開篇就講過:

想象一下我們有XYZ3個變量,我們想看看這3個變量之間的關(guān)系和關(guān)系的方向,首先我們考慮XY之間是獨立的,此時存在兩種情況,一是XY沒有任何聯(lián)系,二是雖然XY在表面上有聯(lián)系,但是實際上其實沒聯(lián)系(表面上的聯(lián)系也是因為同時受到Z的影響造成的)。

為了更好地說明3個變量間關(guān)系的各種情況,我們借助有向無環(huán)圖DAGs看看:

上面的這個圖顯示了XYZ之間關(guān)系的所有可能性,看到這個圖我們再來回味一下兩個變量獨立的情況,如果XY是獨立的,那么上圖中的[a], [b], [g], [h], [i], [j], [o], [p], [q], [r], [t], [u], [v], [x], [y], and [z]都會沒有啦,因為這些子圖中都有都有XY之間的指向箭頭。我們看[I]這個圖就表達了完全中介效應(yīng),就是XY是沒有直接因果的,之所以有表面的因果也是因為Z存在,如果Z不在了,XY依然獨立。同理圖[m]也是一個意思。

上面介紹了兩個變量獨立,還有一個概念叫做條件獨立,條件獨立也會牽涉到第三個變量Z,就是說在Z的特定水平下XY是獨立的,只要Z不變,XY就一直獨立,此時所有XY的虛假關(guān)系都是Z導(dǎo)致的:

Conditional independence is linked to the causal structures depicted in these graph by saying that if some intervention kept Z constant, X and Y would be independent, just like as if conditioned on a particular category of Z

上面的子圖[n]就表示一種條件獨立關(guān)系,其實[l],[m]也可以看作是XY條件獨立。

應(yīng)用條件獨立的思想就引申出了工具變量instrumental variable這個概念,如果我們要回答:“對于存在相關(guān)關(guān)系的XZ,到底是X對Z有作用還是Z對X有作用這一科學(xué)問題”,我們找到工具變量Y,這個Y只會對Z產(chǎn)生影響,但是不會影響X且不會被X影響,這樣就保證了在有向無環(huán)圖中XY之間是絕不會有箭頭存在的(圖[K]),但是Y一定有箭頭指向Z,此時就形成了XY的條件獨立性,這個條件就是Z。

看到這兒估計好多人已經(jīng)暈了,沒辦法呀,寫作水平有限,得給大家放個圖。

讀到這的同學(xué)先回頭把圖[k]和圖[m]好好地瞅兩眼,繼續(xù)往下看,把圖k和圖m印在你的腦海里,如果此時XY是真實是獨立的,那我們的可以得出來X是因Z是果(圖[k]);如果此時XY是條件獨立的,我們就可以得出來Z是因X是果(圖[m])。

以上就是用工具變量推斷因果方向的思想。

孟德爾隨機化

上面寫了很多的橫斷面觀察數(shù)據(jù)推斷因果的思想,目的之一就是要給大家引出來孟德爾隨機化Mendelian Randomization(寫個文章真的是煞費苦心啊,趕緊先點個贊再繼續(xù)往下看)。孟德爾隨機化其實就是找到了一個近乎完美的工具變量,建議大家閱讀下面這篇文獻:

Mendelian Randomization: Genetic Variants as Instruments for Strengthening Causal Inference in Observational Studies

這篇文獻就講了,通過孟德爾隨機化來實現(xiàn)在觀察數(shù)據(jù)實現(xiàn)因果推斷,這兒依然是粗淺地給大家進行介紹。

The basic principle utilized in Mendelian randomization is that genetic variants that either alter the level of, or mirror the biological effects of, a modifiable environmental exposure that itself alters disease risk should be related to disease risk to the extent predicted by their influence on exposure to the environmental risk factor.Common genetic polymorphisms that have a well-characterized biological function (or are markers for such variants) can therefore be utilized to study the effect of a suspected environmental exposure on disease risk.

孟德爾隨機化的基本原理就是基因變量和疾病的關(guān)系程度是可以被基因所造成環(huán)境因子的暴露所預(yù)測的?;虻淖兓梢杂脕硌芯凯h(huán)境暴露對疾病的影響。

這里面重要需要理解的就是使用基因的變異替代環(huán)境的變異。

有人問,為啥我不直接測暴露呢?是因為基因受到的社會心理行為因素更少,或者說沒有。

舉個例子,我在研究維生素C和冠心病的因果關(guān)系的時候,如果我除了直接來收集了維C使用和冠心病發(fā)病率的數(shù)據(jù),我還得收集各種心理,社會,行為因素作為協(xié)變量吧,此時我問你,你能保證都收集的面面俱到嘛?

不能,絕對做不到,因為有很多可能至今未被人們理解的變量會影響冠心病。

但是如果我用基因來作為可修飾環(huán)境因素的替代,是不是這個關(guān)系就清晰多了,因為基因是不會那么容易被外界因素影響的,另外因為減數(shù)分裂過程是隨機的,所以基因之間也沒有聯(lián)系--------孟德爾第二定律------孟德爾隨機化的由來。

舉個例子,下表可以看得到很多心理行為因素都和CRP水平有關(guān)系:

但是,你卻可以發(fā)現(xiàn)同樣的這些心理行為因素都和1050G/C基因型是沒關(guān)系的(除了CRP)。這個基因就可以作為CRP的marker,就是一個很好的工具變量。

在觀察性研究中還有一個顧慮是反向因果,但是使用基因型作為工具變量也很好地排除了反向因果;還可以避免測量誤差和選擇偏倚,具體解釋請查閱原文獻哈。

孟德爾隨機化和隨機對照試驗思想對比

孟德爾隨機化和隨機對照實驗是有邏輯上的一致性的。如下圖:

在隨機對照實驗中我們有專門的隨機分配過程來保證組間的可比性,在孟德爾隨機化中我們有一個樣本的挑選過程,這個挑選是通過等位基因?qū)崿F(xiàn)的,把等位基因作為了暴露的代替,從而也可以實現(xiàn)組間可比性:

我們考慮一個研究降壓藥效果的隨機對照試驗,影響血壓的變量是很多的,通過試驗分配的隨機化,我們樸素地認為所有的可能或不可能影響血壓的因素都在兩組中可比了?!居形恼聲陔S機化后比較基線特征,這個操作是完全沒有必要的】

在孟德爾隨機化中我們認為等位基因的分配就是一個天然的隨機過程,所以如果我們找到了影響暴露的等位基因,此時我們選擇不同基因型的個體進行比較就可以直接得到暴露所造成的效果。

舉例子:我要研究酒精消耗和心血管疾病的關(guān)系,有可能不飲酒的人其實是自身身體本來就差,所以他不飲酒所以有可能你發(fā)現(xiàn)不飲酒的人心血管病發(fā)病情況更加高,還有情況是因為他心血管疾病了所以他不飲酒了,這個是反向因果,諸如此類,你做個橫斷面調(diào)查是說不清楚的。

但是我找到了一個影響飲酒的基因ALDH2 genotype,這個基因是隨機的呀,是不會受到其余因素影響的,也不會有反向因果的。

你只要這個基因陽性,我就樸素地認為你就是飲酒的,即使你沒有飲酒也是因為你反向因果了,或者是被環(huán)境影響了;只要你這個基因陰性,你就是不飲酒,即使你飲酒也是因為被環(huán)境影響了。有人估計要罵我在亂說,其實是的,這個孟德爾隨機化一定要是大樣本才行的,一定注意。反正思想就是這樣。

The analogy with randomized controlled trials is also useful in understanding why an objection to Mendelian randomization—that the environmentally modifiable exposure proxied for by the genetic variants (such as alcohol intake or circulating CRP levels) are influenced by many other factors in addition to the genetic variants (Jousilahti and Salomaa, 2004)—while true, is of no consequence.

所以說你只要找一批ALDH2 genotype陽性的人和ALDH2 genotype陰性的人,直接調(diào)查它們的心血管病發(fā)病,你就可以得到飲酒對心血管病的影響了,注意一定是大樣本情形哈。

有些同學(xué)還是不信,在寫個例子:很多研究都說CRP和hypertension, insulin resistance, and coronary heart disease有關(guān)系,所以很多學(xué)者都說CRP造成了這些病,有一天,有人做了孟德爾隨機化研究了這個問題,他就發(fā)現(xiàn)雖然CRP和這些病相關(guān),但是CRP基因和這些病都沒關(guān),這就矛盾了吧,其中一個解釋就是混雜太多了,還有一個解釋就是反向因果,就是說橫斷面數(shù)據(jù)不準(zhǔn)的,你得信孟德爾隨機化。文獻給大家貼上,有興趣自己去看:

Davey Smith G, Lawlor D, Harbord R, Timpson N, Rumley A, Lowe G, Day I, Ebrahim S. Association of C-reactive protein with blood pressure and hypertension: Lifecourse confounding and Mendelian randomization tests of causality. Arteriosclerosis, Thrombosis, and Vascular Biology. 2005;25:1051–1056.

這一部分是對比隨機對照試驗嘛,就再給大家寫個例子:比如我研究降壓藥的效果,我會設(shè)計一個隨機對照試驗,把所有影響血壓的因素都通過隨機分配到兩組中,一組給藥,一組不給,挺好的設(shè)計,精髓就在于混雜隨機分配的過程。轉(zhuǎn)到孟德爾隨機化,相關(guān)基因的顯性和隱性也是隨機分的,天然隨機的,而這個隨機就保證了你暴露還是不暴露,所以在邏輯上孟德爾隨機和隨機對照試驗是一樣一樣的:

Thus the fact that many other factors are related to the modifiable exposure does not vitiate the power of randomized controlled trials; neither does it vitiate the strength of Mendelian randomization designs.

所以如果你信隨機對照試驗,你就應(yīng)該理解并相信孟德爾隨機化。以上從類比隨機對照研究的角度給大家寫了孟德爾隨機化,希望給大家以啟發(fā)。

孟德爾隨機化和工具變量思想

本文開篇就講了,一個完美的工具變量必須有外生性和與X強相關(guān),基因型是有天然的外生性的,所以第一個條件完美滿足,因為我們找的基因本來就是對我們的研究的暴露有影響的基因(比如引起維生素D缺乏的基因)所以第二個條件也幾乎完美滿足。還有這個工具變量也是肯定和其它可能影響結(jié)局的混雜無關(guān)的。

反正就是:用適合的基因作為工具變量太完美啦,記住下圖!

這個基因不會影響結(jié)局,因為它是僅引起暴露的基因,這個基因和你能想象到的任何混雜(各種心理行為社會因素)都不可能有關(guān)系,所以如果在數(shù)據(jù)分析中我們發(fā)現(xiàn)這個基因的表達和結(jié)局竟然出現(xiàn)了關(guān)系,那么一定是通過影響暴露X從而影響了結(jié)局Y,而且這個因果一定是從X到Y(jié)而不會反過來,這一切的推斷都是從橫斷面觀察性研究中得出的,多么精妙啊。

以上給大家寫了從工具變量角度理解孟德爾隨機化。希望能給大家以啟發(fā)。

實例操練

希望看了上面的比較詳細的解釋,大家應(yīng)該理解了孟德爾隨機化的原理,接下來再帶著大家用實際例子進行實操

這篇文章太長了實在放不下了,先點關(guān)注,看下篇吧。略略略.....。

小結(jié)

今天給大家寫了孟德爾隨機化的原理,感謝大家耐心看完,自己的文章都寫的很細,代碼都在原文中,希望大家都可以自己做一做,請關(guān)注后私信回復(fù)“數(shù)據(jù)鏈接”獲取所有數(shù)據(jù)和本人收集的學(xué)習(xí)資料。如果對您有用請先收藏,再點贊轉(zhuǎn)發(fā)。

也歡迎大家的意見和建議,大家想了解什么統(tǒng)計方法都可以在文章下留言,說不定我看見了就會給你寫教程哦,另有任何問題都可以私信我哈。

往期精彩

R數(shù)據(jù)分析:如何給數(shù)據(jù)框的列改名

R數(shù)據(jù)分析:相關(guān)性分析

R數(shù)據(jù)分析:有調(diào)節(jié)的中介

R數(shù)據(jù)分析:如何用R做數(shù)據(jù)模擬

R數(shù)據(jù)分析:用R語言做meta分析

R數(shù)據(jù)分析:用R語言做潛類別分析LCA

R數(shù)據(jù)分析:多分類邏輯回歸

R數(shù)據(jù)分析:如何做聚類分析,實操解析

R數(shù)據(jù)分析:主成分分析及可視化

R數(shù)據(jù)分析:一些數(shù)據(jù)可視化的基本原則

R數(shù)據(jù)分析:生存分析的做法和結(jié)果解釋

R數(shù)據(jù)分析:潛在剖面分析LPA的做法與解釋

R數(shù)據(jù)分析:鳶尾花數(shù)據(jù)集的聚類分析實操

R數(shù)據(jù)分析:潛變量與降維方法(主成分分析與因子分析)

R數(shù)據(jù)分析:逐步回歸的做法和原理,案例剖析

R數(shù)據(jù)分析:如何在R中使用mutate

R數(shù)據(jù)分析:著名的“三門問題”的R語言模擬

R數(shù)據(jù)分析:貝葉斯定理的R語言模擬

R數(shù)據(jù)分析:層次聚類實操和解析,一看就會哦

R數(shù)據(jù)分析:R Markdown:數(shù)據(jù)分析過程報告利器,你必須得學(xué)呀

R數(shù)據(jù)分析:傾向性評分匹配實例操作

R數(shù)據(jù)分析:ROC曲線與模型評價實例

R數(shù)據(jù)分析:雙分類變量的交互作用作圖

R數(shù)據(jù)分析:如何用R語言做meta分析,寫給小白

R數(shù)據(jù)分析:非專業(yè)解說潛變量增長模型

R數(shù)據(jù)分析:競爭風(fēng)險模型的做法和解釋

R數(shù)據(jù)分析:競爭風(fēng)險模型的做法和解釋二

R數(shù)據(jù)分析:資料缺失值的常見處理方法

R數(shù)據(jù)分析:多水平模型詳細說明

R數(shù)據(jù)分析:邏輯斯蒂回歸與泊松回歸

R數(shù)據(jù)分析:結(jié)構(gòu)方程模型(SEM)介紹

R數(shù)據(jù)分析:一般線性回歸的做法和解釋

R數(shù)據(jù)分析:雙因素方差分析與交互作用檢驗

R數(shù)據(jù)分析:再寫潛在類別分析LCA的做法與解釋

R數(shù)據(jù)分析:如何繪制回歸分析結(jié)果的森林圖

R數(shù)據(jù)分析:嵌套數(shù)據(jù)分析為什么要用加隨機效應(yīng)?終于解釋清楚了

R數(shù)據(jù)分析:自我報告的身高數(shù)據(jù)的離群值探索

R數(shù)據(jù)分析:傾向性評分匹配完整實例(R實現(xiàn))

R數(shù)據(jù)分析:如何用lavaan包做結(jié)構(gòu)方程模型,實例解析

R數(shù)據(jù)分析:再寫stargazer包,如何輸出漂亮的表格

R數(shù)據(jù)分析:如何用R做多重插補,實例操練

R數(shù)據(jù)分析:如何用mice做多重插補,實例解析

R數(shù)據(jù)分析:廣義估計方程式GEE的做法和解釋

R數(shù)據(jù)分析:交互作用的簡單斜率圖做法及解釋

R數(shù)據(jù)分析:何為Tidy data,它又有什么好處

R數(shù)據(jù)分析:如何理解模型中的“控制”,圖例展示

R數(shù)據(jù)分析:如何計算問卷的聚合效度,實例操練

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容