MA plot
MA plot即M-versus-A plot,在芯片數(shù)據(jù)處理出現(xiàn)之前也稱為Bland-Altman plot,是由發(fā)明者名字命名的,而MA plot是對M與A作圖而得名,M是minus的縮寫,代表兩個值之差,A是add的縮寫,代表兩個值之和。有研究者也把MA plot稱為Ratio-Intensity (RI) plots,同時(shí)MA也正好是micro-array的簡寫。
MA plot的作用是為了展示兩個值幾乎相等的變量(x和y)之間的關(guān)系,為了展示兩個變量之間的變化關(guān)系,大多數(shù)人的思維都是把x與y分別作為橫軸和縱軸進(jìn)行繪圖,如果y=x,則該圖呈45度角的直線(如下圖中左邊圖的藍(lán)色直線),可以通過查看點(diǎn)形成的直線偏離預(yù)期直線的多少來衡量系統(tǒng)偏差,然而該圖存在以下幾個缺點(diǎn):
1. 人的視覺對水平線比更敏感
2. 不同坐標(biāo)軸的刻度可能會使預(yù)期參考直線偏離45度
3. 很難從直觀上衡量偏離一條線性的大小
MA plot的處理方法是把該直線順時(shí)針旋轉(zhuǎn)45度,把參考對角線變?yōu)橹本€,具體做法是把(x+y)/2作為橫軸,(y-x)作為縱軸,則參考直線變?yōu)橐粭l水平線,如下方右圖,這樣可以很清楚的在視覺上展示兩個相等的變量之間偏離參考值的大小,即存在的系統(tǒng)誤差的大小

對于芯片數(shù)據(jù)中信號值x和y的比較,一般先對它們進(jìn)行l(wèi)og2處理,再進(jìn)行Minus(log2{Y}-log2{x}=log2(y/x))和Add((log2{x}+log2{y})/2)做MA plot,為什么使用log2處理的原因如下:
1. 取對數(shù)后的兩組數(shù)據(jù)的值差異比不取對數(shù)時(shí)更獨(dú)立于其值大小
2. 對于取對數(shù)后的值標(biāo)準(zhǔn)化只需簡單的加法即可
3. 取對數(shù)后使分布不太過度偏斜
4. 取對數(shù)后使變異大小跨度更真實(shí)
5. 取log2而不取ln或log10是因?yàn)樾酒男盘栔荡笮》秶鸀?~2^16-1的整數(shù)值(一般都是用計(jì)算機(jī)的16位來存儲信號強(qiáng)度值)
參考:
http://bmbolstad.com/Dissertation/Bolstad_2004_Dissertation.pdf
http://bioinformatics.mdanderson.org/MicroarrayCourse/Lectures10/r3_bw.pdf
http://www.jstor.org/stable/24307038?seq=1#page_scan_tab_contents