高通量、全基因組的DNA芯片已經(jīng)成為生物領(lǐng)域十分有用的工具。然而,芯片實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù)量日益增長,由于不同的分析方法,會(huì)得出不同結(jié)論,因而分析起著關(guān)鍵作用。
基因芯片分析就是為了通過生物信息學(xué)方法從這些芯片數(shù)據(jù)中發(fā)現(xiàn)可能對生物效應(yīng)起作用的關(guān)鍵基因,從中尋找特定模式并對每個(gè)基因給予注釋,從而挖掘出隱含的生物學(xué)過程并抽提出生物學(xué)的或功能層面上的意義。
根據(jù)芯片的使用目的,一張芯片可能包含數(shù)十、數(shù)百甚至數(shù)十萬的不同序列。被排列成矩陣的DNA片段通常稱為探針,而樣本RNA則被成為靶標(biāo)。
基本的芯片實(shí)驗(yàn)中,樣本mRNA首先被反轉(zhuǎn)錄成cDNA(在過程中同時(shí)被熒光標(biāo)記),后與芯片上的核酸探針混合,互補(bǔ)雜交的cDNA就結(jié)合到芯片上,而未被雜交的樣本被洗脫掉。
芯片被一個(gè)熒光掃描儀掃描后,芯片上某個(gè)位置探針結(jié)合上了樣本中互補(bǔ)的核酸,就在該位置顯出了一個(gè)熒光點(diǎn),此位置提示基因的身份,而熒光強(qiáng)度則提示了原始樣本中該mRNA水平的高低。芯片技術(shù)不只用于檢測基因表達(dá),也可以用于檢測單核苷酸多態(tài)性等。
在芯片技術(shù)中有兩種基本方法:單染色技術(shù)和雙染色技術(shù)。單染色技術(shù)是將一個(gè)樣本經(jīng)一種熒光標(biāo)記后單獨(dú)雜交的一張芯片上,是目前使用最多的方法。將一個(gè)樣本單獨(dú)與一張芯片雜交,可以方便簡單地在多張芯片之間進(jìn)行比較。產(chǎn)生的芯片數(shù)據(jù)為單通道信號數(shù)據(jù),這種方法產(chǎn)生的數(shù)據(jù)變異大,需要通過重復(fù)實(shí)驗(yàn)來減少誤差。
雙染色技術(shù)是把兩個(gè)樣本用不同熒光標(biāo)記后一起雜交到同一張芯片上。用于檢測兩種不同條件下基因表達(dá)的差異情況,如疾病組織和正常組織(往往多個(gè)正常組織DNA混合在一起,作為”pool“樣本);處理組與對照組。兩個(gè)樣本(如處理與對照)被兩種不同熒光標(biāo)記。一個(gè)樣本的cDNA用Cy5(一種顯示為紅色染料)標(biāo)記,另一個(gè)樣本用Cy3(一種顯示為綠色的染料)標(biāo)記。這兩種熒光標(biāo)記的樣本混合后與芯片上的探針競爭雜交。
這樣產(chǎn)生的芯片數(shù)據(jù)為雙通道信號數(shù)據(jù)。這種雙通道信號數(shù)據(jù)便于兩樣本間的直接比較,有助于減少數(shù)據(jù)變異性,提高組間差異表達(dá)分析的準(zhǔn)確性,同時(shí)減少了芯片的使用量,節(jié)約了成本。但由于使用這種技術(shù)已經(jīng)確定好了實(shí)驗(yàn)設(shè)計(jì),就無法與其他樣本進(jìn)行比較了。
當(dāng)前,市場上芯片主要來自三家公司:Affymetric公司、Agilent公司和Illumina公司。
基因芯片分析
軟件介紹
基因芯片分析一般對硬件要求不高,普通的計(jì)算機(jī)就能運(yùn)行,但如果處理較多的數(shù)據(jù)量時(shí),建議提高內(nèi)存,一般擁有16g內(nèi)存和i7的處理器基本就能快速運(yùn)行所有分析了。目前基因芯片的分析工具很多,但各有優(yōu)缺點(diǎn)。根據(jù)難易程度推薦以下三款軟件和工具。
1. GeneSpring 優(yōu)點(diǎn):互動(dòng)式的視窗操作界面,傻瓜式操作,功能強(qiáng)大,擁有超過4400篇的高水平參考文獻(xiàn)的引用,表達(dá)譜數(shù)據(jù)分析的金標(biāo)準(zhǔn)。缺點(diǎn):商業(yè)軟件收費(fèi),操作繁瑣,功能拓展性差。如同SPSS一樣,適用于零基礎(chǔ)。
2. BRB-Array 優(yōu)點(diǎn):基于excel的分析工具,自動(dòng)調(diào)用R包,功能強(qiáng)大,拓展性強(qiáng),操作簡單,免費(fèi)使用。缺點(diǎn):專業(yè)性強(qiáng),格式要求高,稍有不符就報(bào)錯(cuò)。適用于有一定專業(yè)基礎(chǔ)。
3. R-Bioconductor 優(yōu)點(diǎn):R語言,生信必學(xué)的分析工具,強(qiáng)大的統(tǒng)計(jì)分析和作圖工具,集合了幾乎所有最新的分析算法和工具包,免費(fèi)下載使用。缺點(diǎn):需要有一定計(jì)算機(jī)編程能力。
數(shù)據(jù)下載
一般來說要比較和整合不同實(shí)驗(yàn)室和不同實(shí)驗(yàn)的數(shù)據(jù)是比較困難的。因此,科學(xué)家成立了一個(gè)聯(lián)盟(MGED學(xué)會(huì))來規(guī)范化芯片數(shù)據(jù)的輸出和注釋,促進(jìn)數(shù)據(jù)共享和統(tǒng)一數(shù)據(jù)庫的建立。
指定的標(biāo)準(zhǔn)化規(guī)則稱為MIAME,權(quán)威期刊一般只接受遵循MIAME規(guī)則的芯片數(shù)據(jù)論文。NCBI的GEO和EBI的ArrayExpress是目前最大的公開資源數(shù)據(jù)庫,用于存儲(chǔ)和發(fā)布與MIAME相容的芯片數(shù)據(jù)。