1. 實(shí)驗(yàn)設(shè)計(jì)與技術(shù)路線
(1) 常用流程
| 流程 | 說(shuō)明 |
|---|---|
| 1.材料收集 | 細(xì)胞、細(xì)胞上清、組織、血漿、血清、腦脊液、外泌體、尿液...... |
| 2.定量技術(shù) | 蛋白組:iTRAQ/TMT、LabelFree、SILAC、修飾;代謝組:靶向、非靶 |
| 3.數(shù)據(jù)驗(yàn)證 | 蛋白組:PRM、WB、ELISA;代謝組:MRM |
| 4.深入研究 | 臨床標(biāo)志物、生理病理機(jī)制、藥效機(jī)制、中醫(yī)理論、藥物靶點(diǎn)...... |
(2) 樣品
| 樣品類型 | Pool(混樣) | Individual(單樣) |
|---|---|---|
| 降低個(gè)體差異 | 不要求大樣本 | 要求大樣本 |
| 數(shù)據(jù)分析 | 低維,難以整合其他信息 | 多維多角度 |
| 可追溯性 | 不能重新定義組別 | 可根據(jù)所需重新定義組別 |
| 樣本量 | 少 | 多 |
| 成本 | 低 | 高 |
(3) iTRAQ/TMT項(xiàng)目設(shè)計(jì)
體外等重同位素標(biāo)記定量技術(shù),可同時(shí)比較多個(gè)樣本之間的蛋白表達(dá)量差異(通常10個(gè)樣本以下)。
基本原則:
- 適用較廣,但樣本間需要較好的平行性,不適合進(jìn)行不同物種樣本間比較,如牛、羊、豬之間的比較;也不適合一些差異較大的IP樣品的比較。
- 一般差異比較樣本組用同一個(gè)試劑盒標(biāo)記;
- 建議3個(gè)生物學(xué)重復(fù);對(duì)于臨床樣本、小鼠等動(dòng)物樣本、植物樣本等,每個(gè)生物學(xué)重復(fù)建議來(lái)自多個(gè)生物個(gè)體的重復(fù);
- 多個(gè)試劑盒項(xiàng)目設(shè)計(jì)時(shí),可加入內(nèi)標(biāo)(IS),內(nèi)標(biāo)通常是所有樣本等量混合的樣本。
(4) Labelfree項(xiàng)目設(shè)計(jì)
Labelfree是通過(guò)比較肽段母離子質(zhì)譜峰強(qiáng)度,分析不同來(lái)源樣品蛋白的表達(dá)量差異。該技術(shù)無(wú)需昂貴的同位素標(biāo)記做內(nèi)標(biāo)。
基本原則:
- 適用于各類型生物樣本;尤其是樣本量較少或差異非常大的樣品,如細(xì)胞上清、亞細(xì)胞成分、IP樣品等的分析;
- 對(duì)于組間差異大的樣品,可采用iBAQ算法(MaxQuant)來(lái)反映一個(gè)樣品內(nèi)不同蛋白間的相對(duì)豐度,可進(jìn)行不同物種樣品間的比較,如牛、羊、豬之間的比較;
- 適合多組分析、后期差異比較組可能會(huì)改變的實(shí)驗(yàn)設(shè)計(jì);
- 建議3個(gè)生物學(xué)重復(fù);對(duì)于臨床樣本、小鼠等動(dòng)物樣本、植物樣本等,每個(gè)生物學(xué)重復(fù)建議來(lái)自多個(gè)生物個(gè)體的重復(fù)。
(5)DIA項(xiàng)目設(shè)計(jì)
DIA是數(shù)據(jù)非依賴性采集定量技術(shù),它將質(zhì)譜整個(gè)全掃描范圍分為若干個(gè)窗口,高速循環(huán)地對(duì)每個(gè)窗口中的所有離子進(jìn)行選擇、碎裂及檢測(cè),從而無(wú)遺漏、無(wú)差異地獲取樣本中所有離子的全部碎片信息。DIA無(wú)需指定目標(biāo)肽段,掃描點(diǎn)數(shù)均勻,利用譜圖庫(kù)即可實(shí)現(xiàn)定性確證和定量離子篩選,并可實(shí)現(xiàn)數(shù)據(jù)回溯。
基本原則:
- 適用于各類型生物樣本;
- 需要先進(jìn)行l(wèi)ibrary構(gòu)建;
- 適合多組分析、后期差異比較組可能會(huì)改變的實(shí)驗(yàn)設(shè)計(jì);
- 建議獨(dú)立的大樣本分析。
(6)各定量技術(shù)比較
從數(shù)據(jù)采集模式來(lái)說(shuō),iTRAQ/TMT和Labelfree都是傳統(tǒng)的DDA掃描,即在每個(gè)掃描周期內(nèi),只采集豐度最高的10-20個(gè)母離子信號(hào)的子離子碎片,其他信號(hào)的子離子信息丟失,因此覆蓋率低、隨機(jī)性高、重復(fù)性相對(duì)低;DIA掃描則在每個(gè)掃描周期內(nèi),將質(zhì)量區(qū)間設(shè)置為多個(gè)區(qū)段window,每次采集window內(nèi)所有母離子信息及其碎片(掃描速度足夠快),因此具有高覆蓋度、高重復(fù)性的特點(diǎn)。
| 定量技術(shù) | iTRAQ/TMT | Labelfree | Labelfree分級(jí) | DIA |
|---|---|---|---|---|
| 樣本數(shù) | 少 | 少/多 | 少 | 多 |
| 樣品 | 一般pool | pool/individual | 一般pool | 一般individual |
| 樣品平行性 | 平行 | 平行/不平行 | 平行/不平行 | 平行/不平行 |
| 數(shù)據(jù)量深度 | 高 | 低 | 高 | 高 |
| PRM驗(yàn)證對(duì)接性 | 低 | 低 | 低 | 高 |
| 建庫(kù) | 否 | 否 | 否 | 是 |
| 成本 | 較高 | 低 | 較高 | 高 |
| 拓展性 | 否 | 否 | 否 | 是(可根據(jù)library重新分析) |
| 采集模式 | DDA | DDA | DDA | DIA |
(7)搜庫(kù)軟件
流程回顧:
蛋白質(zhì)酶切為肽段,經(jīng)過(guò)色譜分離進(jìn)入質(zhì)譜儀,得到質(zhì)譜實(shí)際譜圖,利用搜庫(kù)軟件與理論譜圖進(jìn)行匹配打分,對(duì)肽段和蛋白進(jìn)行鑒定、定量和下游數(shù)據(jù)分析。
- Mascot
特點(diǎn):收費(fèi);基于隨機(jī)匹配打分算法;整合FDR閾值和Percolator算法;質(zhì)譜數(shù)據(jù)檢索的黃金標(biāo)準(zhǔn)。 - MaxQuant
特點(diǎn):免費(fèi)不開(kāi)源;優(yōu)勢(shì)在labelfree,RT校正,Match between runs提高鑒定數(shù);配套的后處理工具Perseus。 - Spectronaut
特點(diǎn):收費(fèi);相對(duì)其他DIA軟件,準(zhǔn)確性高、靈敏度高、速度快;實(shí)現(xiàn)超過(guò)1000個(gè)DIA原始文件同時(shí)分析,極高譜圖解析率,數(shù)據(jù)校正平均峰面積CV<10%;蛋白FDR、肽段FDR和CScore三重標(biāo)準(zhǔn)。
2. 質(zhì)量控制
(1)色譜質(zhì)控
- 色譜的峰形,決定定量準(zhǔn)不準(zhǔn)
對(duì)稱?拖尾? - 色譜的數(shù)據(jù)點(diǎn),決定定量準(zhǔn)不準(zhǔn)
峰曲線上點(diǎn)多?少? - 色譜的穩(wěn)定性,決定定量準(zhǔn)不準(zhǔn)
RT是否偏移?使用iRT同位素內(nèi)參校正色譜偏移 - 色譜的分離度,決定質(zhì)譜的采集效率
(2)質(zhì)量控制 - 基礎(chǔ)狀態(tài)考察
牛血清白蛋白(BSA):考察質(zhì)量偏移、洗脫時(shí)間、峰寬、信號(hào)響應(yīng)等;
細(xì)胞樣品:考察組學(xué)能力,如負(fù)責(zé)樣品蛋白和肽段數(shù)目鑒定能力。 - 復(fù)雜樣本鑒定重現(xiàn)性
三次重復(fù)鑒定的肽段DDA在60%以上,DIA在90%以上;
三次重復(fù)鑒定的蛋白DDA在70%以上,DIA在90%以上; - QC樣本
一般是將所有樣本等量混合成QC樣本。前后QC,中間每10個(gè)樣加一個(gè)QC。
統(tǒng)計(jì)分析QC樣本的CV分布、聚類、相關(guān)性分析、PCA得分、質(zhì)譜穩(wěn)定性。
(3)質(zhì)控目標(biāo) - 全
鑒定數(shù)目多,覆蓋率高。 - 穩(wěn)
鑒定重現(xiàn)性高,穩(wěn)定性好,尤其是大樣本的檢測(cè)。 - 準(zhǔn)
定量準(zhǔn)確性高。
3. 下游分析
進(jìn)行蛋白質(zhì)組學(xué)的研究,可從以下角度來(lái)分析:
哪些蛋白質(zhì)?
豐度如何?
有何功能?
在哪里作用?
是否或如何互作?
結(jié)構(gòu)?
鑒定層面就不再贅述,只補(bǔ)充下搜庫(kù)的數(shù)據(jù)庫(kù)選擇。一是綜合性蛋白數(shù)據(jù)庫(kù),如NCBI、Uniprot、Ensembl等;二是特定物種的蛋白庫(kù),如擬南芥(TAIR)、水稻(RAPDB)、家蠶(silkdb)等;三是針對(duì)非模式生物,由已測(cè)序結(jié)果翻譯而來(lái)的蛋白序列數(shù)據(jù)。
(1)定量層面定量數(shù)據(jù)概括
a. 表達(dá)量層次聚類熱圖:
在相似性的基礎(chǔ)上對(duì)數(shù)據(jù)分組、歸類。一般組內(nèi)的數(shù)據(jù)模式相似性較高,組間相似性較低。
b. 樣品組間表達(dá)譜相關(guān)性分析:
樣本相關(guān)性熱圖。
c. PCA 分析:
多個(gè)變量綜合定量比較考察。
對(duì)高維數(shù)據(jù)降維,減少?gòu)?fù)雜性,對(duì)樣本進(jìn)行分類及預(yù)測(cè),易于解釋,分離信號(hào)和噪音,數(shù)據(jù)可視化。趨勢(shì)聚類分析
即將蛋白根據(jù)表達(dá)趨勢(shì)進(jìn)行歸類。趨勢(shì)聚類后,可以結(jié)合層次聚類、共表達(dá)網(wǎng)絡(luò)分析、功能分類、信號(hào)通路分類或染色體分析等方法進(jìn)行更深入的挖掘,適合最佳時(shí)間、最佳濃度、最佳溫度等的選擇。統(tǒng)計(jì)學(xué)分析
差異蛋白篩選:
| 設(shè)計(jì) | 實(shí)驗(yàn)設(shè)計(jì) | 重復(fù)設(shè)計(jì) | 統(tǒng)計(jì)學(xué)方法 |
|---|---|---|---|
| 兩組間比較 | 實(shí)驗(yàn) vs 對(duì)照 | >=3 | T-test |
| <3 | Significance A/B | ||
| 多組比較 | 梯度1 vs 梯度2 vs 梯度3... | >=3 | One-way Anova |
| case*2 vs control*2 | >=3 | Two-way Anova |
(2)功能層面
亞細(xì)胞定位預(yù)測(cè)
生物體內(nèi)的蛋白質(zhì)必須要運(yùn)輸?shù)郊?xì)胞的特定位置才能發(fā)揮生物學(xué)功能。研究未知蛋白生物學(xué)功能的第一步通常是獲得蛋白亞細(xì)胞定位信息。
傳統(tǒng)的電子顯微法、熒光顯微法等實(shí)驗(yàn)驗(yàn)證方法進(jìn)行亞細(xì)胞定位,結(jié)果準(zhǔn)確但費(fèi)時(shí)費(fèi)力,因此可通過(guò)機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)大規(guī)模蛋白的亞細(xì)胞定位預(yù)測(cè)。
在線工具:
CELL:http://cello.life.nctu.edu.tw/功能分析
根據(jù)相似性原理,具有相似序列的蛋白也可能具有相似的功能,因此將blast所得的相似蛋白的功能信息轉(zhuǎn)嫁到目標(biāo)蛋白上,可輔助對(duì)于目標(biāo)蛋白尤其是研究程度不足的物種的目標(biāo)蛋白的功能注釋。
GO(Gene Ontology)基因功能標(biāo)準(zhǔn)化詞匯術(shù)語(yǔ),三大本體BP,CC,MF。
BlastGO大規(guī)模注釋GO。
注釋是一個(gè)評(píng)判打分的過(guò)程,這個(gè)打分系統(tǒng)會(huì)綜合考量目標(biāo)序列和比對(duì)序列的相似性、GO條目來(lái)源的可靠度以及GO有向無(wú)環(huán)圖的結(jié)構(gòu),只有滿足預(yù)設(shè)分?jǐn)?shù)的GO term才會(huì)被注釋給目標(biāo)蛋白序列。
保守motif預(yù)測(cè):通過(guò)InterProscan搜索EBI數(shù)據(jù)庫(kù)中與目標(biāo)蛋白匹配的保守基序(motif),并將motif相關(guān)的功能信息注釋給目標(biāo)蛋白序列。
在線工具:Motif-x:http://motif-x.med.harvard.edu/
通路分析
KEGG Pathway共7大類。介紹略
多通路整合——>發(fā)現(xiàn)分子調(diào)控機(jī)制。蛋白互作網(wǎng)絡(luò)
在生物體中,蛋白質(zhì)并非孤立存在的,其功能的行使必須借助于其他蛋白質(zhì)的調(diào)節(jié)和介導(dǎo)。這種調(diào)節(jié)或介導(dǎo)作用的實(shí)現(xiàn)首先要求蛋白質(zhì)之間有結(jié)合作用或相互作用。
蛋白質(zhì)互作網(wǎng)絡(luò)對(duì)于揭示蛋白功能具有重要意義。例如,高度聚集的蛋白質(zhì)可能具有相同或相似的功能;連接度高的蛋白質(zhì)可能是影響整個(gè)系統(tǒng)代謝或信號(hào)轉(zhuǎn)導(dǎo)途徑的關(guān)鍵點(diǎn)。
分析工具:IntAct、MINT、String、Cytoscape......
術(shù)語(yǔ):edge、node、cluster、degree、module.......