蛋白質(zhì)組學(xué)實(shí)驗(yàn)設(shè)計(jì)、質(zhì)控與分析

1. 實(shí)驗(yàn)設(shè)計(jì)與技術(shù)路線

(1) 常用流程

流程 說(shuō)明
1.材料收集 細(xì)胞、細(xì)胞上清、組織、血漿、血清、腦脊液、外泌體、尿液......
2.定量技術(shù) 蛋白組:iTRAQ/TMT、LabelFree、SILAC、修飾;代謝組:靶向、非靶
3.數(shù)據(jù)驗(yàn)證 蛋白組:PRM、WB、ELISA;代謝組:MRM
4.深入研究 臨床標(biāo)志物、生理病理機(jī)制、藥效機(jī)制、中醫(yī)理論、藥物靶點(diǎn)......

(2) 樣品

樣品類型 Pool(混樣) Individual(單樣)
降低個(gè)體差異 不要求大樣本 要求大樣本
數(shù)據(jù)分析 低維,難以整合其他信息 多維多角度
可追溯性 不能重新定義組別 可根據(jù)所需重新定義組別
樣本量
成本

(3) iTRAQ/TMT項(xiàng)目設(shè)計(jì)
體外等重同位素標(biāo)記定量技術(shù),可同時(shí)比較多個(gè)樣本之間的蛋白表達(dá)量差異(通常10個(gè)樣本以下)。
基本原則

  • 適用較廣,但樣本間需要較好的平行性,不適合進(jìn)行不同物種樣本間比較,如牛、羊、豬之間的比較;也不適合一些差異較大的IP樣品的比較。
  • 一般差異比較樣本組用同一個(gè)試劑盒標(biāo)記;
  • 建議3個(gè)生物學(xué)重復(fù);對(duì)于臨床樣本、小鼠等動(dòng)物樣本、植物樣本等,每個(gè)生物學(xué)重復(fù)建議來(lái)自多個(gè)生物個(gè)體的重復(fù);
  • 多個(gè)試劑盒項(xiàng)目設(shè)計(jì)時(shí),可加入內(nèi)標(biāo)(IS),內(nèi)標(biāo)通常是所有樣本等量混合的樣本。

(4) Labelfree項(xiàng)目設(shè)計(jì)
Labelfree是通過(guò)比較肽段母離子質(zhì)譜峰強(qiáng)度,分析不同來(lái)源樣品蛋白的表達(dá)量差異。該技術(shù)無(wú)需昂貴的同位素標(biāo)記做內(nèi)標(biāo)。
基本原則

  • 適用于各類型生物樣本;尤其是樣本量較少或差異非常大的樣品,如細(xì)胞上清、亞細(xì)胞成分、IP樣品等的分析;
  • 對(duì)于組間差異大的樣品,可采用iBAQ算法(MaxQuant)來(lái)反映一個(gè)樣品內(nèi)不同蛋白間的相對(duì)豐度,可進(jìn)行不同物種樣品間的比較,如牛、羊、豬之間的比較;
  • 適合多組分析、后期差異比較組可能會(huì)改變的實(shí)驗(yàn)設(shè)計(jì);
  • 建議3個(gè)生物學(xué)重復(fù);對(duì)于臨床樣本、小鼠等動(dòng)物樣本、植物樣本等,每個(gè)生物學(xué)重復(fù)建議來(lái)自多個(gè)生物個(gè)體的重復(fù)。

(5)DIA項(xiàng)目設(shè)計(jì)
DIA是數(shù)據(jù)非依賴性采集定量技術(shù),它將質(zhì)譜整個(gè)全掃描范圍分為若干個(gè)窗口,高速循環(huán)地對(duì)每個(gè)窗口中的所有離子進(jìn)行選擇、碎裂及檢測(cè),從而無(wú)遺漏、無(wú)差異地獲取樣本中所有離子的全部碎片信息。DIA無(wú)需指定目標(biāo)肽段,掃描點(diǎn)數(shù)均勻,利用譜圖庫(kù)即可實(shí)現(xiàn)定性確證和定量離子篩選,并可實(shí)現(xiàn)數(shù)據(jù)回溯。
基本原則

  • 適用于各類型生物樣本;
  • 需要先進(jìn)行l(wèi)ibrary構(gòu)建;
  • 適合多組分析、后期差異比較組可能會(huì)改變的實(shí)驗(yàn)設(shè)計(jì);
  • 建議獨(dú)立的大樣本分析。

(6)各定量技術(shù)比較
從數(shù)據(jù)采集模式來(lái)說(shuō),iTRAQ/TMT和Labelfree都是傳統(tǒng)的DDA掃描,即在每個(gè)掃描周期內(nèi),只采集豐度最高的10-20個(gè)母離子信號(hào)的子離子碎片,其他信號(hào)的子離子信息丟失,因此覆蓋率低、隨機(jī)性高、重復(fù)性相對(duì)低;DIA掃描則在每個(gè)掃描周期內(nèi),將質(zhì)量區(qū)間設(shè)置為多個(gè)區(qū)段window,每次采集window內(nèi)所有母離子信息及其碎片(掃描速度足夠快),因此具有高覆蓋度、高重復(fù)性的特點(diǎn)。

定量技術(shù) iTRAQ/TMT Labelfree Labelfree分級(jí) DIA
樣本數(shù) 少/多
樣品 一般pool pool/individual 一般pool 一般individual
樣品平行性 平行 平行/不平行 平行/不平行 平行/不平行
數(shù)據(jù)量深度
PRM驗(yàn)證對(duì)接性
建庫(kù)
成本 較高 較高
拓展性 是(可根據(jù)library重新分析)
采集模式 DDA DDA DDA DIA

(7)搜庫(kù)軟件

流程回顧:
蛋白質(zhì)酶切為肽段,經(jīng)過(guò)色譜分離進(jìn)入質(zhì)譜儀,得到質(zhì)譜實(shí)際譜圖,利用搜庫(kù)軟件與理論譜圖進(jìn)行匹配打分,對(duì)肽段和蛋白進(jìn)行鑒定、定量和下游數(shù)據(jù)分析。

  • Mascot
    特點(diǎn):收費(fèi);基于隨機(jī)匹配打分算法;整合FDR閾值和Percolator算法;質(zhì)譜數(shù)據(jù)檢索的黃金標(biāo)準(zhǔn)。
  • MaxQuant
    特點(diǎn):免費(fèi)不開(kāi)源;優(yōu)勢(shì)在labelfree,RT校正,Match between runs提高鑒定數(shù);配套的后處理工具Perseus。
  • Spectronaut
    特點(diǎn):收費(fèi);相對(duì)其他DIA軟件,準(zhǔn)確性高、靈敏度高、速度快;實(shí)現(xiàn)超過(guò)1000個(gè)DIA原始文件同時(shí)分析,極高譜圖解析率,數(shù)據(jù)校正平均峰面積CV<10%;蛋白FDR、肽段FDR和CScore三重標(biāo)準(zhǔn)。

2. 質(zhì)量控制

(1)色譜質(zhì)控

  • 色譜的峰形,決定定量準(zhǔn)不準(zhǔn)
    對(duì)稱?拖尾?
  • 色譜的數(shù)據(jù)點(diǎn),決定定量準(zhǔn)不準(zhǔn)
    峰曲線上點(diǎn)多?少?
  • 色譜的穩(wěn)定性,決定定量準(zhǔn)不準(zhǔn)
    RT是否偏移?使用iRT同位素內(nèi)參校正色譜偏移
  • 色譜的分離度,決定質(zhì)譜的采集效率
    (2)質(zhì)量控制
  • 基礎(chǔ)狀態(tài)考察
    牛血清白蛋白(BSA):考察質(zhì)量偏移、洗脫時(shí)間、峰寬、信號(hào)響應(yīng)等;
    細(xì)胞樣品:考察組學(xué)能力,如負(fù)責(zé)樣品蛋白和肽段數(shù)目鑒定能力。
  • 復(fù)雜樣本鑒定重現(xiàn)性
    三次重復(fù)鑒定的肽段DDA在60%以上,DIA在90%以上;
    三次重復(fù)鑒定的蛋白DDA在70%以上,DIA在90%以上;
  • QC樣本
    一般是將所有樣本等量混合成QC樣本。前后QC,中間每10個(gè)樣加一個(gè)QC。
    統(tǒng)計(jì)分析QC樣本的CV分布、聚類、相關(guān)性分析、PCA得分、質(zhì)譜穩(wěn)定性。
    (3)質(zhì)控目標(biāo)

  • 鑒定數(shù)目多,覆蓋率高。
  • 穩(wěn)
    鑒定重現(xiàn)性高,穩(wěn)定性好,尤其是大樣本的檢測(cè)。
  • 準(zhǔn)
    定量準(zhǔn)確性高。

3. 下游分析

進(jìn)行蛋白質(zhì)組學(xué)的研究,可從以下角度來(lái)分析:

  • 哪些蛋白質(zhì)?

  • 豐度如何?

  • 有何功能?

  • 在哪里作用?

  • 是否或如何互作?

  • 結(jié)構(gòu)?
    鑒定層面就不再贅述,只補(bǔ)充下搜庫(kù)的數(shù)據(jù)庫(kù)選擇。一是綜合性蛋白數(shù)據(jù)庫(kù),如NCBI、Uniprot、Ensembl等;二是特定物種的蛋白庫(kù),如擬南芥(TAIR)、水稻(RAPDB)、家蠶(silkdb)等;三是針對(duì)非模式生物,由已測(cè)序結(jié)果翻譯而來(lái)的蛋白序列數(shù)據(jù)。
    (1)定量層面

  • 定量數(shù)據(jù)概括
    a. 表達(dá)量層次聚類熱圖:
    在相似性的基礎(chǔ)上對(duì)數(shù)據(jù)分組、歸類。一般組內(nèi)的數(shù)據(jù)模式相似性較高,組間相似性較低。
    b. 樣品組間表達(dá)譜相關(guān)性分析:
    樣本相關(guān)性熱圖。
    c. PCA 分析:
    多個(gè)變量綜合定量比較考察。
    對(duì)高維數(shù)據(jù)降維,減少?gòu)?fù)雜性,對(duì)樣本進(jìn)行分類及預(yù)測(cè),易于解釋,分離信號(hào)和噪音,數(shù)據(jù)可視化。

  • 趨勢(shì)聚類分析
    即將蛋白根據(jù)表達(dá)趨勢(shì)進(jìn)行歸類。趨勢(shì)聚類后,可以結(jié)合層次聚類、共表達(dá)網(wǎng)絡(luò)分析、功能分類、信號(hào)通路分類或染色體分析等方法進(jìn)行更深入的挖掘,適合最佳時(shí)間、最佳濃度、最佳溫度等的選擇。

  • 統(tǒng)計(jì)學(xué)分析
    差異蛋白篩選:

設(shè)計(jì) 實(shí)驗(yàn)設(shè)計(jì) 重復(fù)設(shè)計(jì) 統(tǒng)計(jì)學(xué)方法
兩組間比較 實(shí)驗(yàn) vs 對(duì)照 >=3 T-test
<3 Significance A/B
多組比較 梯度1 vs 梯度2 vs 梯度3... >=3 One-way Anova
case*2 vs control*2 >=3 Two-way Anova

(2)功能層面

  • 亞細(xì)胞定位預(yù)測(cè)
    生物體內(nèi)的蛋白質(zhì)必須要運(yùn)輸?shù)郊?xì)胞的特定位置才能發(fā)揮生物學(xué)功能。研究未知蛋白生物學(xué)功能的第一步通常是獲得蛋白亞細(xì)胞定位信息。
    傳統(tǒng)的電子顯微法、熒光顯微法等實(shí)驗(yàn)驗(yàn)證方法進(jìn)行亞細(xì)胞定位,結(jié)果準(zhǔn)確但費(fèi)時(shí)費(fèi)力,因此可通過(guò)機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)大規(guī)模蛋白的亞細(xì)胞定位預(yù)測(cè)。
    在線工具:
    CELL:http://cello.life.nctu.edu.tw/

  • 功能分析
    根據(jù)相似性原理,具有相似序列的蛋白也可能具有相似的功能,因此將blast所得的相似蛋白的功能信息轉(zhuǎn)嫁到目標(biāo)蛋白上,可輔助對(duì)于目標(biāo)蛋白尤其是研究程度不足的物種的目標(biāo)蛋白的功能注釋。
    GO(Gene Ontology)基因功能標(biāo)準(zhǔn)化詞匯術(shù)語(yǔ),三大本體BP,CC,MF。
    BlastGO大規(guī)模注釋GO。
    注釋是一個(gè)評(píng)判打分的過(guò)程,這個(gè)打分系統(tǒng)會(huì)綜合考量目標(biāo)序列和比對(duì)序列的相似性、GO條目來(lái)源的可靠度以及GO有向無(wú)環(huán)圖的結(jié)構(gòu),只有滿足預(yù)設(shè)分?jǐn)?shù)的GO term才會(huì)被注釋給目標(biāo)蛋白序列。
    保守motif預(yù)測(cè):通過(guò)InterProscan搜索EBI數(shù)據(jù)庫(kù)中與目標(biāo)蛋白匹配的保守基序(motif),并將motif相關(guān)的功能信息注釋給目標(biāo)蛋白序列。
    在線工具:Motif-x:http://motif-x.med.harvard.edu/

  • 通路分析
    KEGG Pathway共7大類。介紹略
    多通路整合——>發(fā)現(xiàn)分子調(diào)控機(jī)制。

  • 蛋白互作網(wǎng)絡(luò)
    在生物體中,蛋白質(zhì)并非孤立存在的,其功能的行使必須借助于其他蛋白質(zhì)的調(diào)節(jié)和介導(dǎo)。這種調(diào)節(jié)或介導(dǎo)作用的實(shí)現(xiàn)首先要求蛋白質(zhì)之間有結(jié)合作用或相互作用。
    蛋白質(zhì)互作網(wǎng)絡(luò)對(duì)于揭示蛋白功能具有重要意義。例如,高度聚集的蛋白質(zhì)可能具有相同或相似的功能;連接度高的蛋白質(zhì)可能是影響整個(gè)系統(tǒng)代謝或信號(hào)轉(zhuǎn)導(dǎo)途徑的關(guān)鍵點(diǎn)。
    分析工具:IntAct、MINT、String、Cytoscape......
    術(shù)語(yǔ):edge、node、cluster、degree、module.......

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容