A4: 蛋白質(zhì)組搜庫--安裝,建庫,搜庫,整合,分析

搜庫前準(zhǔn)備

搜庫前應(yīng)重裝系統(tǒng),清空不必要的東西,可在服務(wù)器A4, A5重裝win7 PE版本(自帶U深度PE裝機(jī)工具);安裝完后需要激活一下win7

安裝,均在A4服務(wù)器的C盤
  1. apache(一個網(wǎng)絡(luò)服務(wù)器)安裝:D:\Program\Proteome\MASCOT_v2.3
    點擊exe安裝, 填寫郵箱名可以是假的,但必須跟后面保持一致(如66@.com);登錄localhost時(http://127.0.0.1/)出現(xiàn) it works!為安裝成功

  2. Perl x64 語言安裝 (Mascot是基于Perl語言編寫的)
    D:\Program\Proteome\MASCOT_v2.3
    3.Mascot x64 安裝:D:\Program\Proteome\MASCOT_v2.3
    安裝時,要找到安裝包內(nèi)的mascot.licence 的具體路徑,將其粘到指定的licence 框內(nèi)
    mascot.licence 的具體路徑: D:\Program\Proteome\MASCOT_v2.3

為了讓apache讀懂Mascot,需要將/MASCOT/ 文件夾內(nèi)的httpd.config文件中的全部內(nèi)容,黏貼到/apache/文件夾內(nèi)的httpd.config文件尾部,保存后重新打開apache,restart一下apache,再刷新Mascot網(wǎng)頁。成功則可看見Mascot 網(wǎng)頁的相關(guān)搜庫內(nèi)容。
PS: 若刷新網(wǎng)頁失敗,多半是因為apache沒有被打開,或重啟成功,多重啟嘗試則可!

4.Netframework 安裝
為了可對搜庫進(jìn)行批量操作,需要使用Daemon,但Daemon安裝前,需要安裝Netframework 4.5版本,Netframework在此類似JAVA,用于解釋.exe軟件
存放路徑:D:\Software\Drivers\Package\NetFramework
PS: 1. Netframework 4.5用于win 7電腦;若在win10 上安裝Daemon,則不需要安裝Netframework

  1. Daemon 安裝(也稱Mascot Daemon)D:\Program\Proteome\MASCOT_v2.3
    Daemon可對搜庫進(jìn)行批量操作。

  2. Scaffold安裝 D:\Program\Proteome\Q+S
    1)重裝服務(wù)器后,本機(jī)的時間需要該licence的時間,安裝時將licence 粘進(jìn)對應(yīng)的框(sn.txt文件為licence)
    2)在【控制面板】,進(jìn)入【防火墻】,高級設(shè)置,選【出站規(guī)則】,【新建規(guī)則】,選【程序】,將Scaffold文件夾下的 jre/bin/javaw.exe block掉, 選【阻止連接】,再隨便重命名一下
    c:/program file/scaffold 4

MASCOT搜庫

  1. peptide Mass Fingerprint 是按蛋白的KD數(shù)進(jìn)行搜庫;
  2. 單個Raw文件可在Ions Search進(jìn)行搜庫,但前提需要將raw文件的.wiz格式轉(zhuǎn)為mgf格式
    3.搜庫前建庫:
    1)可在uniprot上下載所需的物種參考氨基酸序列:
    在Taxonmy下,選view protein,選擇Swiss prot(這個參考序列屬于一個基因?qū)?yīng)一個全長protein),
    選擇.fasta格式進(jìn)行下載 (有時候注釋時也需要將其.txt格式的文件一起下載)
    2)進(jìn)入MASCOT網(wǎng)頁,導(dǎo)入數(shù)據(jù)庫http://a4/mascot
    在 Configuration editor進(jìn)入,選database maintence, 進(jìn)入建庫操作面板,修改:
    (1)選上Active, AA(氨基酸),mem lock(把數(shù)據(jù)放入內(nèi)存進(jìn)行搜庫);
    (2)將路徑C:/MASCOT/sequence/Mouse/GRCm38.fa輸入指定框,并修改為:C:/MASCOT/sequence/Mouse/GRCm38*.fa
    (3)只保留parse accession 和 parse description 這兩項,并且parse accession選4th項,parse description 選5th項,后面的空格全清空,再點擊test definition 看格式是否喜歡,最后確定正確不報錯時點擊Apply 使用。
    (4)然后在MASCOT網(wǎng)頁database status(http:/a4/mascot/x-cgi/ms-status.exe)上瘋狂F5刷新,觀察status達(dá)到 In use(在刷新時,索引fasta文件會慢慢進(jìn)入MASCOT,需要稍等)

Daemon的搜庫前工作

1.先導(dǎo)入/IBS/文件夾已有的參數(shù)設(shè)置:D:\Program\Proteome\MASCOT_v2.3\IBS ,再保存為tmp.par,再在Task Editor導(dǎo)入,保存在/IBS/parameter/。
2.導(dǎo)入餾分,理論上每個餾分都單獨(dú)進(jìn)行搜庫;
PS: 餾分輸入下面有一個選項,[Merge MS/MS],這一項適用于多個餾分對應(yīng)一個樣本的情況,才可以merge

  1. 在MASCOT建庫成功后,重啟Daemon 可見新庫已建入,run即可;
  2. 搜庫完成后,結(jié)果放在:MASCOT/data/.dat,均可用Scaffold進(jìn)一步整合分析,也可用高級版的MASCOT查看其他相關(guān)信息;
    PS: 1. 理論上1個mgf文件對應(yīng)1個dat文件,均可在Daemon的進(jìn)程列表上查詢;
    2.基本上按照輸入順序搜庫,序號為輸出的終止時間。

Scaffold整合文件及分析

官網(wǎng)下載Install_Scaffold_Q+S_5.2.0_Windows_x64或4.0版本,安裝后導(dǎo)數(shù)據(jù)。

  1. 將MASCOT/data/.dat的搜庫結(jié)果,先按組別名字劃分好文件夾,按組順序分別導(dǎo)入,如三次重復(fù)組:A,B,C仨組(x 21個餾分)分別進(jìn)入;
  2. 導(dǎo)入時若報錯memory不足,可在【Edit】中的【Preference】中,設(shè)置【Memory】為16G(16000MB);
  3. 統(tǒng)計分析:進(jìn)入【Quant】中【Update Experimental Design】,設(shè)置:
  1. 設(shè)【Analysis Type】為Ratio-based;
  2. 設(shè)【Experiment Type】為Between-subjects(Independent Groups);
  3. 設(shè)【Edit Sample Names and Categories】設(shè)置組數(shù)以及對應(yīng)的組別顏色;
  4. 設(shè)【Organize Quant Samples】中,將每組對應(yīng)的餾分拖進(jìn)改組,設(shè)置【Reference】為control 組的餾分,F(xiàn)inish 后 Update Samples;


    3e9762b407ecb2a85d746c5b2d5bade.jpg
  1. 保存為.sf3文件,方便后續(xù)導(dǎo)入;
  2. 導(dǎo)出數(shù)據(jù)前,可設(shè)置:
    1)【hide decoys】去掉decoys;
  1. Min peptides=2 或FDR threshold=1%;
  2. Protein Threshold=99% , Peptides Threshold=95%(若蛋白過少,可放松倆閾值到90%);
    4)選擇【Quant】中【Launch Q+ Quantitation Module】模塊,進(jìn)行需要一段時間,選擇【Display Options】為Fold Change Ratio,然后右鍵選擇【Copy All Data】,黏貼到新的Excel表格去。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容