Salmon 使用說明

salmon quant 有兩種類型
一種使用raw reads 另一種用已經(jīng)比對好的序列(BAM/SAM格式),這種算法依賴于salmon quant的參數(shù)
例如:提供一個(gè)-a(alignment)參數(shù),就用比對算法,否則就會用raw reads 算法進(jìn)行計(jì)數(shù)

比對模型用參數(shù) salmon quant --help-reads
dual-phase,基于mapping評估rna-seq中轉(zhuǎn)錄本的豐富程度。
salmon quant 參數(shù):
mapping input 參數(shù)

-l #arg  字符串類型描述文庫類型
-i #arg salmon index(索引)
-r #arg  文件中包括不匹配的序列(如:單端測序序列)
-1 #arg  文件中包含#1匹配
-2 #arg  文件中包含#2匹配

基本參數(shù)

-v #輸入字符串版本
-h #調(diào)用幫助文檔
-o #arg  輸出質(zhì)量文檔
--seqBias #序列特異性偏好矯正
--gcBias #(單端序列)進(jìn)行GC偏好性矯正
-p #arg (=4)同時(shí)使用線程數(shù)
--incompatPrior #arg (=0)  比對與指定文庫類型不相符,由真正的片段產(chǎn)生。0表示比對中與庫類型不一致為“不可能”,1表示不一致>=比對

--geneMap #arg  文件將轉(zhuǎn)錄組比對到基因上。如果有這個(gè)文件,salmon輸出quant.sf 和quant.genes.sf兩個(gè)文件,后一個(gè)文件中包括 基因水平富集預(yù)測。轉(zhuǎn)錄組到基因比對需要提供GTF文檔或一個(gè)以制表符分割的格式每行包含一個(gè)轉(zhuǎn)錄本和基因的名字,名字也要用tab鍵分割。文件的擴(kuò)展名可以是“gtf”“gff”或“gff3”,都以GTF格式處理;以其他任何擴(kuò)展名都認(rèn)為是simple format。"transcript_id" 包括transcript identifier,"gene_id" 為對應(yīng)的gene identifier.
--meta #用于宏基因組數(shù)據(jù)(metagenomic),可以去除對宏基因組數(shù)據(jù)不重要的富集評估。

salmon建立索引
salmon index --help
命令行參數(shù):

-v #[--version] 顯示版本信息
-h #[--help] 幫助信息文檔
-t #[--transcripts] arg 轉(zhuǎn)錄本fasta 文件
-k #[--kmerLen] arg (=31) k-mers長度設(shè)置
-i #[--index] arg salmon的索引
--gencode  #輸入轉(zhuǎn)錄本fasta為GENCODE格式,在第一個(gè)‘|’字符處將轉(zhuǎn)錄本名分開。這個(gè)命名將用來準(zhǔn)備輸出文件,在基因-轉(zhuǎn)錄本GTF文件中查找這些轉(zhuǎn)錄本。
--keepDuplicates #默認(rèn)設(shè)置中去除冗余的序列一致性轉(zhuǎn)錄本,該參數(shù)保留輸入文件中的冗余轉(zhuǎn)錄本病單獨(dú)計(jì)數(shù)。
-p #(--thread) arg (=2) 線程數(shù)(僅用于計(jì)算偏好性特征, computing bias features)
--perfectHash #[quasi index only] 建立索引時(shí)用完美哈希(perfect hash)而非密集哈希(dense hash),尤其是在計(jì)數(shù)時(shí)所占的內(nèi)存小,但所需時(shí)間較長。
--type #arg (=quasi) 要構(gòu)建索引的類型,此版本的salmon中參數(shù)唯一,為“quasi”
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容