2022-11-22教你如何使用gffread軟件

一、獲取軟件
1、利用conda,簡單快捷

conda install gffread

2、下載安裝
這里用到了gffread (https://github.com/gpertea/gffread),安裝方式如下 (若不理解,見這個為生信學(xué)習(xí)打造的開源Linux教程真香的軟件安裝部分):

git clone https://github.com/gpertea/gffread
cd gffread
make release

二、軟件的使用
首先是用gffread提取cds序列,蛋白序列,轉(zhuǎn)錄本序列

gffread genome.gff3 -g genome.fa -x  cds.fa
gffread genome.gff3 -g genome.fa -y  protein.fa
gffread genome.gff3 -g genome.fa -w  transcripts.fa

接下來我們利用組合工具來提取mRNA,和gene序列

python -m jcvi.formats.gff bed --type=mRNA --key=ID a.gff3 > mRNA.bed
這個需要借助Python 包jcvi包
抽取 GFF文件中mRNA, key是ID
基因也是如此
python -m jcvi.formats.gff bed --type=gene --key=ID  a.chr.gff3  > gene.bed
圖片.png

注意用bedtools提取序列,要加-s 參數(shù)(能區(qū)分正反鏈)

bedtools getfasta -fi ./a.fasta  -bed gene.bed   -nameOnly  -s -fo a.gene.fa

a.gene.fa就是我們需要的文件,同理也可以得到a.mRNA.fa。
再利用提取最長轉(zhuǎn)錄本腳本,獲得基因中最長可變剪切的序列。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容