国产一区二区精彩福利,婷婷操99在线

根據(jù)注釋文件中基因位置提取序列

在基本的生信分析中，我們有時候需要某些基因的序列，而下載的參考基因組包中，一般不會提供每個基因的序列。下面分享一個簡單的根據(jù)gff或gtf注釋文件提取目的基因序列的python腳本。

Exact_sq.py

#usage:python Exact_sq.py ref_gene.fa annotation.gff/gtf
import sys
ref_sq=sys.argv[1]
anno_gene=sys.argv[2]
with open(ref_sq,"r") as ref_file:
    ref_sq_lib={}
    for line in ref_file:
        line=line.strip()
        if line[0] == ">":
            chr_id=line
            ref_sq_lib[chr_id]=""
        else:
            ref_sq_lib[chr_id]=ref_sq_lib[chr_id]+line
out=open("Matched_sq.fa","a+")
with open(anno_gene,"r") as anno_file:
    for info in anno_file:
        info=info.strip()
        chr=info.split("\t")[0]
        star_pos=int(info.split("\t")[3])-1
        term_pos=int(info.split("\t")[4])-1
        id=info.split("\t")[8].split(";")[0].split(":")[1]
        for ref_chr in ref_sq_lib.keys():
            if " " in ref_chr:
                ref_chr1=ref_chr.split(" ")[0].split(">")[1]
                if chr == ref_chr1:
                    matched_sq=ref_sq_lib[ref_chr][star_pos:term_pos]
                    out.write(">"+id+"\n"+matched_sq+"\n")
            else:
                if ">"+chr == ref_chr:
                    matched_sq=ref_sq_lib[ref_chr][star_pos:term_pos]
                    out.write(">"+id+"\n"+matched_sq+"\n")

用法為python Exact_sq.py 參考基因組序列文件目的基因的注釋文件

最終生成一個Matched_sq.fa文件。

最后編輯于：2022.08.01 22:14:00

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成，瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

根據(jù)注釋文件中基因位置提取序列

根據(jù)注釋文件中基因位置提取序列

在基本的生信分析中，我們有時候需要某些基因的序列，而下載的參考基因組包中，一般不會提供每個基因的序列。下面分享一個簡單的根據(jù)gff或gtf注釋文件提取目的基因序列的python腳本。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

根據(jù)注釋文件中基因位置提取序列

在基本的生信分析中，我們有時候需要某些基因的序列，而下載的參考基因組包中，一般不會提供每個基因的序列。下面分享一個簡單的根據(jù)gff或gtf注釋文件提取目的基因序列的python腳本。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

在基本的生信分析中，我們有時候需要某些基因的序列，而下載的參考基因組包中，一般不會提供每個基因的序列。下面分享一個簡單的根據(jù)gff或gtf注釋文件提取目的基因序列的python腳本。