需求
給定cds序列,統(tǒng)計不同的密碼子出現(xiàn)的頻率。首先需要將fasta序列以3位單位分割
找到了一個辦法
https://www.jb51.net/article/139207.htm
居然可以使用正則表達式。。。
代碼
import re
from Bio import SeqIO
for rec in SeqIO.parse("cds.fasta",'fasta'):
all_codons = re.findall('.{3}',str(rec.seq))
codon_freq = {}
for aa in all_codons:
if aa not in codon_freq:
codon_freq[aa] = 1
else:
codon_freq[aa] += 1
all_codons 是一個列表
歡迎大家關注我的公眾號
小明的數(shù)據(jù)分析筆記本