python統(tǒng)計cds序列中不同密碼子的個數(shù)

需求

給定cds序列,統(tǒng)計不同的密碼子出現(xiàn)的頻率。首先需要將fasta序列以3位單位分割

找到了一個辦法
https://www.jb51.net/article/139207.htm

居然可以使用正則表達式。。。

代碼

import re
from Bio import SeqIO
for rec in SeqIO.parse("cds.fasta",'fasta'):
  all_codons = re.findall('.{3}',str(rec.seq))

codon_freq = {}
for aa in all_codons:
  if aa not in codon_freq:
    codon_freq[aa] = 1
   else:
    codon_freq[aa] += 1

all_codons 是一個列表

歡迎大家關注我的公眾號
小明的數(shù)據(jù)分析筆記本

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容