二代測(cè)序:Phred33和Phred64格式判斷

原理:取10000行,求平均堿基質(zhì)量,來(lái)判斷格式

import gzip
from pickle import bytes_types
from statistics import mean
def line_chr_ascii(aline):
    #print(f'line_chr_ascii:{aline}')
    nline = []
    for i in aline:
        nline.append(ord(i))
    return nline
def main():        
    inputfile = "/data3/Pugionium_cornutum_population/pc-y101-1/3_1_GCCAAT_L008_R1_001.fastq.gz"
    readnum = 0
    qual_list = []
    f = gzip.open(inputfile,'r')
    i = 0
    while i<10001:#取10000行
        line = f.readline().rstrip()
        line = bytes.decode(line)
        #print(line)
        if '@' in line:
                readnum = readnum+1
                i = i+1
        elif '+' in line:
            line = f.readline().rstrip()
            line = bytes.decode(line)
            line = line_chr_ascii(line)
            qual_list = qual_list+line
            i = i+2
        else:
            i=i+1
        
    f.close()
    qual_mean = mean(qual_list)
    print(f'read numbers total:{readnum}')
    print(f'qual mean:{qual_mean}')
    print(f'Phred 33:{qual_mean-33}')
    print(f'Phred 64:{qual_mean-64}')
    readnum = None
    qual_list = None
image.png

很明顯是phred33格式的

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容