學(xué)習(xí)小組Day7筆記--尹露茜

最后一天在豆豆花花的引導(dǎo)下成長
教程的知識總結(jié)特別好
是我一直接觸又疑惑的部分
喜歡這樣的系統(tǒng)歸納
真誠致謝

學(xué)習(xí)內(nèi)容

怎么區(qū)分一二三代測序
二代測序大體流程
NGS組學(xué)都包括哪些分類

測序過程和原理

Fastq & Fasta
Fastq格式:一種基于文本的,保存生物序列(通常是核酸序列)和其測序質(zhì)量信息的標(biāo)準(zhǔn)格式,一般都包含有4行。
第一行:由‘@’開始,后面跟著序列ID和可選的描述,序列ID是唯一的;
第二行:堿基序列;
第三行:由‘+’開始,后面是序列的描述信息;
第四行:第二行序列的質(zhì)量評價(jià)(quality value)。
Fasta格式:

1:以“>”為開頭,fasta格式標(biāo)志。
2:序列ID號,gi號,NCBI數(shù)據(jù)庫的標(biāo)識符,具有唯一性。
格式為:gi|gi號|來源標(biāo)志|序列標(biāo)志(接收號、名稱等),若某項(xiàng)缺失可以留空,“|”保留。
3:序列描述。
4:堿基序列,序列中允許空格、換行、空行,一般一行60個(gè)。

Fastq文件→Fasta文件

Linux命令
法1:sed '/^@/!d;s//>/;N' your.fastq > your.fasta
法2:seqtk seq -A input.fastq  > output.fasta
FASTX-Toolkit

一款用于處理Short-Reads FASTA/FASTQ文件的程序,里面包含了豐富的Fasta/Fastq文件格式轉(zhuǎn)換、統(tǒng)計(jì)等命令。
http://hannonlab.cshl.edu/fastx_toolkit/

屏幕快照 2019-07-07 上午10.26.11.png
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容