最后一天在豆豆花花的引導(dǎo)下成長
教程的知識總結(jié)特別好
是我一直接觸又疑惑的部分
喜歡這樣的系統(tǒng)歸納
真誠致謝
學(xué)習(xí)內(nèi)容
怎么區(qū)分一二三代測序
二代測序大體流程
NGS組學(xué)都包括哪些分類
測序過程和原理
- 原理介紹視頻:https://share.weiyun.com/5qojuBY 密碼: 密碼:bxsry4
- 文章《測序的世界》:http://www.itdecent.cn/p/101c14c3a1d2
Fastq & Fasta
Fastq格式:一種基于文本的,保存生物序列(通常是核酸序列)和其測序質(zhì)量信息的標(biāo)準(zhǔn)格式,一般都包含有4行。
第一行:由‘@’開始,后面跟著序列ID和可選的描述,序列ID是唯一的;
第二行:堿基序列;
第三行:由‘+’開始,后面是序列的描述信息;
第四行:第二行序列的質(zhì)量評價(jià)(quality value)。
Fasta格式:
1:以“>”為開頭,fasta格式標(biāo)志。
2:序列ID號,gi號,NCBI數(shù)據(jù)庫的標(biāo)識符,具有唯一性。
格式為:gi|gi號|來源標(biāo)志|序列標(biāo)志(接收號、名稱等),若某項(xiàng)缺失可以留空,“|”保留。
3:序列描述。
4:堿基序列,序列中允許空格、換行、空行,一般一行60個(gè)。
Fastq文件→Fasta文件
Linux命令
法1:sed '/^@/!d;s//>/;N' your.fastq > your.fasta
法2:seqtk seq -A input.fastq > output.fasta
FASTX-Toolkit
一款用于處理Short-Reads FASTA/FASTQ文件的程序,里面包含了豐富的Fasta/Fastq文件格式轉(zhuǎn)換、統(tǒng)計(jì)等命令。
http://hannonlab.cshl.edu/fastx_toolkit/

屏幕快照 2019-07-07 上午10.26.11.png