awk 命令使用記錄 例1, 修改fasta序列ID 若后續(xù)只需要用到序列,不需要ID的信息,就可以把ID信息完全修改掉 例2:簡化fasta序列名字 ID 修改前后對(duì)比 ...
awk 命令使用記錄 例1, 修改fasta序列ID 若后續(xù)只需要用到序列,不需要ID的信息,就可以把ID信息完全修改掉 例2:簡化fasta序列名字 ID 修改前后對(duì)比 ...
在對(duì)拼裝或者數(shù)據(jù)庫下載的序列文件進(jìn)行下一步分析時(shí),我們通常會(huì)對(duì)序列進(jìn)行去冗余操作,其中經(jīng)常需要提取同一個(gè)‘gene’的最長轉(zhuǎn)錄本,所以動(dòng)手用python寫一個(gè)腳本。 一、基本...
組裝策略 適用于設(shè)計(jì)多樣本多物種的組裝。例如100個(gè)樣本,10個(gè)物種。這里如果想直接完成10個(gè)de nove組裝,需要將所有樣本數(shù)據(jù)放到一起后,通過樣本信息表聲明每個(gè)樣本的物...
對(duì)于蛋白的fa文件,由于是每個(gè)轉(zhuǎn)錄本對(duì)應(yīng)一個(gè)蛋白序列。由于后期注釋需要以基因?yàn)閱挝?,因此需要?duì)fa文件進(jìn)行處理,計(jì)算每一個(gè)轉(zhuǎn)錄本的蛋白序列長度,然后提取最長的蛋白序列,該序列...
前言:在對(duì)miRNA進(jìn)行靶標(biāo)預(yù)測分析時(shí),需要特定物種的轉(zhuǎn)錄本作為靶向的數(shù)據(jù)庫。通常對(duì)miRNA預(yù)測以3'UTR區(qū)域?yàn)橹?,這就需要對(duì)轉(zhuǎn)錄本數(shù)據(jù)庫進(jìn)行UTR區(qū)域的提取。我在之前寫...
TBtools 是一個(gè)集合了超多生信處理的小工具,非常方便,而且是無命令行的操作,入門門檻極低。開發(fā)者是華南農(nóng)業(yè)大學(xué)陳程杰博士,TBtools文章地址:https://www...
一、BLAST+(NCBI發(fā)布于2009年) 下載地址:https://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/LATES...
bedtools批量提取基因組指定位置序列 之前已經(jīng)介紹過很多提取序列的方法,有腳本的也有軟件的,這里再介紹一種方法。 用到軟件是bedtools,具體方法如下: Optio...
如何從海量高通量測序數(shù)據(jù)中篩選出目標(biāo)數(shù)據(jù)?這是困擾大多數(shù)老師的一個(gè)難題! 小編以一個(gè)excel的簡單函數(shù)為例,演示一下如何從表格中快速篩選感興趣的基因等信息。 函數(shù)的名稱是V...