使用TEclass對TE一致性序列進(jìn)行分類

軟件安裝

軟件地址在http://www.compgen.uni-muenster.de/tools/teclass/index.hbi?, 由于TEclass這個軟件已經(jīng)許久沒有更新了,因此還要講解下安裝步驟。

wget http://www.compgen.uni-muenster.de/tools/teclass/download/TEclass-2.1.3.tar.gz
tar xf TEclass-2.1.3.tar.gz
cd TEclass-2.1.3

下載依賴的軟件

sh Download_dependencies.sh

由于代碼老舊,部分內(nèi)容無法自動下載,需要手動下載, 例如librf, blast. 最終要保證文件夾下有如下文件

例如blast

curl -o 'blast.tar.gz' ftp://ftp.ncbi.nlm.nih.gov/blast/executables/legacy.NOTSUPPORTED/2.2.26/blast-2.2.26-x64-linux.tar.gz

編譯依賴的軟件

sh Compile_dependencies.sh
安裝過程

安裝TEclass, 這一步可以跳過 RepBase的配置。

perl Configure.pl
``

安裝預(yù)編譯的分類器

```bash
wget http://www.compgen.uni-muenster.de/tools/teclass/download/classifiers.tar.gz
mv classifiers.tar.gz classifiers
tar xf classifiers.tar.gz

測試運(yùn)行

./TEclassTest.pl ./testfile.fa

軟件使用

構(gòu)建分類器

如果你想使用最新的RepBase,那么就需要自己從RepBase下載數(shù)據(jù)進(jìn)行構(gòu)建。

如果是單核處理器,可能要花費(fèi)數(shù)周的時間,所以建議用上你的所有線程。

/TEclassBuild.pl -x 0  -o new_classifiers -p 99

重復(fù)序列分類

在RepeatModeler建模后,提取Unknown序列使用TEclassTest進(jìn)行歸類,假如輸入文件命名為Modelerunknown.lib

TEclassTest Modelerunknown.lib

結(jié)果在Modelerunknown.lib_xxxx, xxxx是你運(yùn)行日期。

Modelerunknown.lib # 輸入文件
Modelerunknown.lib.html 
Modelerunknown.lib.lib # 輸出結(jié)果
Modelerunknown.lib.stat #結(jié)果統(tǒng)計

Modelerunknown.lib.lib中的fasta會有分類信息,如

>rnd-1_family-12#Unknown ( RepeatScout Family Size = 705, Final Multiple Alignment Size = 88, Localized to 114 out of 117 contigs )|TEclass result: LTR|forward|ORFs: 583..2355:+1

其他參數(shù):

  • -c: 訓(xùn)練的分類器所在路徑, 默認(rèn)是TEclass-2.1classifiers
  • -o: 輸出結(jié)果路徑,默認(rèn)在當(dāng)前文件下新建
  • -r: 預(yù)測輸入序列的反向互補(bǔ)序列

參考文獻(xiàn): TEclass: a tool for automated classification of unknown eukaryotic transposable elements

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容