Fasta序列文件合并與分割,支持.seq等無頭序列

寫在前面

我隱約記得我寫過類似主題,但也并不確定。相關(guān)功能,我并不寫使用說明的沖動,一者是這些功能至少是四五年前就有的,二者是這些功能其實(shí)比較簡單,但也并不常用。然而,現(xiàn)在我還是決定寫一篇。主要動機(jī)簡單,TBtools “黑轉(zhuǎn)粉” 的人不多。而其中就有一個老鐵直接找我聊過。說實(shí)話,我還是比較感動。畢竟愿意花時間去認(rèn)識其他人的人,確實(shí)不多。而后來,這位老鐵的不少建議,我都是接受的。其中有很多好建議,盡管我都放在todo list。但既然這次的需求簡單,我覺得我有必要做個回應(yīng)。
于是有今天這個教程。

Fasta Merge and Split

序列的合并和分割。這個功能是 TBtools 早期功能之一,估摸至少也是四五年前。寫出來之后,我自己幾乎是沒用過的。不過一些育種方向或者進(jìn)化方向的老師倒是不是有跟我提到這個功能好用,甚至包括我本科班主任老師。
打開這個功能比較簡單,



功能界面如下



從界面看得出來,左邊就是合并,右邊就是分割。

序列文件合并

進(jìn)行序列合并,只需要將序列全部拖拽放置到輸入框,隨后設(shè)置一個輸出文件即可。



看看輸出文件



TBtools支持批量拖拽輸入,所以這一切,實(shí)在太簡單。

Fasta Split 進(jìn)行序列文件分割

分割功能,說實(shí)話,TBtools 有點(diǎn)厲害。我們使用剛才合并的那個文件。


當(dāng)然,我們也可以調(diào)整個數(shù),比如分割后每個文件保留不多于4個序列記錄。

當(dāng)然,值得注意的應(yīng)該是 Split Mode。

支持三種模式:

  1. 按分割后每個文件中序列最大記錄數(shù)分割,比如上述,假定輸入的文件含有11個序列,按照每個文件最多 4 個序列來分割,那么就是3個文件,分別含有 4,4,3 個序列。
  2. 指定分割成的文件數(shù)目,如盡量平均分配每個文件的記錄數(shù),比如輸入的文件含有是 9 個序列,分割成 3 個文件,那么每個就是 3,3,4 個序列。
  3. 指定分割成的文件最大大小,如 3Kb,輸入的文件為 12 Kb。那么 TBtools 會盡量按照這個數(shù)目去分割。

平均分割成指定數(shù)目個文件

按照文件最大大小分割文件

很多時候,序列長度變化是巨大的。我們希望分隔后的文件按照最終大小分割,方便如網(wǎng)頁上傳等。



可以看到,完美。當(dāng)然,這個時候,我們不打開序列文件,是不知道其中到底有多少個序列的。不過我們很清楚,每個序列記錄是完整的,而且他們的總長絕對符合我們的需求。

寫在最后

天下大勢,分久必合,合久必分。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容