超快超省事!統(tǒng)計(jì) Fasta 文件/序列相關(guān)信息

寫(xiě)在前面

我經(jīng)常使用一個(gè)不起眼的功能,Fasta Stat。但從未寫(xiě)過(guò)相關(guān)推送。主要是其使用過(guò)于簡(jiǎn)單,只要把 Fasta 序列文件放進(jìn)去,點(diǎn)擊 Start 就可以了。早上起來(lái),突然想起了這一功能,并增加了一個(gè)相對(duì)高頻的需求快捷完成選項(xiàng)。既然這一功能是我高頻使用,那么相信他就跟序列提取功能類(lèi)似。雖然不起眼,雖然是小功能,但是很實(shí)用,甚至或者是最能節(jié)約數(shù)據(jù)分析時(shí)間。
于是索性也寫(xiě)一個(gè)帖子

快速統(tǒng)計(jì) Fasta 文件/序列 的相關(guān)信息

在日常分析中,我們常常手上會(huì)有一個(gè) Fasta 序列文件,文件可能很小,數(shù)十 Kb,也可能很大 數(shù)十 Gb。當(dāng)然,可以使用 TBtools 的 Big File View 進(jìn)行快速瀏覽。更多時(shí)候,我們想要知道的或許是:

  1. 有多少個(gè)序列?
  2. 序列長(zhǎng)度分布幾何?比如 N50
  3. 序列 GC 含量幾何?
  4. 如果是組裝結(jié)果,Gaps 情況如何?
    ......

于是,你打開(kāi)了 TBtools

于是看到

輸入界面簡(jiǎn)單

可以看到,上述操作可以快速獲得序列文件概覽

獲取每一個(gè)序列的統(tǒng)計(jì)信息

有些時(shí)候 ,我們不僅僅想要知道序列文件整體情況,我們還想知道其中每條序列的長(zhǎng)度,GC含量等等
于是操作起來(lái)也很簡(jiǎn)單,只需要設(shè)置一個(gè)輸出文件就可以

便捷操作有二

直接輸出序列長(zhǎng)度信息。事實(shí)上,這個(gè)功能比較常用,比如一些FPKM/RPKM的計(jì)算,比如Basic BioSequences View等序列結(jié)構(gòu)可視化功能等。
此時(shí)只需要補(bǔ)充勾選Keep Only Sequence Length即可。于是上述輸出文件會(huì)變成,


超快,超方便~

快速查看幾/一個(gè)序列的情況。有時(shí)候,我們手上會(huì)有一個(gè)或幾個(gè)序列,會(huì)想要快速查看其大體情況,比如長(zhǎng)度。那么,直接切換輸入選項(xiàng)到 Seq Input 即可。

寫(xiě)在后面

Emmm... 功能整體就這么簡(jiǎn)單。其實(shí)我甚至認(rèn)為,不需要這個(gè)推文,每個(gè)人看到 這個(gè)功能也知道怎么使用。當(dāng)然,這是我個(gè)人寫(xiě) TBtools 時(shí)一直期望。
真正優(yōu)秀的界面化工具,應(yīng)該是一打開(kāi)就會(huì)使用,而無(wú)需Manual。
不過(guò),這有可能嗎?哈哈。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容