
寫(xiě)在前面
經(jīng)過(guò)了前面的五次IGV改造,我以為這個(gè)系列可能就到此為止了。
然而在近期的數(shù)據(jù)分析過(guò)程中,我們?nèi)匀话l(fā)現(xiàn)了一個(gè)新的需求:
在展示sRNA reads的時(shí)候,只看某個(gè)長(zhǎng)度的reads,比如植物的miRNA大多是21nt,常見(jiàn)的phasiRNAs,或者全都是21nt,或者全都是24nt
在IGV中,一個(gè)不錯(cuò)的選項(xiàng)是Group Alignment。使用整個(gè)選項(xiàng),可以做很多事情,如下:

從選項(xiàng)中,我們可以看到,可以基于讀段方向,讀段文庫(kù)等進(jìn)行分組,甚至也可以基于自定義的tag進(jìn)行分組。
這里存在一個(gè)簡(jiǎn)單的方法可以實(shí)現(xiàn),按照sRNA reads的長(zhǎng)度進(jìn)行分組,即直接在BAM文件操作,對(duì)每一個(gè)記錄增加一個(gè)tag,記錄其對(duì)應(yīng)的read長(zhǎng)度信息。這個(gè)做法事實(shí)上比較OK的,但是也是比較ugly的。一者是低效,二者是增加硬盤(pán)存儲(chǔ)。
那么解決這個(gè)問(wèn)題最好的做法就是,繼續(xù)改造IGV
改造結(jié)果
昨天晚上,在與博導(dǎo)討論到某個(gè)位點(diǎn)的分析是,我們覺(jué)得有必要單獨(dú)查看21nt的sRNA reads。我當(dāng)然不會(huì)選擇去對(duì)BAM做修改。于是拿起IGV,改之。
效果如下:
修改之前,我們可以看到存在不同長(zhǎng)度的reads在AlignmentTrack

在改造中的IGV,為了更快地看到不同長(zhǎng)度的reads,我們?cè)谥耙呀?jīng)提供了Color Alignments的參數(shù)

可以看到,這個(gè)位點(diǎn)是個(gè)很不錯(cuò)的21-nt PHAS位點(diǎn),從readLen Track或者是real-time phasing score track都不錯(cuò)。下面的Alignment Track中存在一些24 nt 和 22 nt的reads,當(dāng)然還有其他長(zhǎng)度的。于是我們使用Group Alignment by sRNA Len

上圖增加了一個(gè)Option,使用后效果如下

此時(shí),我們當(dāng)然也可以不用Color By ReadLen

對(duì)比起一開(kāi)始的Reads Alignment Track,Phas的情況看起來(lái)清晰很多。
當(dāng)然,這個(gè)功能或許只有在相對(duì)混雜的位點(diǎn),會(huì)更加明顯。
寫(xiě)在最后
有時(shí)候,或許很多事情,跟sRNA位點(diǎn)是一樣的。
需要撥開(kāi)云霧,才能看到真相。
修改版IGV的獲取方式
近日有多個(gè)朋友聯(lián)系過(guò)來(lái),想要使用這個(gè)改造后的IGV。嗯...
我個(gè)人的想法是:
- 付費(fèi),如資助XiaLab課題組出游一次,大體價(jià)格是3K,那么將獲得本年度(如果還有更細(xì)的話)的我經(jīng)手的IGV更新功能。
- 直接聯(lián)系課題組PI即RX獲取,課題組主頁(yè)為 http://xialab.scau.edu.cn/
