發(fā)育軌跡分析是單細(xì)胞分析中比較常見的一種分析,旨在預(yù)測出細(xì)胞類型之間的發(fā)育關(guān)系,構(gòu)建細(xì)胞的發(fā)育軌跡。常見的發(fā)育軌跡分析有很多,例如monocle2/3,RNA velocity等。今天小編就來簡單介紹一下我們?cè)谌粘7治鲋械?strong>RNA velocity流程。大家如果想了解RNA velocity的原理,也可以參考一些網(wǎng)上的文章(RNA velocity of single cells文獻(xiàn)學(xué)習(xí))
話不多說,我們直接進(jìn)入正題吧~
1. 軟件安裝
在安裝之前需要安裝以下依賴包:
conda install numpy scipy cython numba matplotlib scikit-learn h5py click
pip install pysam
安裝velocyto
velocyto依賴python3,但是我目前都是python2,所以需要安裝python3
conda install -c bioconda velocyto.py` </pre>
conda安裝velocyto的命令是怎么找到的,請(qǐng)參考conda安裝軟件指南,或者參考velocyto官網(wǎng)安裝指南
但是在安裝的過程中總出現(xiàn)以下的報(bào)錯(cuò)信息:隨后我又查了一些資料:conda中python環(huán)境的配置,發(fā)現(xiàn)安裝軟件的時(shí)候可以在命令后添加python=2/3,用這種方式來調(diào)用python的版本,隨后我也這樣嘗試了一下,果不其然,這樣操作以后就可以正常安裝了~
conda install -c bioconda velocyto.py python=3
檢查軟件是否安裝成功which velocyto
2. 運(yùn)行流程
2.1 文件格式轉(zhuǎn)換(bam to loom)
`velocyto run -u Gene -o ./ -e KO -v /XXX/06.RNA_velosity/input/i1.KO.bam /XXX/Database/refdata-gex-mm10-2020-A/genes/genes.gtf
參數(shù)信息
-u 用于保證UMI的唯一性,如果設(shè)置為Gene,則將GX 標(biāo)簽將附加到UB 標(biāo)簽
-o 結(jié)果目錄,./表示在講結(jié)果保存到當(dāng)前目錄
-e 設(shè)置的樣本名稱,將在loom文件中對(duì)每個(gè)記錄添加上該信息,盡量短一些
-v 是否顯示詳細(xì)信息,-v (only warnings) -vv (warnings and info) -vvv (warnings, info and debug)
默認(rèn)數(shù)據(jù)bam文件和gtf文件
如果想了解更多參數(shù)的信息,可以輸出"velocyto run --help"進(jìn)行查看` </pre>
2.2 合并loom文件(可選)
當(dāng)多個(gè)樣本在一起做分群的時(shí)候,需要執(zhí)行這一步,如果是單個(gè)樣本的RNA velocity則不需要進(jìn)行l(wèi)oom文件的合并。
合并方法很簡單,需要準(zhǔn)備兩個(gè)文件(1.python腳本;2.所需loom文件的路徑),然后運(yùn)行一個(gè)python腳本即可。
Tips:需要注意的是velocyto依賴python3,所以需要調(diào)用python3所在的路徑
1. python腳本(merge.py)內(nèi)容如下:
import loompy
files = []
inf = open("loom.file.list", "r")
for line in inf:
files.append(line.strip())
inf.close()
loompy.combine(files, "merged.loom", key="Accession")` </pre>
2. 所需loom文件的路徑所需loom文件的路徑都存放在loom.file.list文件中(如下圖,每一行是一個(gè)loom文件的絕對(duì)路徑)
最后把這兩個(gè)文件放在用一個(gè)目錄下運(yùn)行即可:
/xxx/python merge.py
運(yùn)行完成后就可以得到名為merged.loom的loom文件
運(yùn)行完這兩步以后,我們的準(zhǔn)備文件就都得到啦。我們下期在具體講講在R中運(yùn)行RNA velocity的流程~