最近對單細(xì)胞轉(zhuǎn)錄組很感興趣,就跑了一跑~
以下就是單細(xì)胞轉(zhuǎn)錄組的上游分析過程。
如有不對,請大家多多指點。
1.cellranger-3.1.0下載
官網(wǎng)地址:https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest
大家可以自行觀看,里面有鏈接,我就直接粘貼過來了
#創(chuàng)建工作目錄
cd ~/project/
mkdir project_scrnaseq
#下載 Cell Ranger - 3.1.0
# 1.1個G的軟件,確實夠大了
wget -O cellranger-3.1.0.tar.gz "http://cf.10xgenomics.com/releases/cell-exp/cellranger-3.1.0.tar.gz?Expires=1571872225&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cDovL2NmLjEweGdlbm9taWNzLmNvbS9yZWxlYXNlcy9jZWxsLWV4cC9jZWxscmFuZ2VyLTMuMS4wLnRhci5neiIsIkNvbmRpdGlvbiI6eyJEYXRlTGVzc1RoYW4iOnsiQVdTOkVwb2NoVGltZSI6MTU3MTg3MjIyNX19fV19&Signature=Dc7MFkUeE2xZvqS4rD28J-UGlISoJjYv8~QuwDI8lO3TLoDidtwKlgWNqff8vrY8uWRwVrl2C-tIW~aNI3jbrtYSKKgh7J0nWCz3zo5apcOW24UUCuzs58F6Jk7PKCELI2I~9ZhEAPam3Nxp4FbdYOolEBep4rywEegxyuhJVNMPlaQ9HsC-Z66irU0DfJ-4Ng7Z6lfU~w2~sWeykGa6mGEWoo3qN4dMhcvYcgYZSNioUlghKGponKMLuBkEX5QNrYitAQtwMQksWuw8MZ~BDlwnoMMd~Rg01xQu7~X48e6Fk4wxzwPTe5cCzlWd1cJrOP9J84ed8zXGZrRBwE6-QQ__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"

1571829287(1).png
#下載的是tar.gz格式的壓縮包,所以接下來當(dāng)然就是無情的解壓它!
tar -xzvf cellranger-3.1.0.tar.gz
#可以自行安排是否需要添加環(huán)境變量~~
##我就沒有添加,不過怎么用,自己舒服就好!
下載完軟件包了,接下來其實就和普通的RNAseq其實是一樣的
必須要做的就是:
參考基因組索引的構(gòu)建
測序文件的比對
2.參考基因組索引的構(gòu)建
1.模式生物參考基因組索引
對于模式生物,比如Human,Mouse 等等生物的參考基因組索引,cellranger官網(wǎng)都有鏈接,可以自行下載
https://support.10xgenomics.com/single-cell-gene-expression/software/downloads/latest
#Human GRCh38
wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-GRCh38-3.0.0.tar.gz
#Human hg19
wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-hg19-3.0.0.tar.gz
#Mouse
wget http://cf.10xgenomics.com/supp/cell-exp/refdata-cellranger-mm10-3.0.0.tar.gz
2.非模式生物參考基因組索引
對于一些研究比較少的物種,需要自己去構(gòu)建參考基因組索引
其實cellranger的參數(shù),在官網(wǎng)上都有體現(xiàn),大家可以自行學(xué)習(xí)!
在此,以擬南芥分析為例:
vim mkgtf.sh
#!/bin/bash
cellranger=/home/liuyue/project/project_scrnaseq/cellranger-3.1.0
database=/home/liuyue/project/project_scrnaseq/database
$cellranger/cellranger mkgtf $database/AT_10.gtf ./AT_10.filter.gtf \
--attribute=gene_biotype:protein_coding \
--attribute=gene_biotype:lincRNA \
--attribute=gene_biotype:antisense \
--attribute=gene_biotype:IG_LV_gene \
--attribute=gene_biotype:IG_V_gene \
--attribute=gene_biotype:IG_V_pseudogene \
--attribute=gene_biotype:IG_D_gene \
--attribute=gene_biotype:IG_J_gene \
--attribute=gene_biotype:IG_J_pseudogene \
--attribute=gene_biotype:IG_C_gene \
--attribute=gene_biotype:IG_C_pseudogene \
--attribute=gene_biotype:TR_V_gene \
--attribute=gene_biotype:TR_V_pseudogene \
--attribute=gene_biotype:TR_D_gene \
--attribute=gene_biotype:TR_J_gene \
--attribute=gene_biotype:TR_J_pseudogene \
--attribute=gene_biotype:TR_C_gene
$cellranger/cellranger mkref --genome=AT \
--fasta=$database/AT_10.fa \
--genes=./AT_10.filter.gtf \
--ref-version=3.1.0
#####可以看出,cellranger在進行參考基因組索引構(gòu)建的時候,其實是使用了2個命令
cellranger mkgtf
cellranger mkref
#共同執(zhí)行的
參考基因組構(gòu)建的結(jié)果:
1571830499(1).png
4.單細(xì)胞轉(zhuǎn)錄組的比對
比對直接就是一個命令
cellranger count
vim count.sh
#!/bin/bash
clean=/home/liuyue/project/project_scrnaseq/clean
cellranger=/home/liuyue/project/project_scrnaseq/cellranger-3.1.0
ref=/home/liuyue/project/project_scrnaseq/reference/AT
$cellranger/cellranger count --id=AT_root \
--transcriptome=$ref \
--fastqs=$clean \
--sample=SRRXXXXXX \
--force-cells=8000
#需要注意的其實就是輸入文件和輸出文件的位置別搞錯了就行