
本教程基于銀白楊頂芽單細胞測序數(shù)據(jù),聚焦 CYC 和 CDK 基因家族參與葉片發(fā)育的分子機制,適配有少量生信基礎(chǔ)(了解 Linux 基本操作、R 語言入門)的讀者。教程共4節(jié),遵循 “軟件準備→基礎(chǔ)分析→細胞注釋→高級挖掘” 的分析流程,代碼均來自實際研究,注釋結(jié)合發(fā)表文章核心結(jié)果,確保 “代碼可復現(xiàn)、結(jié)果可解讀”。
第 1 節(jié):環(huán)境搭建,軟件安裝,參考基因組構(gòu)建
1.1 核心軟件與 R 包安裝
#1.1.1 Linux 環(huán)境(細胞定量核心)#代碼如下:
# 1. 安裝cellranger(10x單細胞定量工具)
wget -O cellranger-7.1.0.tar.gz"https://cf.10xgenomics.com/releases/cell-exp/cellranger-7.1.0.tar.gz?Expires=1693501070&Policy=eyJTdGF0ZW1lbnQiOlt7IlJlc291cmNlIjoiaHR0cHM6Ly9jZi4xMHhnZW5vbWljcy5jb20vcmVsZWFzZXMvY2VsbC1leHAvY2VsbHJhbmdlci03LjEuMC50YXIuZ3oiLCJDb25kaXRpb24iOnsiRGF0ZUxlc3NUaGFuIjp7IkFXUzpFcG9jaFRpbWUiOjE2OTM1MDEwNzB9fX1dfQ__&Signature=Fjmu-V9q97ffbFeqNxeiI95GmusN90g-~OxoQW8lFLh3fqIeMKCZwmgjRTw9XXSB8ZG133zB5XmEBAzeEHLUIupwM9Kxtfd5mWd0GHzL1t6n7adbulUSpTZ2BrROlQrjyHMMcCPnjb1ysjQ2-j2578HnX6yY~7u2kwqlY8SE6gUlcMp0xn0x5JQmW9AsNBiWwgdCaTmoNvkev6neKYkwvng~x6qOk6ofakITlaJp7x5s00XlGNvuiH8sK3nWLHw6KBKxQWgAbIoPzYPnieBBv7Ow3DLrmIGeUrwcBfSTGloSH9UeG5MNRx~eQlewUBR5xKQXzllZHJUcsFK9D-7hPw__&Key-Pair-Id=APKAI7S6A5RYOXBWRPDA"
tar -zxvf cellranger-7.1.0.tar.gz
echo 'exportPATH=/home/liangjinghui/software/cellranger-7.1.0/:$PATH' >> ~/.bashrc
source ~/.bashrc # 配置環(huán)境變量(永久生效)
# 2. 安裝blastp(序列比對工具,用于基因注釋)
conda install -c bioconda blast -y
#1.1.2 R 環(huán)境(下游分析核心)代碼如下:
# 激活R環(huán)境(建議用conda創(chuàng)建專屬環(huán)境)
source activate R
# 安裝基礎(chǔ)依賴包
install.packages("pak")
library(pak)
pak::pkg_install(c("Seurat","dplyr", "patchwork", "ggplot2","tidyverse"))
# 安裝單細胞專用包
pak::pkg_install("chris-mcginnis-ucsf/DoubletFinder")? #雙細胞過濾
BiocManager::install(c("monocle","ComplexHeatmap", "SingleCellExperiment"))? #擬時序與可視化
pak::pkg_install(c("clustree","clusterProfiler", "org.Palb.eg.db"))? #聚類優(yōu)化與功能富集
# 安裝植物單細胞專用包
devtools::install_github("compbioNJU/scPlant")
devtools::install_github("Jasonxu0109/PlantPhoneDB")
# 驗證安裝(查看核心包版本)
packageVersion("Seurat")? #需≥4.3.0
packageVersion("monocle")? #需≥2.28.0
#1.2 參考基因組構(gòu)建(植物單細胞關(guān)鍵步驟)植物單細胞分析需整合核基因組與細胞器基因組,避免線粒體污染干擾細胞注釋,步驟如下:
# 1. 數(shù)據(jù)準備(整合核基因組與線粒體基因組)
# 核基因組:來源中國林科院。線粒體基因組:NCBI(登錄號NC_041085.1)。使用notepad合并林科院和NCBI下載的文件,形成整合基因組和線粒體基因組的總文件,線粒體手動過濾刪除tRNA和rRNA的注釋,重疊的基因保留part1一個,exon同CDS,55個。
cd /home/workdirectory? #工作目錄
# 2. GFF轉(zhuǎn)GTF(cellranger要求輸入格式)
gffread -T Poalb_combine_genome.gff -oPoalb_combine_genome.gtf
# 3. 構(gòu)建cellranger參考基因組
cellranger mkref --genome=Poalb.genome \
--fasta=Poalb_combine_genome.fa \
--genes=Poalb_combine_genome.gtf
#封面:出包王女