安裝Homer
mkdir homer && cd homer
wget http://homer.ucsd.edu/homer/configureHomer.pl
#檢查依賴軟件是否已安裝,一般生信服務(wù)器上都安裝有對應(yīng)軟件
perl configureHomer.pl -check
# 下載安裝Homer
perl configureHomer.pl -install
echo "export PATH=$PWD:/bin" >> ~/.bashrc
source ~/.bashrc
查看Homer支持哪些物種
perl configureHomer.pl -list
下載對應(yīng)的物種的數(shù)據(jù)源(本次的實驗物種是水稻)
perl configureHomer.pl -install rice
perl configureHomer.pl -install rice.IRGSP-1.0
安裝其他配套軟件
- samtools
- R
R需要安裝的依賴包有DESeq2,edgeR
開始分析預(yù)測motif
findMotifsGenome.pl <peak/BED file> <genome> <output directory> -size # [options]
HOMER peak文件有至少5列:
| Peak ID | 染色體 | 起始位置 | 終止位置 | 鏈的方向(+/- or 0/1, where 0="+", 1="-") |
|---|---|---|---|---|
| chr1_peak1 | chr1 | 1213 | 5688 | + |
findMotifsGenome.pl T0h.Homerpeak.txt rice.IRGSP-1.0 T0h
需要注意的點,有可能你的基因的chr的字符串可能和數(shù)據(jù)庫里的不一致,此時你就直接指定你自己的參考基因組文件即可
findMotifsGenome.pl T0h.Homerpeak.txt rice.IRGSP-1.0.genome.fa T0h -p 16
參數(shù)說明:
-bg backgroundpeak.bed #默認是使用基因組作為背景,如果要是有多組之間比較的話,可以使用該參數(shù),指定其他的組的peak bed作為背景
-p 16 指定使用16個cpu運算
輸出結(jié)果介紹
輸出結(jié)果在上面指定的第三個參數(shù)文件夾T0h內(nèi)
homerMotifs.all.motifs 所有的各種長度的motifs
homerMotifs.motifs10 長度為10的motifs
homerMotifs.motifs12
homerMotifs.motifs8
homerResults de novo的motif信息的文件夾
-
homerResults.html de novo 預(yù)測的motifs
從頭預(yù)測的motif knownResults 已知的motif信息的文件夾
-
knownResults.html
已知的motifs knownResults.txt
motifFindingParameters.txt 運行Homer的各種參數(shù)設(shè)定
seq.autonorm.tsv 短核苷酸序列自動矯正情況

