1、下載hg38文件
? UCSC官網(wǎng)下載hg38文件,網(wǎng)址http://hgdownload.soe.ucsc.edu/goldenPath/hg38/bigZips/,進(jìn)入到如下界面:

我們可以下載其中的hg38.fa.gz 和質(zhì)量控制文件md5sum.txt。我直接點(diǎn)擊下載了。下載完之后,首先用md5sum.txt進(jìn)行完整性檢驗(yàn)。
> cat md5sum.txt
dcc3ea27079aa6dc3f9deccd7275e0f8 hg38.2bit
1d97953254e25acd112a94895f01c039 hg38.agp.gz
1c9dcaddfa41027f17cd8f7a82c7293b hg38.fa.gz
435423b167c13a2388d5691dc10a4750 hg38.fa.masked.gz
820796b72974d077281b3386c4fb8295 hg38.fa.out.gz
7645bc6e919eeb19bfc62451afc3c248 hg38.trf.bed.gz
a5aa5da14ccf3d259c4308f7b2c18cb0 hg38.chromFa.tar.gz
e9fddcb1663dd303f1f5d6cbb71d6a82 hg38.chromFaMasked.tar.gz
92910523b903753216ac18945c788d81 hg38.fa.align.gz
273fedff7f16fa2bed0d70c75f79caa2 hg38.gc5Base.wigVarStep.gz
9ed58d68e0998d511a8a58f4f748ce84 hg38.gc5Base.wib
c82fddc1c8ce3120cb5863f7384ed177 hg38.gc5Base.wig.gz
> echo 1c9dcaddfa41027f17cd8f7a82c7293b hg38.fa.gz > check_md5sum_hg38.txt #復(fù)制hg38.fa.gz的MD5號(hào)到另一個(gè)新的文件中
> md5sum -c check_md5_hg38.txt #驗(yàn)證
hg38.fa.gz: 成功

然后命令行解壓。
gunzip hg38.fa.gz
由于文件解壓出來(lái)后較大,可能會(huì)解壓很長(zhǎng)時(shí)間,等一會(huì)就好。
解壓出來(lái)的hg38.fa文件可以用于后續(xù)使用。
2、 建立索引(bowtie2)
文件準(zhǔn)備:hg38.fa
source activate wes #進(jìn)入到conda小環(huán)境
bowtie2-build hg38.fa hg38 #bowtie2 建立索引
建立索引的時(shí)間真的超級(jí)長(zhǎng)?。?!
可以掛到服務(wù)器后臺(tái)運(yùn)行
nohup bowtie2-build hg38.fa hg38 & > nohup01.out