看老大RNA-seq視頻
P5/P6:RNA-seq:軟件安裝-上/下
1.有源代碼的下載源代碼,一般的軟件會(huì)提供多個(gè)平臺(tái)
2.沒(méi)有源代碼的下載二進(jìn)制版本
linux的軟件中心---conda---類似360軟件中心
$():把括號(hào)里的命令運(yùn)行一下
安裝完conda后,最重要的一步是添加清華源的鏡像,提高下載速度,配置環(huán)境需要用到conda config??捎胏onda config --show查看已有的配置
查看已有環(huán)境
conda info --envs
建立一個(gè)python2環(huán)境,并且安裝比對(duì)軟件bwa
conda create -n biostar python=2 bwa
Create -n rna python=2 bwa

點(diǎn)yes后會(huì)將添加到環(huán)境變量

如果沒(méi)添加到環(huán)境變量,單次install的時(shí)候就是miniconda3/bin/conda create -n biostar python=2 bwa

如果添加到環(huán)境變量,就是conda create -n biostar python=2 bwa
用conda安裝前可先conda search trimmomatic,看看這個(gè)軟件是不是conda給他的名字
也可在下面這個(gè)網(wǎng)址搜索bioconda是否有這個(gè)包(看看大小寫、下劃線、中華線之類的)
conda不是萬(wàn)能的

刪掉conda:rm -rf miniconda3/
cat ~/.barch
export PATH=/home/jmzeng/biosoft/myBIn/bin:$PATH#在變量里加入了??



P7:5-sratoolkit下載數(shù)據(jù)
一個(gè)RNA-seq實(shí)戰(zhàn)-超級(jí)簡(jiǎn)單-2小時(shí)搞定
第一步:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177(在這里更改GSE號(hào))
第二步:
第三步:


cat id |while read id ;do (prefetch $id &) ;done #寫一個(gè)循環(huán)下載fa數(shù)據(jù)


批量殺任務(wù)

生成SRA文件

生成fq文件

批量生產(chǎn)fq文件
ls /public/project/RNA/airway/sra/*sra |while read id;do ( nohup fastq-dump --gzip --split-3 -O ./ $id & );done
尋找gz結(jié)尾文件:
find ~/ -name "*gz"
一件我理解不了的了事

可是我 find以后,咩有
而我find其他就有,證明find沒(méi)用錯(cuò)呀,可能是沒(méi)有下載下來(lái)


不知道為什么不能fastq-dump,鏈過(guò)來(lái)的也應(yīng)該能用的啊,我刪掉這個(gè)sra的路徑再鏈一次,藍(lán)色和紅色什么區(qū)別呢?


我想起來(lái)了,紅色是無(wú)效的鏈接,如果紅色是tt從zy那鏈接 過(guò)來(lái)的,如果zy給移動(dòng)或者刪除了,那么就失效了,應(yīng)該是這樣的,那條tt和zy是一個(gè)從前下,一個(gè)從后下的,而我去zy里也找不到SRA文件了。
P8:6-qc
接下來(lái)要從fa轉(zhuǎn)fq文件
ls -lh raw/|wc #看數(shù)據(jù)
less raw/nohup.out #有后臺(tái)日志
grep failed raw/nohup.out

zless SRR1039508_1.fastq.gz #查看
P10:7-alignment-1
從老大視頻里扒來(lái)的鏈接,先收藏
vi tmp.sh
p12:RNA-seq:7-alignment-3
cat *|awk '{print $1}' |paste - - - - - - - - - - - - - -
linux文本處理3架馬車
less -S 文本名 整行顯示
Less -SN 文本名
grep RNA SraRunTable.txt |wc
head SRR_Acc_List.txt > id > cat id
mv SraRunTable.txt info改名為info
mv SRR_Acc_List.txt allid改名為allid
grep SRR5933809 info
可以直接grep SRR59338 id,輸出來(lái)的結(jié)果為
SRR5933808
SRR5933809
SRR5933810
SRR5933811