bilibili視頻-《轉(zhuǎn)錄組測(cè)序數(shù)據(jù)分析》筆記

看老大RNA-seq視頻

P5/P6:RNA-seq:軟件安裝-上/下

1.有源代碼的下載源代碼,一般的軟件會(huì)提供多個(gè)平臺(tái)

2.沒(méi)有源代碼的下載二進(jìn)制版本

linux的軟件中心---conda---類似360軟件中心

$():把括號(hào)里的命令運(yùn)行一下

安裝完conda后,最重要的一步是添加清華源的鏡像,提高下載速度,配置環(huán)境需要用到conda config??捎胏onda config --show查看已有的配置

查看已有環(huán)境

conda info --envs

建立一個(gè)python2環(huán)境,并且安裝比對(duì)軟件bwa

conda create -n biostar python=2 bwa

Create -n rna python=2 bwa

image-20181229110154604

點(diǎn)yes后會(huì)將添加到環(huán)境變量

如果沒(méi)添加到環(huán)境變量,單次install的時(shí)候就是miniconda3/bin/conda create -n biostar python=2 bwa

如果添加到環(huán)境變量,就是conda create -n biostar python=2 bwa

用conda安裝前可先conda search trimmomatic,看看這個(gè)軟件是不是conda給他的名字

也可在下面這個(gè)網(wǎng)址搜索bioconda是否有這個(gè)包(看看大小寫、下劃線、中華線之類的)

http://bioconda.github.io/recipes.html

conda不是萬(wàn)能的

刪掉conda:rm -rf miniconda3/

cat ~/.barch
export PATH=/home/jmzeng/biosoft/myBIn/bin:$PATH#在變量里加入了??

P7:5-sratoolkit下載數(shù)據(jù)

一個(gè)RNA-seq實(shí)戰(zhàn)-超級(jí)簡(jiǎn)單-2小時(shí)搞定

** http://www.bio-info-trainee.com/2218.html**

第一步:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE50177(在這里更改GSE號(hào))

第二步:

第三步:

第四步:
cat id |while read id ;do (prefetch $id &) ;done #寫一個(gè)循環(huán)下載fa數(shù)據(jù)

批量殺任務(wù)

生成SRA文件

生成fq文件

批量生產(chǎn)fq文件

ls /public/project/RNA/airway/sra/*sra |while read id;do ( nohup fastq-dump --gzip --split-3 -O ./ $id & );done

尋找gz結(jié)尾文件:
find ~/ -name "*gz"

一件我理解不了的了事

可是我 find以后,咩有

而我find其他就有,證明find沒(méi)用錯(cuò)呀,可能是沒(méi)有下載下來(lái)

image-20181229202232620

不知道為什么不能fastq-dump,鏈過(guò)來(lái)的也應(yīng)該能用的啊,我刪掉這個(gè)sra的路徑再鏈一次,藍(lán)色和紅色什么區(qū)別呢?

我想起來(lái)了,紅色是無(wú)效的鏈接,如果紅色是tt從zy那鏈接 過(guò)來(lái)的,如果zy給移動(dòng)或者刪除了,那么就失效了,應(yīng)該是這樣的,那條tt和zy是一個(gè)從前下,一個(gè)從后下的,而我去zy里也找不到SRA文件了。

P8:6-qc

接下來(lái)要從fa轉(zhuǎn)fq文件

ls -lh raw/|wc #看數(shù)據(jù)
less raw/nohup.out #有后臺(tái)日志
grep failed raw/nohup.out
zless SRR1039508_1.fastq.gz #查看

P10:7-alignment-1

從老大視頻里扒來(lái)的鏈接,先收藏

https://blog.csdn.net/xubo245/article/details/50878760

https://blog.csdn.net/xubo245/article/details/50836185

vi tmp.sh

p12:RNA-seq:7-alignment-3

cat *|awk '{print $1}' |paste - - - - - - - - - - - - - -

linux文本處理3架馬車

less -S 文本名 整行顯示

Less -SN 文本名

grep RNA SraRunTable.txt |wc

head SRR_Acc_List.txt > id > cat id

mv SraRunTable.txt info改名為info

mv SRR_Acc_List.txt allid改名為allid

grep SRR5933809 info

可以直接grep SRR59338 id,輸出來(lái)的結(jié)果為

SRR5933808

SRR5933809

SRR5933810

SRR5933811

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 生信學(xué)習(xí)筆記 linux部分功能 查看文件夾 工具 選項(xiàng) 可以設(shè)置鼠標(biāo)功能 可以設(shè)置右鍵粘貼 雙擊這個(gè)窗口可以再打...
    Vikenn閱讀 1,218評(píng)論 1 4
  • wes定義: 全外顯子組測(cè)序,是利用目標(biāo)序列捕獲技術(shù), 將全基因組編碼基因外顯子區(qū)域的DNA捕獲并富集后,進(jìn)行高通...
    鳳凰_0949閱讀 4,628評(píng)論 0 7
  • 軟件安裝 miniconda安裝 wget -c https://mirrors.tuna.tsinghua.ed...
    小夢(mèng)游仙境閱讀 1,042評(píng)論 0 1
  • 最寶貴的時(shí)間。最容易流逝的也是時(shí)間。 2018年就剩下了最后10天。腦子里嗡的一聲,這一年又要過(guò)去了?! 回想這一...
    果仁檸檬閱讀 987評(píng)論 2 17
  • 旅游記事十二 今天是2018年6月22日。天氣還不錯(cuò),甘州氣溫25度。老梁決定不跟我們走國(guó)道了,自己上高速,到下一...
    江漢綠蘿閱讀 294評(píng)論 0 1

友情鏈接更多精彩內(nèi)容