2022-09-26-----隨堂測(cè)驗(yàn)

下載Synechococcus elongatus UTEX 2973(accession no.為GCA_000817325.1 )的基因組注釋文件,生成一個(gè)locus_tag和Name對(duì)應(yīng)關(guān)系的表格?要求:只能使用一行shell命令,生成的表格以制表符分隔;并將shell命令和基因數(shù)目寫(xiě)在答案處。

打開(kāi)網(wǎng)址,進(jìn)入NCBI網(wǎng)站

https://www.ncbi.nlm.nih.gov/

點(diǎn)擊Download
點(diǎn)擊FTP

按genomes/all/GCA/000/817/325目錄進(jìn)入

點(diǎn)擊目錄 GCA_000817325.1_ASM81732v1
選擇想要下載的文件,復(fù)制鏈接

wget https://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/817/325/GCA_000817325.1_ASM81732v1/GCA_000817325.1_ASM81732v1_genomic.gff.gz? #通過(guò)復(fù)制的鏈接下載基因注釋文件

復(fù)制鏈接,下載壓縮包


查看下載的文件

gunzip GCA_000817325.1_ASM81732v1_genomic.gff.gz

解壓文件,已經(jīng)存在,詢(xún)問(wèn)是否覆蓋,選擇y

grep $'RefSeq\t' GCA_000817325.1_ASM81732v1_genomic.gff> test.tsv

生成table分隔文件

less test.tsv

查看文件內(nèi)容

查看的結(jié)果

失敗,文件中無(wú)此內(nèi)容

grep $'RefSeq\t' GCA_000817325.1_ASM81732v1_genomic.gff|less?? #查看抓取文件,無(wú),失敗

less GCA_000817325.1_ASM81732v1_genomic.gff?? #查看文件內(nèi)容

選取需要抓取的關(guān)鍵詞

grep $'\tProtein' GCA_000817325.1_ASM81732v1_genomic.gff |head

抓取目標(biāo)行

grep $'\tProtein' GCA_000817325.1_ASM81732v1_genomic.gff |sed 's/^.*;Name=//g'|sed 's/;.*;locus_tag=/\t/g'|sed 's/;.*$//g'|head

抓取目標(biāo)列
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容