下機(jī)數(shù)據(jù)校驗(yàn)md5值

RNA-seq數(shù)據(jù),PE150策略,公司給出了rawdata及cleandata

公司給出的下機(jī)數(shù)據(jù)格式

格式如下圖


每個(gè)標(biāo)本一個(gè)文件夾
每個(gè)文件夾包括雙端測(cè)序的fq格式文件及MD5校驗(yàn)文件

由于服務(wù)器空間有限,因此在自己的移動(dòng)硬盤處理數(shù)據(jù),每個(gè)流程一個(gè)文件夾,定義移動(dòng)硬盤的check文件夾維目錄檢查內(nèi)容

進(jìn)入文件夾

cd /home/test/project/check

設(shè)定目錄

ad=/home/test/project/data
nohup find $ad  -name   *.gz  -print0 | xargs -0 md5sum > check.md5 &

因?yàn)榭赡苄枰^長(zhǎng)時(shí)間,因此放入后臺(tái)運(yùn)行并掛起

nohup find  $ad  -name    *.txt -print0 |xargs -0  cat > check.list &

把每個(gè)文件夾的md5文件整理并放入check.list中

awk '{print $1}' check.list >newcheck
awk '{print $1}' check.md5 >newmd5

md5值在每個(gè)文件中的第一列中,提取出來(lái)并新建目錄

diff -s newcheck newmd5

利用diff命令對(duì)比兩文件并最終確定是否相同,s參數(shù)的意義是對(duì)比正確后予以顯示


結(jié)果
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容