前面通過視頻給大家介紹一下我們要復(fù)現(xiàn)的內(nèi)容
? 復(fù)現(xiàn)SCI文章多序列比對相似性表格(一)
就是下面這篇文章的Table2

表格如下,一共有23種不同的肝炎病毒株

表格中,右上三角是23種病毒株的DNA序列,兩兩之間的序列相似性。左下三角是23種病毒株的氨基酸序列,兩兩之間的序列相似性。
今天我們先來計算,DNA序列兩兩之間的序列相似性。
1)數(shù)據(jù)獲取這里文章的表格中已經(jīng)給出了23個病毒株的ID號,在表格的行名中。直接貼到NCBI數(shù)據(jù)庫就可以下載相應(yīng)的DNA序列和氨基酸序列。
2)計算DNA序列兩兩之間的序列相似性,這里有23種病毒株,所以需要計算253次。
最終我們可以得到下面這個DNA序列兩兩之間的相似性

今天的分享就先到這里,希望對大家的科研有所幫助。