最近系統(tǒng)的從頭到尾學(xué)習(xí)了一下樊龍江老師出版的生物信息學(xué)這本書,學(xué)習(xí)生物信息有1年多了,從事醫(yī)學(xué)數(shù)據(jù)分析6年多了,唯一的感覺就是基礎(chǔ)很重要真的很重要,參加了很多的培訓(xùn)班,自己也看過很多的視頻,也辦過幾期的線下培訓(xùn),還是感覺要夯實基礎(chǔ),于是又從頭的過了一遍基礎(chǔ)知識。樊龍江老師這本書里面的內(nèi)容對于想要入門的小伙伴還是挺好的,在接下來有空的日子里,青鹽會一點一點的分享學(xué)習(xí)筆記,今天要分享的是生物數(shù)據(jù)的來源和產(chǎn)生的途徑。

1.核苷酸序列數(shù)據(jù)
核苷酸序列數(shù)據(jù):指DNA或者RNA中四種堿基的排列順序
常見的核苷酸序列數(shù)據(jù)。
脫氧核糖核酸(DNA):腺嘌呤(A),鳥嘌呤(G),胸腺嘧啶(T),胞嘧啶(C);
核糖核酸(RNA):腺嘌呤(A),鳥嘌呤(G),尿嘧啶(U),胞嘧啶(C)。
2.蛋白質(zhì)序列和結(jié)構(gòu)數(shù)據(jù)
(1)蛋白質(zhì)序列數(shù)據(jù):是指20種氨基酸的排列順序(即蛋白質(zhì)的一級結(jié)構(gòu))。
20種氨基酸的名稱及縮寫:丙氨酸(A),精氨酸(R),天冬氨酸(D),半胱氨酸(C),谷氨酰胺(Q),谷氨酸(E),組氨酸(H),異亮氨酸(I),甘氨酸(G),天冬酰胺(N),亮氨酸(L),賴氨酸(K),甲硫氨酸(M),苯丙氨酸(F),脯氨酸(P),絲氨酸(S),蘇氨酸(T),色氨酸(W),酪氨酸(Y),纈氨酸(V)。
(2)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù):主要是蛋白質(zhì)的三級結(jié)構(gòu)信息。蛋白質(zhì)的三級結(jié)構(gòu)是蛋白質(zhì)的多肽鏈在各種二級結(jié)構(gòu)的基礎(chǔ)上,再進一步盤曲或者折疊形成的具有一定規(guī)律的三維空間結(jié)構(gòu)。蛋白質(zhì)三級結(jié)構(gòu)數(shù)據(jù):主要來源實驗(X射線晶體衍射、核磁共振等)。
3.生物芯片數(shù)據(jù)
生物芯片(biochip或bioarray)技術(shù)起源于核酸分子雜交,該技術(shù)根據(jù)生物分子間特異相互作用的原理,將生化分析過程集成于芯片表面,實現(xiàn)生物信息的存儲和集成,從而實現(xiàn)對于DNA,RNA,多肽,蛋白質(zhì)以及其他生物成分的高通量快速檢測。
(1)基因芯片(gene chip):又稱DNA芯片(DNA chip)或DNA 微陣列(DNA microarray) ,是將cDNA或寡核苷酸固定在微型載體上形成微陣列。
(2)蛋白質(zhì)芯片(protein chip或protein microarry):蛋白質(zhì)芯片是將蛋白質(zhì)或抗原等一些非核酸生物物質(zhì)固定在微型載體上形成微陣列。
(3)細(xì)胞芯片(cell chip):是將細(xì)胞按照特定的方式固定在載體上,用來檢測細(xì)胞間相互影響或相互作用。
(4)組織芯片(tissue chip):是將組織切片等按照特定的方式固定在載體上,主要用來對免疫組織等組織內(nèi)成分差異進行研究。
4.分子標(biāo)記數(shù)據(jù)
分子標(biāo)記是遺傳標(biāo)記的一種,遺傳標(biāo)記是指在染色體上位置已知的一個基因或者一段DNA序列,可被用于鑒定生物個體或者物種,包括形態(tài)標(biāo)記、細(xì)胞學(xué)標(biāo)記、生活標(biāo)記和分子標(biāo)記四種類型。
5.生物表型數(shù)據(jù)
生物表型(phenotype)數(shù)據(jù):指與生物體的個體形態(tài),外觀,生理,功能等相關(guān)的一些指標(biāo)數(shù)據(jù),如:身高,膚色,血型,酶活力,藥物耐受力乃至性格等,一般情況下通過常規(guī)的測量和檢測就能夠得到相應(yīng)的數(shù)據(jù)集。