精品一精品二精品三,青青草精品中文无码

作為一個(gè)剛接觸生物信息這個(gè)專業(yè)小白，我正在努力學(xué)習(xí)著最基礎(chǔ)的東西，最先是了解GEO數(shù)據(jù)庫，自己利用數(shù)據(jù)進(jìn)行分析，還好之前有R語言基礎(chǔ)，這第一步就花了很長時(shí)間，但是完成后是很有成就感的，希望我在自己摸索的道路上越走越順，接下來就是記錄我學(xué)習(xí)心路。(可能有很多錯(cuò)誤，歡迎各位老師指正)

首先是瀏覽GEO數(shù)據(jù)庫，這個(gè)龐大的數(shù)據(jù)庫看的我是真的暈，學(xué)好英文真的是很重要啊，不過不能急，慢慢來，一點(diǎn)一點(diǎn)去看，先下載幾個(gè)數(shù)據(jù)看看，我一般是以白血病(leukemia)為例

GDS GSE GPL GSM

這四個(gè)東西我之前是分不清的，后來在強(qiáng)大的網(wǎng)絡(luò)幫助下，我成功弄明白了，GSM是單個(gè)樣本的實(shí)驗(yàn)數(shù)據(jù)，GDS是人工整理好的關(guān)于某個(gè)話題的GSM的集合，一個(gè)GDS中的GSM的平臺是一樣的，GSE是一個(gè)實(shí)驗(yàn)項(xiàng)目中的多個(gè)芯片實(shí)驗(yàn)，可能使用多個(gè)平臺，GPL是芯片的平臺，如Affymetrix， Aglent等。

好啦，接下來是下載數(shù)據(jù)了，以GSE13822為例，下載它的數(shù)據(jù)系列文件GSE_series_matrix,文件里面！號開頭的是一些實(shí)驗(yàn)描述內(nèi)容，一般包括標(biāo)題，樣本信息，實(shí)驗(yàn)平臺，研究者，發(fā)布時(shí)間等等信息，處理數(shù)據(jù)前之前需要認(rèn)真看這些內(nèi)容。弄清楚樣本數(shù)量，以及實(shí)驗(yàn)組和對照組的樣本編號。