生物信息學(xué)筆記-術(shù)語(yǔ)篇

皮爾遜相關(guān)系數(shù)

它是一種度量?jī)蓚€(gè)變量間相關(guān)程度的方法。它是一個(gè)介于 1 和 -1 之間的值,其中,1 表示變量完全正相關(guān), 0 表示無(wú)關(guān),-1 表示完全負(fù)相關(guān)。

怎樣解讀spss皮爾遜 P值和r值?

r值就是皮爾遜相關(guān)系數(shù)的大小,代表了相關(guān)的強(qiáng)度,即兩個(gè)變量共變性的程度,取值范圍為(-1,1)。

p值是顯著性,與皮爾遜相關(guān)顯著性檢驗(yàn)有關(guān),P<0.05時(shí)表示相關(guān)顯著,即在當(dāng)前的樣本下可以明顯的觀察到兩變量的相關(guān),兩個(gè)變量的相關(guān)有統(tǒng)計(jì)學(xué)意義。

箱線圖

能提供有關(guān)數(shù)據(jù)位置和分散情況的關(guān)鍵信息,尤其在比較不同的母體數(shù)據(jù)時(shí)更可表現(xiàn)其差異。


箱線圖信息

如上圖所示,標(biāo)示了圖中每條線表示的含義,其中應(yīng)用到了分位值(數(shù))的概念。


Kaplan-Meier生存曲線

隨訪研究,如對(duì) 某人群進(jìn)行跟蹤,直至出現(xiàn)一個(gè)特殊事件或終點(diǎn),如死亡、癌癥復(fù)發(fā)等,對(duì)所有研究對(duì)象從某特定時(shí)間點(diǎn)開(kāi)始追蹤,記錄出現(xiàn)特殊事件的時(shí)間。通常,當(dāng)所有研究對(duì) 象出現(xiàn)該事件時(shí)研究才結(jié)束,但也有些研究對(duì)象可能失訪,或者研究提前結(jié)束,這樣就有一些對(duì)象的結(jié)局未知,對(duì)這些對(duì)象記錄跟蹤的時(shí)間(截尾數(shù)據(jù))。

假設(shè)檢驗(yàn)中的P值

假設(shè)檢驗(yàn)是推斷統(tǒng)計(jì)中的一項(xiàng)重要內(nèi)容。用SAS、SPSS等專(zhuān)業(yè)統(tǒng)計(jì)軟件進(jìn)行假設(shè)檢驗(yàn),在假設(shè)檢驗(yàn)中常見(jiàn)到P值( P-Value,Probability,Pr),P值是進(jìn)行檢驗(yàn)決策的另一個(gè)依據(jù)。

P值即概率,反映某一事件發(fā)生的可能性大小。統(tǒng)計(jì)學(xué)根據(jù)顯著性檢驗(yàn)方法所得到的P 值,一般以P < 0.05 為顯著, P<0.01 為非常顯著,其含義是樣本間的差異由抽樣誤差所致的概率小于0.05 或0.01。實(shí)際上,P值不能賦予數(shù)據(jù)任何重要性,只能說(shuō)明某事件發(fā)生的機(jī)率。

主要包含六個(gè)數(shù)據(jù)節(jié)點(diǎn),將一組數(shù)據(jù)從大到小排列,分別計(jì)算出他的上邊緣,上四分位數(shù)Q3,中位數(shù),下四分位數(shù)Q1,下邊緣,還有一個(gè)異常值

生存分析中的p值

是表示這兩組之間的生存率是否有差異。

因?yàn)橐话闵娣治鲅芯康亩际且粋€(gè)實(shí)驗(yàn)組的治療方法之類(lèi)的, 一個(gè)對(duì)照組的傳統(tǒng)方法之類(lèi)。通過(guò)生存分析對(duì)比,可以發(fā)現(xiàn)兩組生存率之間是否存在差異,繼而說(shuō)明兩種實(shí)驗(yàn)處理是否有差異,或者哪種處理更有效

是整體比較,比如你的生存時(shí)間是5年的,那自然是比較整體5年下來(lái)的生存率,如果你的生存時(shí)間是10年的跟蹤數(shù)據(jù),那自然是比較整體10年下來(lái)的生存率。

生存分析比較的生存率,本來(lái)就是一個(gè)整體一段時(shí)間持續(xù)下來(lái)的生存率,而不是單個(gè)時(shí)間點(diǎn)的生存率

數(shù)據(jù)的標(biāo)準(zhǔn)化與中心化

數(shù)據(jù)標(biāo)準(zhǔn)化是指:數(shù)值減去均值,再除以標(biāo)準(zhǔn)差;所謂中心化, 是指變量減去它的均值.

免疫印跡(immunoblotting)

又稱(chēng)蛋白質(zhì)印跡(Western blotting),是一種借助特異性抗體鑒定抗原的有效方法。該方法是在凝膠電泳和固相免疫測(cè)定技術(shù)基礎(chǔ)上發(fā)展起來(lái)的一種新的免疫生化技術(shù),既具有凝膠電泳的高分辨率又具備固相免疫測(cè)定的高特異性和高靈敏性,可檢測(cè)1-5ng的中等大小蛋白。其優(yōu)點(diǎn)是方法簡(jiǎn)便、標(biāo)本可長(zhǎng)期保存、結(jié)果便于比較,故被廣泛應(yīng)用于分子生物學(xué)等領(lǐng)域,成為一種常用的一種研究方法。

生物學(xué)中的保守性

保守性一般是在進(jìn)化理論中應(yīng)用較多,“保守性好”指的是發(fā)生突變的幾率低。以蛋白為例,一般用于進(jìn)化或物種親緣關(guān)系分析的蛋白都含有可變部分——非保守區(qū),和穩(wěn)定部分——保守區(qū)。

真核基因表達(dá)調(diào)控的順式作用元件

順式作用元件(cis-acting element)是指DNA分子上對(duì)基因表達(dá)有調(diào)節(jié)活性的特定核苷酸序列。順式作用元件的活性只影響同一DNA分子上的基因。這種DNA序列多位于基因上游或內(nèi)含子中。

真核基因的順式作用元件按其功能可以分為:?jiǎn)?dòng)子、增強(qiáng)子和靜止子。

啟動(dòng)子的結(jié)構(gòu)和功能

啟動(dòng)子是轉(zhuǎn)錄因子和RNA聚合酶的結(jié)合位點(diǎn),位于受其調(diào)控的基因上游,鄰近基因轉(zhuǎn)錄起始點(diǎn),是基因的一部分。

增強(qiáng)子的結(jié)構(gòu)和功能

增強(qiáng)子(enhancer),又稱(chēng)強(qiáng)化子(transcriptional enhancer),是一種遠(yuǎn)端調(diào)控元件,至少距轉(zhuǎn)錄起始點(diǎn)上游100bp以上,通常位于-700~-1000處,所以又稱(chēng)為上游激活序列(upstream activator sequence, UAS)。

增強(qiáng)子也要通過(guò)與特定的蛋白質(zhì)因子(轉(zhuǎn)錄因子)結(jié)合而實(shí)現(xiàn)其對(duì)轉(zhuǎn)錄的增強(qiáng)作用。

靜止子

是一種類(lèi)似增強(qiáng)子但起負(fù)調(diào)控作用的順式作用元件。有人稱(chēng)為沉默基因。靜止子與相應(yīng)的反式作用因子結(jié)合后,可以使正調(diào)控系統(tǒng)失去作用。

真核基因調(diào)控的反式作用因子

不論是啟動(dòng)子還是增強(qiáng)子序列,他們的轉(zhuǎn)錄調(diào)節(jié)功能都是通過(guò)與特定的DNA結(jié)合蛋白的相互作用而實(shí)現(xiàn)的。

真核生物的RNA聚合酶與原核生物的RNA聚合酶不同,它本身不能啟動(dòng)轉(zhuǎn)錄,純化了的真核生物RNA聚合酶在體外是不能啟動(dòng)轉(zhuǎn)錄的。因此必須事先有一套轉(zhuǎn)錄因子裝配到啟動(dòng)子上,RNA聚合酶才能啟動(dòng)轉(zhuǎn)錄。

這些轉(zhuǎn)錄因子一般并不是RNA聚合酶的組成成分。

能直接或間接識(shí)別各種順式調(diào)控元件并與之結(jié)合從而調(diào)控基因轉(zhuǎn)錄效率的各種蛋白質(zhì)分子稱(chēng)為反式作用因子 (trans-acting factor)。

能激活真核生物基因轉(zhuǎn)錄的蛋白質(zhì)稱(chēng)為轉(zhuǎn)錄因子(transcription factor, TF)。轉(zhuǎn)錄因子是參與正調(diào)控的反式作用因子,是轉(zhuǎn)錄起始過(guò)程中RNA聚合酶所需要的輔助因子。

免疫印跡

是根據(jù)抗原抗體的特異性結(jié)合檢測(cè)復(fù)雜樣品中的某種蛋白的方法。
將混合抗原樣品在凝膠板上進(jìn)行單向或雙向電泳分離, 然后取固定化基質(zhì)膜與凝膠相貼。在印跡紙的自然吸附力、電場(chǎng)力或其它外力作用下, 使凝膠中的單一抗原組份轉(zhuǎn)移到印跡紙上, 并且固相化。最后應(yīng)用免疫覆蓋液技術(shù)如免疫同位素探針或免疫酶探針等, 對(duì)抗原固定化基質(zhì)膜進(jìn)行檢測(cè)和分析。

小干擾RNA(Small interfering RNA;siRNA

有時(shí)稱(chēng)為短干擾RNA(short interfering RNA)或沉默RNA(silencing RNA),是一個(gè)長(zhǎng)20到25個(gè)核苷酸的雙股RNA,在生物學(xué)上有許多不同的用途。

CpG

CpG表示核苷酸對(duì),其中G在DNA鏈中緊隨C后。CpG對(duì)很少出現(xiàn)在人類(lèi)基因中。然而,在許多基因的啟動(dòng)子(promotor)或轉(zhuǎn)錄起始位點(diǎn)(transcription start site,TSS)區(qū)域周?chē)?a target="_blank" rel="nofollow">甲基化經(jīng)常被抑制。這些區(qū)域包含濃度相對(duì)較高的CpG對(duì),與染色體一起稱(chēng)作CpG島,其長(zhǎng)度通常在幾百到幾千核苷酸的長(zhǎng)度內(nèi)變化。

CpG島(CpG island)

CpG雙核苷酸在人類(lèi)基因組中的分布很不均一,而在基因組的某些區(qū)段,CpG保持或高于正常概率,這些區(qū)段被稱(chēng)作CpG島,在哺乳動(dòng)物基因組中的1~2kb的DNA片段,它富含非甲基化的CpG雙倍體。

陽(yáng)性和陰性選擇

所謂陰性和陽(yáng)性指的是細(xì)胞生存下來(lái)的條件。陽(yáng)性選擇指的是只有反應(yīng)的細(xì)胞才能生存,否則凋亡。陰性選擇指的是只有不反應(yīng)的細(xì)胞才能生存,否則凋亡。

對(duì)于B細(xì)胞來(lái)說(shuō)

陰性選擇指的是只有在骨髓發(fā)育中不予自身抗原反應(yīng)的B細(xì)胞才能生存;陽(yáng)性選擇指的是在外周在體細(xì)胞高頻突變的過(guò)程中能高親和力識(shí)別T細(xì)胞提呈的B細(xì)胞才能增殖。B細(xì)胞是先陰選后陽(yáng)選

對(duì)于T細(xì)胞來(lái)說(shuō)

陽(yáng)性選擇指的是只有在胸腺皮質(zhì)發(fā)育中識(shí)別MHC分子的T細(xì)胞才能生存;陰性選擇指的是只有在胸腺髓質(zhì)發(fā)育中不予自身抗原反應(yīng)的T細(xì)胞才能生存;T細(xì)胞是先陽(yáng)選后陰選


微衛(wèi)星(microsatellite)

一般指基因組中由短的重復(fù)單元(一般為1~6個(gè)堿基)組成的DNA串聯(lián)重復(fù)序列。

微衛(wèi)星DNA符合孟德?tīng)栠z傳模式,共顯性表達(dá),廣泛分布于真核生物的基因組中,包括編碼區(qū)和非編碼區(qū).研究表明,可能是DNA復(fù)制過(guò)程中的“鏈滑”(strand slippage)現(xiàn)象造成微衛(wèi)星DNA多態(tài)性信息容量(polymorphic information content, PIC)較高.

由于微衛(wèi)星具有數(shù)量多、在基因組內(nèi)分布均勻、多態(tài)性信息豐富、易于檢測(cè)等優(yōu)點(diǎn)被作為優(yōu)良的遺傳標(biāo)記(genetic marker)而得到廣泛應(yīng)用。

根據(jù)重復(fù)單元的構(gòu)成與分布,微衛(wèi)星DNA序列被分為3種類(lèi)型:?jiǎn)我恍?pure),復(fù)合型(compound)和間斷型(interrupted), 例如:

單一型:ATATATATATATATATATATATAT

復(fù)合型: ATATATCACACACACACACAC

間斷型: ATATATCA ATATATCA ATATATA

遺傳圖譜

某一物種的染色體圖譜(也就是我們所知的連鎖圖譜),顯示所知的基因和/或遺傳標(biāo)記的相對(duì)位置,而不是在每條染色體上特殊的物理位置。由遺傳重組測(cè)驗(yàn)結(jié)果推算出來(lái)的、在一條染色體上可以發(fā)生的突變座位的直線排列(基因位點(diǎn)的排列)圖。

遺傳圖譜即遺傳連鎖圖譜,是基因組研究中的一個(gè)重要組成部分,它是指基因組中基因以及專(zhuān)一的多態(tài)性標(biāo)記之間相對(duì)位置的圖譜。即通過(guò)兩點(diǎn)測(cè)驗(yàn)和三點(diǎn)測(cè)驗(yàn)對(duì)統(tǒng)計(jì)的各種帶型個(gè)體數(shù)進(jìn)行連鎖分析計(jì)算,建立連鎖群。也可從第二個(gè)標(biāo)記開(kāi)始,測(cè)驗(yàn)與前一個(gè)標(biāo)記是否協(xié)同分離。根據(jù)分離資料,用最大似然法估計(jì)不同標(biāo)記位點(diǎn)間的重組率數(shù)值并轉(zhuǎn)換成遺傳距離,連鎖的遺傳標(biāo)記間距離,一般用cM表示,IcM為同源染色體配對(duì)期望交換值1%的染色體長(zhǎng)度。隨著計(jì)算機(jī)技術(shù)的發(fā)展,目前已有多個(gè)構(gòu)建遺傳圖譜的軟件,研究者用的較多的軟件主要有MapMaker及 JoinMap 3.0 。


Spike-in Control:添加/加入(某種物質(zhì))的對(duì)照(組)

在某些情況下,待檢驗(yàn)樣本中不含待測(cè)物質(zhì)或者含有但是濃度很低,為了證明自己建立的方法能對(duì)樣本中待測(cè)物質(zhì)進(jìn)行有效的檢測(cè),可在待檢樣本中加入一定量的待測(cè)物質(zhì)(外標(biāo))來(lái)進(jìn)行該方法檢測(cè)能力的驗(yàn)證。有時(shí),這種加入外標(biāo)的物質(zhì),也可用作為陽(yáng)性對(duì)照。

Genetic Mosaic

In genetics, a mosaic, or mosaicism describes the presence of two or more populations of cells with different genotypes in one individual, who has developed from a single fertilized egg.Mosaicism has been reported to be present in as high as 70% of cleavage stage embryos and 90% of blastocyst-stage embryos derived from in vitro fertilization.

全基因組擴(kuò)增(whole genome amplification, WGA)

WGA是一組對(duì)全部基因組序列進(jìn)行 非選擇性擴(kuò)增的技術(shù),其目的是在沒(méi)有序列傾向性的前提下大幅度增加 DNA 的總量。其中最具代表性方法是 DOP-PCR 和 PEP-PCR。 DOP-PCR 和 PEP-PCR 的基本原理都是通過(guò)其隨機(jī)引物與基因組 DNA 多處退火從而使大部分基因組序列得到擴(kuò)增。DOP-PCR 的引物是由其 3′和 5′端的特異核苷酸序列和中間的 6 個(gè)核苷酸構(gòu)成的隨機(jī)引物組成。PEP-PCR 的引物是由15 個(gè)隨機(jī)核苷酸組成的完全隨 機(jī)引物。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容