ANNOVAR結(jié)果說明-SNP/INDEL

一 結(jié)果文件說明

??? 1? VCF (Variant Call Format)是儲(chǔ)存Variation結(jié)果的文件格式 該文件的#列為文件的詳細(xì)解讀信息

??? 2? *.hg19_multianno.xls是在VCF的基礎(chǔ)上,用ANNOVAR注釋,并增加OMIM、GO、KEGG等數(shù)據(jù)庫功能注釋信息。

二 結(jié)果文件(*.hg19_multianno.xls)按照功能區(qū)域注釋基因及區(qū)域注釋

變異位點(diǎn)所處的基因(對(duì)應(yīng)的氨基酸)可能直接與疾病相關(guān)。公司對(duì)變異位點(diǎn)進(jìn)行已知基因結(jié)構(gòu)及所處區(qū)域注釋,有助于老師了解此變異位點(diǎn)對(duì)應(yīng)的基因結(jié)構(gòu)及所處區(qū)域信息。

CHROM:染色體

POS:變異位點(diǎn)在染色體上的絕對(duì)位置

ID:dbSNP注釋ID

REF:參考基因組堿基型

ALT:樣本基因組堿基型

Func.refGene:對(duì)變異位點(diǎn)所在的區(qū)域進(jìn)行注釋(exonic,splicing, UTR5, UTR3, intronic, ncRNA_exonic, ncRNA_intronic, ncRNA_UTR3,ncRNA_UTR5, ncRNA _splicing, upstream, downstream,intergenic)。

說明:1、exonic應(yīng)該包括coding exonic portion、UTR3和UTR5,但ANNOVAR注釋結(jié)果中exonic只代表coding exonic portion。2、當(dāng)一個(gè)變異位點(diǎn)位于多個(gè)基因或轉(zhuǎn)錄本,且功能不同,這些功能按照優(yōu)先級(jí)排序,該列輸出優(yōu)先級(jí)最高的功能類型:Exonic = splicing > ncRNA> > UTR5/UTR3 > intron > upstream/downstream? > intergenic。當(dāng)一個(gè)變異既位于一個(gè)基因的UTR3,又位于另一個(gè)基因的UTR5時(shí),該列輸出"UTR5,UTR3"。當(dāng)一個(gè)變異既位于一個(gè)基因的downstream,又位于另一個(gè)基因的upstream時(shí),該列輸出"upstream,downstream "。

Gene.refGene:列出該變異位點(diǎn)相關(guān)的基因。

XXXlocalfreq:公司正常人外顯子數(shù)據(jù)庫中,該變異位點(diǎn)上突變堿基的等位基因頻率;例如:0.32;表示假設(shè)數(shù)據(jù)庫中1000人,其中320個(gè)人有該突變;

hgmd_variantType,hgmd_pmid:人類基因突變數(shù)據(jù)庫注釋,給出該變異位點(diǎn)相關(guān)的突變類型和在HGMD數(shù)據(jù)庫中的ID

omim_id:孟德爾遺傳病數(shù)據(jù)庫注釋,給出與變異位點(diǎn)所在基因相關(guān)的OMIM數(shù)據(jù)庫ID

pho_or_dis,chpo_or_dis:給出與變異位點(diǎn)所在基因相關(guān)的遺傳疾病中英文表型名稱或疾病信息

inheritance:給出與變異位點(diǎn)所在基因相關(guān)的遺傳方式

GeneDetail.refGene:描述UTR、splicing、ncRNA_splicing或intergenic區(qū)域的變異情況。當(dāng)Func列的值為exonic、ncRNA_exonic、intronic、ncRNA_intronic、upstream、downstream、upstream;downstream、ncRNA_UTR3、ncRNA_UTR5時(shí),該列為空;當(dāng)Func列的值為exonic;splicing時(shí),表示該位點(diǎn)位于某些轉(zhuǎn)錄本的exonic區(qū),另一些轉(zhuǎn)錄本的splicing區(qū),這種情況下,GeneDetail會(huì)給出該位點(diǎn)對(duì)于轉(zhuǎn)錄本splicing的影響,例如,NM_1524XX:exon3:c.232C>T,表示該變異位于轉(zhuǎn)錄本NM_1524XX上,exon3表示第3個(gè)外顯子,c.232C>T表示cDNA的232bp處發(fā)生由C到T的突變;當(dāng)Func列的值為intergenic時(shí),該列格式為dist=1322;dist=12414,表示該變異位點(diǎn)距離兩側(cè)基因的距離

ExonicFunc.refGene:外顯子區(qū)的SNV or InDel變異類型(SNV的變異類型包括synonymous_SNV, missense_SNV, stopgain,stopgloss和unknown;InDel的變異類型包括frameshift insertion, frameshift deletion, stopgain, stoploss, nonframeshift insertion, nonframeshift deletion和unknown)

AAChange.refGene:氨基酸改變,只有當(dāng)Func列為exonic或exonic;splicing時(shí),該列才有結(jié)果。按照每個(gè)轉(zhuǎn)錄本進(jìn)行注釋(例如,AIM1L:NM_001039775:exon2:c.C2768T:p.P923L,其中,AIM1L表示該變異所在的基因名稱,NM_001039775表示該變異所在的轉(zhuǎn)錄本ID,exon2表示該變異位于轉(zhuǎn)錄本的第二個(gè)外顯子上,c.C2768T表示該變異引起cDNA在第2768位上由C突變?yōu)門,p.P923L表示該變異引起蛋白序列在第923位上的氨基酸由Pro變?yōu)長eu),再如,F(xiàn)MN2:NM_020066:exon1:c.160_162del:p.54_54del,表示該變異引起cDNA的第160到162位發(fā)生刪除,p.54_54del表示該變異引起蛋白序列在第54位上的氨基酸刪除

*.wgEncodeGencodeBasicV19:Gencode對(duì)變異位點(diǎn)所在的區(qū)域進(jìn)行注釋(相關(guān)解釋同*.refGene)

cpgIslandExt:CpG島預(yù)測結(jié)果,注釋結(jié)果為CpG島名稱,如CpG:?116(116是該CpG島中CG二核苷酸的數(shù)目)

cytoband:該變異位點(diǎn)所處的染色體區(qū)段(利用Giemas染色觀察得到的)。如果變異位點(diǎn)跨過多個(gè)區(qū)段,用短橫線連接

wgRna:基于miRBase和snoRNABase,對(duì)變異位點(diǎn)相關(guān)的microRNA和snoRNA進(jìn)行注釋,給出microRNA和snoRNA的基因名稱

targetScanS:UCSC提供TargetScanS注釋數(shù)據(jù)庫,庫中包含在3’UTR中保守的microRNA結(jié)合位點(diǎn),來源于TargetScanHuman5.1的預(yù)測結(jié)果;該軟件預(yù)測microRNA的靶點(diǎn),預(yù)測結(jié)果依據(jù)microRNA與靶點(diǎn)之間結(jié)合的效能進(jìn)行排序,排名越靠前,說明microRNA與其靶點(diǎn)的結(jié)合越可能是實(shí)際存在的事件。此項(xiàng)給出microRNA靶點(diǎn)的信息,一是score,是該靶點(diǎn)的分值,反映的是結(jié)合效能的排名,因此,score越大,說明排名越靠后,實(shí)際發(fā)生該結(jié)合的可能性越小,作者沒有推薦閾值;二是Name,是作用于該靶點(diǎn)的microRNA名稱。例如,Score=62;Name=KRAS:miR-181:1,表示該靶點(diǎn)的分值是62,其位于KRAS基因的3’UTR中,受到該變異位點(diǎn)影響的microRNA是miR-181:1。表示該變異位點(diǎn)位于microRNA(miR-181:1)在基因KRAS的3’UTR上的結(jié)合位點(diǎn)。

tfbsConsSites:基于transfac矩陣數(shù)據(jù)庫(v7.0),計(jì)算所有轉(zhuǎn)錄因子結(jié)合位點(diǎn)在人/小鼠/大鼠比對(duì)中的保守分值,當(dāng)結(jié)合位點(diǎn)的分值達(dá)到閾值時(shí),認(rèn)為該位點(diǎn)在人/小鼠/大鼠中保守。該列給出的是該變異位點(diǎn)所在的保守轉(zhuǎn)錄因子結(jié)合位點(diǎn)的位置和分值,即Name和Score。Name是結(jié)合位點(diǎn)處的motif名稱,這些motif能夠被轉(zhuǎn)錄因子識(shí)別,例如V$CDPCR3_01,利用一些在線服務(wù)器(如MSigDB)能夠查詢這個(gè)motif能夠被哪些轉(zhuǎn)錄因子識(shí)別;Score是該結(jié)合位點(diǎn)的保守分值

genomicSuperDups:檢測該變異位點(diǎn)是否位于重復(fù)片段(segmental duplication)中。重復(fù)區(qū)域中檢測到的遺傳變異大多數(shù)是由于序列比對(duì)錯(cuò)誤造成的,所以被注釋到segmental duplications的變異需要謹(jǐn)慎對(duì)待,很可能是假陽性位點(diǎn)。給出兩個(gè)值,一是Name,表示基因組中與該變異位點(diǎn)所在區(qū)域相似的片段的位置;二是Score,表示兩個(gè)相似片段的序列一致性。例如,Score=0.994828;Name=chr19:60000,表示chr19:60000所在片段跟該變異位點(diǎn)所在片段相似,序列一致性為0.994828,范圍0~1

rmsk:重復(fù)序列注釋信息,重復(fù)序列來源于RepeatMasker注釋。例如,Name="1385:(CACCC)n(Simple_repeat)"。Name由兩部分構(gòu)成,一部分(CACCC)n是repeat的名稱,另一部分Simple是repeat的類別。只要有注釋信息,就表明該變異位于散在重復(fù)序列或低復(fù)雜度序列中;這些區(qū)域容易出現(xiàn)比對(duì)錯(cuò)誤,所以該區(qū)域的變異位點(diǎn)可靠性不高 保守(有害)性預(yù)測個(gè)體中的突變往往非常多(全基因組范圍內(nèi)能達(dá)到3.6M-4.4M),而真正有害的突變卻是罕見的,有很多根據(jù)變異位點(diǎn)的保守性等信息進(jìn)行有害性預(yù)測的軟件能幫助我們進(jìn)行突變位點(diǎn)的有害性評(píng)估。采用國際慣用的變異有害性預(yù)測軟件對(duì)突變位點(diǎn)的有害性進(jìn)行預(yù)測,協(xié)助找出真正有害的突變位點(diǎn)。

SIFT:SIFT分值(dbNSFP version 3.0),表示該變異對(duì)蛋白序列的影響。逗號(hào)前后分別是SIFT_score和SIFT_pred:SIFT_score是SIFT分值,分值越小越可能“有害”,表明該SNP導(dǎo)致蛋白結(jié)構(gòu)或功能改變的可能性大。SIFT_pred是預(yù)測結(jié)果,取值為T或者D。當(dāng)該變異同時(shí)影響多個(gè)蛋白序列時(shí),對(duì)每條蛋白序列有一個(gè)SIFT值,取最小值。D: Deleterious (sift<=0.05); T: tolerated (sift>0.05))

Polyphen2_HVAR:利用PolyPhen2基于HumanVar數(shù)據(jù)庫預(yù)測該變異對(duì)蛋白序列的影響,用于孟德爾遺傳病的診斷(dbNSFP version 3.0)。逗號(hào)前后分別是Polyphen2_HVAR_score和Polyphen2_HVAR_pred:Polyphen2_HVAR_score是PolyPhen 2分值,數(shù)值越大越可能“有害”,表明該SNP導(dǎo)致蛋白結(jié)構(gòu)或功能改變的可能性大;Polyphen2_HVAR_pred是預(yù)測結(jié)果,取值為D或P或B(D: Probably damaging (>=0.909), P: possibly damaging (0.447<=pp2_hvar<=0.909); B: benign (pp2_hvar<=0.446))Polyphen2_HDIV:利用PolyPhen2基于HumanDiv數(shù)據(jù)庫預(yù)測該變異對(duì)蛋白序列的影響,用于復(fù)雜疾病(dbNSFP version? 3.0)。逗號(hào)前后分別是Polyphen2_HDIV_score和Polyphen2_HDIV_pred:Polyphen2_HDIV_score是PolyPhen2分值,數(shù)值越大越可能“有害”,表明該SNP導(dǎo)致蛋白結(jié)構(gòu)或功能改變的可能性大;Polyphen2_HDIV_pred是預(yù)測結(jié)果,取值為D或P或B(D:Probably damaging (>=0.957), P: possibly damaging (0.453<=pp2_hdiv<=0.956); B: benign(pp2_hdiv<=0.452))

MutationTaster: MutationTaster預(yù)測結(jié)果(dbNSFP version3.0),表示該變異對(duì)蛋白序列的影響。逗號(hào)前后分別是MutationTaster_score和MutationTaster_pred:MutationTaster_score是MutationTaster分值,取值為0-1,分值越大,表示預(yù)測結(jié)果越可靠。MutationTaster_pred是預(yù)測結(jié)果,取值為A、D、N或者P。"A"("Disease_causing_automatic"); "D"("Disease_causing"); "N" ("Polymorphism"); "P"("Polymorphism_automatic")。A和D都表示位點(diǎn)可能有害。

MutationAssessor:MutationAssessor預(yù)測結(jié)果(dbNSFP version? 3.0),表示該變異對(duì)蛋白序列的影響。逗號(hào)前后分別是MutationAssessor_score和MutationAssessor_pred:MutationAssessor_score是MutationAssessor初始分值,越大越可能“有害”,表明該SNP導(dǎo)致蛋白結(jié)構(gòu)或功能改變的可能性大。MutationAssessor_pred是H、M、L或N(H:? high; M: medium; L: low; N: neutral.)。H和M表示功能性的,L和N表示non-functional??

LRT:LRT預(yù)測結(jié)果(dbNSFP version3.0),表示該變異對(duì)蛋白序列的影響。逗號(hào)前后分別是LRT_score和LRT_pred:LRT_score是LRT分值,分值越小越可能“有害”,表明該SNP導(dǎo)致蛋白結(jié)構(gòu)或功能改變的可能性大。LRT_pred是預(yù)測結(jié)果,取值為D、N或者U(D:Deleterious; N: Neutral; U: Unknown)

FATHMM:FATHMM預(yù)測結(jié)果(dbNSFP version3.0),表示該變異對(duì)蛋白序列的影響。逗號(hào)前后分別是FATHMM_score和FATHMM_pred:FATHMM_score是FATHMM初始分值,分值小于-1.5認(rèn)為是Deleterious,分值越小越可能有害,表明該SNP導(dǎo)致蛋白結(jié)構(gòu)或功能改變的可能性大。FATHMM_pred是D或T(D:Deleterious; T: Tolerated)?

phyloP46way_placental: PhyloP預(yù)測結(jié)果(dbNSFP version3.0),基于46個(gè)哺乳動(dòng)物物種的多序列比對(duì)得到位點(diǎn)的保守性分值,分值越大,位點(diǎn)越保守。該分值考慮的是變異位點(diǎn)的保守性,而非考慮該位點(diǎn)上的堿基,所以無論該位點(diǎn)上是同義突變還是非同義突變,score都相同。該分值用來尋找具有功能重要性的位點(diǎn),利用這些score值,能夠推斷出疾病易感性位點(diǎn)

phyloP100way_vertebrate: PhyloP預(yù)測結(jié)果(dbNSFP version3.0),基于100個(gè)脊椎動(dòng)物物種的多序列比對(duì)得到位點(diǎn)的保守性分值,分值越大,位點(diǎn)越保守

CADD:CADD是一種對(duì)SNV、InDel的有害性進(jìn)行打分的工具,它整合多種信息來注釋變異位點(diǎn)的功能;不僅預(yù)測編碼區(qū)變異(包括同義突變和非同義突變的影響)的功能影響,還預(yù)測非編碼區(qū)變異的功能影響。對(duì)于SNP,僅對(duì)CADD分值排名在前10%的SNP給出分值,‘.'表示CADD分值排名不在前10%。我們的注釋結(jié)果中,有分值時(shí),逗號(hào)前后分別是CADD和CADD_Phred;CADD列是初始分值,CADD_Phred是轉(zhuǎn)換后的分值;沒有分值,即為'.'時(shí),表示CADD_Phred值小于10。CADD_Phred分值中,10表示score排名在前10%,20表示前1%,30表示前0.1%,因此,分值要求越低,能保留下來的位點(diǎn)越多。對(duì)于SNP,CADD作者建議CADD_Phred分值>15,文章中通常用10或15;InDel沒有建議值

SiPhy_29way_logOdds:與phylop類似,SiPhy是基于29種哺乳動(dòng)物的多序列比對(duì)得到位點(diǎn)的保守性分值,分值越大,位點(diǎn)越保守(dbNSFP version 3.0)

gerp++gt2:dbNSFP version3.0中的gerp++只包含coding variant的注釋。為了注釋所有變異位點(diǎn)的保守性,ANNOVAR整理了gerp++gt2,包含GERP++ 分值大于2的位點(diǎn)。越保守的位點(diǎn)發(fā)生變異,對(duì)于蛋白的影響越大。分值越高,位點(diǎn)越保守。通常,GERP++ 分值大于2的位點(diǎn)認(rèn)為是保守位點(diǎn),可能具有功能數(shù)據(jù)庫(頻率)注釋人群中有很多變異位點(diǎn)是多態(tài)性的(高頻的),而真正有害的變異位點(diǎn)一般是低頻的。公司對(duì)每個(gè)變異位點(diǎn)注釋國際通用的部分?jǐn)?shù)據(jù)庫中的頻率及臨床相關(guān)信息,有助于了解這個(gè)變異位點(diǎn)發(fā)生的頻率高低(臨床相關(guān))的信息,協(xié)助找出致病突變位點(diǎn)。

wgEncode*HMM:non-coding區(qū)域的注釋

avsnp147:該變異在dbSNP(版本147)中的ID

?CLIN*:(clinvar_20170130)注釋變異與人類健康之間的關(guān)系,臨床意義的數(shù)據(jù)來源于NCBI,格式為:CLINSIG=Pathogenic;CLNDBN=Immunodeficiency_38;CLNACC=RCV000162196.3;CLNDSDB=MedGen:OMIM;CLNDSDBID=CN221808:616126。CLINSIG代表變異位點(diǎn)在臨床意義,可取值為Benign,Likely benign,Likely pathogenic,Pathogenic,drug response,not provided,Uncertain significance,other。CLINDBN代表變異位點(diǎn)相關(guān)的疾病名稱。CLNACC代表變異在CLINVAR數(shù)據(jù)庫中的accession號(hào)和版本號(hào)。CLNDSDB是疾病關(guān)聯(lián)信息的數(shù)據(jù)庫來源,CLNDSDBID是數(shù)據(jù)庫中的編號(hào)。

gwasCatalog:檢測變異位點(diǎn)是否在以往的GWAS研究中被報(bào)導(dǎo),表示該變異位點(diǎn)與哪些疾病相關(guān)聯(lián),“.”表示沒有GWAS報(bào)導(dǎo)

1000g2015aug_Chinese: 給出千人基因組計(jì)劃數(shù)據(jù)(2015年8月公布的版本)的中國人群中,該變異位點(diǎn)上突變堿基的等位基因頻率

1000g2015aug_eas:給出千人基因組計(jì)劃數(shù)據(jù)(2015年8月公布的版本)的東亞人群中,該變異位點(diǎn)上突變堿基的等位基因頻率

1000g2015aug_all:給出千人基因組計(jì)劃數(shù)據(jù)(2015年8月公布的版本)的所有人群中,該變異位點(diǎn)上突變堿基的等位基因頻率,文獻(xiàn)通常采用0.01的標(biāo)準(zhǔn)進(jìn)行過濾

esp6500siv2_all:國家心肺和血液研究所外顯子組測序計(jì)劃(NHLBI-ESP project,esp6500si_all數(shù)據(jù)庫中包含SNP變異、InDel變異和Y染色體上的變異的所有個(gè)體中,突變堿基的等位基因頻率(alternative allele frequency),文獻(xiàn)中通常采用0.01的標(biāo)準(zhǔn)進(jìn)行過濾.

ExAC_ALL:ExAC是Exome Aggregation Consortium的簡稱,整合了60706個(gè)無親緣關(guān)系個(gè)體的數(shù)據(jù),這些個(gè)體來源于大量disease-specific研究和群體遺傳學(xué)研究,能夠用做嚴(yán)重疾病研究的reference set of allele frequency。目前ExAC數(shù)據(jù)庫中包括ALL, AFR (African), AMR (Admixed American), EAS (East Asian), FIN (Finnish), NFE (Non-finnish European), OTH(other), SAS (South Asian)。ExAC_ALL是指在所有人群中,該變異位點(diǎn)上突變堿基的等位基因頻率,文獻(xiàn)中通常采用0.01的標(biāo)準(zhǔn)進(jìn)行過濾

ExAC_EAS:在ExAC的東亞人群中,該變異位點(diǎn)上突變堿基的等位基因頻率

gnomAD_exome_*: Aggregation Database(gnomAD)基因組聚合數(shù)據(jù)庫(gnomAD)是一個(gè)研究者聯(lián)盟,旨在整合和協(xié)調(diào)各種大型測序項(xiàng)目的外顯子組和基因組測序數(shù)據(jù),并為更廣泛的科學(xué)界提供摘要數(shù)據(jù)。 在第一個(gè)版本中只包含了外顯子組數(shù)據(jù),因此被稱為Exome Aggregation Consortium(ExAC);相關(guān)釋義見ExAC_*

InterVar(automated):InterVar按照ACMG檢驗(yàn)標(biāo)準(zhǔn)給出的致病性分級(jí)基因功能及通路注釋 對(duì)突變位點(diǎn)所在基因進(jìn)行疾病相關(guān)數(shù)據(jù)庫,通路及功能相關(guān)注釋,能了解到該突變位點(diǎn)是否已知與某類型疾病相關(guān),也能了解到該突變位點(diǎn)所在基因存在于哪些通路中,對(duì)了解該基因的生物學(xué)功能有重要意義。

GO:Gene Ontology數(shù)據(jù)庫注釋,GO是基因本體學(xué)注釋,包括了基因的生物學(xué)過程(Biological Process,BP),細(xì)胞組分(Cellular Component,CC)和分子功能(Molecular Function,MF)的注釋。給出變異位點(diǎn)所在蛋白質(zhì)或者基因參與的生物學(xué)通路名稱。

KEGG_PATHWAY:全基因組及代謝途徑數(shù)據(jù)庫注釋,給出變異位點(diǎn)所在基因參與的代謝通路名稱

Swissprot:是一個(gè)蛋白質(zhì)序列數(shù)據(jù)庫,在整合其他數(shù)據(jù)庫信息的基礎(chǔ)上以較低的冗余度實(shí)現(xiàn)對(duì)蛋白質(zhì)的評(píng)注功能,如功能描述、結(jié)構(gòu)域、翻譯后修飾、變體等;變異位點(diǎn)信息 此部分信息為變異位點(diǎn)的詳細(xì)信息,包括變異位點(diǎn)的覆蓋深度,突變前后堿基型和純雜合信息等。變異位點(diǎn)的信息能在家系分析或者篩選中起到重要的作用。GT:GQ:DP:AD:ARQAUL:變異的質(zhì)量值,值越高越好,文獻(xiàn)中常見20以上的過濾標(biāo)準(zhǔn)

FILTER:過濾TAG,如果該位點(diǎn)滿足所有過濾條件,則標(biāo)記為PASS(過濾條件采用的是國際慣用的過濾標(biāo)準(zhǔn))

INFO:變異軟件檢測的變異位點(diǎn)信息

FORMAT:用“:”分隔了若干個(gè)字段:

?GT:該位點(diǎn)基因型(Genotype)。0代表Allele和ref相同,1、2、3等代表Allele和ref不同;純合:0/0,1/1;雜合:0/1

?GQ:基因型質(zhì)量值(對(duì)應(yīng)格式0/0,0/1,1/1三種基因型,質(zhì)量值越大越好)

?DP:該位點(diǎn)測序深度(覆蓋的總reads數(shù))

AD: 該位點(diǎn)變異堿基型的深度(非參考?jí)A基的reads數(shù))

AR:變異堿基型的深度占總深度的比例

Genotype:與FORMAT列對(duì)應(yīng),‘:'分隔的每一部分對(duì)應(yīng)FORMAT‘:’分隔的每一部分;?

優(yōu)先級(jí)信息 通過積累公開文獻(xiàn)中的篩選標(biāo)準(zhǔn),僅作為指導(dǎo)和參考。

1)該位點(diǎn)不在genome repeat 區(qū)域(即genomicSuperDups和Repeat 沒有注釋信息)

2)千人基因組數(shù)據(jù)庫中頻率小于0.01

3)該位點(diǎn)位于exonic 或者 splicing 區(qū)域

4)該位點(diǎn)經(jīng)SIFT、Polyphen、MutationTaster、CADD預(yù)測至少有一個(gè)軟件預(yù)測為有害

5)該位點(diǎn)位于exonic 或者 splicing 區(qū)域

6)去掉本地?cái)?shù)據(jù)庫中高頻出現(xiàn)的變異

7)去掉Qual小于20,F(xiàn)ilter為lowQual的變異

8)gnomAD中各個(gè)種群最大MAF值<1%

9)去掉基因間的變異,保留外顯子以及距離剪接位點(diǎn)10個(gè)堿基之內(nèi)的變異(但要保留HGMD,clinvar中報(bào)道的致病或疑似致病及VUS的變異)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容