外显子组测序课件.ppt

上传人:牧羊曲112 文档编号:2146877 上传时间:2023-01-18 格式:PPT 页数:31 大小:1.63MB
返回 下载 相关 举报
外显子组测序课件.ppt_第1页
第1页 / 共31页
外显子组测序课件.ppt_第2页
第2页 / 共31页
外显子组测序课件.ppt_第3页
第3页 / 共31页
外显子组测序课件.ppt_第4页
第4页 / 共31页
外显子组测序课件.ppt_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《外显子组测序课件.ppt》由会员分享,可在线阅读,更多相关《外显子组测序课件.ppt(31页珍藏版)》请在三一办公上搜索。

1、外显子组测序,1,目 录,2,外显子测序(也称目标外显子组捕获)是指利用序列捕获技术将全基因组外显子区域DNA捕捉并富集后进行高通量测序的基因组分析方法。是一种选择基因组的编码序列的高效策略,外显子测序相对于基因组重测序成本较低,对研究已知基因的SNP、Indel等具有较大的优势。在人类基因中大约有180,000外显子,占人类基因组的1%,约30MB。Ng S B,Turner E H,Robertson P D,et al.Targeted capture and massively parallel sequencing of 12 human exomesJ.Nature,2009,46

2、1(7261):272-276.人类基因组的蛋白编码区域大约包含85%的致病突变。-Choi M,Scholl U I,Ji W,et al.Genetic diagnosis by whole exome capture and massively parallel DNA sequencingJ.Proceedings of the National Academy of Sciences,2009,106(45):19096-19101.,一、外显子测序简介,3,The sensitivity to detect heterozygous variants with 10 reads i

3、s 78.6%,but increases to 95.2%at 20 x and approximately 100%at 30 x and greater.1The average coverage of each base in the targeted regions was 100-fold,and 95.3%of these bases were covered sufficiently deeply for variant calling(10 coverage)2Exome sequencing produced a higher level of coverage for t

4、he targeted sequences(mean,167.50),slightly increasing our ability to detect mutations with VAFs of less than 10%.3,Choi M,Scholl U I,Ji W,et al.Genetic diagnosis by whole exome capture and massively parallel DNA sequencingJ.Proceedings of the National Academy of Sciences,2009,106(45):19096-19101.Ya

5、n X J,Xu J,Gu Z H,et al.Exome sequencing identifies somatic mutations of DNA methyltransferase gene DNMT3A in acute monocytic leukemiaJ.Nature genetics,2011,43(4):309-315.Platforms A.Genomic and Epigenomic Landscapes of Adult De Novo Acute Myeloid LeukemiaJ.N Engl J Med,2013,2013(368):2059-2074.,二、测

6、序深度,4,Coverage rate,Sequencing depth and coverage of the nine paired initial sequencing samples.,5,三、测序平台,Ion Proton,Illumina HiSeq,6,基于Ion Proton的外显子测序流程,7,The bound DNA is isolated using streptavidin-coated Dynabeads paramagnetic beads,and then amplified and purified.The purified,target-enriched s

7、ample is then returned to the Ion Torrent system workflow for emulsion PCR,enrichment,and sequencing.Exome sequencing results on the Ion Proton System using the Ion PI Chip and the Ion TargetSeq Exome Kit,8,基于Ion Proton的外显子测序结果,9,基于Illumina HiSeq的外显子测序流程,10,DNA样本要求(单次):总量:6 g DNA;浓度:37.5 ng/L;纯度:OD2

8、60/280=1.8-2.0。(来自华大基因)DNA样本要求(单次):总量:200-300bp小片段PE文库5 g;浓度:50ng/L;纯度:OD260/280=1.8-2.0。(来自美吉生物)DNA样本要求(单次):总量:50g;浓度:100ng/L;纯度:OD260/280=1.8-2.0。(来自派森诺生物),基因组DNA样本要求,11,外显子捕获平台,12,Highly uniform coverage across 62 Mb of exomic sequence,including 5UTR,3 UTR,microRNA,and other non-coding RNA.Stream

9、lined protocol for pre-enrichment pooling of up to six samples dramatically reduces hands-on time and cost.Optimized for use with the TruSeq DNA Sample Preparation Kit,providing a gel-free protocol that requires the lowest DNA input.Automation-friendly with master-mixed reagents and plate-based proc

10、essing for up to 96 reactions.,TruSeq Exome Enrichment Kit,13,TruSeq Exome Enrichment Workflow,14,烈冰生物外显子测序数据分析思路,15,四、数据分析流程,16,1.数据下机文件:*.fastq2.序列QC去除低质量reads,和连续的低质量片段,去掉接头序列。QC统计reads数量及测序质量。3.Mapping由于bwa能准确、快速的将短序列比对到基因组上,而且软件持续更新和说明文档完备,是外显子捕获测序的首选。4.Sam到bam转换:Samtools的多种工具可以将sam文件转换为bam文件,r

11、mdup工具能去除PCR扩增产生的冗余reads,消除由于文库扩增而导入的突变,降低假阳性。Flagstat统计reads的mapping情况以及比较去除duplicate前后reads数目的反映样品建库的冗余情况。Picard提供的多个工具,修改bam文件,使之适合于后续的GATK软件包中的工具的处理。,17,5.Indel区域的reads重新做局部多序列比对:在indel的边缘,一些错配看起来很像是SNP,通过对dbSNP库及bam文件检测到的indel附近的reads进行局部的重新比对,可以消除indel周边的假阳性SNP。6.碱基质量重新打分:测序仪给reads中的碱基的qual值存在

12、一定的偏差,通过经验的错误模型来重新计算的碱基的qual值,重新给reads的各个碱基的qual打分。7.Call snv和indel:对处理好的多样品bam文件同时运行UnifiedGenotyper,大大提高call SNP的灵敏度和准确性,多样品同时比较的结果,方便了后续的样品间差异的筛选。8.突变位点的重新打分:通过hapmap,omni,dbsnp数据库中已知的突变位点建模优化,对各个突变位点重新打分,筛选。大大降低了假阳性率。9.注释:通过ANNOVAR软件对vcf结果注释,关联到多个数据库。,18,1.Mapping统计:统计总reads数,mapped reads及unique

13、 mapped reads数目及百分比。2.捕获效率统计:统计来自捕获区域的Fragment比例:,五、数据分析内容,19,统计target区域所有的碱基覆盖次数分布:,对每个target区域的覆盖和深度统计:如果客户对某些基因特别感兴趣,想要看看来自这些基因的外显子区域的覆盖情况,可以提供每个target或者特定target区域的覆盖情况和测序深度统计。,20,3.Snv和indel关联数据库:Snv和indel结果按照突变的位点是否在捕获的区域之内分成两部分:*_target.snv:突变处于捕获的靶区域(target region)内。*_off_target.snv或者*_target

14、.indel:突变在捕获的靶区域之外。Snv和indel结果与以下的数据库关联,为突变的筛选提供大量的信息。,21,1)基因注释:通过基因注释可以达到以下的目的:突变的功能定位(在外显子,内含子,剪接位点还是基因间区);突变所在的基因名称或者临近的基因;突变如果在编码区域,是否引起氨基酸的改变(同义突变,非同义突变的呢过);如果引起氨基酸的改变,按照HGVS命名规则表示-改变的基因ID,转录本ID,外显子编号,以及氨基酸改变,如OD2:NM_022162:exon8:c.G2722C:p.G908R。默认使用refSeq完成基因注释,如果有特殊的要求,可以使用UCSC known gene,E

15、nsembl,GENCODE,CCDS等基因注释系统。,22,23,24,2)1000G注释:检测突变位点是否在1000 Genomes Projects(2012 release)数据库中检测到,如果检测到,显示等位基因频率(allele frequency)。默认是使用所有人种的数据库,如果有特定要求,可以按照要求展示不同人种(比如AMR,AFR,ASN,EUR,中国人,日本人)等位基因频率。3)dbSNP注释:检测突变是否在dbSNP数据库中,如果在,显示rsID。默认使用db SNP135数据库,如果有特定的要求,可以使用dbSNP129,dbSNP130,dbSNP131,dbSNP

16、132数据库。4)AVSIFT:SIFT是一款很受欢迎的检测非同义突变位点重要性的软件,对应非同义突变位点,会给定一个打分,若打分低于0.05,则表明突变很可能会影响到蛋白质的功能。,25,5)与UCSC的数据库的关联:ftp:/hgdownload.cse.ucsc.edu/goldenPath/hg19/database/.txt.gz,提供了大量的基因组注释信息,目前关联的数据库有:tfbsConsSites:在人/小鼠/大鼠中保守的转录因子结合位点,以transfac Matrix Database(v7.0)为基础。wgRna:snoRNA and miRNA注释。targetSca

17、nS:TargetScan预测的miRNA把区域。gwasCatalog:已经发表的各种疾病的GWAS结果。genomicSuperDups:基因组中的重复片段。phastConsElements46way:通过phastCons对脊椎动物的全基因组比对生成的保守区域,根据用于比对的物种数目,分为17way,28way,30way,44way等。默认使用46way。如果客户需要关联UCSC中其它的数据库,也可以定制。6)cosmic63:已观察到的癌症相关突变,显示在COSMIC中的ID(identifiers),观察到的次数,以及观察到的癌组织。,26,4.CNV:XHMM是一款外显子捕获拷

18、贝数变异检测的优秀软件包,使用GATK和XHMM能够得到较好的外显子捕获的CNV结果。5.其它:Polyphen-2(Polymorphism Phenotyping v2)也是一款基于多序列比对和蛋白质3D结构,预测氨基酸替换(从一种氨基酸改变为另一种氨基酸)对蛋白质结构和功能影响的软件,如果客户有要求,可以提供Polyphen-2对snv结果的进一步分析服务。,27,28,29,可以通过GT(genotype)直接比较样品间的差异(GT简介:0表示与Ref相同,1表示与ALTS第1个碱基相同,2表示如ALTS第2个碱基相同)。,通过和多个数据库的提供关联精细筛选条件:,30,六、后续验证,Sanger测序验证根据目的基因设计个性化验证方案(后续验证由老师自己完成),31,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号