第十三章基因组学ppt课件.ppt

上传人:牧羊曲112 文档编号:1356328 上传时间:2022-11-13 格式:PPT 页数:52 大小:4.17MB
返回 下载 相关 举报
第十三章基因组学ppt课件.ppt_第1页
第1页 / 共52页
第十三章基因组学ppt课件.ppt_第2页
第2页 / 共52页
第十三章基因组学ppt课件.ppt_第3页
第3页 / 共52页
第十三章基因组学ppt课件.ppt_第4页
第4页 / 共52页
第十三章基因组学ppt课件.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《第十三章基因组学ppt课件.ppt》由会员分享,可在线阅读,更多相关《第十三章基因组学ppt课件.ppt(52页珍藏版)》请在三一办公上搜索。

1、第十三章基因组学,第十三章基因工程和基因组学,第一节 基因组学 概述,基因组学(genomics) :遗传学研究进入分子水平后发展起来的一个分支,主要研究生物体内基因组的分子特征。* 研究对象:以整个基因组为研究单位,而不以单个基因为单位作为研究对象。* 研究目标:认识基因组的结构、功能和进化;阐明整个基因组所包含的遗传信息和相互关系;充分利用有效资源,预防和治疗人类疾病。,基因组(Genome):又称染色体组,是指一个物种单倍体的染色体数目,是生物体全部遗传物质的总和。基因组学(Genomics):对生物体所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱)、核苷酸序列分析、基因定位和

2、基因功能分析的一门科学。最终目标:获得生物体全部基因组序列,注解基因组所含的全部基因,鉴定所有基因的功能及基因间相互作用关系,并阐明基因组的复制及进化规律。,一、基因组学的概念,不同生物基因组大小,1. 人类基因组计划 与曼哈顿原子 计划、阿波罗登月计划并称的人类科学史上的重大工程。于1990年首先在美国启 动,后有德、日、英、法、中等国的科学家先后正式加入。,(一) 人类基因组, 1990年,美国国会批准美国的“人类基因组计划”在10月1日正式启动。其总体规 划是准备在15年内(19902005)至少投入30亿美元,分析人类的基因组30 亿个碱基对。 2003年,6国科学家宣布人类基因组序列

3、图绘制成功,HGP的所有目标全部实现。覆盖人类基因组所含基因区域的99%,精确率达到99.99%,比原计划提前两年多,耗资27亿美元。,人类基因组计划,人类基因组核基因组DNA的总长约3109bp,含有24条线性DNA分子,最长的有250 Mb,最短的55 Mb。 30亿个碱基对。线粒体基因组是长度为16569 bp的环状DNA分子,每个细胞平均含有800个线粒体,每个线粒体含10个基因组拷贝。以每10cm 书写60个字母计算,30亿个碱基对连接的长度可达5 000 km,相当于北京到香港来回的距离。,为人类的基因组研究提供重要的依据。 1996年,酵母菌基因组测序。 1998年12月,线虫完

4、整基因组序列的 2000年3月,果蝇的基因组测序 2001年12月14日,拟南芥基因组的完整图谱。,(二) 其他生物基因组,我国超级杂交稻(籼稻)基因组计划 2001年7月启动2002年4月5日Science。 材料:籼稻“9311”。完成单位:华大基因研究中心、中科院遗传与发育生物学研究所等12个单位。水平:水稻基因组的总基因数约为4602255615个,工作框架图序列已覆盖水稻整个基因组92以上的基因。方法:“鸟枪射击法”,利用国产曙光2000、曙光3000超级计算机(1000亿次/秒)对随机DNA碎片进行排序和组装。,水稻基因组计划,国际水稻(粳稻)基因组计划始于1998年,日本、美国、

5、中国、法国等国家和地区参加。中国负责第4号染色体:36 Mb (占910%)。,国际水稻基因组测序计划,2002年12月21日Nature,中国第四号染色体。 材料:粳稻“日本晴”。完成单位:中科院国家基因研究中心等4家单位。水平:第四号染色体中的总碱基数目为0.35亿碱基对,覆盖全长序列98的区域,只剩下7个小空洞,碱基序列的精确度达到99.99%。完整测定的着丝粒序列在高等生物中属于首次。,国际水稻基因组测序计划,水稻是第一个完成基因组全序列测定的农作物,核基因组含有12条染色体,总长约389Mb,1号染色体最大为43.2Mb,10号染色体最小22.6Mb。全基因组预测约含有4万个基因。水

6、稻双链闭环线粒体基因组大小为491kb,叶绿体基因组134.5kb,C值:是指一个单倍体基因组中DNA的总量。值悖理 (C value paradox):物种的C值和它的进化复杂性之间无严格对应关系的现象称为C 值悖理,是复杂生物基因组的一个普遍特征,(三) C值悖理和N值悖理,(三) C值悖理和N值悖理,N值:是指生物体所含有的基因数目。N值悖理(N value paradox):复杂性不同的生物种属所具有的基因数目与其生物结构的复杂性不成比例的现象。如结构比较简单的线虫含有的基因数为1.9万个, 比线虫更复杂的果蝇基因数为1.8万个, 水稻的基因数约4万个, 最复杂的人类其基因总数约3万个

7、。,四、基因组学研究内容,(一)结构基因组学(structural genomics)通过基因作图、核苷酸序列分析确定基因组成、进行基因定位的科学。遗传信息在染色体上,但染色体不能直接用来测序,必须将基因组这一巨大的研究对象进行分解,使之成为较易操作的小的结构区域,这个过程就是基因作图。完成基因组图谱构建之后,就可以利用图谱进行基因组序列测定和组装。,四、基因组学研究内容,(二)功能基因组学(functional genomics) 利用结构基因组所提供的信息和产物,研究基因组功能表达的一门分支学科。主要研究内容:基因的识别、鉴定和克隆。包括新策略、新技术、新方法的创立和各种基因组数据的建立;

8、基因结构与功能及其相互关系的研究。包括基因变异体的系统鉴定和目录的绘制;基因表达谱的编制、基因结构与功能关系的鉴定、基因相互作用网络图的编制;基因表达调控的研究,四、基因组学研究内容,(三)蛋白质组学(proteomics)研究细胞内蛋白质组成及其活动规律。旨在阐明生物体全部蛋白质的表达模式及功能模式,内容包括鉴定蛋白质表达、存在方式、结构、功能和相互作用方式等。基因是遗传信息的携带者,而全部生物功能的执行者却是蛋白质, 仅仅从基因的角度来研究是远远不够的。,第 2节 基因组图谱构建,基因组计划的目的是获得全基因组序列,并对其进行解读。DNA测序每次反应仅能读取1000bp的长度,因此,基因组

9、测序的基础是基因组图谱的构建。,鸟枪射击法(shotgun) 基因组序列测定,第 2节 基因组图谱构建,基因组测序策略 重叠群法 相互存在重叠序列的一组克隆。根据重叠群的相对位置讲各个克隆首尾相连,长度可达百万级bp。对单个重叠群,采用鸟枪法测序,然后进行组装。这是由上而下(up to down)的测序策略。 直接鸟枪法 首先进行全基因组鸟枪法测序,再用分子标记为起点强鸟枪DNA片段组装。这是由下而上(bottom to up)的测序策略。这种方法依赖于高密度分子标记基因组图谱。基因组图谱分为遗传图谱和物理图谱。,(一)遗传标记,遗传标记就是遗传物质的特殊的易于识别的多态性表现形式,它包括形态

10、标记、细胞学标记、生化标记和分子标记。形态标记:主要指可以观察到的一些性状,如种皮颜色、眼色、株高等。细胞学标记:细胞学标记是指能明确显示遗传多态性的细胞学特征。生化标记:主要是同工酶及种子贮藏蛋白,有时又称蛋白质标记。分子标记:主要指DNA水平上的标记。,DNA标记,以DNA为基础的分子标记主要包括 基于杂交的分子标记,如RFLP。 基于PCR的分子标记,如RAPD、AFLP、SSR (又称microsatellite )、AFLP 等。 基于DNA序列和芯片的分子标记,如SNP(single nucleotide polymorphism)。,RAPD由Williams 等(1990)和W

11、elsh等(1990)分别发展起来的分子标记技术。这一技术是以基因组DNA为模板,采用随机设计的单个寡核甘酸序列(一般为10bp)为引物,通过PCR扩增,产生不连续的DNA产物,用于检测DNA序列的多态性。,RAPD (Random amplified polymorphic DNA),重复序列 串联重复序列(tandem repeated sequence),其重复单位首尾相连,成串排列(Flavell 1986)。 散布重复序列(interspersed repeated sequence),其重复单位与其它无关序列或单拷贝序列相间排列。,SSR (simple sequence repe

12、ats)或微卫星(microsatellite ),微卫星DNA序列或SSR又称短串联重复序列(short sequence repeat,STR),它是由几个核甘酸(一般16个)为重复单位簇集而成的串联重复序列,可随机的分布在整个基因组的不同位置上。微卫星长度具有高度变异性,并且这种多态性常常表现复等位性,两端的序列多是相对保守的单拷贝序列,因而可以根据两端的序列设计一对特异引物,扩增每个位点的微卫星序列,从而揭示其长度的多态性(simple sequence length polymorphism,SSLP)。,SSR,ISSR是一种新型的分子标记。与SSR相反,直接用同位素标记SSR序列

13、,扩增2个SSR间的单拷贝序列。为了增加扩增的特异性,在引物的5和3端分别加入12个选择性碱基,引物长度1618bp。,ISSR(inter-ssr), AFLP结合了RFLP和RAPD技术的优点。AFLP的基本原理是基于PCR的扩增基因组DNA限制性片段多态性。基因组DNA先用限制性内切酶切割,然后将双链接头(adapter)连接到DNA片段的末端,通过选择在3端分别添加13个选择性碱基的不同引物,选择性地识别具有特异配对顺序的酶切片段并与之结合,从而实现特异扩增。,AFLP ( Amplicon fragment length polymorphism),AFLP反应过程示意图,遗传信息由

14、DNA mRNA 蛋白质。一个典型的真核生物mRNA分子:5- U TR ( 5端转录非翻译区) , ORF (开放阅读框架) ,3- U TR ( 3端转录非翻译区) ,polyA,任何一个基因,cDNA 的5端或3端的有限序列即可特异性地代表生物体某种组织某个时期的一个表达基因。EST 的数目可以显示所代表的基因的拷贝数,EST (expressed sequence tags),从组织细胞中提取总mRNA ,构建成标准cDNA 文库,然后从中挑取大量克隆,利用载体通用引物测出插入载体的cDNA 片段5端或3端300 - 500 碱基的序列。将测序所得的EST 与dbEST 等数据库中的数

15、据进行比较分析,根据核酸或蛋白质序列的同源性比较,可以鉴定出哪些EST 代表已知基因,哪些EST 代表未知基因。,EST,序列标签位点(sequence tagged site) 是一小段DNA序列。每个基因组仅1个拷贝,很容易分辨。STS要满足2个条件: 是一段已知的序列,可据此涉及PCR引物来检测不同DNA片断中是否存在 这一序列。 STS在染色体上必须是独一无二的。如果在基因组中有多个位点出现,作图数据将含混不清。常见的寻找STS的方法: EST、 SSLP、 随机基因组序列,STS,单核苷酸多态性是指基因组序列中由于单个核苷酸(,)的替换而引起的多态性。通常SNPs不包括碱基的插入、缺

16、失以及重复序列拷贝数的变化。这种标记只有两种等位基因。人类基因组的编码基因中有20万个SNPs, 在非编码区的数目可能还要多10倍以上。单倍型:当前常用术语“happlotype”(单倍型)代替术语“allele”(等位基因)。在给定的一条染色体的紧密连锁的位点上多个等位基因的集合,通常34个相邻等位基因彼此靠近而构成的单倍型可作为一个整体而遗传(称为单倍型块(haploblock),SNP ( single nucleotide polymorphism ),(二) 遗传图谱的构建,1 人类基因组遗传图谱的构建人类的遗传图谱是利用家系分析法,在对8个家系的134个成员的分析中(186个减数分

17、裂),主要根据5264个STR标记绘制而成的。利用这些家系的资料绘制第1至22号染色体图谱。对于X染色体图谱,还利用了来自另外12个家系,170个成员(105个减数分裂)的资料绘制而成。最后,将5264个标记定位在2335个位点(其中有些标记相距很近而作为一个位点)。,2 植物基因组遗传图谱的构建,作图群体常用的遗传作图群体有F2群体、回交群体、加倍单倍体(double haploid,DH)群体、重组近交系(recombinant inbred lines,RIL)群体、近等基因系(nearisogenic lines,NIL)群体等(徐云碧,1994)。遗传标记的染色体定位,标记间的连锁分

18、析 LINKAGE、Mapmaker、JoinMap,二、 物理图谱绘制,(一 )限制性作图 (二)基于克隆的基因组作图(三) 原位杂交(四)序列标签位点(STS)作图(五) 人类基因组图谱,重叠群(contigous DNA clones, contigs)从1个感兴趣的位置开始,利用第1个元件的末端部分来辩别第2个元件,沿染色体“行走”(walk)。通过鉴别目标位点两测的2个DNA标记,从1个标记向另1个标记的行走。沿染色体鉴别一系列重叠群是大规模研究的基础。在特定区域的染色体行走可以提供分离通过遗传图谱定位在该区域基因的方法。集中全部染色体的重叠群,可以为以后研究提供有效克隆来源。染色体

19、行走考虑的根本是每“步”的大小,较大的步加快积聚相邻克隆的进程。,(二) 基于克隆的基因组作图,区域作图 Regional mapping,区域作图 Regional mapping,Minimal tiling path selected for sequencing.,区域作图 Regional mapping,(三) 原位杂交,荧光原位杂交(fluorescent in situ hybridization, FISH)基因组原位杂交(genome in situ hybridization, GISH ),(四)序列标签位点(STS)作图,辐射杂交系 是含有另一种生物染色体片断的啮齿类

20、细胞。带有人类染色体片段的辐射杂交系 DNA库 YAC/BAC克隆作图 获得大分子DNA克隆文库以后,用PCR的方法检测STS,根据重叠的STS标记绘制克隆连锁图。,(四)序列标签位点(STS)作图,当两个片段含有同一STS顺序时,则这两个片段彼此重叠。如果它们彼此邻接,这两个STS总会同时出现在相同片段上。如果它们相距甚远,有时会在同一片段,有时则在不同片段。要将一组STS作图定位,必需收集来自同一染色体或整个基因组随机断裂的DNA片段。不同DNA片段之间有各种可能的重叠,可以覆盖整个作图区段。依次采用单个STS挑出它们所在的DNA片段,根据它们彼此的重叠关系可以逐段绘DNA物理图。,生物信

21、息学是现代生物技术与计算机科学的结合,收集、加工和分析生物资料和信息的学科。应用生物信息学可以将来自不同的基因组理论和应用综合并标准化,利用大量的生物信息资料了解遗传网络系统、信号传递及相互关系,计算机还可进行一些生物模拟研究。利用生物信息学能够分析从微生物、动物、植物以及人类基因组序列测定产生的大量资料,阐明遗传信息。 研究内容两大类:DNA 数据分析; 蛋白质数据分析。,第三节生物信息学(bioinformatics),基因芯片,基因芯片(gene chip),又称DNA微阵列(microarray),是由大量DNA或寡核苷酸探针密集排列所形成的探针阵列,其基本原理是通过杂交检测信息。利用

22、基因芯片,可以实现基因信息的大规模检测。,生物信息学的应用,(一)发现新基因和新的单核苷酸多态性在研究生物的基因时,不断的发现新的基因。一般说来,从基因组DNA预测新基因,是发现新基因的另一个重要途径。SNP出现在蛋白质的编码基因上,它可改变蛋白质的结构和功能,也可出现在非编码区,操控基因的表达水平。(二)分析基因组中非编码蛋白质区域功能在高等生物和人的基因组中非编码序列已占到基因组序列的绝大部分,这表明这些非编码序列必定具有重要的生物功能。(三)在基因组水平上研究生物进化分子进化是对不同生物的同源分子,即结构和功能相似的蛋白质或编码该蛋白质的基因,进行比较。(四)完整基因组比较研究在后基因组

23、时代,完整基因组数据越来越多,有了这些资料人们就能对若干重大生物学问题进行分析研究,如:生命的起源?生命是如何进化的? 估计最小独立生活的生物体至少需要多少基因?这些基因是如何使生物体具有生命?等等。,在蛋白质水平研究基因组的基因表达。分析基因组的蛋白质类型、数量、空间结构变异以及相互作用的机制。蛋白质组学比基因组学更为复杂:DNA线状结构与二级结构的功能差异不大,但多肽链需折叠成一定的三维空间结构才形成有功能的蛋白质;同一种蛋白质经不同的加工修饰可形成不同的功能,因此蛋白质的多样性远复杂于基因本身。,第四节 蛋白质组学(Proteomics),蛋白质2D电泳分析A对照;B为人的垂体瘤蛋白质2D电泳箭头示有明显差异的蛋白质。,蛋白质组学(Proteomics),人角化细胞的2D电泳蛋白质图谱,经S35放射自显影显示,可以分辨出100种以上的蛋白质。,蛋白质组学,酵母双杂交系统原理示意图如左图所示,将蛋白质X与转录因子结合域构建融合蛋白;Y、Z分别与激活域融合,通过检测报告基因(lac Z)的转录与否确定X蛋白的互作蛋白是Y,而不是Z。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号