《第十三章基因组学幻灯片讲义第13章基因组学.ppt》由会员分享,可在线阅读,更多相关《第十三章基因组学幻灯片讲义第13章基因组学.ppt(66页珍藏版)》请在三一办公上搜索。
1、第13章 基因组学,基因组学,1 基因组学概述 2 基因组图谱的构建3 基因组测序4 功能基因组学,本章教学时数:4学时。本章重点:基因组计划的基本流程。本章难点:分子标记和基因图谱;研究基因功能的方法,1 基因组学概述,基因组(genome),又称染色体组一个物种单倍体的染色体数目,物种全部遗传信息的总和物种遗传信息的“总词典”控制发育的“总程序”生物进化历史的“总档案”,基因组学(genomics),1986年提出,至今20年,已经发展成为遗传学中最重要的分支学科。对物种的所有基因进行定位、作图、测序和功能分析,基因组学研究的最终目标,获得生物体全部基因组序列 鉴定所有基因的功能 明确基因
2、之间的相互作用关系 阐明基因组的进化规律,经典遗传学,在20世纪初,遗传学刚刚诞生的时候,遗传学家的工作主要是鉴别感兴趣的基因,确定这些基因在染色体上的位置。第一个环节:寻找自发突变体,或者利用物理、化学因素诱发突变。第二个环节:通过连锁分析确定新基因与已知基因的相互关系,绘制遗传连锁图。,几个代表物种的基因组大小,钓鱼竭泽而渔,CREDIT:JOE SUTLIFF,Science,Vol 291:1221.,Fishing in a More Effective Way!,基因组学的研究内容,结构基因组学 功能基因组学 蛋白质组学,结构基因组学(structural genomics),基因
3、定位 基因组作图 测定核苷酸序列,功能基因组学(functional genomics),又称后基因组学(postgenomics)基因的识别、鉴定、克隆 基因结构、功能及其相互关系 基因表达调控的研究,蛋白质组学(proteomics),鉴定蛋白质的产生过程、结构、功能和相互作用方式,人类基因组计划,1990,美国国立卫生研究所和能源部投资30亿,启动了人类基因组计划,预计15年时间完成人类基因组全部序列的测定1996,完成标记密度为0.6cM的人类基因组遗传图谱,100kb的物理图谱2000,完成草图2001年2月,公布人类基因组图谱的修订版2002,完成测序工作,2 基因组图谱的构建,基
4、因组计划的主要任务是获得全基因组序列但是,现在的测序方法每次只能测8001000bp大量的测序片段要拼接要知道序列在Chr上的位置才能正确拼接基因组计划的第一个环节:构建基因组图谱,基因组图谱,遗传图谱(genetic map)物理图谱(physical map),遗传图谱(genetic map),采用遗传分析的方法将基因或其它DNA序列标定在染色体上构建连锁图。,遗传标记,有可以识别的标记,才能确定目标的方位及彼此之间的相对位置。构建遗传图谱就是寻找基因组不同位置上的特征标记。包括:形态标记 细胞学标记 生化标记 DNA分子标记,多态性(polymophism),所有的标记都必须具有多态性
5、!花色:白色、红色 株高:高、矮 血型:A、B、O型 淀粉:糯、非糯所有多态性都是基因突变的结果!,形态标记,形态性状:株高、颜色、白化症等又称表型标记数量少很多突变是致死的受环境、生育期等因素的影响,最早建立的果蝇连锁图,就是利用控制果蝇眼睛的形状、颜色,躯体的颜色、翅膀的形状等形态性状作为标记,分析它们连锁关系及遗传距离,绘制而成的。控制性状的其实是基因,所以形态标记实质上就是基因标记。,果蝇连锁图,细胞学标记,明确显示遗传多态性的染色体结构特征和数量特征 染色体的核型 染色体的带型 染色体的结构变异 染色体的数目变异优点:不受环境影响缺点:数量少、费力、费时、对生物体的生长发育不利,生化
6、标记,又称蛋白质标记 就是利用蛋白质的多态性作为遗传标记。如:同工酶、贮藏蛋白 优点:数量较多,受环境影响小 缺点:受发育时间的影响、有组织特异性、只反映基因编码区的信息,DNA分子标记,简称分子标记以DNA序列的多态性作为遗传标记优点:不受时间和环境的限制 遍布整个基因组,数量无限 不影响性状表达 自然存在的变异丰富,多态性好 共显性,能鉴别纯合体和杂合体,限制性片段长度多态性(restriction fragment length polymorphism,RFLP),DNA序列能或不能被某一酶酶切,相当于一对等位基因的差异。如有两个DNA分子(一对染色体),一个具有某一种酶的酶切位点,而
7、另一个没有这个位点,酶切后形成的DNA片段长度就有差异,即多态性。可将RFLP作为标记,定位在基因组中某一位置上。人类基因组中有105个RFLP位点,每一位点只有两个等位基因。,RFLP分析,RFLP标记位共显性标记,微卫星(microsatellite)标记,微卫星又称为简单重复序列(simple sequence repeat,SSR)。这种重复序列的重复单位很短,常常只有2个、3个或4个核苷酸如一条染色体TCTGAGAGAGACGC 另一染色体TCTGAGAGAGAGAGAGAGACGC,就构成了多态性。,遗传图谱的构建方法,理论基础:连锁与交换 基本方法:两点测验法和三点测验法,植物遗
8、传图谱的构建,选择研究材料(亲本)构建分离群体 遗传标记检测 标记间的连锁分析,选择亲本,要求亲缘关系远,遗传差异大 但又不能相差太大以导致引起子代不育。对备选材料进行多态(差异)性检测,综合测定结果,选择有一定量多态性的一对或几对材料作为遗传作图亲本。,构建作图群体,遗传标记的染色体定位,利用遗传学方法或其它方法将少数标记锚定在染色体上,作为确定连锁群的参照系。常用的方法:单体分析 三体分析 代换系分析 附加系分析,标记间的连锁分析,利用在两个亲本间有多态性的标记分析分离群体中所有个体的基因型根据连锁交换的情况,确定标记之间的连锁关系和遗传距离有计算机软件可以应用,水稻遗传图,1994年,水
9、稻第一张高密度遗传图谱 927个位点,1383个标记 1998年,1157个位点,2275个标记 2000年,3267个标记 高密度的遗传图谱为基因组测序和遗传研究奠定了坚实的基础。,人类遗传图谱的构建,不可能根据需要选择亲本,设计杂交组合,构建分离群体!只能检测现存家庭连续几代成员的基因型 家系分析法 资料有限、必须借助于统计学方法,现有的人类遗传图谱,122号染色体 8个家系134个成员 X染色体,12个家系170个成员 5364个SSR标记 2335个位点 标记间的平均距离599kb,物理图谱的构建,用分子生物学方法直接检测DNA标记在染色体上的实际位置绘制成的图谱称为物理图谱。有遗传图
10、谱为什么还要构建物理图谱?,遗传图谱的缺陷,分别率有限 人类只能研究少数减数分裂事件,不能获得大量子代个体 测序要求每个标记的间隔小于100kb 实际是599kb,遗传图谱的缺陷,精确性不够经典遗传学认为,交换是随机发生的基因组中有些区域是重组热点倒位、重复等染色体结构变异会限制交换重组,酵母遗传图与物理图比较,A 遗传图B 物理图,物理作图的方法,1、限制酶作图2、依靠克隆的基因组作图3、荧光原位杂交4、序列标签位点作图,限制酶作图(restriction mapping),限制酶作图(restriction mapping),荧光原位杂交(fluorescent in situ hybri
11、dization,FISH),荧光原位杂交(fluorescent in situ hybridization,FISH),荧光原位杂交(fluorescent in situ hybridization,FISH),荧光原位杂交(fluorescent in situ hybridization,FISH),人类基因组物理图,1987年,RFLP图谱,403个标记,10Mb 1994年,5800个标记,0.7Mb 1996年,17000多个标记,100kb 完全适应全基因组测序的要求,遗传图与物理图的整合,有些标记既是遗传标记,又是物理标记 RFLP标记 SSR标记 某些基因序列借助这些标记
12、可以将遗传图和物理图整合起来,基因组测序策略,有了高密度的基因组图谱,就可以开始全基因组测序了测序的技术飞速发展,现在可以全自动化测序的策略有两个:鸟枪法 克隆重叠群法,鸟枪法(shotgun sequencing),鸟枪法的优缺点,优点:不需要高密度的图谱 速度快、简单、成本低缺点:拼接组装困难,尤其在重复序列多的区域主要用于重复序列少、相对简单的原核生物基因组,克隆重叠群法(clone contig),将基因组DNA切割长度为0.1Mb1Mb的大片段,克隆到YAC或BAC载体上 然后再进行亚克隆,分别测定单个亚克隆的序列 再装配、连接成连续的DNA分子。这是一种自上而下(up to dow
13、n)的测序策略 clone-by-clone method,两种基因组测序策略,The E.coli genome,A portion of the E.coli chromosome showing genes and operons.A dot indicates the promoter for each gene or operon.Arrows and color indicate the direction of transcribtion:dark blue genes are transcribed left to right,light blue are transcribe
14、d right to left.Overlapping gene are shown in green.,功能基因组学,完成基因组测序,仅仅是基因组计划的第一步,更重要的工作在于弄清楚:基因组序列中所包含的全部遗传信息是什么;基因组作为一个整体如何行使功能。就是对基因组序列进行诠释的过程,也就是功能基因组学的研究内容。,根据序列分析搜寻基因,查找开放阅读框(open reading frame,ORF)开放阅读框都有一个起始密码子,ATG,还要有终止密码子。从ATG开始,然后向下游寻找终止密码子。起始密码子和终止密码子之间的碱基数目要能够被3整除 每一条链都有3种可能的阅读框,2条连共计有6种
15、可能的阅读框.计算机可以很快给出结果。,同源查询,利用已经存入数据库的基因序列与待查的基因组序列比对,从中查找可以与之匹配的碱基序列及其比例,用于界定基因。同源查询可以部分弥补ORF扫描的不足。,同源查询的依据,有亲缘关系的物种,基因组可能存在某种程度的相似性:存在某些完全相同的序列;ORF的排列相似,如等长的外显子;ORF指令的氨基酸序列相似;模拟的多肽链的高级结构相似,等。,基因功能研究,1、计算机预测基因功能 依据仍然是同源性比较。同源基因拥有一个共同的祖先基因,它们之间有许多相似的序列。种间同源基因 种内同源基因,基因功能研究,2、实验确认基因功能 基因克隆 基因敲除(knock-out)基因的超表达 反义RNA技术 RNAi 转座子插入突变,反义RNA(antisense RNA)技术,