基因组的结构与功能.ppt

上传人:小飞机 文档编号:5760225 上传时间:2023-08-17 格式:PPT 页数:94 大小:2.67MB
返回 下载 相关 举报
基因组的结构与功能.ppt_第1页
第1页 / 共94页
基因组的结构与功能.ppt_第2页
第2页 / 共94页
基因组的结构与功能.ppt_第3页
第3页 / 共94页
基因组的结构与功能.ppt_第4页
第4页 / 共94页
基因组的结构与功能.ppt_第5页
第5页 / 共94页
点击查看更多>>
资源描述

《基因组的结构与功能.ppt》由会员分享,可在线阅读,更多相关《基因组的结构与功能.ppt(94页珍藏版)》请在三一办公上搜索。

1、2023/8/17,鲁云霞制作,1,第三章 基因组的结构与功能,重点:基因组的概念,各类生物基因组的特点。难点:各类生物基因组的结构特点。基本要求:掌握基因组的概念、各类生物基因组的结构特点;熟悉基因的转位与插入;比较和了解各类生物基因组的差异。,2023/8/17,鲁云霞制作,2,基因组概述,从简单的病毒到复杂的高等动植物细胞,都有一套决定于生物基本特征和功能的遗传信息,贮存于病毒或细胞的核酸中;RNA和蛋白质的结构信息都以基因的形式贮存于DNA(或RNA)中;DNA中有大量非编码序列,在真核生物中高达95%以上;含有一种生物的一整套遗传信息的遗传物质,称为基因组。病毒、原核生物及真核生物所

2、贮存的遗传信息量有巨大的差别,其基因组的结构与组织形式上也各有特点。,2023/8/17,鲁云霞制作,3,本章主要内容,第一节 基因组的概念第二节 病毒基因组的结构特点第三节 原核生物的基因组第四节 真核生物基因组第五节 基因组变异的意义第六节 人类基因组学简介,2023/8/17,鲁云霞制作,4,第一节 基因组是一套完整单倍体的遗传物质的总和,一、基因组储存了生物体整套的遗传信息基因组(genome)泛指一个细胞或病毒的全部遗传信息。在真核生物体中,基因组是指一套完整单倍体DNA(染色体DNA)和线粒体DNA的全部序列,既包括编码序列,也包括大量存在的非编码序列。人类基因组包含22条常染色体

3、和X、Y两条性染色体上的全部遗传物质(核基因组)以及胞浆线粒体上的遗传物质(线粒体基因组)。某些病毒的基因组由RNA组成。,2023/8/17,鲁云霞制作,5,二、不同生物基因组蕴含的遗传信息量有着巨大的差别,基因组的大小通常以其DNA含量来表示,单倍体基因组中的全部DNA量称为C值(C-value);不同生物的基因组大小差异很大。基因组大小和DNA含量随着生物进化复杂程度的增加以及生物结构和功能复杂程度的增加而逐步上升;C值矛盾:如人的C值只有109bp,肺鱼的C值为1011bp;基因组的大小与基因的数目没有直接的线性关系。,2023/8/17,鲁云霞制作,6,不同生物物种的基因组大小比较,

4、2023/8/17,鲁云霞制作,7,三、不同生物基因组的结构与组织形式也明显不同,原核生物的基因组一般较小,结构比较简单;病毒基因组的大小和结构差异较大;真核生物基因组一般较庞大,但结构基因在基因组中所占的比例较小,其中编码序列更小,且存在大量重复序列;人的基因组中只有23%的DNA序列是编码序列。,2023/8/17,鲁云霞制作,8,基因组信息人类基因组:编码区域只占2%-3%对于非编码序列,尚不清楚其含义或功能非编码区域对于生命活动具有重要的意义 包括内含子、简单重复序列、移动元件、假基因 重复序列:大卫星(macro-satellite)DNA小卫星(mini-satellite)DNA

5、微卫星(micro-satellite)DNA 顺式调控元件:启动子、增强子、沉默子,2023/8/17,鲁云霞制作,9,第二节 不同病毒基因组的核酸具有不同特点,病毒(virus)是最简单的生命形式,遗传信息的延续构成了生命活动的主要内容。病毒基因组的主要功能就是保证基因组的复制及其向子代传递,整套基因组所编码的蛋白质都是与基因复制、病毒颗粒包装以及向其它宿主细胞传递密切相关,有些蛋白质可影响宿主细胞基因表达和增殖,通过促进细胞的增殖而有利于病毒复制繁衍。,2023/8/17,鲁云霞制作,10,2023/8/17,鲁云霞制作,11,一、病毒基因组核酸的主要类型,病毒基因组(virus gen

6、ome)的核酸有DNA,也有RNA,但不会二者共存。按照核酸的性质、基因组结构及复制的特点,可以将病毒基因组分为以下几类:双链DNA如腺病毒是线状双链,乳头瘤病毒是环状双链;单链DNA:如X174;双链RNA如轮状病毒含有正负两条RNA链;单链负股RNA如流感病毒需要先合成与其互补的mRNA;单链正股RNA如SARS;逆转录病毒通常引起人和动物的肿瘤,如HIV可作为mRNA行使模板功能。,2023/8/17,鲁云霞制作,12,SARS病毒简介,SARS冠状病毒属于单股正链RNA病毒;RNA分子不分节段,5端有甲基化帽,3端有polyA结构,基因组长度在2700030000碱基之间;5端约2/3

7、的区域编码病毒RNA聚合酶蛋白,后1/3的区域编码结构蛋白,依次为S蛋白(spike protein),E蛋白(envelop protein),M蛋白(membrane protein),N蛋白(nucleocapsid protein)等;在结构蛋白编码区可能的ORF中,能编码在已知蛋白质序列数据库中未找到任何同源序列的未知蛋白PUP(predicted unknown protein)。,2023/8/17,鲁云霞制作,13,2023/8/17,鲁云霞制作,14,部分RNA病毒基因组可以被反转录成DNA,逆转录病毒是一类特殊的单股正链RNA病毒,通常引起人和动物的肿瘤;逆转录病毒基因组一

8、般包括3个基本的结构基因,即gag、pol、env,分别编码核心蛋 白、逆转录酶和膜蛋白。,2023/8/17,鲁云霞制作,15,逆转录病毒的基因组结构;线状DNA 中的 LTRs;整合到宿主细胞时发生的U3和U5分别缺失2个碱基对和出现4-6bp的靶DNA重复,逆转录病毒的基因组结构,2023/8/17,鲁云霞制作,16,二、病毒基因组结构与功能的特点,不同病毒基因组大小相差较大乙肝病毒(HBV)DNA为3.2kb,所含信息量较少,只能编码几种蛋白质;而痘病毒基因组DNA长达300kb,可编码几百种蛋白质。不同病毒基因组可以是不同结构的核酸病毒基因组的核酸可能是DNA,也可能是RNA;可能是

9、单链,也可能是双链;可能是闭合环状分子,也可能是线性分子。,2023/8/17,鲁云霞制作,17,病毒基因组有连续的也有不连续的DNA 病毒基因组均由连续的DNA分子组成;多数RNA病毒基因组也由连续的核糖核酸链组成,但有些则以不连续的核糖核酸链组成。病毒基因组的编码序列大于90 病毒基因组的大部分是用来编码蛋白质的,只有很小部分不编码蛋白质。单倍体基因组 除逆转录病毒基因组有两个拷贝外,至今发现的病毒基因组都是单倍体,每个基因在病毒颗粒中只出现一次。,2023/8/17,鲁云霞制作,18,基因有连续的和间断的 感染细菌的病毒(噬菌体)基因组与细菌基因组结构特点相似,基因是连续的;而感染真核细

10、胞的病毒基因组与真核生物基因组结构相似,有内含子,基因是间断的。相关基因丛集排列 病毒基因组核酸序列中功能相关的几个蛋白质基因丛集在基因组的一个或几个特定部位,形成一个功能单位或转录单元,受同一个转录调控机制调节,它们可被一起转录成为多顺反子mRNA,然后加工成为各种蛋白质的模板。,2023/8/17,鲁云霞制作,19,基因重叠 有些病毒在进化过程中形成重叠基因,即同一段核酸序列能编码2种或2种以上蛋白质。这些重叠基因虽然共用一段核酸序列,但转录出的mRNA链阅读框不同。X174噬菌体的基因结构 Ala Glu Gly Val Met 终止-G C GG A A G G A G T GA T

11、G T A A T G T C T-Arg Lys Glu 终止 起始 Ser,2023/8/17,鲁云霞制作,20,噬菌体x174基因图谱,2023/8/17,鲁云霞制作,21,2023/8/17,鲁云霞制作,22,举例:SV40病毒基因组,SV40病毒的基因组是双链环状DNA,全长5243bp,基因组复制通过DNA复制过程而完成;基因组中含有早期转录基因和晚期转录基因两部分,早晚期转录的两部分基因大约等长,但转录方向相反;在早期和晚期转录区之间是调控区(约400bp),主要包括复制起点、启动子和增强子,可调节基因组的复制及早期和晚期基因的转录。,2023/8/17,鲁云霞制作,23,典型病

12、毒基因组介绍,2023/8/17,鲁云霞制作,24,第三节 原核生物基因组比较简单,原核生物一般只有一个染色体,即一个核酸分子,大多数为双螺旋结构,少数为单链形式存在。原核生物基因组较小,结构简单。原核生物需要根据外界环境的变化,调节自身的酶系统的组成及功能,利用不同的营养物质,调整细胞内某些蛋白质的数量;原核基因组中存在操纵子结构,一个调控区控制数个结构基因,结构基因是成套表达的,从而可以有效地利用核酸序列。,2023/8/17,鲁云霞制作,25,原核生物转录后的mRNA结构图,2023/8/17,鲁云霞制作,26,一、原核基因组结构与功能的特点,1.基因组通常由一条环状DNA分子组成。没有

13、明显的核结构,在细胞内相对集中在一个区域,形成类核结构。其中DNA占80,其余为RNA和蛋白质。,2023/8/17,鲁云霞制作,27,Nucleoid(类核,拟核)Bacterial chromosome 细菌染色体,2023/8/17,鲁云霞制作,28,2.基因组中只有1个复制起始点。3.基因操纵子结构。操纵子(operon)是指数个功能相关的结构基因(sructure gene)串联在一起,构成信息区,连同上游的调控区(包括启动子和操纵基因)以及下游的转录终止信号所构成的基因表达单位,所转录出的RNA为多顺反子。4.编码序列一般不重叠。5.基因是连续的,无内含子,转录后不需要剪接(切)。

14、6.编码区在基因组中所占的比例(约占50)远远大于真核基因组,但小于病毒基因组。非编码区主要是一些调控序列。,2023/8/17,鲁云霞制作,29,7.基因组中很少有重复序列。编码蛋白质的结构基因多为单拷贝,而编码rRNA的基因往往是多拷贝的。8.细菌基因组中存在有可移动的DNA序列,包括插入序列和转座子。9.具有编码同工酶的基因。10.在DNA分子中具有多种功能的识别区域,如复制的起始区、复制终止区、转录启动区转录终止区等。这些区域往往具有特殊的序列,并且含有反向重复序列。,2023/8/17,鲁云霞制作,30,2023/8/17,鲁云霞制作,31,五、细菌基因组中的可移动成分产生转座现象,

15、转座因子(transposable element)是能在一个DNA分子内部或两个DNA分子之间移动的DNA片段。在细菌中,则指可在质粒和染色体之间或在质粒与质粒之间移动的DNA片段。转位也是DNA重组的一种形式。插入顺序 插入顺序(insertion sequence,IS)是一类较小的没有表型效应的转位因子,长度约7002000bp,由一个转位酶基因及两侧的反向重复序列(inverted repeat sequence,IR)组成。,2023/8/17,鲁云霞制作,32,IR的对称结构使IS可以双向插入靶位点,并在插入后于两侧形成一定长度(311bp)的顺向重复序列(direct repe

16、at sequence,DR),DR是靶位点序列复制的产物。转座子 转座子(transposon,Tn)是一类较大的可移动成分,除有关转座的基因外,至少带有一个与转座作用无关并决定宿主细胞(菌)遗传性状的基因。转座子中的转位酶常称为转座酶,其功能是介导转座子插入到DNA的其他部位。可转座的噬菌体 可转座的噬菌体(transposable phage)是一类具有转座功能的溶源性噬菌体,包括Mu和D108等。,2023/8/17,鲁云霞制作,33,2023/8/17,鲁云霞制作,34,简化的转座过程,2023/8/17,鲁云霞制作,35,(二)转座因子的几个遗传效应,由转座因子复制出一个新拷贝转移

17、到基因组中的新位置;新的转座因子转到靶点后,靶点序列倍增成为2个靶点序列,并分别排列在转座因子两侧,形成同向重复序列(见图);在转座过程中能形成共合体;转座因子转座后能促使染色体畸变;转座因子从原来位置上切除(切离,excision);转座可引起插入突变;由于携带有标志基因如ampR、terR、smR,使受体基因组增添了新的基因。,2023/8/17,鲁云霞制作,36,转座子具有反向末端重复序列以及在靶部位两侧产生的同向重复序列。在该例中靶序列为5bp,转座子末端由9bp反向重复序列组成,数字1-9指序列重复碱基对。,2023/8/17,鲁云霞制作,37,六、质粒DNA是具有自主复制能力的双链

18、环状DNA,是存在于细菌染色体外的具有自主复制能力的共价闭合环状双链DNA分子。分子量一般为106108,小型质粒的长度一般为1.515kb。其基因组的结构特点类似于细菌基因组。通常质粒对于宿主细胞的生存不是必需的,但质粒含有的某些基因,可对宿主细胞的生物特性产生影响。因质粒是一个完整、独立的复制子,并能转化细胞,即把它的一个复本从供体细胞转移给受体细胞,而且能给转化细胞带来特殊标记,故在基因工程技术中作为目的基因的载体被广泛应用。,2023/8/17,鲁云霞制作,38,The ORF of the inserted gene has to be in the same direction a

19、s that of the lacZ A fusion protein contains the N-terminal sequence of lacZ and the inserted ORF will be produced,2023/8/17,鲁云霞制作,39,The ORF of the inserted gene has to be in the same direction as that of the lacZ A fusion protein contains the N-terminal sequence of lacZ and the inserted ORF will b

20、e produced,2023/8/17,鲁云霞制作,40,Ampicillin resistant?yes yesTetracycline resistant?No yes,B X B,B,B,X,Ampr,ori,Ampr,Tcr,ori,抗性基因的插入失活以筛选重组质粒,2023/8/17,鲁云霞制作,41,质粒的遗传控制,复制调控系统:由复制起点(ori)、rep基因、cop基因组成,控制质粒的拷贝数;分配系统:使质粒在细菌分裂过程中精确分配到子细胞中;细胞分裂系统:抑制细胞分裂,使细胞分裂与质粒复制协调;位点特异重组系统:由质粒att位点、质粒编码的Int和Xis酶、宿主FIS组成,

21、将高拷贝质粒形成的多聚体拆开成单体,便于平均分配;质粒的不相容性:具有相同复制起始位点和分配区的两种质粒不能共存于一个宿主菌。,2023/8/17,鲁云霞制作,42,质粒的类型,接合型质粒、可移动型质粒和自传递质粒:接合型质粒只能使细菌接合;可移动型质粒可被传递;自传递型质粒兼具上述两种质粒的功能(如F质粒)。严谨型和松弛型质粒:分别为低拷贝数和高拷贝数质粒。窄宿主谱及广宿主谱质粒:窄宿主谱质粒存在于一种或数种密切相关的宿主(如ColE);广宿主谱质粒可在不同科、属、种细菌间传递(如pC194)。,2023/8/17,鲁云霞制作,43,细菌基因组学研究及意义,细菌基因组学是测定细菌全基因组序列

22、,把细菌全基因组序列的知识和分析序列的情报工具结合起来,研究细菌的毒力和致病性的一门科学。更好地了解病原微生物的致病机制;加快重要致病基因的发现速度;寻找病原菌特异的DNA序列,提高临床诊断的效率和准确性;为筛选有效药物及发展疫苗提供参考。,2023/8/17,鲁云霞制作,44,第四节 真核生物基因组更加复杂,一、真核生物基因组远大于原核生物基因组真核生物(eukaryote)基因组的容量远远大于原核生物基因组,真核基因组的结构与功能更为复杂。人的单倍体基因组DNA约为3.3x109bp,大肠杆菌的基因组只有4.6x106bp。,2023/8/17,鲁云霞制作,45,二、真核生物基因组由染色体

23、DNA和染色体外DNA组成,真核生物细胞具有细胞核,DNA为线状,与组蛋白、非组蛋白结合成染色质。除细胞核基因组外,真核生物还具有线粒体基因组,在植物细胞中的叶绿体内也有遗传物质。,2023/8/17,鲁云霞制作,46,2023/8/17,鲁云霞制作,47,2023/8/17,鲁云霞制作,48,三、真核生物基因组的结构特点,1、每一种真核生物都有一定的染色体数目,除配子(精子和卵子)为单倍体外,体细胞一般为双倍体,即含有两份同源的基因组。2、真核基因组远远大于原核生物基因组,结构复杂,基因数庞大,具有许多复制起始点,每个复制子大小不一。3、真核基因都由一个结构基因与相关的调控区组成,转录产物为

24、单顺反子(monocistron),即一分子mRNA只能翻译成一种蛋白质。4、真核生物含有大量重复顺序。,2023/8/17,鲁云霞制作,49,5、真核生物基因组内非编码序列(non-coding sequence,NCS)占90以上。6、真核基因是断裂基因(split gene),即编码序列被非编码序列分割开来,基因与基因间的非编码序列为间隔DNA(spacer DNA),基因内非编码序列为内含子,被内含子隔开的编码序列则为外显子。7、功能相关的基因构成各种基因家族,它们可以串联在一起,亦可相距很远,但即使串联在一起的成簇的基因也是分别转录的。8、真核生物基因组中也存在有一些可移动的遗传因素

25、(mobile genetic elements)。,2023/8/17,鲁云霞制作,50,内含子、启动子,假基因,基因片段,非编码序列 90,编码序列 10,结构基因及其相关序列20 30,SINEs,LINEs,卫星DNA,小卫星DNA,微卫星DNA,散在分布重复序列40,串联重复序列60,中/高度重复序列20 30,单/低拷贝序列7080,基因外DNA7080,人类基因组(3109bp)结构组成,2023/8/17,鲁云霞制作,51,重复序列的特点,在人类基因组中,非编码序列占95%以上;这些非编码序列一部分是基因的内含子、调控序列等,另一部分便是重复序列;真核基因组的重复序列可高达总D

26、NA量的50%;串联重复顺序:具有一个固定的重复单位,该重复单位头尾相连形成重复顺序片段,约占整个人类基因组的10;编码区串联重复顺序:如编码rRNA、tRNA、组蛋白和免疫球蛋白的基因。,2023/8/17,鲁云霞制作,52,重复序列的分类 高度重复序列 在基因组中的重复次数达数百万次(105)的DNA序列称为高度重复序列。典型的高度重复序列有卫星DNA和反向重复序列两类。中度重复序列 中度重复序列是在基因组中的重复次数为101105。中度重复序列约占基因组DNA总量的35。单拷贝序列 在整个基因组中仅出现一次或少数几次。大多数编码蛋白质的基因都属于这一类。,2023/8/17,鲁云霞制作,

27、53,(一)高重复序列DNA:可集中在某一区域串联排列,典型的高重复序列有卫星DNA和反向重复序列。1.卫星DNA是出现在非编码区的串联重复序列,通常存在于间隔DNA和内含子中,分为:大卫星DNA:也称经典卫星DNA;小卫星DNA:由中等大小的串联重复顺序组成,有高度可变的小卫星DNA和端粒DNA;微卫星DNA:一类更简单的寡核苷酸串联重复序列。,2023/8/17,鲁云霞制作,54,Satellite DNA,Mouse genome DNA,30%GC in satellite DNA,CsCl centrifugation,2023/8/17,鲁云霞制作,55,包括特异基因的区域可由原位

28、杂交技术(in situ hybridization)识别。,卫星 DNAs 经常存在于异染色质,2023/8/17,鲁云霞制作,56,鼠卫星位于着丝粒,2023/8/17,鲁云霞制作,57,2.反向重复序列两个顺序相同的拷贝在DNA链上呈反向排列。人类基因组约含5的反向重复序列,散布于整个基因组中,常见于基因组调控区内,可能与复制、转录的调控有关。两个反向排列的拷贝之间隔着一段间隔顺序;两个拷贝反向串联在一起,中间没有间隔顺序,形成回文结构(palindrome)。,2023/8/17,鲁云霞制作,58,(二)中重复序列DNA,中度重复序列散在分布于基因组中;中重复序列常与单拷贝序列间隔排列

29、,有一部分是编码rRNA、tRNA、组蛋白和免疫球蛋白的结构基因,另外一些可能与基因的调控有关;典型的Alu家族是一种散在重复顺序,由于序列中有限制性内切酶Alu的酶切位点而得名;重复单位是300bp,由2个130bp的重复序列组成,中间有31bp间隔序列,重复3050万次;为灵长类基因组所特有,可作为天然标记。,2023/8/17,鲁云霞制作,59,(三)重复序列的DNA多态性,DNA位点多态性:由于等位基因间在特定位点上的DNA序列存在差异造成;限制性片段长度多态性(RFLP):用同一种限制酶消化不同个体的DNA时,会得到长度各不相同的限制性片段类型;串联重复顺序多态性:可变数目的串联重复

30、序列(VNTRs),有小卫星DNA多态性,微卫星DNA多态性。,2023/8/17,鲁云霞制作,60,四、多基因家族和假基因,基因家族(gene family)是指核苷酸序列或编码产物的结构具有一定程度同源性的一组基因。同一个家族的基因成员是由同一祖先基因进化而来,同源性最高可达100(多拷贝基因)。多基因家族中的基因,其编码产物常具有相似的功能;而在基因超家族中,许多基因的编码产物在功能上却毫无相同之处。根据家族内各成员同源性的程度,基因家族主要有以下几种类型:,2023/8/17,鲁云霞制作,61,核酸序列相同 实际上是多拷贝基因。如rRNA基因家族,tRNA基因家族,组蛋白基因家族等。核

31、酸序列高度同源 如人类生长激素基因家族。包括3种激素的基因:人生长激素(hGH)、人胎盘促乳素(hCS)和催乳素(prolactin)。它们之间的同源性很高,尤其是hGH与hCS,蛋白质氨基酸序列有85的同源性,mRNA序列有92的同源性。编码产物具有同源功能区 如src癌基因家族,各成员基因结构虽无明显的同源性,但每个基因产物都含有250个氨基酸顺序的同源蛋白激酶结构域。,2023/8/17,鲁云霞制作,62,编码产物具有小段保守基序 如DEAD盒基因家族含有几个不同的基因,它们的产物都具有解旋酶的功能,其结构特征是8个氨基酸基序,内含DEAD盒序列:AspGluAlaAsp。基因超家族 基

32、因超家族(gene superfamily)是指一组由多基因家族及单基因组成的更大的基因家族。它们的结构有程度不等的同源性,可能都起源于相同的祖先基因,但是它们的功能并不一定相同。最典型的基因超家族是免疫球蛋白基因超家族。,2023/8/17,鲁云霞制作,63,基因超家族,通过应用计算机分析基因结构序列,使越来越多的基因归为一类,使原来的多基因家族成为基因超家族。如丝氨酸蛋白酶基因超家族,原来是多基因家族,具有酶活性;现已有很多新成员加入进去,特别是载脂蛋白(apolipoprotein),只是转移胆固醇蛋白颗粒中的成分,不具有酶活性。,2023/8/17,鲁云霞制作,64,(二)假基因(ps

33、eudogene,),是与某些有功能的基因结构相似,但不能表达基因产物的基因;假基因起初可能是有功能的,但在复制时编码序列或调控元件发生突变,或是插入了mRNA逆转录的cDNA,缺少基因表达所需要的启动子序列;传统假基因通常是在编码区引入了终止密码子,如;加工的假基因()是插入了由mRNA逆转录的cDNA;假基因在高等哺乳动物基因组中是一种普遍现象。,2023/8/17,鲁云霞制作,65,假基因:类似于基因但不表达的DNA序列。不表现任何功能,是基因的退化形式。假基因在基因组中形成稳定的和无活性的拷贝,由活化的原始基因突变而来,存在着在某个阶段伤及基因表达的一种或多种缺陷(入启动子错误、有缺陷

34、的剪接信号、框架中有终止信号等)之故。一旦不能产生正常的基因产物,就失去了对发生进一步突变的选择性屏障作用,因此典型的假基因都有很多缺陷。某些假基因有3-多聚A尾巴及准确地切掉了内含子,因而与mRNA类似,被认为是源自插入基因组的逆转录体(可能由某些病毒携带)。,2023/8/17,鲁云霞制作,66,每个和球蛋白基因家族组成单个簇,包括功能性基因和假基因,2023/8/17,鲁云霞制作,67,真核生物基因组中的转座子在真核生物基因组中,编码序列在染色体中的位置相对比较稳定,但一些中度重复序列往往可以移动。端粒以线性染色体形式存在的真核基因组DNA末端都有一种特殊的结构,称为端粒(telomer

35、e)。该结构是一段DNA序列和蛋白质形成的复合体,仅在真核细胞染色体末端存在。其功能主要有保护线性DNA的完整复制、保护染色体末端及决定细胞的寿命等。,2023/8/17,鲁云霞制作,68,第五节基因组变异具有重要的生理和病理意义,基因组在进化过程中发生了各种形式的变异,如突变、插入、缺失、不同数目串联重复和单核苷酸多态性();染色体变异可导致疾病的发生;线粒体基因病受到越来越多的重视;易感基因与环境的相互作用。,2023/8/17,鲁云霞制作,69,基因组学包括3个不同的亚领域结构基因组学(structural genomics)功能基因组学(functional genomics)比较基因

36、组学(comparative genomics),基因组学概念,第六节基因组学是一门新的科学,2023/8/17,鲁云霞制作,70,人类基因组计划的直接动因是要解决包括肿瘤在内的人类疾病的分子遗传学问题。6000多个单基因遗传病和多种大面积危害人类健康的多基因遗传病的致病基因及相关基因,代表了对人类基因中结构和功能完整性至关重要的组成部分。疾病基因的克隆在HGP中占据着核心位置,也是计划实施以来成果最显著的部分。,2023/8/17,鲁云霞制作,71,人类基因组DNA的奥秘 遗传信息存贮在4种字符组成的核酸序列中“天书”用遗传语言书写的人类遗传蓝本包含的信息量巨大更重要的是目前人类对它了解甚少

37、天书中只有4个字符(碱基A、T、G、C)既没有段落,也没有标点符号是一个长度为3109的一维序列。,2023/8/17,鲁云霞制作,72,一、人类基因组的四张图谱:遗传图,物理图,转录图,序列图;二、人类基因组计划的完成向人们提出了更高的挑战,人类基因组计划简介,2023/8/17,鲁云霞制作,73,Craig Venter(head of Celera Genomics),Ari Patrinos(director of DOE HumanGenome Program and Biological and Environmental Research Program),and Francis

38、 Collins(director,NIH National Human Genome Research Institute),2023/8/17,鲁云霞制作,74,Background 1:The Road to the Sequence,2023/8/17,鲁云霞制作,75,1985 HGP first be discussed,(May)Robert Sinsheimer(pictured)hosts a meeting at the University of California(UC),Santa Cruz,to discuss the feasibility of sequenc

39、ing the human genome.(December)Kary Mullis and colleagues at Cetus Corp.develop PCR,a technique to replicate vast amounts of DNA(Science).,2023/8/17,鲁云霞制作,76,1990 large-scale sequencing on model organisms,(August)NIH(National Institutes of Health)begins large-scale sequencing trials on four model or

40、ganisms:Mycoplasma capricolum(支原体),Escherichia coli(大肠杆菌)(up,pink),Caenorhabditis elegans(线虫)(up,rainbow),and Saccharomyces cerevisiae(啤酒酵母)(up,ovals).Each research group agrees to sequence 3 Mb at 75 cents a base within 3 years.,2023/8/17,鲁云霞制作,77,1991 rice genome sequencing begins,(June)NIH biolog

41、ist J.Craig Venter announces a strategy to find expressed genes,using ESTs(Science).A fight erupts at a congressional hearing 1 month later,when Venter reveals that NIH is filing patent applications on thousands of these partial genes.(October)The Japanese rice genome sequencing effort begins.,2023/

42、8/17,鲁云霞制作,78,2001 Draft Sequence of Human Genome Published,The HGP consortium publishes its working draft in Nature(15 February),and Celera publishes its draft in Science(16 February).,For more details,we can refer the web:http:/,2023/8/17,鲁云霞制作,79,And 2002 April 5,A Draft Sequence of Rice Genome p

43、ublished by Chinese scientist,A Draft Sequence Assembly of the Rice Genome Science 2002 April 5;296(5565):p.79-92,Refer Science Online:,2023/8/17,鲁云霞制作,80,On Feb 16th 2001 What happened?,2001年2月中旬,Nature与Science分别发表了人类基因组工作框架图(the draft genome),这是人类基因组计划(human genome project,HGP)实施以来所取得的最重大进展,也是生命科学

44、领域中的一个里程碑。自HGP提出以来,到现在一共16年。这16年来科学家们所走过的是一条充满艰辛的路,同时也是一条谱写辉煌的路。回顾这段将在人类历史上永载史册的光辉历程,相信对每一位科学殿堂里的探索者都会大有启迪。我们应该记住他们,记住他们所作出的成就。J.Craig Venter是一位在人类基因组计划实施中贡献最大的科学家之一,他曾反对基因专利化,1998年,他和Perkin-Elmer公司联合组建了的Celera Genomics公司,Celera的商业计划是快速完成人类基因组测序,以及将信息调入一个复杂的遗传及医用信息库,并以订阅的方式销售给制药及生物技术公司,本文正是他们公司的成果,发

45、表在Science上。,2023/8/17,鲁云霞制作,81,(一)人类基因组作图,1.遗传图的制作2.物理图分析 3.转录图制作4.基因组序列测定 5.资料的储存和利用,2023/8/17,鲁云霞制作,82,遗传图(genetic map),又称连锁图(linkage map),是指以具有遗传多态性的遗传标记为“路标”,以遗传学(重组)距离为“图距”的基因组图,是基于遗传功能而建立的图谱。表示基因或DNA标志在染色体上的相对位置与遗传距离,用分摩尔根(cM)来表示。1分摩尔根表示每次减数分裂的重组频率为。,1.遗传图制作,2023/8/17,鲁云霞制作,83,物理图(physical map

46、)是指以一段已知核苷酸序列的DNA片段为标志(称为序列标记位置,sequence tagged site,STS)、以碱基对的大小为图距(Mb、kb)所作出的基因组DNA分析。物理图谱反应的是DNA序列上两点之间的实际距离,遗传图谱反应这两点之间的连锁关系。,2.物理图分析,2023/8/17,鲁云霞制作,84,由于人类基因组中,真正为蛋白质编码的序列仅占23。而这些序列在细胞中只有10左右表达。从不同组织中提取mRNA,合成cDNA然后进行大规模测序,这种策略被认可,cDNA片段被称为表达序列标签(Expressed sequence tag,EST),3.转录图分析,2023/8/17,鲁

47、云霞制作,85,4.序列图测定,人类基因组计划最终将测定出总长度约1米,由近30亿个核苷酸组成的人类基因组的全部序列。要求一种更高效的规模测序,并将测出的每一个DNA片段按其染色体位置进行准确的排列,从而得到人类基因组DNA序列碱基排列的全貌。,2023/8/17,鲁云霞制作,86,5.资料的储存和利用,目前建立的数据库主要有:GenbankEMBLDDBJ PIR Swiss-PROT可从互联网之间进入这些数据库获得或输送有关基因组序列的数据,2023/8/17,鲁云霞制作,87,二、基因组计划带来的希望和挑战 实验数据的积累速度在迅速地增加 计算机科学和技术也在不断地发展,2023/8/1

48、7,鲁云霞制作,88,后基因组时代的挑战,2002年2月12日,人类基因组计划最终完成,报道了99%的人类基因组序列。我们正生活在后基因组时代。人类基因组计划已开始进入由结构基因组学向功能基因组学过渡、转化的过程。功能基因组学的主要内容之一:研究一个细胞内基因转录表达的类型、发育阶段以及反应状态。,2023/8/17,鲁云霞制作,89,关于生物复杂性生物的复杂性不仅仅是基因的数目人类基因约为30000个线虫有20000个基因,230000/220000=210000103000,2023/8/17,鲁云霞制作,90,单个基因组分析基因序列基因功能基因的表达调控基因产物基因多态性,2023/8/17,鲁云霞制作,91,比较基因组分析物种关系物种进化物种起源,2023/8/17,鲁云霞制作,92,2023/8/17,鲁云霞制作,93,人、鼠基因组比较,人基因组 鼠基因组 鼠染色体上的颜色和数字代表在人染色体上对应的片段.,老鼠约75%的基因与人类相同。,2023/8/17,鲁云霞制作,94,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号