《《人类基因》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《人类基因》PPT课件.ppt(74页珍藏版)》请在三一办公上搜索。
1、第二章 人类基因 human gene,第二章 人类基因,基因的概念基因的化学本质人类基因和基因组的结构特点基因的生物学特性人类基因组计划,基因的概念,1865年 基因是一些特殊因子1871年 发现核酸1903年 染色体是遗传单位1910年 基因位于染色体上1913年 染色体包含线性排列的基因1927年 突变是基因内的物理变化1931年 交换引起重组1944年 DNA是遗传物质1945年 基因编码蛋白质1951年 首次蛋白质测序1953年 DNA双螺旋结构1958年 DNA半保留复制1961年 三联体密码发现1977年 真核基因不连续性1977年 DNA可以测序1995年 首次基因组测序,基因
2、的概念,基因(gene)是决定一定功能产物的DNA序列。这种功能产物主要是蛋白质和RNA。一个基因的结构除了编码特定功能产物的DNA序列外,还包括对这个特定产物表达所需的邻接DNA序列。,基因的化学本质,在整个生物界中,绝大部分生物(包括人类)基因的化学本质是DNA;在某些仅含有RNA和蛋白质的病毒中,基因的化学本质是RNA。,一、DNA分子组成DNA分子的基本单位是脱氧核苷酸,依各自所携碱基的不同,可以分成A、G、C、T 4种。将它们按一定顺序排列连接后即构成DNA单链。它们的排列顺序是DNA遗传的核心。二、DNA分子结构 双螺旋结构模型,基因的化学本质,人类基因组,人类基因组(genome
3、)是人的所有遗传信息的总和。它包括两个相对独立而相互关联的基因组:核基因组与线粒体基因组。通常人类基因组指的是核基因组。,人类基因组的组织结构,人类的基因或人类基因组中的功能序列可分为4大类,即单一基因、基因家族、拟基因和串联重复基因。基因家族指由一个祖先基因经过重复和变异所形成的一组基因。有两类:(1)一个基因簇:由一个基因产生多次拷贝(几乎相同序列),成簇排列于同一染色体上。(2)多基因簇(图3-5):成簇地分布于几条不同的染色体上。如编码珠蛋白的基因:5个相关基因排列于16p染色体上。拟基因或假基因指在多基因家族中某些成员不产生有功能的基因产物。,基因的分类,基因的结构,真核生物基因的编
4、码序列往往被非编码序列所分割,呈现断裂状的结构,故而也称断裂基因(split gene)。一、外显子和内含子外显子(exon):编码序列内含子(intron):非编码序列,外显子-内含子的接头区是一高度保守的一致顺序,称为外显子-内含子接头。每一个内含子的5端起始的两个碱基是GT,3端最后的两个碱基是AG,通常把这种接头形式叫做GT-AG法则(GT-AG rule)。这两个序列是高度保守的,在各种真核基因的内含子中均相同。每个断裂基因中第一个外显子的上游和最末一个外显子的下游,都有一段不被转录的非编码区,称为侧翼顺序。,基因的结构,第二节 遗传的分子基础,二、真核基因的分子结构特征,基因组的组
5、成,人类基因组按DNA序列分类既有单拷贝序列,也有重复频率不等的多拷贝序列。单拷贝序列:在基因组中仅有单一拷贝或少数几个拷贝,长度在8001000bp之间,其中有些是编码细胞中各种蛋白质和酶的结构基因,占到人类基因组的大多数。重复多拷贝序列:分散地穿插于整个基因组中,根据复性的速度不同,又可分为简单序列DNA和中度重复DNA。,简单序列DNA(simple-sequence DNA)或卫星DNA:以小于200bp的小片段为单位串联重复很多次,约占整个基因组的1015,大多数长度可达105bp,多位于染色体的异染色质区。在蔗糖或氯化铯密度梯度超速离心图谱上观察到的位于染色体DNA主带旁边的小带D
6、NA,重复多拷贝序列,重复多拷贝序列,小卫星DNA(minisatellite DNA):有15-100bp组成的重复单位,重复20-50次形成的1-5kb的短DNA微卫星DNA(microsatellite DNA):某些存在于基因组的间隔序列和内含子等非编码区内的简单序列DNA,重复序列为1-6bp,被称为。,中度重复DNA(intermediate repeat DNA):约占整个基因组的2540,以不同的量分布于整个基因组的不同部位。短分散元件(short interspersed element):DNA的长度可短至100bp500bp,拷贝数105以上。如Alu家族长分散元件(lo
7、ng interspersed element):可长达6000bp7000bp,拷贝数为 102 10。如KpnI家族,重复多拷贝序列,基因的生物学特性,DNA分子中碱基对的排列顺序蕴藏着遗传信息,决定了基因的基本功能和特性。基因复制与表达构成了基因的主要功能。,遗传密码:在DNA的脱氧核苷酸长链上,每三个相邻的碱基序列构成一个三联体,每个三联体密码能编码某种氨基酸,所以三联体(triplet)是遗传信息的具体表现形式。因而三联体又称三联体密码(triplet code)、遗传密码(genetic code)或密码子(codon)。,遗传信息的储存单位,编码链:5-ATG AAA CGA G
8、TC TTA TGA-3,反编码链:mRNA:,3-TAC TTT GCT CAG AAT ACT-5,5-AUG AAA CGA GUC UUA UGA-3,遗传密码的特性通用性 在绝大多数情况下,遗传密码在整个生物界中都是通用的。但也有一些例外存在,如线粒体DNA中有3个遗传密码与通用密码不同。简并性 除少数氨基酸仅有一种密码子外,其余氨基酸都各被26个密码子编码,这种现象称为遗传密码的简并性(degeneracy)。起始密码和终止密码 密码子AUG若位于mRNA的5端起始处,则是蛋白质合成的起始信号,叫起始密码子(initiation codon),同时编码甲酰甲硫氨酸和甲硫氨酸;若不是
9、位于mRNA的起始端,则只具有编码甲硫氨酸的作用。密码子UAA、UAG和UGA不编码任何氨基酸,而是作为肽链合成的终止信号,称为终止密码子。,基因通过自我复制保持遗传的连续性,基因具有自我复制(self-replication)的重要特性。复制发生在细胞分裂周期的S期,DNA双螺旋结构解旋为两条单股的多核苷酸链,以DNA分子自身的每一股单链为模板进行自我复制合成新的DNA分子。复制的起点由特定的碱基序列组成。真核生物的复制从多个位点同时开始进行。,新链的复制过程具有一定的特点 互补性:半保留性:反向平行性:不对称性:不连续性:,基因通过自我复制保持遗传的连续性,基因表达(gene expres
10、sion):是把基因所储存的遗传信息转变为由特定的氨基酸种类和序列构成的多肽链,再由多肽链构成蛋白质或酶分子,从而决定生物各种性状(表型)的过程。基因表达包括两个步骤:以DNA为模板转录合成mRNA;将遗传信息翻译成多肽链中相应的氨基酸种类和序列,基因表达,转录(transcription):是在RNA聚合酶的催化下,以DNA的35单链(反编码链)为模板,按照碱基互补配对原则(但RNA以U和DNA的A配对,其余配对形式与复制时一致),以三磷酸核苷酸(NTP)为原料合成RNA的过程。转录的最终产物是mRNA、tRNA和rRNA等。,基因表达,转录过程:一般将mRNA的合成分为起始、延伸和终止3个
11、连续的步骤。在起始阶段,RNA聚合酶与启动子结合,即可启动RNA的转录合成。延伸过程是RNA聚合酶由全酶构型变为主酶构型,并沿着模板链的35方向移动,并精确地按照碱基互补原则,以三磷酸核苷酸(UTP、CTP、GTP和ATP)为底物,在3端逐个添加核苷酸,使mRNA不断延伸;终止是RNA聚合酶在DNA模板上移动到达终止信号时,RNA合成的停止。,已发现的一些启动子包括TATA框(TATA box)、CAAT框(CAAT box)、GC框(GC box)以及增强子(enhancer)等,它们构成了结构基因的侧翼序列(flanking sequence),是人类基因组的一些特殊序列,称为调控序列,对
12、基因的有效表达是必不可缺少的。,转录产物的加工和修饰:由RNA聚合酶催化所形成的初始转录产物,仅仅是mRNA的前体,必须经过加工和修饰,才能形成有功能的mRNA。主要包括“加帽”(capping)5端加“7-甲基鸟嘌吟核苷酸”;“加尾”(tailing)3端加“多聚腺苷酸”(poly A)和剪接 按GT-AG法则将内含子切除,再将外显子由连接酶逐段连接起来,形成成熟的mRNA分子。,翻译(translation):是以mRNA为模板指导蛋白质合成的过程。蛋白质合成是在细胞质内的核糖体上进行的。蛋白质翻译时mRNA携带遗传信息,作为合成蛋白质的模板;tRNA转运活化的氨基酸和识别mRNA分子上的
13、遗传密码;核糖体是蛋白质合成的场所,把各种特定的氨基酸分子连接成多肽链。蛋白质分子最终的空间结构是由翻译后修饰所决定的。,RNA编辑(RNA editing)是导致形成的mRNA分子在编码区的核苷酸序列不同于它的DNA模板相应序列的过程,属遗传信息加工。1.尿嘧啶核苷酸的加入或删除2.CU、AG或GA的RNA碱基转换3.CG、GC或UA的RNA碱基颠换生物学意义主要表现在:通过编辑的mRNA具有翻译活性;使该mRNA能被通读;在一些转录物5末端可创造生成起始密码子AUG,以调节翻译活性;RNA编辑可能与生物进化有关;RNA编辑不偏离中心法则,因为提供编辑的信息源仍然来源于DNA贮藏的遗传信息。
14、,基因表达的控制,基因表达控制的特点是能在特定时间和特定细胞中激活特定的基因,从而实现“预订”的有序的分化发育过程。真核生物基因表达调控是通过多阶段水平实现的,即转录前、转录水平、转录后、翻译和翻译后等五个水平。,人类基因组(genome)通常是指核基因组,是人的所有遗传信息的总和。,人类基因组,人类基因组计划,“人类基因组计划(human genome project,HGP)”是20世纪90年代初开始的全球范围的全面研究人类基因组的重大科学项目。HGP是美国科学家在1985年率先提出的,旨在阐明人类基因组DNA 3.2109核苷酸的序列,发现所有人类基因并阐明其在染色体上的位置,破译人类全
15、部遗传信息,使得人类第一次在分子水平上全面地认识自我。,HGP的整体目标是阐明人类遗传信息的组成和表达,为人类遗传多样性的研究提供基本数据,揭示人类单基因异常和严重危害人类健康的多基因病的致病基因或者疾病易感基因,建立对各种基因病新的诊治方法,从而推动整个生命科学和医学领域发展。其基本任务是建立人类基因组的结构图谱,即遗传图、物理图、转录图与序列图,并在“制图-测序”的基础上鉴定人类的基因,绘出人类的基因图。,一、人类结构基因组学(human structural genomics)集中建立遗传图、物理图、转录图、序列图基因图(一)遗传图(genetic map)连锁图(linkage map
16、)是以具有遗传多态性的遗传标记作为“位标”,以遗传学距离作为“图距”的基因组图。遗传多态性指在一个遗传座位上具有一个以上的等位基因(群体频率1%),该座位称为多态性座位,可作为遗传图的“位标”。遗传学距离是经典遗传学中特有的重要概念。,具有遗传多态性的标记是建立遗传图的要素:第一代DNA遗传标记RFLPBotstein于1980年最早应用的标记;RFLP局限性:1、提供的“多态性”的信息有限;2、现有的限制酶不可能检出所有的核苷酸改变;3、需要用同位素标记与Southern杂交技术,不安全又不宜自动化。第二代DNA遗传标记STR:1、小卫星DNA-重复单位6-12个bp的VNTR 2、微卫星或
17、短串联重复(STR)重复单位2-6个bp的 VNTR,STR有两个最突出优点:1、作为遗传标记的“多态性”与“高频率”。2、采用重复序列两侧的特异性单拷贝序列作为其在基因组中定“点”标记,以PCR技术操作,可以实现机器化、自动化、电脑化以至完全机器人化。已建立6000多个STR为主体的遗传标记组成的“连锁图”,平均分辨率已达0.7cM。,第三代DNA遗传标记SNP:1996年美国MIT的Lander所提出。1、与RFLP和STR等主要不同:不再以“长度”的差异作为检测手段,而直接以序列的变异作为标记。2、SNP在核苷酸水平上把“序列图”、“物理图”和“遗传图”有机统一起来。3、可能摒弃遗传标记
18、分析技术“瓶颈”凝胶电泳,用DNA测序技术构建基因组图。,(二)物理图:第一技术重要内容:是以一段已知核苷酸序列的DNA片段称为序列标记部位(STS)为“位标”,以Mb或kb作为图距的基因组图。STS的要求:1:在基因组中有明确的位置,位于重复序列两侧的单拷贝特异性序列,而忽略其重复序列。2、一段已知的序列。至1996年10月已建立22000个STS的物理图,X染色体物理图平均分辨率已达75kb。,第二重要内容:是建立以DNA克隆片段相互重叠的“邻接克隆群conting”。“邻接克隆群”的实验标准:用PCR证明这些片段含有STS的序列呈现阳性,并确定这些片段在基因组中的位置。借助于酵母人工YA
19、C片段巨大(0.52Mb)的优点,构建总体覆盖率几乎100%的“YAC 邻接克隆群”;细菌人工染色体(BAC)构建总体覆盖率为100%的、精度更高的“邻接克隆群”。,“物理图”的建立应该归功于DNA克隆技术70年代重大突破DNA克隆技术(遗传工程技术之一):1、质粒装载能力,即插入片段10kb2、噬菌体装载能力达20kb。3、兼有病毒与质粒优点的粘粒装载能力可达3040kb。4、YAC是人类认识真核生物染色体的重大飞跃。其独特优点是装载能力可达0.52Mb,是大片段DNA载体;其次其“人工染色体”性质具有准确复制并随着宿主细胞分裂而分离。,总结:1、以STS为位标的“序列标记”将遗传图、细胞遗
20、传学图以及分子水平的物理图序列图统一成整体的人类基因组图。2、真核生物的染色体是遗传物质最客观、最可靠、最方便的“物理标记”,细胞遗传图可以说是人类基因组的最基本层次的基因组图。3、人类拥有的完整的、多层次的、全方位的“基因组全图”包括细胞遗传学图以区、带为标记或以人为的等分图即染色体长度的百分率为标记、大规模的限制图以稀有酶切点为标记与精细限制图以常规限制性内切酶的位点为标记、基因组特异序列如CpG序列、Alu序列等图,DNA克隆图以及分子水平的核苷酸序列图,自发的染色体断裂点图与重组部位图。,(三)转录图:以“表达序列标记”(EST)绘制转录图(也称cDNA图或表达图人类“基因图”的雏形。
21、1990年提出“cDNA策略”,并作为“基因组全图策略的补充”。1996年,至少已来自300个组织的60多万个EST,总长度至少在200Mb以上。现已有53000个各不相同的转录本片段,可能代表30%50%的基因的大部分信息。,转录图与EST的现实意义:1、为估计人类基因的数目提供较为可靠的依据。2、提供不同组织、不同发育阶段的基因表达的数目、种类及结构,特别是序列的信息。3、提供了鉴定基因的探针,以EST可从“全长cDNA文库”筛到全长cDNA。4、本身就有直接的经济价值。作为“基因组”的一种物理标记,EST尚缺少定位的信息。现在可用FISH及比较基因组杂交(CGH)来基因定位。,(四)序列
22、图以DNA测序绘制序列图,是分子水平的最高层次的、最详尽的物理图。测序总长度约为1m,由30亿核苷酸组成的序列图是人类基因组计划中最为明确、最为艰巨的定量、定质、定时的任务。目前,测定技术的限制:由于一次测序反应尚不能超过1Kb,效率低而不被大规模采用。目前测序中心的主要策略:以大片段克隆建立插入片段约10Kb左右的质粒亚文库,再随机挑选质粒单克隆分别测序,再以电脑程序进行装配。,使用Sequation自动化测序仪:一天能进行2万个测序反应。技术核心主要为Sanger等“酶促末端终止法”+聚丙烯酰胺电泳+扫描隧道电镜。最有前途:DNA芯片(DNA距阵)思路类似于“寡核苷酸反向杂交法”;目前在晶
23、体上以“光刻法”直接合成高密度的可控制序列寡核苷酸的技术突破,已在建立单核苷酸多态性(SNP图)、表达图、大规模突变检测等方面具有重要实际价值。,二、后基因组,随着HGP遗传图、物理图、转录图与序列图等结构基因组学任务的基本完成,科学家们又启动了后基因组计划(post-genome era)。它主要研究基因组的功能,即功能基因组学。后基因组计划将为医学发展提供的线索和机遇,从基因表达谱的变化、细胞内信号转导过程异常等角度认识疾病将是医学发展中的重要变化。,1、功能基因组学在基因组层次上,以“转录图”为基础,研究所有基因的表达、调控和功能,最后建立起“基因表达图”,来揭示个体发育中、各个器官组织
24、中的基因组功能的三维动态变化。2、比较基因组学是指在基因组的层次上,比较不同基因组之间的异同,包括不同物种基因组比较和人类不同基因组比较两方面。3、工业基因组学:研究基因组学的工业应用的学科。比如以转基因动物为“原料”的动物反应器来生产人类生物制品(事物和药物),提供人体器官,培育新的动植物品种等。,4、药物基因组学:研究与药物代谢有关的基因;研究所有与药物作用有关的基因。(1)寻找药物相关基因;(2)基因芯片(chip)及蛋白质分析技术5、疾病基因组学:疾病基因的分离、定位、克隆和鉴定及其发病机制6、蛋白质组学:研究细胞或组织中基因组所表达的全部蛋白质。,三、基因组研究的伦理、法律与社会问题(ethical,legal,social issues,ELSI)(1)遗传信息是人类的共有财富。(2)遗传材料是一种资源。人类遗传资源的共享和遗传材料提供者的自愿原则。(3)个人隐私权。个人的遗传信息应看成是个人隐私,使用其遗传信息时应尊重“人格尊严”,反对“遗传歧视”。(4)对待遗传病患者应该坚持“法律平等”。基因诊断的对象范围和结果评价:包括两方面:对当前不能治疗的遗传病是否必要进行基因诊断;基因诊断的结果是否并如何向患者及其亲属公布及解释。,