《原核生物和真核生物的染色体结构.doc》由会员分享,可在线阅读,更多相关《原核生物和真核生物的染色体结构.doc(6页珍藏版)》请在三一办公上搜索。
1、第二章 原核生物和真核生物的染色体结构第一节:大肠杆菌的染色体与大多数细菌一样,大肠杆菌的染色体DNA呈环状,长度大约是1 mm。大肠杆菌细胞长约2 m,宽约0.51m。游离的大肠杆菌染色体DNA将形成无规则的螺旋,其体积大约是细菌细胞的1000倍。细菌染色体DNA必须经过高度压缩才能适应细胞的体积。细菌的染色体DNA聚集在一起,在细菌细胞内形成一个较为致密的区域(compact structure),称为类核(nucleoid)。细菌的染色体DNA形成50100个环(loops),每个环的长度是50100 Kb。环的两端以某种方式固定在蛋白质核心上(scaffold),因此每一个环在拓扑学上
2、是一个独立的结构域(domains )。第二节:真核生物的染色体和染色质真核生物的基因组DNA被包装成具有一定形态结构的染色体。每一个染色体具有一条巨大的线性DNA分子。在真核生物的染色体中,DNA与被称为组蛋白的碱性结合蛋白相结合。由DNA和组蛋白构成的复合体称为染色质(chromatin)。 一、组蛋白真核细胞中含有5种组蛋白(histones)H1,H2A,H2B,H3和H4。组蛋白的氨基酸组成十分特殊,富含带正电的氨基酸,赖氨酸(lysine)和精氨酸(arginine)。各种组蛋白中有超过20的氨基酸残基是赖氨酸和精氨酸。H2A,H2B,H3和H4是相对较小的蛋白质,分子量一般为11
3、15 KDa,组蛋白H1的分子量约为20 KDa。组蛋白带正电,它们能够与DNA分子上带负电的磷酸基团通过静电引力(electrostatic attraction)结合在一起。这种静电引力显然是稳定染色质最主要的因素。把不同来源的组蛋白混合在一起通常能够实现染色质的重建。因为,除了H1,来自不同有机体的组蛋白都十分相似。二、核小体把染色体分离出来,并使其逐渐解压缩,然后在电子显微镜下观察处于不同压缩状态的染色体,发现染色质的基本结构是一种11 nm粗的纤维,就像一根细线上串联着许多有一定间隔的小珠状结构。染色体就是由这种串珠状结构多层次压缩而成的。电镜下的小珠状颗粒称为核小体。每个核小体包括
4、200 bp DNA,缠绕在一个由H2A,H2B,H3和H4各两分子组成的八聚体上。核小体DNA根据其对微球菌核酸酶的敏感性被分为核心DNA和连接DNA。微球菌核酸酶能迅速地剪切无蛋白质保护的DNA序列,而对结合有蛋白质的DNA序列的剪切效率很差。核心DNA的长度为146 bp,在组蛋白八聚体上以左手方式缠绕1.65圈,形成核小体核心颗粒(nucleosome core particle)。连接相邻核小体核心的DNA称为连接DNA(linker DNA)。不同物种的核心DNA的长度相同,但连接DNA的长度是可变的,从1555 bp不等。组蛋白H1分别与核小体一端的连接DNA以及核心DNA的中部
5、结合,使DNA更紧密地盘绕在组蛋白核心上。一个核小体包括一个核心颗粒、连接DNA和一分子的组蛋白H1。巨大的细胞核DNA分子要包装成染色体需经多层次的结构变化才能实现。核小体结构可视为染色体DNA的一级包装,由直径2nm的DNA双螺旋链绕组蛋白形成直径11nm的核小体“串珠”结构。若以每碱基对沿螺旋中轴上升距离为0.34nm计,200 bp DNA(一个核小体的DNA片段)的伸展长度为68nm,形成核小体后仅为11nm(核小体直径),其长度压缩了6-7倍。三、从核小体到中期染色体若增大离子强度,并保留H1,通过电镜可观察到11 nm纤维会折叠成30 nm纤维,这种结构代表了DNA压缩的第二个层
6、次。目前较公认的二级包装结构模型是螺线管纤维(solenoidal fiber)。它是由核小体纤维盘绕形成的一种中空螺线管,其外径为30nm。H1组蛋白在维持毗邻核小体的紧密度及核小体纤维折转形成螺线管中起了重要作用。 因此,DNA包装为核小体和30 nm纤维共同导致DNA的线性长度压缩了40倍。30 nm纤维需要进一步的折叠才能成为染色体,但是折叠的细节尚不清楚。一般认为30 nm纤维形成4090 Kb的环,环的基部与柔韧的染色体骨架相连,形成伸展的间期染色体。染色体骨架螺旋化,并进一步压缩成中期染色体。目前已经发现有两类蛋白质参与核骨架的形成。一类是拓扑异构酶II,它可能参与基部相连的环状
7、DNA的形成。SMC是另一类核骨架中含量丰富的组成成分,SMC蛋白是染色体复制后进行压缩和姊妹染色单体联会机制的关键组成成分。四、真核生物染色体结构在真核生物的染色体上有几个重要的DNA元件,它们不是基因,也不参与基因表达的调控。这些元件分别是指导染色体DNA复制起始的复制起始位点、细胞分裂时引导染色体进入子代细胞的着丝粒及负责保护和复制线性染色体末端的端粒。它们对于细胞分裂过程中染色体的正确复制和分离至关重要。现在我们对每一个元件逐一加以讨论。 复制起点(origin of replication)是DNA复制开始的位点。复制起点每隔3040 Kb均匀分布在每条真核生物的染色体上。一般来说复
8、制起点位于非编码区。 着丝粒(centromere)是染色体上染色很淡的缢缩区,由一条染色体复制产生的两个姐妹染色单体在此部位相联系。着丝粒指导一个蛋白质复合体的形成,此结构也称为动粒(kinetochore)。纺锤体微管附着在动粒上,在有丝分裂后期拉动姐妹染色单体相互远离,并进入两个子代细胞。端粒(telomere)位于染色体的末端,由端粒DNA和蛋白质构成。五、异染色质、常染色质中期染色体是真核细胞中DNA压缩程度最高的状态,只有在核分裂时才出现。分裂结束后,染色体变松散,看不到单个的结构。用光学显微镜观察间期细胞核时,可以看到着色深浅不同的区域。深的区域主要集中在核的周边,称为异染色质(
9、heterochromatin),包含相对致密的结构。异染色质分为两类:组成型异染色质(constitutive heterochromatin)其DNA不含基因而可一直保持压缩状态。它包括着丝粒和端粒DNA以及某些染色体的某些特定区域,例如人的大部分Y染色体都由异染色质。与组成型异染色质不同,兼性异染色质(facultative heterochromatin)无永久特性,仅在部分细胞的部分时间出现,兼性异染色质含有基因,这些基因在某些细胞中或细胞的某些阶段失活。当这些基因失活时,其DNA就压缩成异染色质。哺乳类雌体细胞2条X染色体,到间期一条变成异染色质者,这条X染色体上的基因就全部失活。
10、常染色质在间期相对疏松,在整个细胞核中分散存在,且染色较弱。一般认为异染色质的结构是高度致密的,参与基因表达的蛋白质不能接近DNA。相反,含有活性基因的常染色质,可允许参与表达的蛋白与DNA结合。第三节:基因组的复杂性一、真核生物的复性动力学 DNA复性取决于两条单链的随机碰撞。决定复性过程的是单链DNA浓度(C0)和反应时间的乘积。用剩余的单链DNA的比例(f)对C0t作图,得到的曲线代表了DNA样品的复性动力学,这就是通常所称的C0t曲线。利用C0t1/2值可以比较不同DNA组分的复性速率。C0t1/2是DNA复性一半时的C0t值。C0t1/2越大表明达到复性一半所需要的时间越长,复性反应
11、越慢。 C0t1/2与基因组的复杂性密切相关。随着基因组复杂性的增加,在确定数量DNA中某一特定序列的拷贝数就越少。例如,大肠杆菌基因组大小为0.004 pg,总量为12 pg的大肠杆菌基因组DNA,每一序列的平均拷贝数为3 000。假如一个真核生物基因组大小为3 pg,12 pg的基因组DNA中,每一序列的平均拷贝数仅为4。因此,在确定的DNA浓度下, C0t值代表了基因组的复杂程度。一般以碱基对表示。已知大肠杆菌基因组含4.2106 bp单一序列,通常以此为标准,在相同的复性条件下,估算其他基因组的复杂性。二、快速复性组分、中间复性组分和慢速复性组分按照复性速度,可以将人类的基因组DNA分
12、成三种组分:快速复性组分(fast component)、中间复性组分(intermediate component)和慢速复性组分(slow component)。所有的真核细胞中都存在这三类DNA组分,但每类组分所占的比例变化很大,比如与哺乳动物相比,酵母基因组的快速复性组分所占比例很小。 1、快速复性组分在复性动力学实验中,大约1015的哺乳动物DNA快速复性组分,其C0t值小于0.01。快速复性组分代表着简单序列DNA。简单序列DNA又叫卫星DNA(satellite DNA),当用密度梯度离心法分离基因组DNA时,含有简单序列DNA的片断就会形成卫星带(satellite band)
13、。例如,将人的基因组DNA截断成50100 Kb的片段,就会形成一个主带(浮力密度为1.701 gcm-3)和三个卫星带(1.687, 1.693以及1.697 gcm-3) 简单序列DNA集中分布在染色体的特定区段。简单序列DNA一般是串连重复序列,它们在染色体中成簇存在,因此常用原位杂交(in situ hybridization)方法进行定位。大部分简单序列DNA靠近染色体着丝粒、端粒或近端粒区。2、中间复性组分大约2540的哺乳动物DNA为中间复性成分,其C0t值位于0.01至10之间。中间复性组分又称中度重复DNA,含有几个不同的家族,其长度和拷贝数差别很大。 (1)分散重复序列绝大
14、多数中度重复DNA一般分散在整个基因组中,因此又称散布重复DNA(dispersed repetitive DNA)。散布重复DNA分为两类:短散布元件(short interspersed elements, SINEs)和长散布元件(long interspersed elements, LINES)。 SINES的长度为150300 bp;LINES的长度为5 0007 000 bp。在人类基因组中最常见的SINE是Alu,Alu家族每个成员的长度约300bp,拷贝数接近1百万,各拷贝有8090的相似性,大多数含有AluI 限制性位点(AGCT) ,因而定名为Alu序列(或Alu家族)。
15、由于每个单位长度中有一个限制性内切酶Alu的切点从而将其切成长130和170bp的两段,Alu序列分散在整个人体或其他哺乳动物基因组中,在间隔DNA,内含子中都发现有Alu序列,平均每5 kb DNA就有一个Alu顺序。(2)串联基因簇中度重复序列还包括几种串联基因簇(Tandem gene clusters)。基因簇是由一组相同或相关的基因串联在一起形成的。rDNA就是其中的一例。它是编码18S、5.8S和28S rRNA的45S前体的基因,在基因组中有约1010 000个拷贝,拷贝数因物种而异。人类基因组中,45S成簇排列,分布在5个不同的染色体上,每一组约含40个拷贝。一个rRNA基因簇
16、(rDNA簇)含有许多转录单位,转录单位之间为不转录的间隔区,该间隔区由21-100 bp片段组成的类似卫星DNA的串联重复顺序。转录单位和不转录的间隔区构成一个rDNA重复单位。(3)慢复性成分大约5060的哺乳动物基因组DNA复性得特别慢, C0t值约为100至10 000。慢复性组分属于单拷贝序列。根据孟德尔遗传学,在单倍体基因组中,每一个基因只有一个拷贝,所以单拷贝DNA组分包含了绝大多数编码mRNA的基因。但是并非每一单拷贝序列都有功能。事实上,只有一小部分的总DNA编码蛋白质或功能RNA分子。其余的单拷贝DNA为位于功能序列之间的间隔DNA(intervening sequence,spacer DNA)。