《第3节单一顺序和重复顺序课件.ppt》由会员分享,可在线阅读,更多相关《第3节单一顺序和重复顺序课件.ppt(43页珍藏版)》请在三一办公上搜索。
1、第三节 单一顺序和重复顺序,一. 单一顺序 (Unique sequence )二. 重复顺序 短片段的重复顺序可分为三种类型:(1)正向重复(direct repeats)又叫顺向重复;(2)反向重复(inverted repeats) ;(3)回文顺序 (Palindromic sequence) 5 GTGAGCTCAC 3 3 CACTCGAGTG 5,单一序列(非重复序列):,基因在基因组中只有一个或几个拷贝,真核细胞中占40%-70%。真核细胞的大多数基因是单拷贝的,但是单一序列中只有百分之几的序列是编码基因的。而原核基因组中,大多数的单一序列是编码基因的。,正向重复:,正向重复(
2、direct repeats)又叫顺向重复,这种重复序列的方向是相同的。比如l噬菌体的复制起点中的重复序列以及真核转座因子Ty,copia的两端,插入序列,转座子的两端的宿主序列以及端粒结构等,反向重复(Inverted repeats ):,同一个序列的两个拷贝在一个分子中以相反的方向重复,相邻重复组成回文序列。由反方向互补的两个DNA片段组成,两个反转重复序列又叫回文序列(palindrome sequence)。呈两侧对称的序列,常存在于插入序列和转座子两端的结构元件中。,画上荷花和尚画,书临汉字翰林书,正反相同,在高度重复序列中,有一种是反向重复序列,也叫回文结构;长度不等,从几个核苷
3、酸到几百个核苷酸等。,这种反向重复序列在基因组中很多,据推测可能与基因的复制、转录等调控有关。,与DNA结合的蛋白质多以二聚体的形式结合,这时会发现结合位点的DNA多具有回文结构的特点。,回文结构的意义:1)是限制性内切酶的识别位点。2)具有调节基因的表达作用,如色氨酸操纵子的前的弱化子。3)转录终止时的识别结构。4)有利于稳定RNA的结构和行使功能。5)基因工程中DNA序列的方便操作。,三.轻度重复顺序和中度重复顺序,轻度重复顺序 在基因组中含有2-10拷贝 , 酵母tRNA基因、人和小鼠的珠蛋白基因等。中度重复顺序 长约300bp 基因组中约有10-几千个拷贝的顺序 如rRNA和tRNA基
4、因 tRNA基因一般都分布于基因组中,而rRNA常集中分布于核仁形成区。,四 Alu家族,长约300bp;Alu顺序也称为短的分散因子(short interspersed elements, SINEs)。 由RNA多聚酶III转录的。 在基因组中30 万个拷贝; 在170bp处有一AluI 的酶切位点; 由两个130bp的串联重复顺序组成; 在二聚体的右半部有31bp插入序列,此插入 顺序来自7SL RNA。 Alu顺序有何应用价值?,在人基因组中Alu基因家族是一个中等重复序列,长度在300bp左右,单倍体基因组中有30万份,分散在各染色体上。,在170 bp处有一个限制性酶切位点Alu
5、。基因组中平均每5kb出现一次Alu序列,因此在基因的内含子以及基因附近的序列中有许多。,Alu家族的每一个成员都很相似,由130 bp的串联重复组成,常见的是二聚体形式,在右半部分的中部有一个31 bp的无关序列插在中间。这个插入序列(IS)来自7SL(是信号识别蛋白SRP的一个成分)。,31 bp IS,Alu家族的广泛存在说明其可能具有某种功能,但是目前还不十分了解。,在小鼠体中有一种和Alu序列同源的序列叫做B1家族,约有5万个成员。重复单位为130 bp,相当于Alu序列的一个单体,和Alu序列的同源性为70%-80%。,Kpn家族是中度重复顺序中仅次于Alu家族的第二大家族。用限制
6、性内切酶Kpn消化人类及其它灵长类动物的DNA,在电泳谱上可以看到4个不同长度的片段,分别为1.2,1.5,1.8和1.9kb,这就是所谓的Kpn家族。Kpn家族成员顺序比Alu家族更长(如人Kpn顺序长6.4kb),而且更加不均一,呈散在分布,属于中度重复顺序的长分散序列。 Kpn家族的拷贝数约为30004800个,占人体基因组的1 。,Hinf家族:这一家族以319bp长度的串联重复存在于人体基因组中。用限制性内切酶Hinf消化人体DNA,可以分离到这一片段。Hinf家族在单位基因组内约有50100个拷贝,分散在不同的区域。319bp单位可以再分成两个亚单位,分别为172bp和147bp,
7、它们之间有70%的同源性。,五. 高度重复顺序,卫星DNA (satellite DNA) 隐蔽卫星DNA(cryptic satellite) 自私 DNA(selfish DNA) 伊甸园 DNA (Garden of Eden DNA) 小卫星 (minisatellite ) 重复序列可变数(variable number tandem repeat VNTRs) DNA指纹(DNA fingerprints),高度重复是一种简单的重复序列,有的重复单位不超过6 bp,但是重复的次数可以达到几十万次之多,故称为高度重复序列,也叫做卫星DNA。,卫星DNA:是高等真核生物基因组重复程度最
8、高的成分,由非常短的串联多次重复DNA序列组成,一般占基因组的10%-30%。因为其序列复杂性不高,所以有时称为简单序列DNA;卫星DNA以大的基因簇分布(100-3000 kb),常位于异染色质的着丝粒,可能在染色体的功能中起作用。,有一些比较复杂的卫星DNA据推测可能是从简单的短序列重复发展变化而来的。,一般这些序列中的GC含量与其他的主体DNA不同(例如小鼠中为30%,低于其主体DNA的42%GC含量)。所以在进行氯化铯密度梯度超离心时,这些DNA由于密度小,会与主体的DNA带分开而出现在上面,所以称为卫星DNA。,也有的卫星DNA密度比主体DNA密度大,出现在主体DNA的下面。隐秘的卫
9、星DNA是指与主体DNA的密度类似,使用氯化铯密度梯度超离心不能分开的高度重复序列,但是可以通过其他的方法将其分离出来。,人们开始时认为这些高度重复的DNA序列没有什么功能。近来发现与DNA复制、基因表达的调节、基因的转位、减数分裂时染色体的配对等过程有重要关系。,等位小卫星DNA是指小卫星中含有的重复序列数目相同;反之,不等位小卫星DNA是指小卫星中含有的重复序列数目不同。,卫星DNA : 基本单位长度 171 bp小卫星DNA:基本单位长度15-65 bp微卫星DNA:基本单位长度2-8 bp,卫星小卫星 微卫星DNA之间的基本差异,人类VNTRs的第一个探针,1985年由Alec Jef
10、fries制备 在肌红蛋白基因的第一个内含子中 分离出132bp的重复顺序 内含4个长33bp的重复单位 内有13bp为核心顺序(GGAGGTGGGCAGG),L1 家族,长6500bp左右 称为长的分散因子(long interspersed elements, LINEs) 在基因组中约6万个拷贝 由RNA多聚酶II转录的。 属于一种转座因子,DNA,非重复序列,轻度重复序列,中度重复序列,高度重复序列,单一序列,一个基因组中只有一个拷贝,一个基因组中有2-10个拷贝,一个基因组中有10-几百个拷贝,一个基因组中有几百-几百万个拷贝,卫星DNA,小卫星DNA12-100 bp,微卫星DNA
11、1-5 bp,基因簇(gene cluster):功能相关,紧密连锁基因家族(gene family):起源相同,结构功能相似假基因(pseudogene)加工假基因(processed pseudogenes)。 有以下的特点: 缺少正常的内含子; 3末端有多聚腺苷酸; 5端的结构和mRNA的5端十分相似; 两侧有顺向重复顺序的存在 。 对以上特点作何推论?因此人们推测它似乎和mRNA一样经过了转录后加工,因此也称其为加工假基因;,基因簇(gene cluster):基因家族中的各成员紧密成簇排列成大串的重复单位,定于染色体的的特殊区域。基因簇少则可以是由重复产生的两个相邻相关基因所组成,多
12、则可以是几百个相同基因串联排列而成。他们属于同一个祖先的基因扩增产物。也有一些基因家族的成员在染色体上排列并不紧密,中间还含有一些无关序列。但总体是分布在染色体上相对集中的区域。,基因家族(gene family):一组功能相似且核苷酸序列具有同源性的基因。可能由某一共同祖先基因经重复和突变产生。基因家族的特点:基因家族的成员可以串联排列在一起,形成基因簇(gene cluster)或串联重复基因(tandemly repeated genes),如 rRNA、tRNA 和组蛋白的基因;有些基因家族的成员也可位于不同的染色体上,如珠蛋白基因;有些成员不产生有功能的基因产物,这种基因称为假基因。
13、a1 表示与 a1相似的假基因。,不同的基因家族中成员的数目不等,功能也各异。基因家族的成员有的位于同一条染色体上,串联在一起,而有的分散在不同的染色体上。,如果有的成员因为变异而失去了原有的功能,或不能再进行表达形成有功能的产物,则称为假基因。,典型的基因家族: 1tRNA 基因 单倍体人基因组中 1300 个 tRNA 基因,tRNA 基因簇; 2rRNA 基因 l00copyrRNA 基因簇(重复单元 28S、18S、5.8s-rRNA) 3组蛋白基因 30-40copy定位:7q32-q36 组蛋白基因簇(重复单位:H1,H2A,H2B,H3、H4)。4珠蛋白基因 类:16p13,基因簇(24Kb):5-1-2-1-3 类:11p15,基因簇(60Kb):5- -Gr-Ar-3。,