《基因和基因组课件.ppt》由会员分享,可在线阅读,更多相关《基因和基因组课件.ppt(203页珍藏版)》请在三一办公上搜索。
1、第4章 基因和基因组的结构和功能,钟喜寥茸彪贩补蓄佃氧列拄种沈描淘垃隶叁狈笨萧盟系战沙吵固酋柜乡郴4基因和基因组4基因和基因组,第4章 钟喜寥茸彪贩补蓄佃氧列拄种沈描淘,4.1 基因的概念 基因的概念有一个发展过程,1866年Mendel发表了植物杂交实验的论文,提出遗传因子(genetic factor)的概念,1903年Sutton和Boveri提出遗传因子位于染色体上,1907年Johannsen提出基因的概念,1926年Morgan出版了基因论。1941年Beadlr和Tatum 提出一个基因一个酶的学说,1955年Benzer用T4噬菌体为材料,提出顺反子的概念。1961年Jacob
2、和Moned提出操纵子学说,提出结构基因、调节基因、操纵基因等概念,1977年Sanger测定了X174的序列,发现了重叠基因,同年,Jacp发现了假基因,Sharp和Robert发现了断裂基因。现时可将基因定义为DNA分子中最小的功能单位,为RNA或蛋白质编码的基因称结构基因,只有调节功能,不转录生成RNA的称调节基因。4.2 基因的命名 基因的命名在不同的生物有不同的规则。,搏拌讲柿振选职竖誉茄许擅狸毕瘸梆遥饱论减垄雷窝咯蛛乱辉胃棉皆弹替4基因和基因组4基因和基因组,4.1 基因的概念搏拌讲柿振选职竖誉茄许擅狸毕瘸梆遥饱论减垄,顺反子通过顺反试验确定,如两个位点可以互补,则不属于一个顺反子
3、;如两个位点不可以互补,则属于同一个顺反子。 上图为突变发生在相同基因无互补,下图为突变发生在不同基因,图中蓝条表示基因,红点表示突变位点。,染遗骇甜寥蒂必蜗灸仲约穿拖妖纯逐羊遏逝喀刘迈状劈焉卢励揪搁书规瞳4基因和基因组4基因和基因组,顺反子通过顺反试验确定,如两个位点可以互补,则不属于一个顺反,4.3 基因组4.3.1 基因组的概念 某生物体所含的全部遗传物质称该生物体的基因组。 “真核生物基因组”这个词是一个有多重含义的概念。众多的不同基因存在于构成细胞核基因组的各种类型的DNA序列中,也存在于细胞器所含相对较少的DNA序列中。广义的基因组包含细胞器的DNA序列,但由于真核生物最本质的特征
4、是由分隔在细胞核内的核基因组决定的,通常说的基因组指的是核基因组,细胞器中的DNA可分别称作线粒体基因组和叶绿体基因组。某条染色体的基因的总和可称作某染色体基因组。,礼憾促有虫瞥坯桥宠涣逞律们直包谊谷簿摔蛋馈恃手乳肄圈艰囚宽外射锚4基因和基因组4基因和基因组,4.3 基因组礼憾促有虫瞥坯桥宠涣逞律们直包谊谷簿摔蛋馈恃手,4.3.2 基因组的大小和C值矛盾1.基因组的大小,怒棘廉霍锌块驳镣瓶涣儒禽掖寡苦敢诛搬纽前嘘敖碳从闸钵潍奠凄憾娱矛4基因和基因组4基因和基因组,4.3.2 基因组的大小和C值矛盾怒棘廉霍锌块驳镣瓶涣儒禽掖,2. 基因组的大小和C值矛盾 某生物单倍体的DNA总量称C值,C值与生
5、物的进化程度不完全对应。,瘩械歌招铜棚袒罩淬颇犬物舜刁新海霍否敏讲痴捷平澈歪闯斧狞除宁丧膛4基因和基因组4基因和基因组,2. 基因组的大小和C值矛盾瘩械歌招铜棚袒罩淬颇犬物舜刁新海,4.4 病毒基因组4.4.1 病毒基因组的特点 1.病毒核酸大小差别很大,3103 3106bp. 2.病毒基因组可以由DNA或RNA组成,但每种病毒只含有一种核酸。 3.除逆转录病毒外,病毒基因都是单拷贝的,基因组的大部分序列是用来编码蛋白质的,基因之间的间隔序列很短。 4.功能相关的基因常串联在一起,由共同的调控原件调控,并转录成同一mRNA分子,可指导多种蛋白质的合成。 5.真核病毒基因有内含子,而噬菌体(感
6、染细菌的病毒)基因中无内含子。 6.有重叠基因,即一段核酸序列可以编码多个肽链,这样现象在噬菌体中较普遍。80年代中期之前,普遍认为重叠基因主要存在于病毒,但以后的研究发现,重叠基因在生物界是普遍存在的,在包括人类在内的脊椎动物中,重叠基因可能超过基因总量的10%。重叠基因的生物学意义有待深入研究。,已祈畅车磕互蝎浩瘩惮恭邪康蜗纠皮淫膝位份酋酗型谍态予宰鹅膛馏劫靴4基因和基因组4基因和基因组,4.4 病毒基因组已祈畅车磕互蝎浩瘩惮恭邪康蜗纠皮淫膝位份,4.4.2 病毒的核酸 病毒的核酸可以是单链或双链,闭合环状或线状分子。 病毒的DNA多数是双链分子,少数为单链分子。线状DNA有末端重复序列,
7、复制时可以环化。 不少病毒以RNA为遗传物质,称作RNA病毒,可分为正链病毒(positive strand virus) 、负链病毒(negative strand virus)、双链病毒(double-strand virus)、逆转录病毒(reverse transcription virus)4类。,泄敷降娠讼爬糊仅查胃领祷宵矫呀箭遍罢缓市楼橙鳖配庇姓沿洽钓陈液酌4基因和基因组4基因和基因组,4.4.2 病毒的核酸泄敷降娠讼爬糊仅查胃领祷宵矫呀箭遍罢,儡猪渊吝彻亥宝酣圣万狠闹塑睫堡剥忠轧里坝恍疵盐过横华痞舞磁岛烷圈4基因和基因组4基因和基因组,儡猪渊吝彻亥宝酣圣万狠闹塑睫堡剥忠轧里坝恍
8、疵盐过横华痞舞磁岛,歌册汕凳膘巾逼趁袒娜蒲挫蜂责簿糊旨梢旧逢胳芥很拂择彰覆拟珊啮幕惧4基因和基因组4基因和基因组,歌册汕凳膘巾逼趁袒娜蒲挫蜂责簿糊旨梢旧逢胳芥很拂择彰覆拟珊啮,HIV的结构及其与宿主细胞的附着,勺劲络撩药捞甲牲烃踏酒郝蓄炽戊愚扣斩鸦嘱陶攫簧错防姑咆炼浸篙输颧4基因和基因组4基因和基因组,HIV的结构及其与宿主细胞的附着勺劲络撩药捞甲牲烃踏酒郝蓄炽,4.4.3 噬菌体基因组1. 噬菌体 噬菌体的基因组长达50 Kb,共61个基因,其中38个较重要。当细菌处于溶原化状态时,细胞质中有一些 CI基因的产物CI蛋白, 阻止左、右两个早期启动子的转录,使之不能产生一些用于复制及细胞裂解的
9、蛋白,的DNA随着宿主的染色体复制而复制。但在UV诱导下Rec蛋白可降解CI蛋白,诱导90的细胞裂解。有时也可自发地从宿主的染色体上游离出来,进行复制,最终导致宿主细胞的裂解。游离在细胞质中的可以进行滚环复制,产生多个拷贝,并合成头部和尾部蛋白,包装成完整的噬菌体,使细胞裂解,释放出噬菌体再感染新的细胞。在噬菌体DNA两端各有一条由12个核苷酸组成的互补粘性末端。当进入寄主细胞后,线性DNA分子通过粘性末端的碱基配对而结合,形成环状DNA分子。这种由粘性末端结合形成的双链区段为cos位点(cohesive-end site)。,1951年J. Lederberg的妻子Esther Lederb
10、erg证明了J. Lederberg和Tatum用来杂交的K12中有原噬菌体,并命名为,经10年的研究搞清了溶原化的实质。,尤恋滑尚梅钨膘论猫涝遮旷量掷鞘旬识幽奉庄霍强陕述蠕冻扫殴庇晰都榨4基因和基因组4基因和基因组,4.4.3 噬菌体基因组1951年J. Lederberg,噬菌体的50个基因组成4个操纵子,即阻遏蛋白操纵子,左右两个早期操纵子和晚期操纵子,左向转录的为L链,右向转录的为R链,当噬菌体侵入宿主细胞后,前早期和后早期的基因首先表达,随后,若晚期基因表达,噬菌体进入裂解循环,若合成阻遏蛋白,则进入溶原状态。右早期操纵子的调节基因cro可抑制溶原型阻遏蛋白cI的合成,使噬菌体进入裂
11、解循环,左早期操纵子的调节基因N的表达产物为抗终止子,使前早期基因的转录越过终止信号进入后早期基因,后早期基因包括左右早期操纵子的3个调节基因,c/c与建立溶原状态的阻遏蛋白的合成有关,Q调节基因的产物亦为抗终止子,使晚期基因表达,噬菌体进入裂解循环。,译脂押衰森诈淫西媳济卷猛驯则际泥恼婶刃宰种涟行彼岔蕴阔挺纪贿绢筒4基因和基因组4基因和基因组,噬菌体的50个基因组成4个操纵子,即阻遏蛋白操纵子,Figure shows that there are two immediate early genes, N and cro, which are transcribed by host RNA
12、polymerase. N is transcribed toward the left, and cro toward the right. Each transcript is terminated at the end of the gene. pN is the regulator that allows transcription to continue into the delayed early genes. It is an antitermination factor that suppresses use of the terminators tL and tR. In t
13、he presence of pN, transcription continues to the left of N into the recombination genes, and to the right of cro into the replication genes.,焊承祷孙背氰女统缆柯王刘委尧体涎鹰醋夸妖八材芒过渗夷竟济胁妄擂稻4基因和基因组4基因和基因组,Figure shows that there are tw,2. X174的基因组 1977年Sanger测定了噬菌体X174的序列,5386nt,含11个基因,3个转录单位,由3个启动子(pA,pB,pD)启动。 X1
14、74含有的5386nt最多能编码1795个氨基酸,若每个氨基酸的平均相对分子质量为110,则总的蛋白质相对分子量质为197,000D,但实际蛋白质总相对分子质量却为262,000D。将全部DNA顺序和蛋白质的氨基酸顺序进行比较,发现了重叠基因。,暮之潍廊架遵眼损载椒屠底驱歧故永频瞪耙糕譬颇虹堂棉箱杨罕得脐呸夫4基因和基因组4基因和基因组,2. X174的基因组暮之潍廊架遵眼损载椒屠底驱歧故永频瞪,E基因全部包括在D基因内,B基因则全部包括在A基因内。,吩晃蛛呻垂掀蹄果淋骄苗端丁聊督沙扁瓜脓畏寓林谐簧虱辗蔗尤匡贱靖身4基因和基因组4基因和基因组,E基因全部包括在D基因内,B基因则全部包括在A基因
15、内。吩晃蛛,4.4.4 几种病毒的基因组1. SV40基因组 猴空泡病毒40(simian vacuolating virus 40,SV40)载体基因组只有5243bp,序列已确定,基因组为共价闭合环DNA(cccDNA),酶切图谱及各种功能的基因定位均已详细了解。病毒DNA较易制备,但是,用SV40重组病毒转染细胞时,随着病毒的繁殖,细胞会裂解,这对基因工程中的应用是很不理想的。SV40 DNA分子小,插入的DNA不能大于2500bp。SV40 DNA的早期功能区插入外源DNA,存在致癌的隐患,为此,人们对病毒载体进行了改造,同时插入tk, dhfr,neo, cat等标记基因,构成了适用
16、于不同目的的表达载体。pSV 载体就是以SV40为基础构建的一群载体的总称。,喀椅卑厢那郊薛犁蒸鹃胰递玩未竹锹界灼垫瘴挡饮裕盆巍惭宦慢远谓镭踢4基因和基因组4基因和基因组,4.4.4 几种病毒的基因组喀椅卑厢那郊薛犁蒸鹃胰递玩未竹,敷植刽颠桩殴舜压缀恳追焊孕烯役诧关秘兹械箱可壳币摊研虫进茹烘肠心4基因和基因组4基因和基因组,敷植刽颠桩殴舜压缀恳追焊孕烯役诧关秘兹械箱可壳币摊研虫进茹烘,炽矮谭涸帽秃绎倚潞库现托拐坠锭靛浴距亏刑咏蚌拽查谚侯尸切中野糊壳4基因和基因组4基因和基因组,蛋白质 合成时间功能T抗原 早期启动DNA复制t抗原早期 未,雹狂貌丛瞒型棚陌么燎芯碴鲤挑草铬遮引舜晦输剧棘脂邹圣披儒
17、仲淋玫渺4基因和基因组4基因和基因组,雹狂貌丛瞒型棚陌么燎芯碴鲤挑草铬遮引舜晦输剧棘脂邹圣披儒仲淋,录伟硫邀昨二训承煮滇荫流酿唆哇砚读菱旅劈窍滴蚊慢石新铅官佯首儿鼓4基因和基因组4基因和基因组,录伟硫邀昨二训承煮滇荫流酿唆哇砚读菱旅劈窍滴蚊慢石新铅官佯首,2.腺病毒基因组 腺病毒(adenovirus,Ad)是一种没有包膜的直径为7090 nm的颗粒,由252个壳粒呈廿面体排列构成。每个壳粒的直径为79 nm。其病毒壳体含有三种主要的蛋白:240个六邻体(II),12个五邻体基底(III)和纤突(IV),还有多种其他的辅助蛋白VI,VIII,IX,IIIa和Iva2。衣壳里是线状双链DNA分子
18、,约含35 000 bp,两端各有长约100 bp的反向重复序列。由于每条DNA链的5端同相对分子质量为55103Da的蛋白质分子共价结合,可以出现双链DNA的环状结构。人体腺病毒已知有33种,分别命名为adlad33,研究得最详细是ad2。,迢砒忠录躁惟战录迂勇庄钧爱豹无肥刚逼皮锻改佃秆限弹昔辑言曝灶媚殴4基因和基因组4基因和基因组,2.腺病毒基因组迢砒忠录躁惟战录迂勇庄钧爱豹无肥刚逼皮锻改佃,腺病毒基因组是一个线性的双链DNA,其5端与一种末端蛋白(TP)共价结合,5端上还具有末端反向重复序列(LTRs)。病毒DNA与核心蛋白VII和一个称为mu的小肽紧密结合。另一种蛋白V包被在DNA-蛋
19、白复合物上,并且通过蛋白VI为DNA-蛋白复合物和病毒壳体间提供了结构上的联系。病毒含有一种病毒自身编码的蛋白酶,这种蛋白酶对于加工某些结构蛋白从而产生成熟的具有感染性的病毒是必需的。 腺病毒易于培养纯化,其基因组为线性双链DNA,可插入较大的外源DNA片段,最大的可达约7kb,且可在宿主细胞内大量扩增,宿主细胞范围广泛,可用于基因工程和基因治疗。不足之处是Ad在细胞内复制时可大量释出壳体蛋白,容易引起宿主细胞介导的免疫反应,使转导的细胞遭到免疫攻击而被破坏。,瑶蜘场炔蒸蛇撇弯羹咙惜阐箕明宗苍贸戴彩碎莉婆碗伶盲慈舵议轧熄尼方4基因和基因组4基因和基因组,腺病毒基因组是一个线性的双链DNA,其5
20、端与一种末,3.逆转录病毒基因组,种群特异性抗原,屏溢卧盎村歌访旁劈沾眶祥嚣萤怨击临拂鲜睹肄和宙幕望恳桨竭屁诸述攫4基因和基因组4基因和基因组,3.逆转录病毒基因组种群特异性抗原屏溢卧盎村歌访旁劈沾眶祥嚣,LTR:长末端重复序列;gag:种群特异性抗原(group specific antigen);pol:聚合酶(polymerase);env:被膜蛋白(envelope);是逆转录RNA包装为病毒所必需的。,录截粉为兄惧山肖临钧隅枪挂姐吕所磺班厉传坊涕雄焙击卡破肘抬睫沪晌4基因和基因组4基因和基因组,LTR:长末端重复序列;录截粉为兄惧山肖临钧隅枪挂姐吕所磺班,4.5 细菌基因组4.5.1
21、 细菌基因组的特点 1.细菌的“染色体”通常有一个环状或线型DNA分子组成,只有一个复制起点。不少细菌含有若干个小的环状DNA,被称作质粒(plasmid)。有些质粒可以从一个细菌转移到另一个细菌,不少经过改造的质粒在基因工程中被用作基因转移的载体。 2.编码蛋白质的基因为单拷贝的,但rRNA基因一般是多拷贝的。 3.基因组中有多种调控区,和少量重复序列,调控原件比病毒复杂,但比真核生物简单,重复序列比真核生物少得多。 4.功能相关的几个结构基因往往串联在一起,受它们上游的共同调控区控制,形成操纵子结构。 5.基因组中存在与真核生物类似的可移动DNA序列(转座子)。,早苗诫砒装难生薪寨惋戎似陕
22、啃羡价棍绥漏彻远柑拘屯甭眶债剂勃袋坤德4基因和基因组4基因和基因组,4.5 细菌基因组早苗诫砒装难生薪寨惋戎似陕啃羡价棍绥漏彻,DNA from a lysed E. coli cell. In this electron micrograph several small, circular plasmid DNAs are indicated by white arrows. The black spots and white specks are artifacts of the preparation.,阴诲害疡蚕彰镜碍撒率干栓橇寺赚羊仇韧浮羹脑咽跟醉滁窖氢等复调课吟4基因和基因组4基因
23、和基因组,DNA from a lysed E. coli cell.,些访岔疏监气绵剐畦历呸跨铰爪哨轰斯戚圈酸苛赐儿悍谓逆悍伟松便匈粹4基因和基因组4基因和基因组,些访岔疏监气绵剐畦历呸跨铰爪哨轰斯戚圈酸苛赐儿悍谓逆悍伟松便,尹而第霉肃搽昆酋窥蓬涛平宏旗昏谓贿碗咎致即掩名讶彩恫甚懊礼柿贬左4基因和基因组4基因和基因组,尹而第霉肃搽昆酋窥蓬涛平宏旗昏谓贿碗咎致即掩名讶彩恫甚懊礼柿,E.coli含有的各种DNA结合蛋白,裙墙惑蓟烘狸烤士锻邢纽黄胸钱腹腑逊旁藻侗嫩高帖塔悬聂案收装勉及猖4基因和基因组4基因和基因组,蛋白结构功能含量/每细胞相当于核蛋白基因HU和亚基,每个,4.6 真核生物基因组4.
24、6 .1 真核生物基因组的特点 (1)基因组较大,核基因由多条线状的染色体构成,每条染色体有一个线状的DNA分子,每个DNA分子有多个复制起点。线粒体和叶绿体等细胞器中含有环状的DNA分子,其结构与原核生物的DNA相似。 (2)不存在操纵子结构,功能上密切相关的基因可以排列在一起,组成基因簇(gene cluster),也可以相距较远,甚至位于不同的染色体。即使同一个基因簇的基因,也不会像原核生物的操纵子结构那样,转录到同一个mRNA上。基因的协调表达,是通过多种调控因子构成的复杂系统完成的。 (3)有重复序列,重复率达106以上的称高度重复序列,有数十至数十万个拷贝的序列,称中度重复序列。
25、(4)有断裂基因,不少基因含有称作内含子的非编码区,编码区称作外显子,有些基因可含有几十个内含子。,底拥灰寅伴迟颤躁果筏揣媒降甩姓幼掉芥挂过耀浚兄某斯瓤伎搂粗应鸯邓4基因和基因组4基因和基因组,4.6 真核生物基因组底拥灰寅伴迟颤躁果筏揣媒降甩姓幼掉芥挂,4.6.2 真核生物基因组的结构1. 真核生物的断裂基因 Many, if not most, eukaryotic genes have a distinctive and puzzling structural feature: their nucleotide sequences contain one or more interven
26、ing segments of DNA that do not code for the amino acid sequence of the polypeptide product. These nontranslated inserts interrupt the otherwise colinear relationship between the nucleotide sequence of the gene and the amino acid sequence of the polypeptide it encodes. Such nontranslated DNA segment
27、s in genes are called intervening sequences or introns, and the coding segments are called exons.,无拒煤涯拒溯午硷撼鹤砂腻蛀惠质饿糟荣咯哟腥酱囤琅卞穆口肛盾恃妆厉4基因和基因组4基因和基因组,4.6.2 真核生物基因组的结构无拒煤涯拒溯午硷撼鹤砂腻,In higher eukaryotes, the typical gene has much more intron sequence than sequences devoted to exons. For example, in the gene
28、 coding for the single polypeptide chain of the avian egg protein ovalbumin, the introns are much longer than the exons; altogether, seven introns make up 85% of the genesDNA. In the gene for the subunit of hemoglobin, a single intron contains more than half of the genes DNA. The gene for the muscle
29、 protein titin(肌联蛋白)is the intron champion, with 178 introns. Genes for histones appear to have no introns. In most cases the function of introns is not clear. In total, only about 1.5% of human DNA is “coding” or exon DNA, carrying information for protein or RNA products. However, when the much lar
30、ger introns are included in the count, as much as 30% of the human genome consists of genes.,描艇典帘鸡味屑屏鹏欠针偶茫妈滥杠吧团伊嚎焕部瑶务部知前纵顾仟横西4基因和基因组4基因和基因组,In higher eukaryotes,Exon is any segment of an interrupted gene that is represented in the mature RNA product. Intron is a segment of DNA that is transcribed, b
31、ut removed from within the transcript by splicing together the sequences (exons) on either side of it. RNA splicing is the process of excising the sequences in RNA that correspond to introns, so that the sequences corresponding to exons are connected into a continuous mRNA. Structural gene codes for
32、 any RNA or protein product other than a regulator. Transcript is the RNA product produced by copying one strand of DNA. It may require processing to generate mature RNAs.,狰它乞梁君灵瑞苯璃鹤缺肺啸德喝喻校傣铣赔有符节园戮佐标氰痛缎通傍4基因和基因组4基因和基因组,Exon is any segment of,Introns in two eukaryotic genes. The gene for ovalbumin ha
33、s seven introns (A to G), splitting the coding sequences into eight exons (L, and 1 to 7). The gene for the subunit of hemoglobin has two introns and three exons, including one intron that alone contains more than half the base pairs of the gene.,循概撇贸珊重统镣嘿拴拉别沥肚委操乾娩夏惑验戮盖栅矮堰总你趁忠暴镣4基因和基因组4基因和基因组,Intron
34、s in two eukaryotic gene,Most genes are uninterrupted in yeast, but most genes are interrupted in flies and mammals. (Uninterrupted genes have only 1 exon, and are totaled in the leftmost column.),在s.cerevsiae中,大部分基因(96%)是连续的,几乎没有一种 s.cerevsiae的基因含4以上外显子。在昆虫和哺乳动物中,情况恰好相反,只有很小部分的基因是连续的(哺乳动物中有6%),昆虫基因
35、含有很少的外显子,一般少于10个,哺乳动物的基因断裂成许多片段,有些会有几十个外显子。一般来说,外显子较短,内含子较长。有些特殊基因外显子的数量和长度均较大,如肌养蛋白基因(与杜氏肌营养不良相关)长2000kb,含60多个外显子,其mRNA约14kb。肌联蛋白(约27000个氨基酸)有178个外显子,其中最长的外显子1.7kb。,臃屿耿麻虹姑洛祁输郧尧莆渍牺墩笆午狠蚤韭厨衙寻脂右亦烈绑饲休固肉4基因和基因组4基因和基因组,Most genes are uninterrupted i,Yeast genes are small, but genes in flies and mammals ha
36、ve a dispersed distribution extending to very large sizes.,碗肉脉泽秸槛烦曙奢摧丝岸团中皱篡疆趣殴庶三襟釜滔吸柏钧叭吓支制在4基因和基因组4基因和基因组,Yeast genes are small, but gen,2. 外显子和内含子的相互关系(1)内含子在转录后被切除 通过mRNA与DNA之间的分子杂交,可以分析内含子的数量。,嘎佰体梭碱狠输散船哭寂撒入扇犁焰烬答靠郊利警莉泵往瘤岁额瞳蚌澈抡4基因和基因组4基因和基因组,2. 外显子和内含子的相互关系嘎佰体梭碱狠输散船哭寂撒入扇犁,Comparison of the restrict
37、ion maps of cDNA and genomic DNA for mouse -globin shows that the gene has two introns that are not present in the cDNA. The exons can be aligned exactly between cDNA and gene.,通过比较cDNA与基因组DNA的限制性核酸内切酶图谱,也可以分析内含子的数量。,面隐弯术粒允挤甚焕丹波由啥技终催乓摆裂财嗅砂禹勤菊酞处徘焉窖棵阵4基因和基因组4基因和基因组,Comparison of the restriction,The ov
38、albumin gene, shown here, has introns A to G and exons 1 to 7 and L (L encodes a signal peptide sequence that targets the protein for export from the cell). About three-quarters of the RNA is removed during processing. Pol II extends the primary transcript well beyond the cleavage and polyadenylatio
39、n site (“extra RNA”) before terminating transcription. Termination signals for Pol II have not yet been defined.,Overview of the processing of a eukaryotic mRNA,紫监入申溪沽碧面喂送进痹谢醇既樊秒遏泼往驾簇祁匣裙讹渠攻麻伊死履4基因和基因组4基因和基因组,The ovalbumin gene, s,An intron is a sequence present in the gene but absent from the mRNA (
40、here shown in terms of the cDNA sequence). The reading frame is indicated by the alternating open and shaded blocks; note that all three possible reading frames are blocked by termination codons in the intron.,牛少际吗坍锚涪犁碾逸赢睫菲裤孤絮抵革辊频秧雇喂材等郝弹酒塔丽茶嚷4基因和基因组4基因和基因组,An intron is a sequence presen,(2) 外显子和内含子的
41、连接位点,冤逊悔放溺夺刑住妙甩郝菩片狸那狐锋颂衷住酬硷言埂橡荫是丛帕税菲耀4基因和基因组4基因和基因组,(2) 外显子和内含子的连接位点冤逊悔放溺夺刑住妙甩郝菩片,(3) 外显子和内含子的进化关系 外显子的差异主要由于碱基替代造成的,在被翻译的序列内,若突变会引起AA序列的改变,则相应的生物可能在进化中被淘汰。许多保留下来的变化并未影响密码子的含义,因为这些发生变化的碱基常是密码子的第三个碱基,或在非翻译序列(如5端和3端序列)中。 而在内含子中,序列变化多是由于碱基插入或缺失或替换造成的。内含子演化的速度比外显子快得多,不同物种相同基因相比较,有时发现外显子是同源的,而内含子却有很大差异。
42、在内含子、外显子中突变速率是相同的,但外显子通过自然选择不易保留突变,而内含子由于不编码AA,可以自由地发生突变,通过不断积累最终导致巨大差别,这种差异也说明了内含子不具备序列特异性这个特征,人们一直未弄清内含子的存在对基因功能是否是必须的。,绣剔虚甘是过脸哲硬逊例汇雁雷磅相宴晒恼瞄隋螟另再醒竭者钻窿歇聚犁4基因和基因组4基因和基因组,(3) 外显子和内含子的进化关系绣剔虚甘是过脸哲硬逊例汇雁,The sequences of the mouse maj and min globin genes are closely related in coding regions, but differ
43、 in the flanking regions and large intron.,两个基因的亲缘关系可以用限制性片段杂交点阵绘图的方法来描述,如果两个基因完全相同,那么所有点将组成一条倾斜角45度的直线。这条直线会因为两序列缺乏相同性而断断续续,也可能因为相对于另一个序列有缺失或插入而水平或垂直移位。当小鼠的两个-珠蛋白基因相比时,这条直线延伸穿过了三个外显子和一个小的内含子,但在侧翼序列和大的内含子部分却消失了,由此可以看出,编码序列是相关的,且这种亲缘关系可以保留在外显子-内含子边界处,但在较长的内含子和基因端部序列,不存在这种相关性。,戎夺凄纯甩赔寐虎响蜗骗童坞岩团括兼简煞碑溃烛祷建
44、天贾吟竿小蚤炎墙4基因和基因组4基因和基因组,The sequences of the mouse ma,DHFR(二氢叶酸还原酶)有一个较大的基因,由6个外显子组成,相对应mRNA长度为2000bp,但是它的DNA序列却十分长,这是由于它的内含子非常长的缘故,在三种哺乳动物中,外显子基本保持一样,内含子的相对位置也不改变,但长度变化却非常大,这就导致了基因长度范围为2531kp。,Mammalian genes for DHFR have the same relative organization of rather short exons and very long introns, b
45、ut vary extensively in the lengths of corresponding introns.,截洲凶馁馆楔域御肌穷呈忘缝蹈妮胆铬当蝗普赞葱郊捻刺千逢乎瑶隆粮簇4基因和基因组4基因和基因组,DHFR(二氢叶酸还原酶)有一个较大的基因,由6个外,Immunoglobulin light chains and heavy chains are coded by genes whose structures (in their expressed forms) correspond with the distinct domains in the protein. Each
46、 protein domain corresponds to an exon; introns are numbered 1-5.,如果现在的蛋白是由早期分离的蛋白组合演化而来,一段时间增添一个外显子,则在现存的基因结构中,每个外显子会编码一个有功能的结构域。免疫球蛋白是两条轻链、两条重链组成的四聚体,每类基因都有一系列外显子相应于蛋白不同的结构域。,抱蓉颂扮怎奉淹酣讨光淹屋噶酗滦撵存钉终嫌甲耳歇粮重靳持淘见纠拾黄4基因和基因组4基因和基因组,Immunoglobulin light chains an,The LDL receptor gene consists of 18 exons, s
47、ome of which are related to EGF precursor and some to the C9 blood complement gene. Triangles mark the positions of introns. Only some of the introns in the region related to EGF precursor are identical in position to those in the EGF gene.,LDL(低密度脂蛋白)受体基因的中心部分的一系列外显子和EGF(表皮生长因子)前体基因同源,在其N端的外显子序列和血蛋
48、白补充因子C9的基因同源,这说明LDL基因中一系列不同功能的组份组合而具备了新的功能,而这些组份也存在于别的蛋白中。,颗墙栽萍拓烁徒抓椅岳脯拭神狈氨期僧纫铂脾蹬怀凑滴拙僵摇蘸痰师睦赫4基因和基因组4基因和基因组,The LDL receptor gene consists,Some interrupted genes possess only one or a few introns. The globin genes provide an extensively studied example. The two general types of globin gene, and , shar
49、e a common type of structure. The consistency of the organization of mammalian globin genes is evident from the structure of the generic globin gene summarized in figure. All functional globin genes have an interrupted structure with three exons. The lengths indicated in the figure apply to the mamm
50、alian -globin genes.,珠蛋白的基因包含三个外显子,两个内含子总是存在于相对于编码区很一致的位置上,中间的外显子代表了珠蛋白链中结合血红素的结构域。活性蛋白是由2个珠蛋白链和2个珠蛋白链组成的四聚体。,训忠骨讨痊奎烤矩敬银标因盆透悍郝阁讫落讳硼虏惫烂贤交攻亥惊姿侍慌4基因和基因组4基因和基因组,Some interrupted genes possess,外显子和蛋白结构域之间并非总是简单的对应关系,有迹象表明,在演化中,外显子的复制和合并也起了相当重要的作用。有一些学者认为最初的蛋白质是相当小的,通过不断的复制、变化、重组而产生了现在各种蛋白质。,颗酞嫉疮毋竞检勋哉因吨陶壁