《基因起源与进化.ppt》由会员分享,可在线阅读,更多相关《基因起源与进化.ppt(49页珍藏版)》请在三一办公上搜索。
1、新基因的 起源与进化,The origin and evolution of new genes,随着基因组数据的大量积累,人们越来越认识到不同生物在基因组大小及基因数目上存在巨大的差异。从仅含470个基因的支原体Mycoplasma genitalium到约含3万多个基因的人类基因组,相差达数十倍;即使是果蝇等分化时间很短的近缘物种,其基因种类和数目也不尽相同。这种差异引出一个根本性的生物学问题:基因是怎样产生的?,如果弄清基因形成和固定机理,科学家就能深入探讨物种的形成和分子进化、物种进化之间的关系,也能根据基因产生的规律设计新的生物活性药物。所以说,研究基因的起源机制,实际上是探究生命演
2、变的根源,同时也具有重要的应用科学意义。,被称为“生命编码”的基因序列,记录着最原始最真实的生命进化信息。,但已经获得的基因组数据中,大多数的基因产生太早,在漫长的进化时间中积累的大量突变,早已湮没了大部分重要的进化信息。许多关于新基因起源的细节随着漫长的进化年代都丢失了。与那些古老的基因相比,年轻基因由于产生时间短,保留了大量进化过程中的重要信息,可以提供给人们新基因进化早期的结构、序列信息,有助于推断其起源机制及进化力量,是研究新基因产生的理想材料。,因此,科学家迫切需要一些年轻的新基因起源实例,作为近距离观察新基因起源的分子机制和进化的动力学过程的研究材料。,新基因起源研究现状,人们对新
3、基因起源问题的兴趣,可以追溯到上世纪30年代。Haldane和Muller提出:通过基因重复可以产生新的基因。此后随着分子生物学实验手段的进步和遗传学的发展,染色体重复、基因家族和断裂基因等大量实验现象进入人们视野,在此基础上提出了一些新基因产生的假说。20世纪80年代中期以后大规模基因组序列信息的获得以及分子进化和群体遗传学理论的成熟,更使得在基因组水平的理论预测成为可能。,然而由于基因组中的大多数基因产生太早,在漫长的进化时间中积累的大量突变早已湮没了大部分重要的进化信息,无论是基因最初产生的分子机制或是随后在群体中扩散并最终固定下来的群体动力学过程,都已无法直接观察和检测。20世纪90年
4、代以前,有关这一问题的探讨基本上是设想性或理论性的。人们迫切需要能够获得一些年轻的新基因起源的实例,使人们能够以实验的手段近距离观察并阐明新基因起源的分子机制和进化的动力学过程。,1993年,华裔学者龙漫远在果蝇中发现了第一个年轻的基因Jingwei基因(约2.5 My),才使以实证方法研究新基因起源的分子机制成为可能,对新基因发生的研究掀开了新的一页。近年来,又有大约20来个新基因被报道,包括司芬克斯(sphinx)基因和猴王基因等。,新基因的产生与进化(Sources and evolution of new genes),研究一个新基因的起源的两个步骤 首先,我们要知道一个新的基因结构在
5、自然界的某一生物个体产生的突变步骤。其次,我们需要知道这一单一个体的新基因扩散到一个物种所有个体的固定过程。,AFGP,antifreeze glycoprotein;CG,chorionic gonadotropin polypeptide;Cid,centromere identifier;DAF,decay-accelerating factor;HLA-DR-1,major histocompatibility complex DR1;PGAM3,phosphoglycerate mutase 3;Pgk2,phosphoglycerate kinase 2;PMCHL,pro-mel
6、anin-concentrating hormone-like;RNASE,ribonuclease;Sdic,sperm-specific dynein intermediate chain;UEV,tumour susceptibility gene.,新基因产生的分子机制,外显子重排(exon shuffling),外显子重排是指由来自不同基因的2个或多个外显子相互接合,或基因内部的外显子产生重复而形成新的基因结构。20世纪70年代,在真核生物中发现断裂基因后,Gilbert提出,通过内含子介导的重组,不同基因的外显子可发生互换,使得原基因结构发生变化,可能产生新的基因。目前已知两种外显
7、子重排:异常重组和逆转座子介导的外显子插入。此外,相邻基因间序列的缺失产生的基因融合也可造成外显子重排。,hamster A-crystallin gene,low-density lipoprotein(LDL)receptor Patthy surveyed protein databases systematically and showed that exon shuffling occurred in many genes of vertebrate and invertebrate organisms.New genes created by exon shuffling in p
8、lants were also observed(e.g.in potatoes and sunflowers).,精卫基因(Jingwei),通过对黑腹果蝇近缘物种新基因的筛选和分析,1993年,华裔学者龙漫远发现了第一个年轻的基因。他根据我国远古精卫溺死而又重生的故事,把这一基因称为“精卫”基因(jingwei)。,精卫填海,又北二百里,曰发鸠之山,其上多柘木。有鸟焉,其状如乌;文首、白喙、赤足,名曰精卫。是炎帝之少女名曰女娃,女娃游于东海,溺而不返,故为精卫。常衔西山之木石,以堙于东海。山海经北山经,基因复制(Gene duplication)基因重复是人们最早认识到的新基因产生机制。这
9、个经典的机制认为,通过重复产生的冗余拷贝,由于不受或很少受到选择压力,不断积累各种突变,最终可能与原基因产生分化,形成具有新生物学功能的基因,而祖先拷贝仍保持原来的功能。现在科学家已经确认,基因重复是新基因产生的重要来源之一。许多新的基因功能都是通过基因复制进化来的,而且对不同种生物的发育程序的进化起了巨大的作用。同样,在染色体片断和基因组水平的复制对人类的新功能的产生和进化也起了重要的作用。,根据重复区域的大小,基因重复可分为单个基因重复、部分基因组重复(segmental duplication)和整个基因组重复(genome duplication)即多倍体化。单个基因和部分基因组的重复
10、主要通过不等交换产生,而基因组重复是有丝分裂或减数分裂过程中发生错误产生的。,利用果蝇、酵母、线虫、鸡、鼠和人的全基因组信息对基因重复的频率做了保守的估计,约为每基因每百万年0.01次。Saccharomyces,C.elegans,Arabidopsis,Drosophila melanogaster,and H.sapiensPercentages of the genes that belong to identifiable families of duplicates in these genomes are 30,48,60,40,and 38%of the genome,resp
11、ectivelyby far,the most general and important mechanism to generate new copies of genes is the duplication of genes and/or genomes,Adh and Adhr genes of Drosophila one is their significant sequence similarity(about 40%amino acid identity);the other their common intron/exon structureAdh functions to
12、detoxify dietary alcohols but Adhr has unknown functionAdh and Adhr were separated by 300 bp in D.melanogaster.two kinds of transcripts:Adh and both genesRecent data on the expression of Adhr in D.lebanonensis and D.buzzatii suggest that the co-transcription is the primitive state,逆转座(Retroposition)
13、逆转座是指转录产生的RNA通过逆转录合成cDNA插入到基因组的过程。由于通过逆转座产生的新拷贝一般不含启动子和调控序列,使得大部分产生的序列成为假基因。然而,在特殊情况下,逆转座序列通过原基因不正常转录携带有启动子,或者插入到基因组后获得外源调控序列而具有表达活性,进而可形成新的表达特异性或新的功能。所以一个有功能的逆转录转座基因呈现出一种嵌合结构逆转录转座的编码区域和一个新的5端调控序列。或是逆转录转座的编码区域和一个从整合靶位点附近招募的新的基因片断这会导致新的嵌合机制具有和亲代基因不同的生物学功能。,斯芬克斯(sphinx),迄今发现的第一个年轻的RNA基因sphinx(司芬克斯)基因,
14、sphinx的发现揭开了基因组中众多非蛋白编码RNA基因(ncRNA)起源发生研究的第一页。对sphinx及其所在果蝇4号染色体的深入研究推翻了遗传学界近百年的一个错误认识,即该染色体无交换重组。,研究发现其3端外显子与ATP合成酶F链具有同源性,但不含内含子,其两端有短的重复序列(TTCG),并且在3末端有poly(A)序列,这些证据指示此外显子是由ATP合成酶F链逆转座插入产生的。而sphinx基因5端的调控序列及外显子被推测是由原先已存在的基因所贡献,这2部分通过外显子重排形成一新的嵌合基因。sphinx基因具有多种剪切形式,并且有的剪切形式具有性别表达特异性,斯芬克斯(sphinx),
15、狮身人面像,可移动元件(Mobile elements)Makalowski等最早描述了Alu元件可以整合进人类衰减加速因子基因(DAF)的蛋白编码区。他们发现基于可移动元件的多样性并不仅限于人类基因组或是Alu家族。麦克琳托克原先在玉米中发现的DNA片段的移动,它们甚至能采取遗传物质全盘打乱重组或复制的方式。所有这些变化,能影响基因的表达,或者,使复制出的基因自由地发展新功能。对人类基因序列和脊椎动物基因的进一步分析表明,可移动元件整合进核基因从而产生新的功能可能是一个普遍的机制。,基因水平转移(gene lateral transfer)基因水平转移是指遗传物质从一个物种通过各种方式转移到
16、另一个物种的基因组中。在原核生物中,转化、转导、接合和转染等现象是频繁发生的。因此,基因水平转移对原核生物的基因组贡献是相当大的。例如一种毛滴虫通过水平转移获得嗜血菌的一种裂解酶,该裂解酶通过插入获得了24个氨基酸构成的一段信号肽,其功能也因此而出现变化,使其由胞内酶变成了胞外酶。Ochman等人发现一些细菌基因组的16%是通过基因水平转移获得的。尽管这种侧向的、或水平的基因转移可以导致同源基因的交换,但是有证据表明它可以招募新的基因并提供新的表型;比如使良性细菌转变为病原体。the gene encoding N-acytylneuraminate lyase in the protozoa
17、n Trichomonas vaginalis shares 80%identity with the neuraminate lyase bacteria Haemophilus influenzae in protein sequence,最近,侧向基因转移的现象也在一种原生生物Richomonas vaginalis中观察到,令人惊奇的是,在显花植物的线粒体中也观察到了五个这种基因转移事件。对于真核生物,基因水平转移主要通过逆转录病毒介导,并且对基因组影响不大.这些通过水平转移产生的外源基因在选择的作用下,经过突变积累,功能分化,可能形成新的基因。这说明,基因的侧向转移可能在真核生物基因
18、的进化中起了重要的作用。同样,转座元件的水平转移可能携带某些基因或基因片断,这对受体生物新基因的形成起了一定的作用。,基因融合/分裂(gene fusion/gene fission)通过中止密码子和基因上游转录终止信号的删除突变和点突变,两个相邻的基因可以通过通读转录融合为单个基因。相反,一个基因也可以分裂为两个单独的基因。关于自然界中新基因的起源,生物学界早已有“基因分裂”的猜想,但科学家一直没有找到直接的证据。近期,中科院昆明动物所王文博士及其合作者的一项研究成果,证明了通过基因分裂能产生新的基因。许多基因融合和分裂事件在原核生物的基因组中被鉴定出,并且已有报道在更高等生物中也存在基因融
19、合事件。,基因融合,the fatty acid synthase gene Trypotophan synthethase gene in fungiHisA and HisF in the histidine pathway Glutamyland prolyl-tRNA synthetase genesSp100-rs in M.musculusubiquitin and ribosomal proteins in diverged organismsthe human Kua-UEV gene fusion,Thompson等人鉴别出了一个人类融合基因,KUAUEV,在这个基因中,肿瘤
20、易感基因(UEV)的E2泛素连接酶变体结构域和一个最近被鉴别出的基因KUA(脂肪酸羟化酶)通过通读转录和编码区可变剪接的机制融合在一起。,UEV在真核生物中保守。仅人中有B和C两个Domain,其中B与脂肪酸羟化酶KUA同源,但在果蝇和线虫中相距甚远或不在一条染色体上,而在人中仅相距几Kb。转录时跳过了KUA的终止子和UEV的起始密码子和A exon,形成一个RNA。其中UEV定位核内,KUA在内膜上,KUA-UEV在胞质中,基因分裂,猴王(monkey-king)基因家族是王文博士及其合作者在果蝇中发现的一个年轻基因家族。它们起源于约一百万年前,该基因家族经过三次重复积累了包括亲本基因在内的
21、4个基因拷贝。其中两份拷贝经过了互补退化最终实现分裂。“猴王基因”的研究结果第一次阐明了基因分裂是如何实现的。此外,“猴王基因”的研究也表明基因的调控序列可以在很短的时间内产生。,猴王(Mokey king)基因,在果蝇的3个近缘种(D.simulans,D.sechellia和D.mauritiana)分开前,祖先基因(mkgp)通过逆转座形成了一个新基因,并且新基因在3个种中分别形成了与祖先基因不同的启动子,其中、sim-mkgr和sch-mkgr具有性别表达特异性在3个物种分开后,D.mauritiana中的mkgp又发生了一次逆转座,形成了另一个新基因mau-mkgr3.而mau-mk
22、gr3与mau-mkgp经过互补性的部分退化,分别继承了原始的mau-mkglp基因的3和5结构域的功能,在不到200万年的时间里就产生了个新成员,这在进化的漫长时间尺度上,简直和孙悟空拔毛变小猴一样神奇,科学家们就形象地把这个基因家族称为“猴王基因”家族。,从头起源(de novo origination)尽管从原先非编码区域变为新基因的这种真正的从头起源很稀少。但是有很多基因的一部分蛋白编码区序列是从头起源的。比如,果蝇精细胞特异性的肌动蛋白中链基因sadic,原先内含子的一部分转变为一个编码蛋白质的外显子。,混合机制(Combined mechanisms)新基因可以通过上述机制产生,既
23、可以是单个机制在起作用,也可以是多种机制的共同作用。jingwei基因、sphinx基因和sdic基因,新基因的进化(Evolution of new genes),新生基因的命运(The fate of a newborn gene.):关于基因复制的命运的经典观点可以追溯到和的工作。他们认为随着不断的突变,基因复制对的一个成员最终失去功能,大多数基因的复制本最终以假基因的形式消亡。,重复基因主要的进化命运,(1)由于随机突变的积累,导致基因沉默或失活,即非功能化(nonfunctionalization)。(2)由于突变而获得新的功能,并被选择作用所保留,即新功能化(neofunction
24、alization)。(3)多数重复基因的命运是亚功能化(subfunctionalization),亦即基因重复以后所有拷贝都可能由于选择压力的松弛而发生突变,且突变的效应常常最早体现在转录调控区域,致使不同拷贝在表达时间和器官特异性方面产生明显分化,分担了祖先基因的功能,因而都被选择作用所保留。,大部分这些进化的改变是在正向达尔文选择下的适应性变化。就如几个在酵母和大肠杆菌中进行的新基因的选择性实验所证实的那样。这些研究表明新基因的产生并不是人们原先认为的是很稀少的事件。,基于懒猴中发现的一个新起源的线粒体假基因在不同进化阶段选择压力的研究,提出了线粒体假基因起源过程的一个新假说,即通过重
25、复产生的线粒体基因组拷贝在很长时间内仍然保持功能,然后再转移整合到核基因组并假基因化。,动物基因中有很多逆转座基因,但长期以来,由于在拟南芥中发现很少的逆转座基因,因而形成了一种认为逆转座在植物基因和基因组进化中并不重要的观念。科学家发现,在水稻基因组中存在大量的逆转座基因,其中三分之一以上的逆转座基因已经获得了其他序列从而进化成了具有新功能的嵌合体基因。很多这些嵌合的逆转座基因也能在玉米、高梁基因组中找到,提示逆转座基因可能在整个草类的广适性进化中提供了重要的基因和遗传基础。此外,也有相当一部分逆转座嵌合基因为水稻所特有,说明基因的逆转座在草类基因组进化中是一个不断发生的过程,而且其速率比灵
26、长类中高了一个数量级。这些研究结果改变了人们对植物基因组进化的认识,研究论文发表在The Plant Cell(2006,18:1791-1802)。,Nucleotide Variation Along the Drosophila melanogaster Fourth Chromosome Wang W,Thornton K,Berry A,Long MY,The Drosophila melanogaster fourth chromosome,believed to be nonrecombining and invariable,is a classic example of th
27、e effect of natural selection in eliminating genetic variation in linked loci.However,in a chromosome-wide assay of nucleotide variation in natural populations,we have observed a high level of polymorphism in a;200-kilobase region and marked levels of polymorphism in several other fragments interspe
28、rsed with regions of little variation,suggesting different evolutionary histories in different chromosomal domains.Statistical tests of neutral evolution showed that a few haplotypes predominate in the 200-kilobase polymorphic region.Finally,contrary to the expectation of no recombination,we identie
29、d six recombination events within the chromosome.Thus,positive Darwinian selection and recombination have affected the evolution of this chromosome.,植物核基因水平转移分子证据被发现,河北省农林科学院谷子研究所刁现民博士“一个植物转座子基因的水平转移”论文,科学大众实验室生物学(PublicLibraryofSciencebiology(PLOSbiology)2006年 基因作为遗传物质从父母传给子孙后代,是传统认识的天经地义的竖向遗传。作为遗传
30、物质的DNA只在同一个物种内转递。同基因的竖向转递相对应,基因的水平转移是指特定基因或其片段的DNA序列以某种未知的方式从一个物种转移到另一个物种。这是最近几年国际遗传学界的新发现。但已有的基因水平转移的证据只在多种细菌和一些昆虫基因组中发现,而且水平转移的基因多是转座子基因,如果蝇的P转座子基因的水平转移等,高等植物的线粒体基因也发现了水平转移,但高等植物的核基因从未有过水平转移的报道。刁现民与美国伯克利加州大学的Damon Lisch博士和Michael Freeling教授合作,克隆了狗尾草属的谷子等材料的MULE转座子序列,在同水稻基因组中的MULE转座子的对比分析中发现了只能用水平转
31、移来解释的高度同源序列,并通过分子杂交、近旁序列变异分析等证实了水平转移的存在。这是高等植物发现的首例核基因水平转移,说明高等植物的核基因也可以以某种未知的方式发生水平转移。,非编码基因占据了生物体基因数目的很大一部分,远远超过编码基因,这部分的研究由于与疾病的相关性,因此收到科学家的瞩目,但是由于在无脊椎动物本身并没有一些非编码基因,比如cis-regulatory因子,给研究带来了很大的不便。来自美国加州大学的研究人员通过对印度腔棘鱼Sarcopterygii(Indonesian coelacanth)部分序列的解析帮助了解了非编码区域演化过程。基因组非编码区域是指基因两侧不被转录的DN
32、A序列,这些区域往往是基因表达的调控区,而且发现其在疾病、发育和演化中的重要性有越来越多的证据。Gill Bejerano等人发现腔棘鱼基因组中的一组被发现起源于一个由反转录子组成的短散布重复序列(short interspersed repetitive element,SINE)家族,这个家族4.1亿年前活跃于肉鳍鱼中,今天仍活跃于腔棘鱼中。它们有些在哺乳动物中已经获得了功能,其中的一种是能够增强一个名为ISL1的神经发育基因表达的增强子,另一种是有关mRNA处理基因PCBP2中的一个外显子。Nature 441,87-90(4 May 2006)A distal enhancer and
33、 an ultraconserved exon are derived from a novel retroposon,研究前景,关于新基因进化的基因组过程人们还知之甚少,因为还没有鉴别得到足够数目的具有新功能的年轻基因。大规模的基因组测序仍在继续,不断有新的物种的基因组序列被公布,从这些庞大的数据中,将能找到大量关于新基因起源与进化的有用信息建立一整套能够快速、有效地发现和研究新基因的研究体系 随着对基因组研究进入后基因组时代和科学技术的高度发展,对于新基因起源的研究更会深入全面。最终能从基因组的水平探讨新基因起源的一般规律和新基因产生对原基因组的影响,将基因结构的进化与功能的适应性联系起来
34、,阐明新基因起源和进化的动力,龙漫远,博士,美国芝加哥大学终生教授和北京大学长江讲座教授。其发现的“精卫”基因第一次从分子水平揭示了基因的起源过程,并由此开创了一个新的学科方向。,1977-1985年在四川农业大学,数量遗传学硕士;1987年-1992年底在加州大学(戴维斯)美国分子群体遗传学最优秀的学者 CharlesLangley的实验室攻读博士学位;1993年-1997年在哈佛大学做博士后研究员,师从WalterGilbert和RichardLewontin 教授;1997年,芝加哥大学龙漫远教授的科学研究成果发表于Sciences、Cell、Proc.Natl.Sci.Acad,USA 和Mol.Biol.Evol,等专业期刊。,1985-1989年 武汉大学生物系。1989-1996年 中科院昆明动物研究所博士。1997年至2002年在芝加哥大学生态与进化学系 博士后。2004年获得国家杰出青年人才基金,并入选国家首批“百千万人才工程”。已在Science、Nature Genetics、PNAS、Nature、Nature Review Genetics等重要学术杂志上发表了多篇论文。,王文 中科院昆明动物所副所长,博导,中德马普青年科学家进化基因组学小组组长。sphinx 和猴王基因的主要发现者。,