《人类基因组中的假基因.ppt》由会员分享,可在线阅读,更多相关《人类基因组中的假基因.ppt(34页珍藏版)》请在三一办公上搜索。
1、第八章 人类基因组中的假基因,第一节 核基因组中的假基因,1977年,Jacq等人在研究5S rRNA基因时发现了第一个假基因(pseudogene,G)。他们在非洲爪蟾DNA中克隆了一个5S rRNA基因相似序列,与功能基因相比,这段序列的5端有16bp的缺失和另外14bp的错配,将这段5 S rRNA基因相似序列称为假基因。,一、假基因(pseudogene)的发现,人的5S rRNA基因有2000个拷贝,并且在染色体上串连排列;非洲爪蟾的5S rRNA基因的一个重复单位含有一个5S rRNA基因、一个不转录的假基因(101bp的5S rRNA基因的片段),每个重复单位间被不转录的间隔序列
2、隔开,间隔序列的长度变化不定,最长达400bp。,GJacp在对非洲爪赡5SrRNA基因簇的研究后发现G核苷酸序列同其相应的正常功能基因基本相同,但却不能合成出功能蛋白质的失活基因。,生物演化上的痕迹,二、假基因类似人的痕迹器官,现已在大多数真核生物中发现了假基因,如Hb的假基因、干扰素、组蛋白、球蛋白和球蛋白、肌动蛋白及人的rRNA和tRNA基因均含有假基因。由于假基因不工作或无效工作,故有人认为假基因,相当人的痕迹器官,或作为后补基因。,脊椎动物中的珠蛋白基因族和假基因,假基因(pseudogene)定义:基因组内,结构上与编码某一蛋白质的结构基因相似,在进化过程中获得突变而丧失了产生蛋白
3、产物能力的序列片段,这类基因称为假基因。,为了表示假基因与结构基因的对应关系,假基因的命名是在结构基因后加一个P表示:如:actin beta pseudogene ACTB-P 或者:ACTB,假基因的表示方法,三、假基因的分类与特点,根据形成机制分为两种类型,(1)非加工假基因(non-processed pseudogene)也叫复制型假基因(duplicated pseudogene)(2)加工假基因(processed pseudogene)或返座假基因(retropseudogene),复制型假基因:往往保留了功能基因的外显子内含子结构,有时这种结构是不完整的。,加工假基因的结构特
4、点:,(1)不同部位有不同程度的缺失或插入突变,常常形成移码及终止密码子;(2)缺少正常基因的内含子和启动子;(3)3端都有真核生物mRNA分子特有的AATAAA信号,造成转录启动区的缺陷;(4)两侧有正向重复序列。,四、假基因的数量,五、人类基因组中假基因的分布,(2004年),六、小鼠基因组中假基因的分布,第二节 线粒体假基因,哺乳动物线粒体基因组(mtDNA)由37个基因和一段长度可变的非编码序列(又称控制区或D-loop)组成。37个基因中包括13个蛋白质基因,2个rRNA基因和22个tRNA基因。其中,13个蛋白质基因分别是细胞素C氧化酶三个亚基、(CO、CO和CO),细胞色素b基因
5、(Cytb)、ATP合成酶亚基ATPase6和ATPase8 和NADH脱氢酶七个亚基的基因NDl,ND2,ND3,ND4,ND4L,ND5,ND6。,一、线粒体基因组简介,动物mtDNA 基因组全序列结构示意图,哺乳动物mtDNA的37个基因都以相同的相对位置排列(仅 在有袋类和鸟类中有微小变化);基因排列得十分紧凑,无重复、无内含子和转座因子,也没有基因间隔区(即使有也很短,仅1至数个核苷酸),有些基因部分序列重叠;动物mtDNA中长度可变的非编码区是mtDNA复制及转录的起点及控制区;尽管不同家畜的mtDNA大小稍有差异,但基因的数量和功能却相似;家畜mtDNA的基因排列相当经济,两个
6、rRNA基因相邻,基因中没有内含子,22个tRNA的基因位于rRNA和13个蛋白质基因之间。,1967年由DuBuy和Riley两位学者发现用提纯的小鼠mtDNA和核DNA进行杂交,发现两者的结合能力很强,推断核基因组中存在mtDNA的同源序列。直到1994年,Lopez等用southem杂交的方法在家猫核基因组中发现了长为7.946kb的线粒体基因组同源序列。发现这种序列是不能表达的假基因,并以nuclear mitochondrial DNA Segments(Numts)指代这种核基因组中存在的线粒体假基因。,二、线粒体假基因,三、线粒体假基因的特点,(1)核基因组中的Numts 片段已
7、经涵盖了线粒体基因组的全部基因。其中细胞色素b(Cytb)、调控区(D-loop)、细胞色素氧化酶C亚基1(CO)的插入频率较高。(2)Numts序列长短不一,短的有39bp,长的则几乎相当于整个线粒体基因组,并且Numts在核基因组中的拷贝数也可能很高。,(3)核基因组中的Numts序列与其同源序列相比,进化模式完全不同。对于原编码蛋白的假基因序列,经常出现终止密码子,碱基替换没有密码子位点倾向性,几乎平均分布。,(4)Numts序列在核基因组中进化速率很低,所以常被认为是mtDNA序列的“分子化石”。,arctander等对于八种窜鸟Cyt b基因的真假序列进行研究发现,mtDNA 的进化
8、速率是Numts序列的13.6倍。,(5)有些Numts序列还可以作为独立的元件在核基因组中复制、移动。Hazkani等研究发现在人类核基因组的Numts序列中只有30%是线粒体基因片段转移到核中形成的,其余70%都是转移以后在核基因组中不断复制、转座而成。,植物哺乳动物昆虫鸟类,四、线粒体假基因的研究范围,五、假基因存在的意义,1 Numts序列为物种系统发育学研究提拱新的方法,比较mtDNA与Numts两种序列进行系统发育研究的结果,更能客观地反映物种的进化关系,也是对传统mtDNA方法的校验。,Sato等在达尔文雀的研究中,应用了两段numt序列和两段mtDNA序列分别作分子标记,结果显
9、示,两种序列建立的系统发育树结果基本相同。这说明numt序列在系统发育研究中有很好的应用价值。,2 Numt序列是细胞核内外两套遗传物质研究的桥梁。3 假基因进化速率很低,保留了远古基因的信息,因此,成为研究生物进化和动态基因组的重要线索。,4 Numts序列进化速率低,常被认为是mtDNA的“分子化石”,因此,可以作为某些系统发育研究的外群。在人类起源问题的研究中,Zischler等用mtDNA的D-loop区作为分子标记,由于没有合适的mtDNA外群,Zischler等应用了在人类核基因组中的一段D-loop区假基因作为外群。证实了现代人类起源于非洲的假说。,5 假基因如同基因备份序列存在
10、于基因组中 通过对非加工假基因的分析,发现它们大多与环境互作的蛋白质相关,并且总是存在其同源基因的附近。因此,有人推测,生物能将重要的基因复制起来作为备份以抵抗不利的环境影响。在鸡基因组,发现与免疫球蛋白有关的功能基因由假基因形成。,6 新基因的形成,1 国外:人类,酵母,果蝇,小鼠,线虫,斑马鱼等的数据及研究成果。2 国内:鸟类线粒体假基因遗传特征及其进化研究(辽宁师范大学);水稻假基因数据库的构建及其基因的分子进化研究(浙江大学);假基因8(NANOGP8)在肿瘤发生中的作用研究(中科院遗传与发育生物研究所)。,六、国内外研究情况,发现了5条cytb假基因;Numts序列在核基因组中进化速
11、率比mtDNA低,但是Numts与mtDNA进化速率的比值对于不同物种来说都是变化的;Numts转移到核基因组之后作为非编码区其进化模式与线粒体的功能基因不同,其碱基替换没有密码子倾向性,在各个位点几乎是平均分布的,同时转换颠换的比值降低,没有明显的转换倾向性。,(1)禽类Numts的研究,在籼稻9311基因组内发现了4607个加工假基因、2153个复制假基因和6720个假基因片段。初步分析发现,水稻中的假基因在着丝粒区域分布较为密集,加工假基因尤其明显。水稻中GC含量和基因密度成线性关系,而假基因和GC含量则没有这种关系。,(2)水稻假基因研究,研究癌组织、癌细胞系、畸胎瘤细胞系和正常组织中OCT4假基因的转录。通过生物信息学的方法发现了OCT4基因的6个假基因。其中OCT4-p5和OCT4-p1在肿瘤中转录而不在畸胎瘤细胞系、正常组织和成纤维细胞中转录。提示,OCT4-p5和OCT4-p1可能调控OCT4基因的活性进而与肿瘤发生有关。,(3)肿瘤发生中OCT4假基因,技术路线,Thank you!,