《基因组学基础.ppt》由会员分享,可在线阅读,更多相关《基因组学基础.ppt(94页珍藏版)》请在三一办公上搜索。
1、第8章基因组学基础,第一节遗传标记,To use DNA you need a roadmap一、遗传标记的发展二、分子遗传标记三、分子遗传标记的应用,一、遗传标记的发展,1、形态学标记2、细胞遗传标记3、生化与免疫遗传标记4、分子遗传标记5、理想的分子遗传标记应具备的特点,1、形态学标记,形态学标记(morphological marker)能够用肉眼识别和观察、明确显示遗传多样性的外观性状。特点简单直观,但标记数目少,多态性低,易受外界条件的影响;依据它进行选择的准确性差,所需时间较长,选择效率也较低。,古代形态学标记,公元前4000年,伊拉克的古代巴比伦石刻上记载了马头部性状在个世代的遗
2、传。,伯乐相马,按图索骥,2、细胞遗传标记,细胞遗传标记(cytological genetic marker)主要是指染色体核型(染色体数目、大小、随体、着丝粒位置、核仁组织区等)、带型(Q、G、C、R带型)和数量特征的变异等,它们分别反映了染色体在结构上和数量上的遗传多态性。,家猪X、Y染色体G带示意图,细胞遗传标记的特点,不易环境影响,呈孟德尔方式遗传。多态性集中表现在染色体高度重复DNA结构的异染色质所在的部位。细胞遗传标记经常伴有对生物有害的表型效应,难以获得相应的标记材料,或者观测和鉴定比较困难,从而限制了细胞遗传标记的应用。,3、生化与免疫遗传标记,免疫遗传学标记(immunog
3、enetical marker)以动物的免疫学特性为标记,包括红细胞抗原多态性和白细胞抗原多态性。生化遗传标记(biochemical genetic marker)主要是指在同一动物个体中具有相同功能的蛋白质存在两种以上的变异体。,同工酶与等位酶,同工酶(isozyme):电泳所可区分的同一种酶(系统)的不同变化等位酶(allozyme):由一个位点的不同等位基因编码的同种酶的不同类型,其功能相同但氨基酸序列不同,等位酶分析的过程,材料的采集,研磨和酶的提取,酶的保存,淀粉凝胶制备,电泳,凝胶切片,酶的组织化学染色,酶谱的记录与分析,数据分析,生化与免疫遗传标记的特点,与形态学标识和细胞遗传
4、标记相比,数量更丰富,受环境影响更小,检测手段简便,是一种较好的遗传标记。血液型和蛋白质型都是基因表达的产物,局限于反映基因组编码区的遗传信息,且标记的数量还比较有限,不能很好地覆盖整个基因组。,4、分子遗传标记,分子遗传标记(molecular genetic marker)是一种新的以DNA多态性为基础的遗传标记.随着分子生物学的发展,相继建立了RFLP、VNTR、RAPD、AFLP、SNP等多种分子遗传标记检测技术,开创了遗传标记研究的新阶段。,分子遗传标记的特点,无表型效应不受环境的限制和影响普遍存在于所有生物数量丰富等特殊优势,5、理想的分子遗传标记应具备的特点,遗传多态性高;检测手
5、段简单快捷,易于实现自动化;遗传共显性,即在分离群中能够分离出等位基因的3种基因型。标记遍布整个基因组;准确性,能正确反映动物的真实遗传,即标记是经济性状基因,还是与影响重要性的性状连锁。实验重复性好(便于数据交换);开发成本和使用成本尽量低廉;,二、分子遗传标记,1、RFLP:限制性片段长度多态性 2、TRS:串联重复序列标记3、SNP:单核苷酸多态性,1、限制性片段长度多态性,RFLPrestriction fragment length polymorphism最早应用于动植物遗传学研究的分子标记技术,RFLP的原理,利用限制性内切酶消化基因组DNA,形成大小不等、数量不同的分子片段,经
6、电泳分离,通过Southern印迹将DNA片段转移至支持膜(尼龙膜或硝酸纤维素膜)上,然后用放射性同位素(32P)或非同位素(如地高辛,荧光素)标记的探针与支持膜上的DNA片段进行杂交。不同基因组DNA酶切位点的改变,会使得RFLP谱带表现出不同程度的多态性.,RFLP示意图,限制性片段的制备,电泳,Southern 印 迹,与放射性探针杂交,放射性自显影,RFLP的特点,呈共显性遗传、无表型效应、不受年龄性别的影响等优点。分析一次只能检测1个位点,多态信息含量较低,而且操作复杂,耗时费力,成本高,并且对模板DNA需求量大。,PCRRFLP,将PCR技术用于RFLP分析,即PCR-RFLP。该
7、技术先用1对引物特异性扩增基因组的某一高变区,然后用限制性内切酶消化PCR产物,电泳检测多态性。PCR-RFLP分析省去了探针的制备、分子杂交等繁琐的过程,DNA需求量也少,大大简化了传统的RFLP技术。,PCRRFLP的应用,CCT GAG GAG,CCT GTG GAG,Mst酶切位点,Mst酶切位点消失,2、串联重复序列标记,tandem repeated sequence,TRS真核生物基因组中的可变串联重复序列(variable number tandem repeated sequence,VNNTR)有两类:小卫星和微卫星,两者具有高度的变异性。,(1)小卫星(minisatel
8、lite DNA),小卫星重复单位的核心序列为15一76bp近缘物种和个体间的小卫星核心序列有着一定的同源性,在一定的条件下可以相互杂交。,DNA指纹图谱原理,选择在VNTR特异序列上没有酶切位点的限制性内切酶将动物总基因组DNA切成不同长度的片段以VNTR中特异序列作为探针,进行Southern杂交,由于不同个体的串联重复序列的数目和位置不同,形成的杂交谱带具有个体的特异性,人们称为DNA指纹图谱(DNA fingerprinting,DFP),VNTR示意图,123,VNTR变异的原理示意图,DFP的特点,多态性检测率高,位点呈共显性遗传个体具有高度特异性技术复杂、成本高,有时谱带过于复杂
9、,微卫星(microsatellite DNA,MS),又称简单序列重复(simple sequence repeat,SSR)是高度重复序列,广泛存在于真核生物基因组,重复单位的核心序列为26bp。,微卫星遗传标记的原理,以微卫星DNA标记两侧特异性序列设计专一引物,通过PCR技术扩增微卫星片段,扩增产物经变性聚丙烯酰胺凝胶电泳分离,不同个体间因核心序列的重复次数不同而产生DNA多态性。,微卫星遗传标记示意图,PCR扩增,凝胶电泳,微卫星遗传标记示意图的特点,分布广泛均匀多态信息含量丰富呈共显性遗传稳定性好,可比性强分析技术易于实现自动化开发成本高,微卫星标记的应用领域,遗传图谱的构建连锁分
10、析特殊的基因(如致病基因)姻亲分析样品鉴定(如父本分析、血缘分析、等号样品分析、杂种分析)物种和居群的遗传多样性群体遗传学分析(如有效群体大小、群体遗传结构、群体分化、迁移与基因流动)保护生物学,Huntingtons diseaseHuntingtin gene of unknown(!)functionRepeats#:6-35:normal;36-120:disease,Friedrich ataxia diseaseGAA repeat in non-coding(intron)regionRepeats#:7-34:normal;35 up:diseaseRepeat expansi
11、on reduces expression of frataxin gene,Microsatellites and disease,3、单核苷酸多态性标记(SNP),single nucleotide polymorphism是指染色体上的某个存在单个碱基的变化,包括单碱基的转换、颠换、插入及缺失等。SNPs in human population,SNP标记的特点,高密度SNP是基因组中最普遍、频率最高的遗传标记。单个SNP虽然只有两个等位基因,多态信息含量不如微卫星位点,但其高密度弥补了其不足。,代表性某些位于基因表达序列内的SNP(coding SNP,cSNP),有可能直接影响蛋白质
12、结构或表达水平,鉴别cSNP对于复杂表型性状与基因变异之间的关联分析具有重要意义。,易实现自动化分析双等位标记,检测时只需“有或无”表示。DNA芯片技术实验了SNP分析的高通量、微型化和自动化。,第二节基因组学,一、产生背景及概念二、基因组学分类三、结构基因组学四、功能基因组学五、比较基因组学,一、产生背景及概念,1.背景:1985年提出人类基因组计划(HGP),随着HGP的提出和实施,产生的基因组学。,2.概念,以分子生物学技术、计算机技术和信息网络技术为研究手段,以生物体内全部基因为研究对象,在全基因背景下和整体水平上探索生命活动的内在规律及其内外环境影响机制的科学。,Genome siz
13、es,3、基因组学的发展历程,流感嗜血杆菌(haemophilus influenzae)1995 年7 月第一个细菌基因组全序列发表,大小为1.8 Mb。含1703 个基因或开放阅读。这是微生物乃至整个生物学领域的一个里程碑.(Science),1997 年9 月,大肠杆菌的完整基因图谱已绘制成功,基因组全序列完成,全长为5Mb,共有4 288 个基因,同时也搞清了所有基因产物的氨基酸序列.,啤酒酵母,1997年,第一个真核生物基因组图谱公布。,秀丽线虫(caenorhabditis elegans)1998 年12 月完成了基因组测序。基因组大小100 Mb,分布于6 条染色体,预测有19
14、,099 个基因。,果蝇Celera公司2000 年3 月宣布了基因组全序列为180 Mb。有13 601 个基因,其中一半的基因功能还没有搞清楚,有1 600 个碱基跨度区仍未能完全测序。,2000 年12 月,第一个植物基因组拟南芥基因组被全部测序,遗传图谱、物理图谱建立,序列大小为125 Mb。基因组测序区段覆盖了全基因组的115.4 Mb,分析共含有25 498 个基因,编码蛋白来自11 000 个家族。,2001年2月中旬,Nature与Science分别发表了人类基因组工作框架图,报告人类基因组共有30 亿个碱基对,预测编码基因31 000个,比最初预测的10 万个编码基因数大大减
15、少。,2002年4月,水稻基因组图谱公布。,2002年小鼠、疟原虫和按蚊基因组测序完成,鼠基因组共有约27亿个碱基对,比人类少15,但其包含的基因数目约在3万个左右,与对人类基因数的最新估计非常接近。,疟原虫的裂殖子,疟原虫破坏两个红细胞,人被蚊子咬之后5到10分钟,疟原虫孢子就会到达肝脏,入侵肝细胞,在这里它们可以躲过人体免疫系统的攻击。孢子侵吞肝细胞的营养,大量地分裂繁殖,大概一个星期之后胀破肝细胞跑出来,将数以百万计的新孢子释放进入血液。新的孢子马上入侵红细胞,再次逃过免疫系统的追杀。它们以血红蛋白为食,继续繁殖,大概两天后破坏红细胞,产生更多的孢子入侵其它红细胞用不了多久,2/3的红细
16、胞都会被疟原虫占领。疟原虫在血液里这种周期性的繁殖过程,就会导致病人三天两头地发高烧、打寒战。,人肝细胞内间日疟原虫(Plasmodium vivax)细胞前期成熟裂殖体疟原虫是疟疾的病原体,分布区几乎遍及全球。间日疟原虫是四种寄生于人体的疟原虫之一。,2003年人类基因组计划宣布,人类基因组序列图绘制成功,人类基因组计划的所有目标全部实现人类遗传变异图谱研究以及黑猩猩基因组测序计划开始,2003年11月,世界上首个复杂生物体的蛋白图谱果蝇蛋白图谱公布,从而实现了只显示遗传密码的基因图谱到揭示遗传密码功能的蛋白图谱的飞跃。这个果蝇(Drosophila melanogaster)蛋白图谱发表在
17、科学杂志的网络版上,这篇研究发布的这个含有7,000多个果蝇蛋白的图谱含盖了这些蛋白之间超过20,000种不同的互作。这些果蝇蛋白有许多与人类蛋白类似,适于作为研制小分子药物如用于治疗癌症、心脏病和糖尿病的口服药片等的靶点,2004年月日多国科学家组成的两个研究小组宣布绘制出鸡的基因序列草图和遗传差异图谱。,科学家选取了家鸡的远祖红原鸡为测绘对象,绘制出了草图中约10亿个碱基对,相当于人类的三分之一。,科学家在日出版的Nature杂志上载文说,分析发现,红原鸡约有万到2.3万个遗传基因,与人类数量基本持平,其中有60与人类相同。,鸡基因组的分析还仅仅是开始,不过已经得出了一些出人意料的结果。科
18、学家们发现,控制鸡生成角蛋白的基因与预想的不同。角蛋白构成人类的头发、指甲,以及鸟类的喙和羽毛,科学家一直认为哺乳动物和鸟类的角蛋白来源相同。但图谱显示,鸡的角蛋白基因与哺乳动物的区别很大。科学家由此推测,角蛋白可能独立进化出了两次。,意外的发现,另外,此前科学界一致认为鸡没有嗅觉,但是分析结果表明鸡具有大量的嗅觉基因,味觉基因却很缺乏。分析还发现,鸡缺乏人类所具有的产生乳汁、唾液和牙齿的基因。,意外的发现,鸡基因组研究的意义,鸡是研究低等脊椎动物和人类等哺乳动物的一种比较理想的中介。将人类基因组与鸡等其他生物的基因组进行比较,有助于更深入理解人类基因的结构和功能,进而开发治疗疾病的新手段,对
19、于培育优质鸡种、改善食品安全、控制禽流感病毒的蔓延也有重要意义。,鸡是种常见的家禽,长期受到进化生物学家的青睐。它的基因序列也有助于科学家了解农业和进化学上重要特性的遗传学基础。,鸡的进化研究,转基因小鸡,对鸡和人类的基因组进行比较后发现约七千万个碱基对是共有的。这暗示着在大约三亿一千万年前二个物种从共同祖先分化出来的时候,遗传物质具有守恒性。,鸡和所有的哺乳动物多起源于恐龙,鸟类的祖先始祖鸟,“分道扬镳”,在鸟类和哺乳动物分离的时候,鸡获得了生成羽毛和喙的蛋白质的基因,而哺乳动物获得了毛皮蛋白质的基因,丧失了与蛋清和蛋黄有关的基因。,鸡的基因组比哺乳动物的紧凑的多,它拥有20万到23万个基因
20、,但仅有十亿个DNA碱基,而同样多的基因人类需要三十亿个碱基。鸡的基因数量与哺乳动物的相当,但它的基因组含有重复的“垃圾”DNA的数量很少。,我国科学家在鸡基因组学研究上的重大突破,中国科学院北京基因组研究所在国际合作的框架下参与和主持完成的原鸡基因组和家鸡基因组多态性研究并于2004年12月9日发表在自然杂志上以主题科学论文的形式发表。,Science发表论文我国家蚕基因组研究获国际认可,2004年12月10日,西南农业大学家蚕基因组研究群体的研究论文家蚕基因组框架图,于12月10日在国际顶尖科研杂志Science上发表,这标志着重庆市家蚕基因组研究成果已得到国际学术界的认可。,丝腺是合成茧
21、丝蛋白质的生物器官,是蚕丝产业的生物学基础。科学家通过分析家蚕基因组和基因表达谱,发现了1874个家蚕丝腺特异基因,其中97为新发现;发现了丝腺中激素活动的证据;科学家甚至比较了家蚕与被称为“生物钢”的蜘蛛丝的生产者蜘蛛的基因构成,发现了它们共同拥有的个基因。,这些功能基因的获得和功能分析的深入开展,将彻底突破茧丝蛋白质合成相关基因克隆和研究的瓶颈。而随着家蚕丝腺特异基因研究的深入,中国将很快在改造丝蛋白质结构,克服丝绸天然加工弱点等重要产业技术的研发方面取得突破。,二、基因组学分类,1、根据研究对象分:动物基因组学、植物基因组学、肿瘤基因组学、药物基因组学、环境基因组学等。2、根据研究的重点
22、分:结构基因组学、功能基因组学、比较基因组学,三、结构基因组学,(一)概念和目的(二)基因图谱(三)结构基因组学研究常用方法,(一)概念和目的,以全基因组测序为目标的基因结构研究弄清基因组中全部基因的位置和结构,为基因功能的研究奠定基础。其目的是建立高分辨的遗传图谱、物理图谱、转录图谱和序列图谱。,(二)基因图谱,1.遗传图谱(连锁图谱)2.物理图谱3.转录图谱(表达图谱)4.序列图谱(分子水平的物理图谱),1.遗传图谱(连锁图谱),概念:指基因或分子标记在染色体上的相对位置与遗传距离,用厘摩(cM)表示。1cM的遗传距离表示在100个配子中有1个重组子。在哺乳动物中,遗传图谱上1cM的距离大
23、约相当于物理图谱上1 000 000bp。,通过该图谱可分清各基因或分子标记之间的相对距离与方向,如靠近着丝粒或端粒。该图谱的构建是以位于同一染色体相邻的2个基因或遗传标记的重组率为基因,因而需要有参考家系和分子遗传标记或基因作为研究基础。,2.物理图谱,指DNA序列上两点间的实际距离。用于确定各遗传标记间的物理距离有两种物理图谱:(1)以已定位的DNA序列标记位点(STS)为位标,以DNA实际长度为图谱距离的基因组图谱。(2)由YAC和/或细菌人工染色体(BAC)连续克隆重叠群组成的物理图谱。,3.转录图谱(表达图谱),以EST为位标,根据转录顺序的位置和距离绘制的图谱,它是染色体DNA某一
24、区域内所有可转录序列的分布图,是基因图的雏形。方法:用已在染色体定位的YAC DNA或BAC DNA为探针,与所有可能相关的各组织cDNA文库杂交,寻找其同源克隆并做进一步分析。,4.序列图谱(分子水平的物理图谱),以某一染色体上所含的全部碱基顺序绘制的图谱。既包括可转录序列,也包括非转录序列,是转录序列、调节序列和功能未知序列的总和。,(三)结构基因组学研究常用方法,1.脉冲场凝胶电泳(PFGE)2.毛细管电泳3.基因芯片技术4.全基因组随机测序,四、功能基因组学,1.概念:利用结构基因组学提供的信息,以高通量,大规模实验方法及统计与计算机分析为特征,全面系统地分析全部基因的功能。研究角度包
25、括:生物学功能、细胞学功能、发育学功能等。,2.功能基因组学常用方法和技术,RNA干扰技术(RNAi)蛋白质组学研究生物信息学研究等。,RNA干扰技术(RNAi),将一段dsRNA导入机体或细胞后,与它有同源序列的基因的表达被干扰或抑制的现象。dsRNA依赖的转录后基因沉默。1998,Fire,线虫作用机制A.Dicer 和Slicer依赖模式:果蝇胚胎细胞和培养细胞S2B.随机降解“PCR”模型:果蝇,线虫,真菌,秀丽新小杆线 虫(C.elegans),蛋白质组学(proteomics),蛋白质组(proteome):是由澳大利亚学者Wasinger 等21 于1995 年提出的,是指由基因
26、组编码的全部蛋白质。蛋白质组学(proteomics)就是指研究细胞内所有蛋白质及其动态变化规律的科学。,生物信息学,生物信息学是以计算机为工具,用数理及信息科学的理论和方法研究生命现象,对生物信息进行储存、检索和分析的一门学科。,五、比较基因组学,利用人类基因组与模式生物基因组之间编码顺序上组织结构上的同源性,发现和克隆人类和其他物种的基因,提示基因功能,从而阐明物种的进化关系及基因组的内在结构。,人类基因组计划(flash动画演示),introduction,人类基因组计划(flash动画演示),section1:mapping section2:building libaries sec
27、tion3:subclonessection4:Ecoli storage section5:preparing DNA for sequencing reactionssection6:sequencing reactionssection7:products of sequencing reactionssection8:separating the sequencing productssection9:reading the sequencing productssection10:assembing resultssection11:sequencing 24 hourssectio
28、n12:gap and 99.99%precision,PCR聚合酶链式反应,Polymerase Chain Reaction是一种选择性体外扩增DNA或RNA的方法.它包括三个基本步骤:(1)变性(Denature):目的双链DNA片段在94下解链;(2)退火(Anneal):两种寡核苷酸引物在适当温度(50左右)下与模板上的目的序列通过氢键配对;(3)延伸 Extension):在Taq DNA聚合酶合成DNA的最适温度下,以目的DNA为模板进行合成.由这三个基本步骤组成一轮循环,理论上每一轮循环将使目的DNA扩增一倍,所以经25-35轮循环就可使DNA扩增达106万倍。,PCR movie,