实习五:系统发育分析.docx

上传人:小飞机 文档编号:5174550 上传时间:2023-06-11 格式:DOCX 页数:5 大小:376.27KB
返回 下载 相关 举报
实习五:系统发育分析.docx_第1页
第1页 / 共5页
实习五:系统发育分析.docx_第2页
第2页 / 共5页
实习五:系统发育分析.docx_第3页
第3页 / 共5页
实习五:系统发育分析.docx_第4页
第4页 / 共5页
实习五:系统发育分析.docx_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《实习五:系统发育分析.docx》由会员分享,可在线阅读,更多相关《实习五:系统发育分析.docx(5页珍藏版)》请在三一办公上搜索。

1、实习五:系统发育分析一PHYLIP, MEGA, MrBayes学号 姓名 专业年级实验时间 提交报告时间 实验目的:1. 学会使用PHYLIP, MEGA和MrBayes构建进化树2, 学会分析建树结果,体会各种方法差异实验内容:系统发育(phylogeny)也称系统发展,是与个体发育相对而言的,它是指某一个类群的形成和发展 过程。系统发育学的目的是研究进化关系,系统发育分析就是要推断或者评估这些进化关系。通过系 统发育分析所推断出来的进化关系一般用分枝图表(进化树)来描述,这个进化树就描述了同一谱系 的进化关系,包括了分子进化(基因树)、物种进化以及分子进化和物种进化的综合。多序列比对的

2、目标是发现多条序列的共性。本次实验旨在使用PHYLIP,MEGA和MrBayes构建进化树,并通过分析 构树的结果,了解各方法的差异性。作业:1. List the title of the orthologous nucleotide and protein sequences you found from Practice 1. Build phylogenetic trees with PHYLIP, MEGA and MrBayes respectively. Make a simple comparison the trees you have got, and try to exp

3、lain the difference.核酸序列使用的是来自 Trifolium repens(白车轴早)硬粒小麦(Triticum durum)Camellia sinensis(山茶)Cicer arietinum (鹰嘴豆)及Glycine max (大豆)dehydrin的编码脱水素(dehydrin)的DNA序列,这些物种将分别以TF,TC,Cam,Cic及Gly表示;首先对于PHYLIP中的关系,通过五种算法的构树结果可以发现其树形的差异不大。尤其是在FM,NJ,UPGMA三种 算法中,五个物种的亲缘关系显示出较强的一致性,这大概是由于这三种方法都是基于距离法(Distance M

4、ethod) 的基础上;其次若把FM法树形的从上到下的五个位置分别标号(图),可以发现三种树形中只有UPGMA中 的和位置有差别。实际上这种差别来自于UPGMA算法的特点:具有最近缘关系的两物种到父节点的距离相等, 且等于这两物种距离的一半,其次在这个基础上再添加其他物种,而据枝长的等长不难看出,两物种一旦被确定为 “近邻”,它们的位置颠倒与否都是等价的(即在例子中表现为Cam和Gly分别在位和位,与其分别在位和 位是等价的)。因此,从本质上讲由PHYLIP构建的FM,NJ,UPGMA三树无差异。 GlycineTriticumTrifoliumphlip FM法构树(核酸)CicerCame

5、llia同理,在MEGA软件据UPGMA与NJ构建的树形中(如图),树形也无太大差异,Cic最远,Tc与Tf近邻,Gly与 Cam近邻,但比较的差别在于MEGA与PHYLIP软件UPGMA与NJ法得到的树形,这是由于其基于的距离数值的不同,也因为MEGA与PHYLIP对这五条序列采取的比对方法不同,PHYLIP使用的是Clustal法而MEGA用的比对结果 来自于MUSCLEoInticum durum cultivar Langdon stress inducible denydrin Corjyj geneTrifolium repens putative dehydnn(DHNb-P g

6、eneblycine max dehydnn COR47-hke (LOG100816984Camellia sinensis dehydnn 1 (DHNl) mRNACicer anetinum dehvdnn DHN3-like iLOC101504337Glycine max dehydnn COR47-hke (LOC100816984)Camellia sinensis dehydnn 1 (DHN1) mRNATnticum durum cultivar Langdon stress inducible dehydrin (Cor39) geneTnfohum repens pu

7、tative dehydnn (DrlNb-P) geneCicer anetinum dehvdnn DHN3-hke (LOC101504337其次,再看MP、ML (以Phylip为例)及Bayes法,此次Baye法得到的结果与MP法较为接近,表现为Gly与Cam 近邻,Tf与Cic近邻,Tc最远,不过MP法中涉及到了有效信息位点的选取的问题,我认为若个别序列长度很短的 话很可能会影响整体五条序列比对的结果,这大概是MP法不大稳定的因素。最后,Bayes法与ML法树形有一定差异的原因大概是由于贝叶斯的方法很依赖于一个合适的进化模型,并建立在 “独立性假设”的基础上:即,贝叶斯定理假设一个

8、属性值对给定类的影响独立于其它属性的值,所以GTR模型是 否适用还有待了解,至于ML法,在分析序列是也同样使用了一个概率模型来评估各种变异。所以可以预见到,若 Bayes法与ML法使用的概率模型不同,其比对结果自然就会有很大的差异。TriticumCicerCicerTriticumTrifoliumTrifoliumphylip ML法构树(核酸)CamelliaCamelliaGlycineGlycinephylip MP法构树(核酸)对于对应的五条蛋白质序列也有相似的特点,但值得注意的是,蛋白质序列没有考虑内含子的存在。倘若以蛋白质 dehydrin本身为分析对象构树自然应使用蛋白质序列

9、,但若构建物种树的话,使用核酸序列应更为准确。(下图为 Phylip中蛋白序列的Bayes法构树结果)2. Run BLASTP with a protein sequences you are interested in, choose RefSeq as the database, select more than 20 hits of different identity (at least pick one for max identity around 90%, 80%40%,pick a dozen for max identity 30-40%),download the seq

10、uences and analyze the evolutionary relationship among the sequences with MEGA (with more than 2 methods) and answers the following questions: Is your tree consistent with the standard taxonomies? Do the trees generated from different methods have the same topology ? If not, describe the differences

11、 and indicate why you think the two trees differ. Do the trees show evidence of paralogous evolution ? Which nodes are orthlogous and which are paralogous bifurcations? Do the trees show evidence of horizontal gene transfer?对同源蛋白质家族,首先利用Clustal X进行多重比对,将大片段的缺失插入和一些模糊不清的联配位置从联配结果 中去除,然后利用Neighborjoin

12、ing方法构建基因树,再用引自展法法(BootStraping)检验基因树的稳健性(1000次 重复)。若在复杂的系统发育情况下,基因树与物种树会出现不一致。按照目前的分子系统发育学这种不一致是由 分子进化事件,基因重复(gene duplication)和基因丢失(gene loss)引起的。在极大简约法(maximal parsimony)原理 下(即这两种进化事件出现次数达到极小),可以追踪出多基因家族历史中的进化事件,且以此构建与物种进化历史 一致的完整基因树(full gene tree),即协调树(reconciled tree)。本次使用MEGA分别通过最大简约法和极大似然法构建

13、据固氮酶氨基酸序列构树,并于NCBI上的标准物种树比较。 首先,可以发现构建的进化树与NCBI上的物种树有很大的差异。如Halothece sp. PCC 7418(在标准物种树与MP 中标注*号),在物种树中与Cyanothece sp. PCC 7822近邻,然而在MP法树形结构中分距很远。此外,我们可以看 出,虽然在物种树里面的各节点分别代表31个不同的物种,但属名相同的物种往往近邻或成簇,而MP法则不然(标准物种树图与MP图中的-号)Holophaga foetidaAnabaena variabilis ColeofasciculusVnfDMethannsarcma barken

14、str. FusarovnfDMethanosarcina barken str. FusaroNifDllyobacter polytropus DSM 2926NifDDesu turomonas acetoxidansNifDHalothece sp. PCC 7418NifUSinornizobium meh oti 1021NifDHalothece sp. PCC 7418NifDSinomizobium meh oti 1021VnfDCIostridium sp. Maddingley MBC34-26vnfUAnabaena variabi is ATCC 29413vnfD

15、Ethanoligenens harbmense YUAN-3VnfDCIostridium pasteurianumAnfDC ostndium arbustiAntDSyntrophobotulus glycohcus DSM 8271nifDMethanotnermococcus okinawensis H1NifEKIebsiella pneumoniaeNifENostoc sp. PCC 7107NifbCyanothece sp. PCC 7822NiftMethanosarcma barken str. Fusaro NifURhizobium legummosarumvnfN

16、CIostndium kluyven DSM 555Nifn/frxC-tamily protein Holophaga foetidaNifH/frxCDesu fotomacu um acetoxidans DSM 771AnfDRhodobacter sphaeroides KD131AnfDCIostndium kluyven DSM 555AnfDTniorhodococcus drewsnVnfDCIostridium pasteurianumAnfDC ostndium arbustiNifb/NifNPelobacter propiomcus DSM 2379Nifb/NifN

17、Geobacter bemidjiensis BernNifESinorhizobium fredu HH103NifcColeotasciculus chthonoplastesNifbThermincola potens JRNifEDesulfotomaculum nignficansNifEMethanococcus manpaludis S2 NifEMethanobacterium sp. Maddingley MBC34 AntDSyntrophobotulus glycohcus DSM 8271AnfDCIostndium kluyven DSM 555mfDMethanot

18、hermococcus okinawensis H1VnfDCIostridium sp. Maddingley MBC34-26vnfUAnabaena vanabi is ATCC 29413NifDllyobacter polytropus DSM 2926NifDDesu furomonas acetoxidansNifDRhiznhiumlegummosarumNifEThermincola potens JRNifEDesulfotomaculum nignficansNifEMethanosarcma barken str. FusaroNifEColeofasciculus c

19、hthonoplastesNifEMethanococcus manpaludis 52Mitt Met ha no bacterium sp. Maddingley MBC34Nitt/NifNPelobacter propiomcus DSM 2379NifE/NifNGeobacter bemidjiensis BernNifESinorhizobium fredu HH103NifEKIebsiella pneumoniaeNifENostoc sp. PCC7W7NifECyanothece sp. PCC 7822vnfNCIostndium kluyven DSM 555iMif

20、H/frxC-family protein Holophaga foetidaNifH/frxCDesu fotomacu um acetoxidans DSM 771Desulfotomaculum marificansVnflJEthanoligenens harbmense YUAN-3AnfDRhodobacter sphaeroides KD131AnfDThiorhodococcus drewsnPelobacter propiomcus DSM 2379Geobacter bemidjiensis EemClostridiiplostrid山m pasteune Clostrid

21、ium arbustiClostridium sp. Maddingley MBC34-26Thermincola potens JRSyntrophobotulus glycohcus DSM 8271 jjKlebsiella pneumoniaeMethanobacterium sp. Maddingley MBC34 -我们再在MP法与ML法的树形中对比,得到两树的共同特点是找到的近邻序列相似,若不考虑枝长的因素下,树 形的拓扑结构大致相同。然而MP与ML法中最大的差异表现在一些非近邻物种间的亲缘关系的远近上,(如上图中, Ethanoligenens harbinense YUAN-

22、3与Clostridium kluyveri DSM 555,两图中分别以+号表示),这显然是考虑树形结构 时采用的标准不同导致的,MP法是树中的进化事件出现次数最小,而ML法使用了概率模型来评估变异,分析最 大可能。据上所述,物种树与蛋白序列树显现出了较明显的不一致性,推测这是由分子进化事件(即基因重复或丢失)产生 的,下面以MP法树形为例分析在31条序列中由这种树形的不一致性表现出的直系,并系和异同源。(MP树)VnfDCIostridium sp. Maddingley MBC34-26 梭爵属梭画04VnfDAnabaena variabilis ATCC 29413 鱼腥藻蓝醐肮*V

23、nfDMethanosarcina barkeri str. Fusaro 甲烷八登球耐属甲烷球菌纲5*VnfDEthanoligenens harbinense YUAN-3 哈尔滨乙醇杆函梭西纲 4 VnfDCIostridium pasteurianum 梭函屈梭帝啊4 AnfDCIostridium arbusti梭菌飒4AnfDRhodobacter sphaeroides KD131 类瑙巳田前嫂形函婀 1 AnfDCIostridium kluyveri DSM 555 梭苗属梭0 4 AnfDThiorhodococcus drewsii 途菌属 Y变形函纲 6 AnfDSyn

24、trophobotulus glycolicus DSM 8271 消化球菌(科)梭菌地 4 nifDMethanothermococcus okinawensis IH1 甲烷热球函.属甲烷球帝甑 5* NitDIlyobacter polytropus DSM 2926 硝化函房泥杆国枝帝地4 NifDDesulfuromonas acetoxidans除硫单胞菌属&变形菌卿日 NitDHalothece sp. PCC 7418 蓝蔬闰蓝醐3* NifDSinorhizobium meliloti 1021苜蓿中华根瘤菌/变形菌觐1 NifDRhizobium leguminosarum

25、豌豆根瘤酹姮形菌婀1 VnfNCIostridium kluyveri DSM 555 梭状芽I包杆函梭恰婀 4 NifH/frxC-family protein Holophaga foetida 全噬菌届全噬曲甑 7 * NifH/frxCDesulfotomaculum acetoxidans DSM 771 脱硫肠状酹屈梭菌地 4 NifE/NifNPelobacter propionicus DSM 2379 暗杆酹属 &变形菌飙m NifE/NifNGeobacter bemidjiensis Bern 地杆菌属 &变形菌婀3 NifESinorhizobiurnfredii HH

26、103 中华根瘤爵属 口变形菌纲 1 NifEKIebsiella pneumoniae 肺炎杆菌 Y变形菌甄 6 NitENostoc sp. PCC 7107 慈琮藻 2* NifECyanothece sp. PCC 7822 蓝制属蓝藻期2#NifEMethanosarcina barkeri str. Fusaro 甲烷八蓍球爵届甲烷球菌甑5* NifEColeofasciculus chthonoplastes 蓝藻 2 * NifEThermincola potens JR消化球菌科梭酹甑4 NifEDesulfotomaculum nigrificans 脱硫肠诚蔺届槌帝舰4

27、NifEMethanococcus maripaludis S2产甲烷球菌属 甲院球爵飒5 * NifEMethanobacterium sp. Maddingley MBC34 甲烷函属甲烷球前婀5*在上图中,我们可以从分类单元的描述中发现编码固氮酶的基因共有nif、vnf及anf三个基因簇。在基因簇内的不 同基因往往是由基因重复事件产生的,如NIFD、K、E、N的依次进化关系,但同一个基因簇的基因在不同物种中可 能会编码不同类型的蛋白,(如固氮酶的A、B、C、D四种类型)而且若虽同为一个基因簇,有可能同一属的某一物 种编码的蛋白与本属同簇基因编码的蛋白不近邻,但与其他属(甚至纲)的蛋白近邻,就要考虑基因的水平转移(如 与蓝藻或与古细菌近邻)。综合考虑,在树就得到了可能的物种分化事件(sp标出)、基因重复事件(dp标出)和 水平转移事件(ht标出),总结图中的划分依据:纲与基因簇同时改变或只有基因簇改变记为dp,纲改变而基因簇不 变视为ht,纲与基因簇均为变记为sp (种属改变)。所以可以看到,MP构树中包含了基因分子进化事件的三个复杂 的事件,并能推测出可能发生的固氮酶基因的进化历程。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号