荒漠杨树4CL基因的鉴定及其对盐胁迫的表达变化.docx

上传人:李司机 文档编号:5967252 上传时间:2023-09-09 格式:DOCX 页数:12 大小:205.39KB
返回 下载 相关 举报
荒漠杨树4CL基因的鉴定及其对盐胁迫的表达变化.docx_第1页
第1页 / 共12页
荒漠杨树4CL基因的鉴定及其对盐胁迫的表达变化.docx_第2页
第2页 / 共12页
荒漠杨树4CL基因的鉴定及其对盐胁迫的表达变化.docx_第3页
第3页 / 共12页
荒漠杨树4CL基因的鉴定及其对盐胁迫的表达变化.docx_第4页
第4页 / 共12页
荒漠杨树4CL基因的鉴定及其对盐胁迫的表达变化.docx_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《荒漠杨树4CL基因的鉴定及其对盐胁迫的表达变化.docx》由会员分享,可在线阅读,更多相关《荒漠杨树4CL基因的鉴定及其对盐胁迫的表达变化.docx(12页珍藏版)》请在三一办公上搜索。

1、荒漠杨树4CL基因的鉴定及其对盐胁迫的表达变化摘要:4-香豆酸:辅酶A连接醐(4CL)基因是植物类苯丙烷生物合成的关键基因。我们在两种荒漠杨树(胡杨和粉叶杨)和盐敏感同源杨树(毛果杨)的基因组中发现了20个4CL基因,而在柳树(SaIiXWilIOW)中发现了12个4CL基因。系统发育分析将所有的杨柳科4CL基因聚为两个分支,其中一个(对应于拟南芥的4CL类分支)显示了适应进化的信号,杨树中保留的基因比沙柳和拟南芥多。我们还发现,沿着两个荒漠杨树谱系,4CL12(在类4CL分支中)表现出正选择。转录图谱分析表明,与毛果杨树相比,4CL2、4CL11和4CL12在荒漠杨树中的表达对盐胁迫的响应发

2、生了显著变化。我们的结果表明,4CL基因的进化可能有助于这两种荒漠杨树耐盐性的发展。1. 引言4-香豆酸:辅酶A连接酶(4CL;EC6.2.1.12)通过催化辅酶A酯1,2的形成,在苯丙烷代谢中发挥重要作用。4CL调节一条有助于类黄酮和木质素合成的特定分支途径3。这两种产物都控制植物的各种生理功能,并提高植物对环境胁迫的适应能力4。4CL蛋白属于AMP结合蛋白家族,包含一个决定性的结构特征:AMP结合结构域中的两个保守结构域5。一个结构域(框I)由一个富含丝氨酸/苏氨酸/甘氨酸(STG)的区域和一个膈氨酸/赖氨酸/甘氨酸(PKG)三联体组成6,这是建立腺首形成超家族的一个重要标准7。另一个结构

3、域包括一个GEICTRG基序(框II),其中半胱氨酸残基可以直接参与催化8。自1981年首次克隆和鉴定4CL基因以来,己在水稻10、大豆11、火炬松12、拟南芥13,14、烟草15,16、杨树2,17和杂交杨树18等植物中发现并研究了一系列4CL和4CL类似基因。在高等植物中,4CL是由一个多基因家族编码的,基因成员的数量因植物种类而异。根据系统发育分析,4CL基因分为两类,I类和II类14,19o第一类蛋白质的结构在所有植物中都是保守的,而第二类蛋白质的结构甚至在同一物种中也是不同的14。在拟南芥基因组中,已检测到4个4CL基因和9个4CL类基因,其中3个4CL基因(4CL1、4CL2和4C

4、L4)属于I类,1个(4CL3)属于H类,其余9个基因被归类为4CL-Like20,它们被预测编码的蛋白质全长与4CL几乎50%相同,并包含与4CL19相同的几个保守基序。在这里,他们都被视为同一基因家族的成员。已有研究表明,第II类中的4CL基因与类黄酮的生物合成密切相关,而第T类中的4CL基因参与木质素和其他苯丙烷类化合物的生物合成14,19o尽管它们的确切作用尚不清楚,但4CL样基因可能与其他功能相关19,20o有证据表明,盐胁迫导致植物细胞壁木质化增加21。因此,人们假设4CL基因的功能与植物遇到的环境胁迫密切相关8,22,23o生长在沙漠地区的两种杨树(胡杨和粉杨)已经适应了高盐度地

5、下水和干旱环境:这两种杨树在维持当地干旱生态系统方面发挥了关键作用24-27。这两个树种的木材比其他杨树坚硬得多28,它们可能在木质部中积累了更多的木质素,用于结构支持和水分运输,以应对极端干旱的环境。然而,对这一现象的研究一直很有限。在本研究中,我们对这两种荒漠杨树和一种盐敏感杨树(P.Sichcarpa)的4CL基因进行了进化分析。我们还利用来自三个物种的愈伤组织来寻找该家族中4CL基因在盐胁迫下表达的任何变化。我们的结果为该基因家族在荒漠杨树环境适应中的进化作用提供了重要的见解。2. 材料和方法2. 1.4CL基因的基因序列收集与鉴定4CL基因在胡杨胡9、三果杨30(JGlV9.0)31

6、、粉果杨32和苏州柳33的蛋白质数据库中被鉴定,从细胞壁基因组34检索到的拟南芥13个4CL基因的蛋白质序列。根据这些蛋白序列,利用BLASTP程序寻找与13个拟南芥基因同源的杨树基因模型,其e值截止值为1-E30o从阳性杨树基因模型命中得到的蛋白质序列然后完成了与tair9.0网站上的拟南芥基因组中的所有蛋白质的BLAST搜索35o具有13个拟南芥基因之一的蛋白质被鉴定为候选的4CL蛋白质。然后,我们应用HMMER程序36,以AMP结合结构域序列为查询,从蛋白质家族数据库(PFAM)数据库37中获得AMP结合结构域(PF00501.21)的隐马尔可夫模型(HMY)轮廓36,以识别杨树基因组中

7、的4CL序列。使用具有默认设置的PFAM批搜索进一步验证这些序列。用两种方法确认的序列用于进一步分析。本研究中使用的4CL基因是根据先前研究20中的拟南芥基因名称和本研究中的系统发育分析而重新命名的。表Sl给出了所使用的五个物种的所有4CL基因的信息。2.2. 系统发育分析用CLUSTALW238比对了拟南芥、胡杨、毛果胡杨、毛果胡杨和苏氏胡杨的全长氨基酸序列。使用MUSIC40和分子进化遗传学分析版本6.0构建了一棵无根邻接(NJ)39树。通过100个重复的Bootstrap分析对树节点进行评估。BOotStraP值小于50%的分支被折叠。此外,通过比较编码区和基因组序列获得基因结构,并使用

8、可伸缩向量图形(SVG)42显示。使用Memev4.10.1)43检测用于系统发育分析的假定4CL蛋白质序列,并将其用于分析可能的保守基序;使用默认参数,但识别的基序的最大数量定义为20。根据基序在Menle中显示的顺序对基序进行编号。用简单模块化结构研究工具(SMART)蛋白质分析软件对检测到的基序进行注释44,45o2.3. 分子进化分析为了评估我们确定的两个主要分支的选择压力的变化,使用最大似然系统发育分析(PAMLv4.6)46中的CODEML分支特定模型来估计非同义替换与同义替换的比率(3)。在两个先验假设下:一个比率模型,在哪一个?假设整个树的值,以及两个比率模型,在哪?允许两个主

9、要派别之间的价值不同。使用INPARANOlD47和MULTlPARAN(HD程序48对五个物种之间的同源蛋白进行鉴定。用MEGA-6程序包重建同源群体间的系统发育关系。用CODEML和PAML的分支模型估计各正位基因组的选择性压力的差异。在不同的假设下,选择胡杨或粉刺胡杨作为前景。对于一些直系类群,分支模型检验表明,两个支系之间的选择压力存在显著差异。因此,我们使用分支点模型来测试胡杨和粉尘胡杨分支中的一些氨基酸是否发生了正选择。然后应用贝叶斯经验贝叶斯方法49来确定肯定选择的候选地点。为了检验哪种模型最符合数据,通过比较使用K?分布的模型对之间的对数似然值的差异来执行似然比检验(LRT),

10、自由度等于模型之间的参数数量的差异50。4CL基因家族分析的流程图如图1所示。由4个物种组成的基因组蛋白质数据库拟南芥的13个4CL基因BLASTP 计戈 U(e30)HMMEK PFAM功能域Cluastx Prank序歹!对齐Mega, PHYML系统MEME模体检测用于分子进化分析的PAML2. 4.4CL基因在盐胁迫和控制条件下的表达根据毛果杨树51、胡杨29和粉尘杨树52的RNA-Seq序列数据,对杨树4CL基因的表达进行了分析。首先使用前面描述的方法从每个物种的芽中诱导出愈伤组织53,54o然后,使用CTAB程序从对照和盐胁迫(200mM氯化钠处理6、12、24和48小时)愈伤组织

11、中分离总RNA55。使用AgiIent2100生物分析仪检测了RNA样品的质量和完整性,其RIN(RNA完整性数)值在8.6到10.0之间,没有降解的迹象。进行3次生物复制,收集等量的总RNA构建文库。用含寡核昔酸(DT)的小球分离Poly(八)mRNA,然后用随机六聚体-引物和逆转录酶(InVitgen,CarlsbadCA,USA)进行合成。在末端修复、接头连接和PCR扩增后,使用IlluminaGenomeAnaIyZer平台对文库进行测序。使用BoWtie256软件,用默认参数将来自三个杨树物种的清洁读数映射到其自己的参考序列上。RNA-Seq的灵敏度将是摩尔浓度和转录本长度的函数。通

12、过归一化RNA长度和测量中的总读数,RPKM读出密度的测量反映了转录本在起始样本中的摩尔浓度57。因此,基因表达水平被测量为给定基因内的外显子区域上每千碱基每百万个映射读数(RPKM)的读数57,为了减少背景转录的影响,我们只从两个或更多时间点的样本中选择具有RPKM21的基因进行进一步分析。为了从毛果杨树、胡杨树和粉果杨树的对照愈伤组织和盐胁迫的愈伤组织中鉴定差异表达基因(DEG),Edger58被用来估计负二项分布下原始读数的平均值和方差,并使用精确测试来鉴定差异表达的转录本。在Edger得到每个表达基因的P值后,我们用假发现率(FDR)来证明P值由R中的函数P调整来证明。如果log2(F

13、PKMsalt/FPKMControD1或G,且调整后的P值(FDR)0.05,则这些基因被鉴定为差异表达基因(Degs)59。3.成果和讨论3. 1.4种杨柳科植物4CL基因的鉴定2.5.识别基因家族成员的第一步是通过相似性搜索找到候选基因60。我们使用BLASTP程序搜索了三种杨树和一种柳树的注释蛋白质序列数据库,总共得到了168,528个蛋白质序列。我们分别从毛果杨树、胡杨、粉果杨树和苏氏杨树基因组中鉴定出20、20、20和12个4CL基因(表1和表S1)。三种杨树的4CL基因数目相同,均多于单株柳树。柳属和杨属植物都经历了共同的基因组复制。然而,与同一科中的另一个属相比,一个属内基因数

14、量的增加可能是两种可能性的结果:杨树可能在基因组复制后保留了比柳树更多的基因副木,或者这些副本可能是通过杨树特有的节段和串联复制而扩展而来的30。3.2.杨树4CL基因的基因结构和基序鉴定为了更好地了解杨柳科植物4CL基因的多样性,利用它们的系统发育关系比较了内含子/外显子排列和保守基序(图2)。如图2所示,密切相关的基因通常更相似,结构上只有内含子和外显子的长度不同。一些相近的基因对确实有不同的内含子/外显子排列。例如,Peu4CL16有10个外显子,而它的近源同源基因Ptr4CL16和Ppr4CL16分别只有6个和5个,尽管它们的系统发育关系得到了较高的BOotStraP值的支持。然而,总

15、的来说,我们的结果表明,杨树的4CL基因具有相对保守的外显子/内含子结构。图2.上述五个物种的4CL基因的系统发育关系、基因结构和基序结构。利用MEGA6软件对拟南芥(At)、三果柳(Ptr)、粉叶柳(PPR)、胡杨(PeU)和苏州柳(WiI)的全长氨基酸序列进行比对,构建了一棵无根NJ树。BOOtStraP值低于50%的分支被折叠。这棵树分为两个分支:不同的颜色背景代表三种4CL:类4CL(红色)、I类(绿色)和H类(橙色)。每个4CL基因的外显子和内含子的长度按比例显示。蓝色实心框代表外显子;黑线代表内含子。用方框表示的主题是用模因预测的。数字和颜色代表图案1-20。方框大小表示图案的长度

16、。Table1.Comparisonof4CLgenefamilysizesinthefiveconsideredspecies.Organisms4CLgroupsTotal4CLsClassIClasslIClass-CLlikeArabidopsisIhaliana31913Populustrichocarpa511420PopulusPrUiHoSa411520Populuseuphratica411520SalixSuchowensis31812然后,我们使用在线程序Memev4.10.1分析了4CL蛋白中的保守基序。总共确定了20个保守的基序(图2和表S2)oMotif6和Moti

17、f10由典型的AMP结合结构域代表,富含Gly、Ser和Thr。属于腺昔形成酶超家族的4CL含有基序6或基序10。基序3和基序12是第二保守的特征基序,与GEIClRG一起。他们的中心半胱氨酸残基被认为直接参与催化5。除了保守结构域,在所有4CL基因中还有其他几个保守基序,如基序2、4和13,表明它们的重要性。然后,我们对主题2、4和13进行了智能注释。基序1和基序4由AMP依赖的合成酶或连接酶的AMP结合结构域代表,基序13由AMP结合酶C末端结构域代表。3.3.4CL基因的系统发育分析为了确定杨树4CL蛋白与其他物种中已知的4CL蛋白之间的进化关系,我们进行了多序列比对,并建立了拟南芥、胡

18、杨、粉尘杨、三果杨和苏霍威斯4CL蛋白的NJ系统发育树(图2)。在这项研究中,我们生成了一个新版本的系统发育重建,其中包含了来自三棵杨树、一棵柳树和拟南芥的4CL和4CL类氨基酸序列数据。总共有72个来自杨柳科的4CL基因和13个来自拟南芥的4CL基因被聚为两个分支,分别命名为A和B分支包括拟南芥中己鉴定的大部分4CL基因(At4CL5-8At4CL10T3),而B分支包含4个拟南芥4CL基因(At4CLl、At4CL2、At4CL3和At4CL4)和一个4CL基因(At4CL9)AT4CL3被归属于4CL类II14,我们的系统发育分析发现,每个杨树或柳树的共同起源只有一个同源拷贝。然而,对于

19、4CLClassI14,包括At4CLLAt4CL2和At4CL4,我们恢复了拟南芥和杨柳科的独立基因复制。At4CLl和At4CL2聚为一个亚支,At4CL4形成另一个独立的亚支,而杨柳科的At4CLl和At4CL2由两个独立的亚支组成。4CL-I类基因在调查杨柳科植物的种类数量有从3种(苏州杨树)到4种(胡杨和灰杨树)到5种(毛果杨树)(表1)o位于树枝B中的4CL基因At4CL9在每个杨柳科植物中只有一个同源基因。在分支A中,8个来自拟南芥的4CL类基因聚在一起,而在杨柳科植物中发现了不同数量的拷贝:14个在胡杨和灰杨树中,13个在毛果杨树中,7个在苏霍沃斯中。类似地,系统发育分析表明,

20、拟南芥和杨柳科的大多数4CL类基因具有共同的同源起源,但也有一些来自独立的谱系特有的基因组或基因重复。这些发现表明,一些4CL基因在进化上是动态的,而另一些基因保持稳定;重复的基因可能在共同的基因组复制后丢失。在1个盐敏性杨树和2个耐盐性杨树上,我们总共回收了6组1:1:14CL的同源基因。此外,我们还发现,三果青杨(Ptr4CL16和Ptr4CL18)和粉果青杨(Ppr4CU0和Ppr4CL17)发生了一次独立复制,导致在较小的亚类中每个物种多一个基因。3.4.分子进化4CL基因之间的系统发育关系表明,总共85个编码4CL蛋白的全长基因被分成两个不同的分支(图2)。为了确定A和B分支之间的选

21、择压力是否存在显著差异(图2),我们使用PAML程序包进行了最大似然密码子模型分析。对两个假设进行了检验:一个比率模型假设两个4CL分支的3(=dNds)比率相同;一个两比率模型,其中两个4CL类型被分配不同的3比率。单比模型和双比模型的对数似然比分别为InL=-8739.544694和-8719.525874(表2)。似然比检验表明,应该摒弃零(单一比率)模型,因此A和B两个分支的选择压力有显著差异(p0.001)。在两比模型下,分支B和A的值分别为0.21307和0.08243,表明分支A(包括最多的4CL基因)比分支B(包括4个4CL基因4CL1-4和一个同源的4CL基因4CL9)受到更

22、宽松的选择限制。Table2.SummarystatisticsofcladesfordetectingselectionusingbranchmodelsinPAML.BranchmodelInL2POne-ratioTwo-ratiosTwo-ratios=0.14106forallbrancheso=0.08243forCladeI=0.21307forCladeII0=0.08243forCladeII=0.21307forCladeI-8739.54-8719.5340.040.001为了寻找包含灰杨树和胡杨树基因的荒漠杨树分支适应性进化的证据,我们只使用了6组1:1:1的同源基因对

23、所有五个物种进行分析。我们排除了具有物种特异性基因复制或丢失的群体,这可能会影响适应性进化的估计。我们对每一组进行了系统发育分析(图3),并研究了荒漠杨树分支(灰杨和胡杨)(Al或Bl)与其他物种(A2或B2)在表观选择压力上的差异。我们使用了PAML中CODEML分支模型来估计两个分支的(=dNdS)值(表3)。LRT分析表明,二比模型对五株树(4CLIl)和六株树(4CL12)的拟合度显著高于一比模型(p4CLI2JT- Ppf4CLI2J -PtHCLI2IWiMCU 2CbdcA 2AT4CLII _AT4CLI2-图3.用于分子进化分析的4个杨树种与拟南芥之间6个同源4CL基因的系统

24、发育树。这些树是用NJ重建的,有100个自举重复。根据图2中属于A和B两个支系的直系同源,A和B分别代表A和B支系,因此荒漠杨树支系(灰杨和胡杨)被归为Al或Bl,其他树种被归为A2或B2。Table3.SummarystatisticsoforthologsfordetectingselectionusingbranchmodelsinPAML.TreeBranchmodel(tree)InL2PTree1One-ratio=0.09995forallbranches-4106.5051773.473988Two-ratios0=0,12256forCladcBl-4104.768183Tr

25、ee2One-ratio=0.05817forCladeB2=0.14031forallbranches-3879.089193.149266Two-ratioso=0.3196forCladeA1-3877.514557=0.1330forCladcA2Table3.Cont.TreeBranchmodel(tree)InL2PTree3Tree4One-ratioTwo-ratios=0.07578forallbranchescoo=0.10875forCladeBl=0.07299forCladeB2-4312.023369-4311.6389450.768848Tree5One-rat

26、ioTwo-ratios=0.19107forallbranches0=0.34271forCladeAl=0.17030forCladcA2-3400.606728-3398.8230323.567392Tree6One-ratioTwo-ratios=0.09507forallbranches(Do=0.40447forCladeA1=0.08459forCladeA2-2426.383206-2422.4519777.8624580.05One-ratioTwo-ratios=0.13484forallbranchestoo=030109forCladeAl=0.12124forClad

27、eA2-3524.776614-3521.9850975.5830340.05对于选择压力在两个分支之间不同的树5和6,平均值3分支Al和A2的值分别为0.40和0.08或0.30和0.12,表明沙漠杨树分支(AI)可能通过正选择保存了更多的氨基酸变化。为了验证这一假设,我们应用了分支站点测试来确定这两棵树的分支Al中可能处于正选择之下的目标站点。我们将分支Al和A2分别指定为前景和背景分支,并在正选择模型A下获得对数似然值。对于树6和零模型A0,分别检测到InL=-3482.762192和InL=-3471.911359的信号。LRT表明,零模型应该被拒绝(p0.99的正选择之下。除了一个例

28、外(对齐位置434),这些氨基酸位于基序2(图4)。为了推断选择对胡杨和粉叶胡杨的同源基因对的影响,使用了非同义替换与同义替换的比率(3=dNds),因为它是作用于基因的选择历史的指示器。比值显著小于1表明净化选择阻碍有害等位基因的传播,而比值1表明正选择促进有益等位基因在种群中的传播61。图5显示了同源基因的dN/ds图,结果表明,大多数对基因的进化主要是在净化选择的影响下进行的。其中,两个荒漠杨树之间的一对直系同源基因(Peu4CL15和Ppr4CL15)的dNdsl,表明正向选择,而一对dN/ds介于0.5和1之间,表明弱净化选择(表S3)oAMaaIZp*Pr*4CL12PWelJ2W

29、Ma.12McrtifLocationJ7SW I Me-109 I MIW I5IO9 75OCKTGriMiacrviKKGYMiNlKAsAtrmccMltTCDCCVTMIDfII| I. mcAvvv rvrQn Kufwxdaamv dactKATMTlMH(MfcT(W0MflVlWltilICVXQ*UieliMFfleAYinrottAGQlMUYVRiSl!rt(lHWlMVArfMlirVJU!yUrSrMXlRttl MlT Af TlHH(M KTGDCCVf SWLVlWlflirnWQ*T*fltllQS*F(IWAVirrKfMlMUYVP(iSItSIMArf

30、XimW!UieG I6YVGMKATAfSIIrO(MrTGOCEoSoGHyQmXM QWFMmlQMO图4.阳性选择位点的位置。来自5个物种274-435个氨基酸位点的4CL12同源序列包括5个基序,数字和颜色代表基序l-4o分支点模型预测的3个正选择位点为红色。在基序2中有两个位置(对齐位置425和433),一个位置(对齐位置434)在没有一个基序中。Table4.Summarystatisticsfordetectingselectionusingbranch-sitemodelsinPAML.ModeEstimatesofparametersInAZ2PPositivelysele

31、ctedsitesTrcc6BranchmodelOne-ratioTworatiosBranch-sitemodelModelAO(2=1)=0.13484forallbrancheso=0.30109forCladeA1=0.12124forCladeA2o=0.05407,po=0.82301.=0.05407,p=0.17699ti)2tfore=0.40000,()2bck=0.05407,P:,=0.000002bfare=1.00000.82=0.40000.P2b=0.00000-3524.7766145.583034-3521.985097-3482.7621921)0=0.

32、05457,PO=0.82708,=L00000.p=0.1561521fore-90.73377.s21bock=0.05457,P23=0.01411WJbfore=90.73377,t*)2bbck-1.00000,Pjb-0.00266-3471.91135921.7016661和pl的直系同源基因落在红线以上,dNds=O.5-1的直系同源基因落在绿线和红线之间。表S3列出了16对基因的名称和值(dN/ds)。4.结论我们通过对基因结构、系统发育关系、保守基序、分子进化和表达谱的综合分析,确定了杨树4CL基因家族的特征。我们从毛果杨树、胡杨、粉果杨树和苏州杨基因组中分别鉴定了20、2

33、0、20和12个4CL基因。所鉴定的4CL基因聚为两个分支,其间检测到不同的选择压力。一个基因(4CL类分支中的4CL12)沿着由两个荒漠杨树组成的谱系显示出正选择。此外,3个4CL基因(4CL2、4CL11和4CL12)在一个或两个荒漠杨树中对盐胁迫的反应明显强于对盐敏感的毛果毛白杨。总而言之,我们的研究结果表明,4CL基因的进化可能有助于这两种荒漠杨树耐盐性的形成。4CLI24CLIS 4.5图6.盐胁迫下同源4CL基因的表达分析。对盐胁迫下3种植物的6个同源4CL基因的相对表达水平进行了转录分析,其中4CL9基因在非胁迫和胁迫愈伤组织中均不表达,而同源基因(4CL15)在盐胁迫下没有表达。Y轴显示盐胁迫后不同时期愈伤组织中表达基因的log2转化RPKM值,X轴显示盐胁迫下的时间点。星号(*)代表在盐胁迫下达到log2(RPKMsalt/RPKMcontrol)1或T阈值的基因的表达,具有显著意义p0.05。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号