《模式微生物基因组学.ppt》由会员分享,可在线阅读,更多相关《模式微生物基因组学.ppt(135页珍藏版)》请在三一办公上搜索。
1、模式生物的功能基因组学从新的视角看老问题,梁 磊,1,原核生物如大肠杆菌(Escherichia coli)和枯草芽孢杆菌(Bacillus subtilis),单细胞真核生物如啤酒酵母菌(Saccharomyces cerevisiae)都被作为传统的模式生物,这是因为它们结构简单、功能复杂、在实验系统中具有内在的优势。,E.coli 的非致病实验菌株(K-12)被列为最早的全基因组测序对象,它在原核遗传学、分子生物学、生物技术、尤其是DNA重组技术领域是首选的模式生物。B.subtilis 是第一个进行全基因组测序的革兰氏阳性菌(1997),并且被作为研究生物化学、生理学、系统发育的遗传学
2、范例。,S.cerevisiae 具有真核细胞的所有基本功能,并且人类疾病30的阳性克隆与酵母同源,对S.cerevisiae 基因产物的生物学作用做准确的测定是极其重要的一步,这有助于我们提高对遗传学上更复杂的、不易研究的多细胞动物的认识。,基因组序列信息表明,超过30的开放阅读框(ORFs),包括E.coli的染色体和B.subtilis 的染色体没有实际的功能。在S.cerevisiae中大约6000个预测基因中的三分之一仍被归为未知细胞功能的阅读框。,因此,除了基因组结构分析以外,其它的系统研究得到的信息对大量的序列数据归类于生物学上有意义的位置是十分必要的。功能遗传学和相关的高通量综
3、合技术学和方法学(例如,DNA微阵列、全基因组突变、双向凝胶电泳、双杂交系统、蛋白微阵列)试图在转录组学、蛋白组学、代谢组学、内部作用组学的细胞区域中确定新的基因。,用功能基因组学方法分析和综合技术阐明模式生物的细胞区域,生物信息学,计算机建模,DNA微阵列,质谱,噬菌体展示,双杂交系统,蛋白质芯片,2D-PAGE二维电泳,质谱,2 Escherichia coli(大肠杆菌):模式真细菌,E.coli作为原核生物学中的模式实验生物,它的地位是无可比拟的。E.coli是最具特征的可自由生长的单细胞生物,并且它已用于研究细胞过程的生物学模式,如DNA的复制和修复、转录、代谢途径、应激反应、信号传
4、导和遗传学规律。,尽管遗传学研究已有几十年,但E.coli K-12基因组中编码4,288个蛋白的38%的基因仍然不清楚生物学功能。这表明我们的认知还存在严重的不足,甚至是对于那些已被很好地研究过的模式生物。,2.1Escherichia coli(大肠杆菌)基因组,E.coli 序列数据除了使全基因组功能分析的方法成为可能,同时也揭示了一些新的基因。基因组序列的生物信息学分析也已经预测了一些结构和调控元件,这些是各种生物化学途径或细胞机制方面知识所不能预见的。在搜索序列相似性的基础上,芳香族化合物,如苯酚丙酸盐的降解途径的未知步骤被其他四个假定的mhp基因所揭示。,在基因组序列确定之前,mh
5、p基因是已经存在的,但没有被鉴定。保守序列单元的出现确定了其中的一个mhp基因可能是由操纵子编码的代谢途径的转录调节子。序列研究揭示了第二个以前没有认识到的操纵子,该操纵子含有一些类似于假单胞菌(Pseudomonas)基因,能够降解芳香族化合物,如甲苯、苯、联苯。,假设的操纵子由三个基因组成,包括能够打开芳香环和氧化C1,C2的1,2-双加氧酶,一个类似于二氢-1,2-双加氧酶的开放阅读框和基因编码的铁氧化还原蛋白还原酶。,2.2 E.coli 转录组学,全基因组核酸序列使研究者们能够应用cDNA方法或者基于寡核苷酸的微阵列分析方法,根据特异性刺激物、遗传变异或者生理紊乱来评价基因组转录图。
6、,热激应答,热激应答,有时一般也称作应激应答,是一种内环境稳定的机制。这种机制是由活细胞在对温度升高不适应的情况下显示出来的。这种进化学上保守的分子对热反应的应答是一种限制性蛋白热激蛋白诱导合成的。除了热激外,其他不利的生理条件,如暴露在乙醇中或转入重金属,都能引起热激蛋白产量的提高。,在过热条件下,热激蛋白除了防止细胞蛋白变性和聚集外,也表现出一些对普通的生理生长所必要的功能,如辅助纠正多聚结构的组装,使新翻译的多肽折叠到它们自然的三级结构。因此,热激蛋白通常更多地被称为分子陪伴。,在细菌中,细胞对热激的反应首先在E.coli中被发现并得到细致地研究。由于热激反应的保守性,它已被作为一种模式
7、系统来研究其他原核生物(如古菌)的调节基因的表达。尽管微阵列提供了E.coli中对应于温度升高时的一系列潜在的参与者,但需要用与基因表达图谱相结合的其他方法给出一个完整的描述:细胞是如何整合和调控这些功能,对环境应激产生一致和快速的适应反应。,细胞代谢生长的转录组学分析,尽管我们已经知道一些与特定的生物合成或者代谢过程(如色氨酸生物合成)相关的必要的操纵子或基因,但不是出于这一目的的其它的基因在还没有发展更综合更全面的实验方法之前还没有被鉴定,这些基因影响着某些代谢行为或者受到某些代谢行为的影响。,E.coli的色氨酸操纵子是分析的最透彻的细菌生物合成操纵子之一。色氨酸操纵子的五个基因(依次是
8、trpE、trpD、trpC、trpB、trpA)编码分支酸转化为色氨酸途径的酶。色氨酸操纵子的转录受抑制蛋白TrpR的抑制调控,也受一种称为转录弱化作用的完全不同的调节模式的抑制调控。,功能基因组学,主要体现在微阵列介导的转录图,允许我们看到的不仅仅是微生物生理的某一焦点方面,如色氨酸代谢、特异性基因或调节子如何与基因表达的所有其他方面相互作用;而且还提供了一个观察基因组表达的视窗,如细胞在葡萄糖上生长的生理能力。,功能基因组学的价值在一项分析基因组表达的研究中得到了证实,即E.coli在含0.2葡萄糖的基本培养基上和在含0.2的肉汤培养基上对数生长后期的基因组表达。E.coli细胞在含葡萄
9、糖的富营养培养基上的生长速度(世代时间G=25min)是含葡萄糖的基本培养基的两倍(G=57min),DNA阵列表明,某些功能上的基因转录的差异性与两种生长条件下细胞生理性状一致,因此提供了依赖于基因表达和生物合成调节子全面调节的生长速率研究。与119个(占所有标注基因的2.8)在富营养培养基上生长的基因相比,225个(占所有标注基因的5.2)在含葡萄糖的基本培养基上生长的基因有很高的表达水平(比例2.5倍)。,影响生长速度的开放阅读框被分成以下几种功能类型:1、翻译装置;2、氮代谢;3、氨基酸生物合成;4、维生素、辅助因子、辅基、载体的生物合成;5、核苷酸生物合成;6、脂肪酸生物合成和降解;
10、7、碳源和能源代谢;8、细胞过程和整体调节子。,在以葡萄糖为碳源和能源的丰富培养基上E.coli生长的标志性特征是快速的生长速度,生物合成途径的停止,大分子合成基因,最显著的是蛋白质合成基因表达的增多。所有这些生理方面的特征在基因组表达水平通过利用全基因组序列信息和使用DNA阵列技术得以揭示。微阵列分子也揭示了在基本葡萄糖培养基上生长的细胞,其碳和能量代谢基因的表达量是丰富培养基上生长时的4倍。,利用综合的转录图谱,我们能够开始对这些未分类的基因根据它们与相似的或相关的基因共调节来描述一项假定的功能。此外,从微阵列实验中得到的可测试的假设可能提供证据来证实未知基因的生物学功能。因此,基于微阵列
11、的转录图谱为进一步研究特征性模式生物如E.coli提供了进一步的动力。,NtrC(氮调节蛋白C)调节子,微阵列遗传学技术具有很多优势,它能够在特异性调节蛋白转录控制下检测所有的基因和操纵子。DNA微阵列技术促进了多基因网络的出现,如Ntr(氮调节)系统,它能根据E.coli细胞的生理状态信息执行一项细胞功能,通过吸收环境中可利用的氨得到氮,从而进行氨基酸生物合成。,对外部有限的氮的分子反应是在氮调节蛋白C(NtrC)的控制下基因转录的活化。NtrC蛋白激活54-基因的转录,氮的吸收控制(Nac)蛋白通过激活氮限制条件下70-基因的转录,从而作为NtrC和70-操纵子的适配器。细胞以这种方式整合
12、各组基因和操纵子的表达以获得全面的适应反应。这种多基因条件导致了基因产物的表达,这些产物能够允许细胞利用环境中任何残留的氨,然后转变为其他的氮源,从而在氮限制条件下能够最小化生长。,为了完全揭示E.coli的NtrC/Nac调节子,Zimmer和他的同事们(2000)使用DNA微阵列将NtrC激活基因过表达的突变株的整体转录水平与具有ntrC无效等位基因菌株中的整体转录水平相比较。尽管氮的网络已经在E.coli中得到很深入的研究,但综合的基因表达图谱鉴定了许多新的NtrC调节子。,这些新的与ATP特异性结合的操纵子转运腐胺(potFGHI)、寡肽(oppABCDF)、二肽(dppABCDF)、
13、核苷酸(nupC)和D-丙氨酸/D-丝氨酸/甘氨酸(cycA)的次级离子共转运。其他一些新鉴定的NtrC/Nac-控制基因,包括几个编码假定蛋白(ycdGHIJKLM,yeaGH,yedL)操纵子,再次证明了微阵列表达图谱对于在某些细胞功能中说明未知基因的能力。,从全基因组的角度检测NtrC/Nac调节子表明,NtrC控制了大约2的E.coli基因,其中大部分是底物转运的操纵子。这些基因的假定功能强调了E.coli在清除环境中含氮化合物的能力,作为抵御氮饥饿的第一道防线。,2.3E.coli蛋白组学,除了基因组结构分析和转录组学特征分析使用阵列技术外,蛋白组学分析依然是功能研究的重要组成,因为
14、蛋白组学分析能够观察到基因表达的最基本水平。与蛋白组学分析相关的中心问题是序列分析预测的开放阅读框的可靠性,蛋白质的物理特征是否与那些开放阅读框预测的一致。而且,已测序生物的蛋白组学的研究揭示了重要的特征,这些特征仅从基于基因组序列的理论蛋白组学是推断不出的。,其它的信息包括生物体内蛋白的丰度,后翻译修饰,蛋白水解。蛋白组学分析的方法通常包括双向凝胶电泳(2-DE),然后是用N-末端测序或质谱的点鉴定。已有的全基因组序列对从双向凝胶中提取的蛋白种类进行快速鉴定很重要。,仅是基因组序列不能对最终在细胞中产生的翻译产物在生化特性和功能上提供一个全面准确的描述。除了个别存在差异,大部分情况下,由实验
15、得到的等电点值和分子量值与基因组序列预测得到的值相当一致。观察值和预期值之间的偏差可能由基因组序列的高度加工蛋白或错译造成。,用转录组学分析,蛋白表达和丰度的主要差异能在不同的细胞状态下测得。在Link和他的同事们的研究报道中,作者分别在最低限度的葡萄糖培养基中的指数生长期和丰富培养基中的稳定生长期检测了E.coli蛋白组的动态特性。2-DE分析不能全面的分析细胞的蛋白组学,几个在丰富培养基上稳定生长期早期鉴定的高丰度的蛋白质在葡萄糖最低限度培养基上生长的细胞中没有观察到。,这些蛋白质是:色氨酸酶(TnaA),用于色氨酸的降解和合成;半乳糖结合蛋白(MglB),在半乳糖转运入细胞的过程中起作用
16、;饥饿诱导蛋白(Dps),它与DNA形成了稳定的复合物,因此保护DNA不被氧化毁坏。这项研究表明了一个生物学原则:细胞改变它们的蛋白成分以适应变化的环境条件。,此外,还表明,更综合的分析方法,如最近发展的基因组学和蛋白组学的方法,正在改变我们观察活细胞的方法,甚至改变对已经被很好地描述过的模式生物的认识,如E.coli。蛋白组学能够被用来加强和支持由基因组序列分析提供的预测信息。,2.4 E.coli的模式代谢:计算机代谢组学,近来的基因组科学的重要目标是将细胞的核苷酸序列信息与生理功能相联系。由于从基因组序列和功能研究得到的大量数据还在不断的积累,迫切需要能够在硅片上建立系统的阐述和发展复杂
17、而完整的细胞系统的代表或数学模型。,图:用已有基因组序列、生理生化数据重建微生物代谢网络以基因组序列为框架,再结合生理生化实验数据,能够在芯片上构建代谢途径的信息,第一步,利用现有的相关基因组数据,生理生化数据重新构建微生物的代谢图谱。第二步,给代谢功能限制条件。第三、四步中,在细胞水平限制条件,以缩小符合要求的表型范围。通过这些步骤来预测代谢表现(例如,可以预测基因删除后对细胞和生物化学结果的影响)。,这些研究表明:代谢行为的计算机分析能够简化生长实验的设计和报告基因敲除的鉴定。此外,芯片分析可能会有助于鉴定丢失的(例如,假定的)或者不正确的功能分配,这些功能分配从基因组序列注释中得到。然而
18、,这一领域的最新研究还处于初期,这种计算机模式和计算机模拟需要反复的实验研究来改进芯片模式。,3 Bacillus subtilis:革兰氏阳性菌的典范,Bacillus subtilis是革兰氏阳性菌中最具特色的典型。它是一种需氧的杆状菌,能够形成内生孢子,在土壤和水中普遍存在。Bacillus subtilis和它关系相近的菌具有商业意义,因为它们具有代谢多样性,尤其是它们产生胞外水解酶(如,淀粉酶和蛋白酶)的能力,这些水解酶能够降解多糖、核酸、脂质。降解产物将作为生物体的碳源。,除了大分子水解酶的产生,Bacillus subtilis在营养饥饿的条件下开始次级代谢途径,如抗生素(如su
19、rfactin、fengycin、difficidin)的产生。营养性缺乏的条件使细菌可形成很独特的结构化学物质、辐射和干旱抗性的芽孢,这种条件下细菌生长难以重建。这些生理特征和遗传操纵的特征导致Bacillus subtilis成为研究革兰氏阳性菌的模式实验生物。它的全基因组序列在1997年发表,是第一个得到全基因组序列的革兰氏阳性真细菌。,3.1 B.subtilis基因组,在已经完成测序的基因组中,即使是研究透彻的模式物种,在全部预测能编码蛋白的基因中也有3060不能根据序列的同源性来划分其功能。B.subtilis也不例外,它有42的基因功能是未知的。尽管几十年来进行着大量的研究,但B
20、.subtilis中只有约1,200个基因(约30)的功能有实验证明,这说明我们要完全了解B.subtilis的生理特征,必须在发现和确认新基因功能方面付出更多的努力。,土壤微生物,如B.subtilis,在进化中得到复杂的调控系统以快速应对周围多变的环境条件和胁迫。细胞对环境压力适应性的调节在很大程度上受双组分信号转导途径的影响,该途径在原核生物中广泛存在。双组分调控系统包括一个传感蛋白激酶和与它同源的应激因子。在B.subtilis中,利用与已知蛋白序列的相似性,37个传感蛋白激酶和34个编码应激因子的基因已经被确定。,微生物经常面临着许多环境压力的胁迫(如温度、湿度或可用营养物质的变化)
21、。B.subtilis的基因组序列表明,有43个温度休克蛋白和总应激蛋白在细菌适应环境变化中起到重要作用。这些蛋白和它们在大肠杆菌中的同源蛋白有很高的相似性,说明革兰氏阴性菌和阳性菌的细胞应激反应在进化上是保守的。,ABC转运蛋白是B.subtilis中确定的功能最多的一组蛋白(Kunst et al.,1997),反映了两大类细菌外荚膜的结构差异。另外一些ATP结合转运蛋白可能增强了B.subtilis抗毒害的能力。B.subtilis基因组中预测共有77种ABC转运蛋白,已经通过克隆基因对它们有深入的了解。,E.coli和B.subtilis全基因组的测定,可全面地研究它们相关的基因组多样
22、性。这种比较基因组的分析提出了一个观点,即可能在10亿多年前,真细菌进化分为革兰氏阴性和阳性两大类。尽管在基因组大小上B.subtilis(4.2Mb)和E.coli(4.6Mb)类似,并且预测的B.subtilis基因约有1,000种(25)和E.coli完全同源,但在基因的功能和操纵子结构上两个基因组之间存在一些明显的差异。,和E.coli不同的是,许多B.subtilis基因参与次生代谢物如抗生素的合成。B.subtilis将近有4的基因编码大量的多功能酶,这些酶和链霉菌参与抗生素合成的蛋白质序列相似。基因组序列分析还清楚表明至少有10种原噬菌体或原噬菌体的痕迹,说明噬菌体侵染在遗传信息
23、空间传递上起了重要作用。,通过观察氨基酸和嘌呤合成基因来研究两个基因组在基因组织方面的差异,显示一些E.coli合成精氨酸和嘌呤的基因分散在染色体上,而在B.subtilis的同源基因则整合在操纵子上。E.coli和B.subtilis的基因组中大量未知基因功能的确定将使我们更深入的了解这些模式物种的进化、生理以及功能分化。,3.2 B.subtilis转录组学,B.subtilis的全基因测序完成以来,人们建立了许多系统的功能分析来描绘不同生长条件、环境胁迫或抗逆、遗传突变情况下基因的功能和调控网络。下面我们将讨论基于微阵列技术的B.subtilis热休克反应的功能分析,双组分调控系统和B.
24、subtilis在不同环境下的生长。这些研究说明了功能基因组如何为B.subtilis的生理学提供充足的实验证据。,B.subtilis中的热休克B.subtilis遇到不同的限制其生长的环境压力,如热休克、渗透压和机械压力时,激活大量应激调节子基因来反应,这些调节子受一种转录因子B调节,同时转录调节因子HrcA或CtsR调控另外一些热诱导基。,转录因子B 是革兰氏阳性菌的总应激因子。代谢、环境压力或饥饿情况下B 因子的活化是应激调节子诱导中重要的一步。许多总应激基因的转录在植物依赖A启动子下发生,但是遇到压力或饥饿依赖B因子途径就会急剧增强。发现新的受B调节的基因并且确定其功能将有助于我们了
25、解总抗逆调节子在B.subtilis抗逆适应中起到的生理作用。,DNA微阵列包含了约4,100个已知的B.subtilis开放阅读框中将近90的PCR扩增片断,它用来检测热休克的整体转录水平。在这项研究中,培养的B.subtilis细胞从37(最佳生长温度)转到48(热休克温度)来引发热休克反应。从生长在两个不同温度的细胞中提取总RNA,用带有两种荧光的反转录酶标记,然后在B.subtilis的微阵列中做差异显示。,在基因组水平分析,B.subtilis整个复杂的热休克反应在单个微阵列实验中就可阐明:超过10的基因表达在热激下呈现明显的上调,同时超过5的转录水平激活的基因表达量上升至少3倍。微
26、阵列实验确定了70种已知或之前假定的依赖B 因子总抗逆调控元在转录水平上诱导,通过鉴定另外72种调控元包括24个编码设想的保守蛋白或无已知同源蛋白的基因,更综合地确定庞杂的B 调节系统。将这些功能未确定的基因划分为B 调控元是因为它们的蛋白行使帮助细胞抵抗不利的环境或代谢压力的功能。,假定的依赖B 因子的启动子中相同的序列与新鉴定的热诱导基因相近,有力地支持了转录水平表达谱的数据。基于微阵列的转录表达技术的局限性在于这种方法只说明了基因在某一特定的细胞途径中存在,因此需要详细的功能分析来确定这些蛋白在抗逆适应性中的确切功能。B.subtilis阵列技术也用于研究对乙醇应激的整体转录水平反应,确
27、定依赖B 因子的抗逆现象,最受关注的是胞质外W 因子的诱导以及抗盐反应中的整个调控元。,双组分调控系统,原核生物、低等真核生物和植物中的一类重要的适应性反应系统由两类信号传导蛋白组成:感受胞外刺激的传感组氨酸激酶和在转录水平上介导适应性反应的同源反应调节基因。双组分调控系统作为基本的应激相伴机制使得物种检测到环境变化并对之作快速反应。,该调控系统通过控制蛋白质磷酸化的变化来调节目的基因的表达。信号接受使膜结合的组氨酸激酶将ATP上的磷酸基团转移到高度保守的组氨酸残基上的能力发生变化,该残基一般在激酶的磷酰基转移二聚体结构域。组氨酸上的磷酸基团随后转移到同源反应调节基因的天冬氨酸残基上,使得后者
28、与目标启动子的亲和力增强。,B.subtilis的基因组测序已经表明大量假定的双组分调控系统的存在:37个传感激酶和34个反应调节基因已被确定,其中30个激酶应激调节基因组合在B.subtilis的染色体上相近排列。诱导这些双组分调控系统的环境信号还未知,因此通过适当地刺激细胞来确定它们的目标基因显得很困难。,为解决这个问题,Ogura 和他的伙伴(2001)在一个多拷贝质粒(pDG148)中,将应激调节基因置于受IPTG诱导的启动子控制下,然后在B.subtilis突变株中过量表达,破坏它们的同源传感激酶基因。应激调节基因的过量表达预期的结果是看到缺乏特定环境信号和同源传感激酶而无法磷酸化时
29、目标基因表达情况的改变。利用DNA微阵列分析确定了应激调节基因的过量表达在基因组转录水平上的影响。,生长和成孢过程中B.subbtilis的全局性基因表达,厌氧呼吸 细菌经常遇到外界含氧量水平的上下波动。与严格的需氧或者厌氧生物相比,兼性细菌在细胞代谢过程中如果遇到外界氧含量变化,它们就会通过感应氧压来进行适当的调节。细菌通过改变潜在基因的表达或者调节蛋白活性来适应氧化还原环境的改变。,一直以来都认为B.subtilis是严格需氧的生物,它以碳(以简单碳水化合物或者有机酸的形式)作为能源来生长和生物合成细胞元件。然而,研究证明,B.subtilis能够在缺氧条件下呼吸,它们以硝酸盐或亚硝酸盐为
30、最终的电子受体,或者在缺少外界电子受体的情况下进行发酵。,从硝酸盐到氨的异化还原过程需要两种酶,膜结合的硝酸盐还原酶(由narGHJI操纵子编码)和依赖于NADH的亚硝酸盐还原酶(由nasDEF操纵子编码)。延胡索酸盐/硝酸盐还原调节子(FNR)是无氧条件下诱导的能够调节narGHJI操纵子表达的转录活化子。双组分信号转换系统,ResD/ResE,它能在氧受限的情况下通过激活fnr转录子,从而在调节控制无氧呼吸的途径中起重要作用。,在没有硝酸盐和亚硝酸盐存在时,在无氧条件下B.subtilis不能很好地利用葡萄糖生长,但在培养基中加入丙酮酸盐后B.subtilis的生长得到很好地改善。目前尚不
31、知道无氧条件下基因表达的整体变化情况。为了在基因水平上揭示无氧基因表达的代谢和遗传控制机制,包含有4,020个开放阅读框的B.subtilis全基因组微阵列被用于检测在指数生长期有氧和无氧条件下基因表达不同的模式。,从有氧到无氧的转变,诱导或者抑制了几百个不同细胞功能的基因,包括碳代谢、电子转移、离子转运、抗生素产生以及压力适应应答。最突出的是包含了以下这些基因的表达:ydjL,编码了一个能够产生2,3-丁二醇脱氢酶的基因。ytkA,该基因在影响压力应答基因dps的上游;,未知区域yolIJK,它编码了一个能够产生类似于aspartyl蛋白酶(YolJ)和二硫键氧化还原酶的基因。其他一些未知基
32、因的mRNA的量在某些无氧条件下会优先得到显著提高。当B.subtilis在硝酸盐或亚硝酸盐上生长时,YkzH和ykjA基因能够得到高水平的转录。,然而,ywcJ和yumD基因的转录水平在没有丙酮酸盐存在的发酵条件下,能够提高3050倍。还有一些未知基因簇,yjlCD和yxxG-yxiM,能够在硝酸盐和亚硝酸盐异化还原过程中和没有丙酮酸盐的发酵生长过程中被负调节。尽管微阵列表达谱分析用于探究基因功能只是探索性的,但报道的结果至少能对以前没有注释功能类别的基因建议一些可能的功能。,Bsubbtilis中的硝酸盐和亚硝酸盐的信号基因表达谱是对narGHJI(硝酸盐还原酶)、narK(硝酸盐排出蛋白
33、)、fnr(球状厌氧呼吸调节子)和hmp(生理功能未知的被公认的黄血色素),以及nasDEF(硝酸盐还原酶)、cydABCD(细胞色素氧化酶和ABC膜转运蛋白)、sbo-alb(一种未知蛋白subtilosin)、ywiD(生理功能未知)、ywiC(生理功能未知)的一种极好的诱导。,在葡萄糖培养基中低效率发酵生长的特点是pdhAB(丙酮酸脱氢酶)表达量的减少和lctPE(L-乳酸透性酶和L乳酸脱氢酶)表达量的显著增加。整体转录谱(global transcriptional profiling)显示B.subtilis中控制厌氧呼吸的调控线路是动态的和复杂的,在这个调控线路中还包含了一些特定专
34、门调节硝酸盐厌氧呼吸的基因和另一些在发酵生长中发挥根本性影响的基因。,孢子形成,历史上,科学家们之所以对B.subtilis如此的感兴趣以至于将它作为一种实验模式生物,很大程度上是因为这种细菌可以经历孢子形成的过程,而这种过程往往是对饥饿的高度特化的适应性反映。在细菌中,孢子形成代表了一种相对简单的实验可追踪的发育过程,它能导致细胞结构的转变。,由于孢子形成是一个复杂的分化过程,所以它需要一个错综复杂的转录调控系统去协调基因表达和复杂的形态变化。这一过程需要一系列受到多重调控的转录因子的活性。经过许多实验室的数十年的研究,和孢子形成有关的主要基因已经被分离和鉴定,其中包括控制B.subtili
35、s进入孢子形成的转录活化蛋白和抑制蛋白Spo0A。,图:对微阵列得到的586个Bacillus subtilis基因的转录图谱进行分级分析,这些基因的表达水平依赖于Spo0A。具有相似表达图谱的基因归为一类。如图所示,这些基因共分为三大类:(1)依赖于Spa0A但是不依赖于F表达的基因;(2)表达受到Spo0A阻遏的基因(3)受F控制或者一些能够形成孢子的下游转录因子控制的基因。每一大类的代表基因均在图右侧表明。红色和绿色分别代表高低不同的mRNA表达水平。,3.3 B.subtilis蛋白组学,一些研究小组通过建立二维的蛋白图谱精确定位物理位置,已经得到了B.subtilis 基因表达的特殊
36、模式。下面着眼于产孢B.subtilis细胞胞外蛋白和在外力诱导蛋白的分析,并介绍蛋白质组是如何提高我们对整体细胞的认识。,胞外蛋白组,像土壤微生物那样,B.subtilis及其相关的种分泌大量的蛋白,主要是降解酶,它们保证细菌可以从广泛的底物中吸取营养物质从而可以在复杂的连续变化的环境中生存。另外,真细菌的分泌蛋白还有其他重要的机能,比如,细胞之间的互相交流,解除环境毒素,或者降低竞争者的数量。,B.subtilis胞质蛋白的二维图谱显示在对数生长期大多数的蛋白是由那些在糖酵解,三羧酸循环,氨基酸的生物合成,翻译和蛋白量的控制中保守的持家基因所分泌的。,整体的数据显示,B.subtilis的
37、胞外蛋白质组包括糖类代谢有关的酶、蛋白酶或肽酶、氨基酸代谢中有关的酶、核酸降解有关的酶、脂酶、碱性磷酸酶、磷酸二脂酶、细胞壁生物合成中的蛋白、脂蛋白(包括不同转运系统中的底物结合元件)、解毒蛋白、鞭毛蛋白、推测中的转录因子、蛋白合成和折叠有关的蛋白(包括GroEL伴侣)、原噬菌体有关的蛋白、产孢特异性蛋白和13个未知功能的蛋白。,4 酵母(Saccharomyces cerevisiae):高等真核生物的模型,电镜图片,酿酒酵母(Saccharomyces cerevisiae)是一种简单的单细胞真核生物,可以作为高等真核生物的模型生物。对这个物种的研究可以使我们了解细胞生命最基本的机制,尤其
38、是人类遗传病的分子基础。与人类相比,S.cerevisiae的基因在实验中更容易操作,可以比较容易的删除、突变、然后重新转入酵母细胞内、过表达、标记并全面地对基因进行研究。,46%的已被识别的人类蛋白在酵母的蛋白质组中都找得到结构同源蛋白。这些人类和酵母共有的同源蛋白都参与细胞生命中很基础的活动,如DNA复制、重组和修复,RNA转录、翻译,细胞内物质转运和基本代谢。,比较有医学意义的是,酵母的基因与30-40%的人类疾病相关基因有很高的序列相似性。虽然很难评估酵母和人共有的的结构同源基因在功能上是否保守,S.cerevisiae代表了一个很宝贵的实验系统,可以使我们探索还没有被了解的人类疾病的
39、相关基因。,酵母作为复杂真核生物实验模型的一个潜在价值是,与人类肾性脑白质营养不良(adrenoleukodystrophy)相关的ALD基因,肾性脑白质营养不良是一种神经退化性疾病,这种病人的过氧化物酶体中饱和长链脂肪酸的-氧化是有缺陷的(过氧化物酶体是微体的主要类型,或者是真核细胞质中的由膜包裹的,含有特别酶类的细胞器)。,人类ALD基因部分编码一个ABC转运蛋白,这种蛋白位于过氧化物酶体的膜上,与酵母细胞的两个ORFs,Pal1p和Ykl188c,有结构同源性。但是,因为基因序列和基因功能不是总能在不同的物种之间保持保守,所以在用模式生物,比如酵母的同源基因解释人类疾病时仍需要谨慎。,4
40、.1 酵母基因组,出芽酵母S.cerevisiae的全基因组序列1996年已经测定,这项工作由来自比利时、英国、加拿大、美国、法国、德国、日本和瑞士的科学家通过国际合作完成。它的全基因组序列在1996年公布,这标志着第一个真核生物的基因组被人类阐明。通过对16个独立的染色体中1200万对碱基的序列分析,人们推测约有6,247个可能的开放阅读框负责编码酵母细胞中的蛋白质产物。,S.cerevisiae基因组序列测定完成后的几年中,根据序列和遗传信息,几乎所有的酵母基因都被注解。在线的酵母基因组数据库(MYGD),可通过慕尼黑蛋白序列信息中心(MIPS)被访问,此数据库提供了文献中记录的已被注解的
41、功能特征、同源性,ORF、RNA基因和其他遗传元件的结构、以及经典遗传学、生物化学和细胞生物学知识。,另一个可被访问的在线数据库是酵母蛋白组学数据库(YPDTM),它可作为一个关于S.cerevisiae蛋白组织信息的综合数据资源。YPD包含了来自许多详尽的、深入的科学文献的蛋白信息。虽然关于酵母的系统的研究有悠久的历史,但截止到基因组序列完成,仍有32%的由基因组序列推测得到的蛋白质的功能还未被确定。,全基因组序列测定已被用于识别可能的新基因,这些基因在经典的遗传学研究中被遗漏;同时还可提供酵母16条染色体的高级组织信息,以及不同染色体上基因和其他序列元件(如,转座子、重复区域motif)的
42、分布特点。测序工作揭示了可观的遗传冗余,特别在酵母染色体的末端。如染色体的两个末端区域domain的核酸序列具有较高的同源性,同时也与染色体和的末端domain同源。,通过基因组的序列可以推导出理论上的酵母蛋白质组,以标准同源性为准则,用信息学的方法对其蛋白质组进行分析后,把50%的酵母蛋白进行了功能分类。自从酵母基因组序列的公布和功能基因组学技术的出现,人们在根据经验确定编码新蛋白基因的功能方面取得了巨大的进步。运用计算机手段得到的信息为实验的进行提供了有价值的指导,但我们仍需要DNA芯片、基因删除和生化分析等功能研究方法,来验证蛋白的功能。,保守的信息学研究发现,酵母11%的蛋白质组参与了
43、代谢(包括发酵和氧化代谢),7%参与转录,6%参与翻译,3%参与能量的产生和储存,3%用于DNA复制,修复和重组。基因组测序也揭示了一些基因产物的存在,而以前人们对这些物质是否存在并不确定。,先前对酵母染色体的研究一直认为S.cerevisiae没有组蛋白H1。但基因组序列的研究表明,S.cerevisiae具有全部的组蛋白,包括H1,其编码基因位于染色体XVI。另一个例子就是基因组测序发现并将微管蛋白基因定位在染色体XII上,而在此之前,虽然酵母遗传学家们付出了许多努力,但仍没有找到这个基因。,4.2 酵母的转录,自从1996年公布了酵母的全基因组序列,人们对S.cerevisiae基因功能
44、的描述有了相当的进展,需要确定约1,900个ORFs的功能。许多研究都应用高通量的基因芯片来分析酵母细胞在特定的刺激、环境变化和遗传改变的影响下的基因组表达情况。,在阐明基因功能的研究中,对不同的生理和发育状态下特定基因mRNA的表达水平的分析确实是非常有力的方法。cDNA和寡聚核苷酸阵列技术不仅揭示了关于染色体复制,染色质重组,减数分裂,孢子形成,和细胞周期调控等基本细胞活动的新的细节,还显示了无规律的外界干扰对酵母转录组动态组成的影响。,金属动态平衡的遗传基础,所有的生物需要金属离子,如铁,铜和锌,来进行各种各样的生化活动。铁和铜在电子传递和许多氧化还原金属酶中是重要的辅助因子,锌是很多酶
45、的催化成分,在锌指结构等结构中起关键作用。但这些金属离子在体内的过量积累对细胞是有毒害作用的。为了控制细胞内的金属离子含量,生物如S.cerevisiae进化出一些动态平衡调节系统来控制金属离子的吸收、分布、储存和解毒。,为了更好的理解S.cerevisiae金属代谢的调控,Lyons和同事运用DNA微阵列和启动子结构的计算机分析,研究了受到转录因子Zap1p调控的酵母基因。转录因子Zap1p感应到细胞中锌的含量并在锌匮乏时刺激其靶基因的表达。,这个研究强烈暗示了46个基因是Zap1p依赖性调节方式的可能靶基因,其中含有18个编码功能未知的蛋白。并且,MEME分析说明ZRE保守序列最可能的模块
46、是5-ACCTTNAAGGT-3。这个研究的结论拓展了某一个特定的真核转录因子的调节子的定义,提高了我们在分子水平上对锌代谢的理解。酵母通过精确的动态平衡调节系统严格的调节铁和铜的吸收和利用。运用DNA阵列技术的研究已经鉴别出酵母转录因子Aft1p和Mac1p构成的调节子的新的可能的靶基因。,代谢重调的功能基因组学,S.cerevisiae作为模式真核细胞的重要性源于这种实验生物本身的一些优点。与许多具有复杂的形态和基因组的真核细胞不同,酵母可以在由实验者控制的化学物理环境下,在特定的培养基上被培养。它的生活史和高度有效的同源重组也使S.cerevisiae很适合经典的遗传分析,包括基因缺失和
47、替代。,利用酵母的基因组序列信息,S.cerevisiae基因组的2062个ORFs(多于1/3的ORFs)的精确缺失已经成功。运用PCR扩增的办法,目的基因的同源部分被连接到一个经过挑选的标志基因(一个抗生素抗性盒)的两端。当这个连接体进入酵母细胞里时,高效率的同源重组使目的基因被标志基因替代。,对基因缺失的酵母菌株的表型研究表明,17%的缺失的ORFs对在丰富培养基上生长的酵母是必需的,基因缺失的菌株中40%在丰富或基本培养基上表现出可被测定的生长缺陷。在丰富培养基上生长不良的突变株一般在基本培养基上生长得也不好,很少有例外。,在另一个研究中,研究者分析了在好氧和厌氧条件下恒化培养的S.c
48、erevisiae的基因组范围的转录图谱。观察到在好氧和厌氧条件下大多数酵母基因的表达图谱是相似的。为适应好氧条件,只有 219个基因的转录加强了3倍以上;而为了适应厌氧条件,140个基因在转录水平上增强了3倍以上。,许多好氧和厌氧诱导基因的生理作用还不是很清楚,需要进一步的研究来确定功能。比较基于微阵列的野生型的S.cerevisiae在不同生长条件下的转录图谱,人们仍没有精确描述指示代谢重规划的转录调控的分子机制。需要运用影响关键转录调节因子活动的遗传突变,连同其他功能基因组的工具,来解析控制细胞生长的调控途径和网络。,基因调控中的核小体重组复合体,基因表达的调控对生物系统的功能是基础的,
49、细胞的很多调控活动发生在转录水平。越来越明显的是,紧缩的染色质结构的修饰是真核生物重要的调控机制,包括酵母。染色质中重复的结构单位是核小体,特征是200bp的DNA负超螺旋链缠绕到组蛋白核心上(正电荷的,富含精氨酸,组氨酸的小蛋白复合体)。,在这部分链上的基因被有效的包在核小体上。体内和体外的研究已经说明核小体抑制转录起始是通过防止真核RNA聚合酶核心酶与转录因子与DNA的接触。越来越多的证据表明一些类型的多聚蛋白复合体,如保守的Swi/Snf和RSC复合体,通过以一种ATP依赖性的方式改变染色质的拓扑结构,来消除核小体介导的转录抑制。,染色质结构因子改变核小体的行为是通过改变核小体结构,从而
50、使转录因子结合在它们特异识别的DNA序列上,帮助起始转录。关于改变染色体结构的复合体Swi/Snf的功能的一些基本方面还未解决,但可以平行测量整个基因组在mRNA水平上表达的高密度方法技术的发展,并为我们提供了阐明Swi/Snf功能的机会。,4.3 酵母蛋白质组学,基因组测序发现的还未确定特征的基因可以通过评估生化活性、蛋白-蛋白相互作用和基因表达产物的亚细胞定位分析进行研究。系统的蛋白质组学对于阐明决定细胞功能的蛋白质网络及其相互作用是必需的,在一定意义上,使基因组信息转化为生命。,酵母蛋白的亚细胞定位,双向凝胶电泳和MS等技术已经被应用于确定S.cerevisiae蛋白质组中蛋白的亚细胞分