《大肠杆菌基因工程.ppt》由会员分享,可在线阅读,更多相关《大肠杆菌基因工程.ppt(147页珍藏版)》请在三一办公上搜索。
1、,基因表达系统,第五章 外源基因的表达,一、大肠杆菌基因工程二、酵母杆菌基因工程三、哺乳动物基因工程四、高等植物基因工程五、外源基因表达产物的分离纯化,一、大肠杆菌基因工程,E.coli作为表达外源基因受体菌的特征外源基因在E.coli中高效表达的原理E.coli基因工程菌的构建策略基因工程菌的遗传不稳定性及其对策利用重组E.coli生产人胰岛素,(一)E.coli作为表达外源基因受体菌的特征,E.coli表达外源基因的优势:,全基因组已测序,共有4,405个开放阅读框架,大部分基因生物学功能已鉴定;,基因克隆表达系统成熟完善;,繁殖迅速、培养简单、操作方便、遗传稳定;,被美国FDA批准为安全
2、的基因工程受体生物。,E.coli表达外源基因的劣势:,缺乏对真核生物蛋白质的翻译后加工修饰系统,如糖基化、磷酸化;,缺乏对真核生物蛋白质的复性功能,表达产物多以无活性的包涵体形式存在;,内源性蛋白酶易降解空间构象不正确的异源蛋白,造成表达产物不稳定;,细胞周质内含有种类繁多的内毒素,痕量内毒素即可导致人体热原反应。,(二)外源基因在E.coli中高效表达的原理,强化蛋白质生物合成抑制蛋白质产物降解恢复蛋白质特异性空间构象,启动子终止子核糖体结合位点密码子质粒拷贝数,强化蛋白质生物合成,1、启动子(promoter,P),启动子:位于结构基因上游,能被RNA聚合酶识别、结合并启动基因转录的一段
3、DNA序列,长40-60bp。,因此,E.coli表达载体所用的启动子必须是E.coli启动子。,没有启动子,基因就不能转录。E.coli的RNA聚合酶不能识别真核基因的启动子。,位于转录起始点上游35bp处,由10bp组成,5-TGACA。,E.coli启动子是由两段彼此分开且又高度保守的核苷酸序列组成:,位于转录起始点上游5-10bp处,由6-8bp组成,5-TATAAT,富含A和T,又称TATA盒。,-10区:,-35区:,-35区与RNA聚合酶s亚基结合-10区与RNA聚合酶的核心酶结合,-10区和-35区的碱基组成及其间隔序列。,启动子和外源基因转录起始点之间的距离。,启动子是控制外
4、源基因转录的重要元件,mRNA生成速率与其强弱密切相关。,-10和-35区与保守序列(5-TATAAT、5-T GACA)相似度越高,启动子活性越强。,-10和-35区的间距越接近17bp,启动子活性越强。,-10区和-35区的碱基组成及其间隔序列:,大多数E.coli启动子与所属基因转录起始点之间的距离是6-9bp,但对外源基因而言,这个距离范围未必最佳。,启动子和外源基因转录起始点之间的距离:,1)启动子最佳距离的探测,目的基因,E,E,A,E,E,启动子,A酶切开,Bal31酶解,目的基因,将目的基因插在一个强启动子下游,若克隆菌内检测不到mRNA,有必要考虑调整启动子与基因之间的距离。
5、,2)启动子的筛选:,探针质粒pKO1的报告基因:半乳糖激酶基因galK,终止子,Ampr,ori,无启动子的galK,pKO13.9 kb,3)启动子的构建:,-35 区序列,-10 区序列,启动子 来 源,PlacPtrpPLPrecAPtac,T T T A C AT T G A C AT T G A C AT T G A T AT T G A C A,T A T A A TT T A A C TG A T A C TT A T A A TT A T A A T,Ptac=3 Ptrp=11 Plac 双Plac串联=2.4 Plac,乳糖操作子色氨酸操作子噬菌体早期操作子recA基因P
6、trp-35区+Plac-10区,4)启动子的可控性:,外源基因的全程高效表达,会对E.coli的生理生化过程造成不利影响。,外源基因持续高效表达的重组质粒,在细胞若干次分裂后,会部分甚至全部丢失,导致重组菌不稳定。,措施:,利用可控性启动子,调整外源基因的表达时序,通过启动子活性的定时诱导,将外源基因的转录启动限制在受体细胞生长的某一特定阶段。,目前广泛应用的E.coli可控性启动子来自相应的操纵子,都含有与阻遏蛋白特异性结合的操纵子序列,其介导的外源基因在E.coli中通常以极低的基底水平表达。,乳糖启动子Plac的可控性:,色氨酸启动子Ptrp的可控性:,噬菌体启动子PL的可控性:,在大
7、型发酵罐中迅速升温困难,常使用双质粒控制系统,间接控制目的基因表达。,应是诱导型的,可通过简单方式、使用廉价诱导物诱导,如温度诱导、IPTG诱导。,最佳启动子必须具备条件:,必须是强启动子,能使外源基因表达量达细胞总蛋白的10-30%以上;,应呈现低水平的基础转录;,2、终止子(terminator,T),强化转录终止的必要性:,过长转录物的产生会影响外源基因的表达。,外源基因在强启动子控制下表达,易发生转录过头现象,RNA聚合酶滑过终止子,继续转录邻近序列,形成长短不一的mRNA混合物。,过长转录产物影响外源基因表达的原因:,1)转录产物越长,RNA聚合酶转录一分子mRNA所需的时间就相应增
8、加,外源基因转录效率下降。,2)若外源基因下游紧接载体的重要功能基因,则RNA聚合酶在此处的转录,可能干扰其生物功能,甚至导致其不稳定性。,4)过长的mRNA往往不能形成理想的二级结构,大大降低翻译效率。,3)过长的mRNA往往产生大量无用的蛋白质,增加工程菌无谓的能量消耗。,pCP1,Ampr,ori,Tcr,筛选Ampr、Tcs的转化子,也可通过探针质粒筛选,唯一的克隆位点处于启动子和报告基因的翻译起始密码子之间,当终止子插入该位点时,由启动子介导的报告基因转录被封闭,从而减少或阻断报告基因的表达。,P,T,强终止子的选择与使用:,对终止作用较弱的终止子,可采用二聚体终止子串联的特殊结构,
9、以增强转录终止作用。,常用终止子来自E.coli rRNA操纵子上的rrn T1T2、T7噬菌体DNA上的T。,E.coli偏爱使用终止密码子UAA,当其后连上一个U而形成四联核苷酸时,转译终止效率会得到进一步加强。,3、核糖体结合位点,外源基因在E.coli中的高效表达不仅取决于转录启动的频率,还与mRNA的翻译起始效率密切相关。,结构不同的mRNA分子具有不同的翻译效率,差别高达数百倍。,mRNA的翻译起始效率主要由其5端的结构序列决定,即核糖体结合位点(ribosomal binding site,RBS)。,1)SD序列:,E.coli RBS的结构:,识别核糖体小亚基中16S rRN
10、A 3端区域3-AUUCCUCC-5,并与之专一性结合,将mRNA定位于核糖体上,启动翻译。,位于翻译起始密码子上游的6-8个核苷酸序列:5-UAAGGAGG-3。,2)翻译起始密码子:,E.coli绝大部分基因以AUG作为翻译起始密码子,但有些基因也使用GUG或UUG作为翻译起始密码子。,RBS对外源基因表达的影响:,1、SD序列的影响:,mRNA与核糖体结合越强,翻译起始效率越高,结合程度取决于SD序列(5-UAAGGAGG-3)与16S rRNA的碱基互补性。以GGAG尤为重要,4个碱基中任何1个换成C或T,均会导致翻译效率大幅度下降。,2、翻译起始密码子的影响:,E.coli起始tRN
11、A可同时识别AUG、GUG和UUG三种起始密码子,但识别频率不同:GUG为AUG的50%、UUG为AUG的25%。,3、SD序列与起始密码子之间距离的影响:,SD序列与起始密码子之间的精确距离保证mRNA在核糖体上定位后,AUG正好处于P位,这是翻译启动的前提。,通常SD序列位于AUG前约7bp处,在此间隔中少1个或多1个碱基,均导致翻译起始效率不同程度的降低。,4、SD序列与起始密码子之间序列的影响:,SD序列下游碱基为AAAA或UUUU时,翻译效率最高;为CCCC或GGGG时,翻译效率是最高值的50%和25%。,如:-半乳糖苷酶mRNA,在此位置上的最佳碱基是UAU或CUU,如用UUC、U
12、CA或AGG取代之,酶的表达水平下降20倍。,紧邻AUG的前3个碱基也会影响翻译起始效率。,5、起始密码子后续若干密码子的影响:,从AUG开始的前几个密码子的碱基序列也至关重要,这一序列不能与mRNA的5端非编码区形成茎环结构,否则会严重干扰mRNA在核糖体上的准确定位。,目前广泛使用的E.coli表达型质粒均含有与启动子来源相同的RBS,序列和间隔是最佳的。,4、密码子,生物体对密码子的偏爱性:,不同生物、甚至同种生物不同的蛋白质编码基因,对简并密码子的使用频率不同,具有一定的偏爱性。,生物体对密码子偏爱性的决定因素:,生物基因组中的碱基含量;,密码子与反密码子相互作用的自由能;,细胞内tR
13、NA的含量。,1、生物基因组中的碱基含量:,在富含AT的生物(如单链DNA噬菌体X174)基因组中,密码子第3位上U和A出现频率较高。,在GC丰富的生物(如链霉菌)基因组中,第3位上含G或C的简并密码子占90%以上。,2、密码子与反密码子相互作用的自由能:,适中的作用强度有利于蛋白质生物合成的迅速进行。,弱配对作用可能使氨酰基tRNA进入核糖体A位需要花费更多的时间。,强配对作用则可能使转肽后核糖体在P位逐出空载tRNA分子耗费更多的时间。,如:,GGG、CCC、GCG、GGC、AAA、UUU、AUA、UAU等使用少。,GUG、CAC、UCG、AGC、ACA、UGU、AUC、UUG等使用多;,
14、3、细胞内tRNA的含量,简并密码子使用频率与相应tRNA的丰度呈正相关。,表达量高的基因含有较少种类的密码子,这些密码子又对应于高丰度的tRNA分子,以便细胞能以更快的速度合成需求量大的蛋白质。,密码子偏爱性对外源基因表达的影响:,原核生物和真核生物基因组中密码子的使用频率有较大差异,因此哺乳动物基因在E.coli中高效翻译的一个重要因素是密码子的正确选择。,使外源基因上的密码子在E.coli中获得最佳表达的策略:,1、外源基因全合成,按E.coli密码子的偏爱性规律,更换外源基因中不适宜的简并密码子。,如:重组人胰岛素、干扰素、生长激素在E.coli中的高效表达均采用了这种方法。,可将这两
15、个tRNA编码基因克隆在另一高效表达质粒上,构建双质粒表达系统。,2、同步表达相关tRNA编码基因,如:人尿激酶原基因的412个密码子中,有22个Arg密码子,其中7个AGG、2个AGA,而E.coli中tRNAAGG和tRNAAGA丰度较低。,5、质粒拷贝数,质粒拷贝数对细菌生长代谢的影响:,表达型质粒在每个E.coli细胞中达数百甚至上千个拷贝,质粒的扩增过程常发生在受体细胞对数生长期,而此时正是细菌生理代谢最旺盛的阶段。,质粒的过度增殖、目的基因的高效表达会影响受体细胞的生长代谢,进而导致重组质粒的不稳定性、目的基因表达水平下降。,措施:将重组质粒的扩增纳入可控制的轨道。,质粒扩增时序的
16、控制:,pCP3拥有温度可诱导的复制子。,28时,每个细胞的质粒拷贝数为60;,42时,拷贝数迅速增至300-600,受体细胞表达的温度敏感型阻遏蛋白CI857失活,外源基因表达。,用温度可同时控制质粒拷贝数和外源基因表达。,(三)大肠杆菌基因工程菌的构建策略,包涵体型表达分泌型表达融合型表达寡聚型表达整合型表达蛋白酶抗性或缺陷型表达系统的构建,1、包涵体型表达,E.coli表达的蛋白质在细胞内凝集,形成无活性、不溶于水的固体颗粒,称为包涵体(Inclusion Bodies,IB)。,包涵体的性质:,大部分存在细胞质中,基本上由蛋白质组成。,少量DNA、RNA、脂多糖等非蛋白分子。,E.co
17、li本身表达的蛋白(如RNA聚合酶、外膜蛋白)、载体蛋白(如标记基因表达产物)。,50%以上是外源基因表达产物,氨基酸序列正确,但空间构象往往错误,无生物活性。,包涵体表达形式的优点:,1、简化表达产物的分离操作,包涵体不溶于水、密度远大于细胞碎片和其它细胞成分,菌体经超声波裂解后,通过高速离心,即可分离出来。,2、保持表达产物的结构稳定,形成包涵体后,E.coli的蛋白酶降解作用对外源蛋白的稳定性构不成威胁。,包涵体表达形式的缺点:,表达的目的蛋白无生物学活性,必须通过有效的变性、复性,才能获得正确空间构象。,变/复性效率对目标产物的收率至关重要,也是一技术难题。尤其目的蛋白分子中Cys残基
18、较多时,复性成功率相当低,一般不超过30%。,外源基因在E.coli中的表达量占细胞总蛋白20%以上时,表达产物倾向形成包涵体。,以包涵体形式表达目的基因,关键是选择高效表达载体,高表达率也是包涵体法的优势所在。,包涵体的变性与复性操作,蛋白质变性复性的动力学原理:,共价修饰和集聚状态的蛋白质不能进入复性过程,成为无活性的蛋白质。包涵体中的蛋白质即属于这两种状态,需在体外进行变性(解除共价修饰和驱散集聚体)、复性操作。,包涵体的变性溶解:,用强变性剂如尿素、盐酸胍,通过离子间相互作用,打断包涵体蛋白质分子内和分子间的各种化学键,使多肽伸展。,便宜,但溶解能力弱、且尿素分解的异氰酸盐能导致多肽链
19、的氨基甲酰化。,溶解能力强,但价格昂贵。,常用的变性剂:,7M盐酸胍:,8M尿素:,包涵体的复性:,缓慢去除变性剂,使目的蛋白从变性的完全伸展状态恢复到正常的折叠结构,同时去除还原剂,使二硫键正常形成。,尿素:,浓度降至4M时,复性过程开始;降至2M时复性结束。,盐酸胍:,浓度降至4M时,复性过程开始;降至1.5M时复性结束。,二硫键形成:,在包涵体变性体系中,始终存在还原剂(如DTT、-ME),使多肽链中的巯基保持还原状态,防止二硫键错配导致严重的集聚。,变性结束后,游离的巯基必须重新配对形成二硫键,多肽链重新折叠。,形成二硫键的主要方式:,1)化学氧化法:,需电子受体,最廉价的电子受体为空
20、气,二硫键形成是随机的,重折叠效果差。,2)二硫键交换:,需氧化型和还原型谷胱甘肽(GSSG和GSH),二硫键形成相对特异,重折叠效果好。,包涵体复性的方法:,稀释复性透析复性超滤复性 柱上复性,缺点:体积增加较大,变性剂稀释速度快、不易控制。,直接加入缓冲液或复性液,放置过夜。,稀释复性:,透析复性:,优点:不增加体积,通过逐渐降低透析液浓度、控制变性剂去除速度。,缺点:易形成无活性蛋白质聚体,不适合规模化生产。,超滤复性:,缺点:样品量少时不适用,有些蛋白质在超滤过程中会发生不可逆变性。,优点:透析速度易控制,适合规模化生产。,柱上复性:,包涵体变性后,在色谱柱上复性。,优点:复性回收率高
21、,达90%以上;快速;工艺易放大;样品稀释倍数小。,2、分泌型表达,以可溶性或不溶性包涵体状态存在于细胞质。,通过运输或分泌,定位于细胞周质(内外膜间的空隙),甚至穿过外膜进入培养基中。,在E.coli中表达的外源蛋白,按其在细胞中的定位,分为两种形式:,蛋白质的分泌机制:,E.coli周质中含有多种分子伴侣,可阻止分泌蛋白随机折叠,分泌在周质或培养基中的重组蛋白很少形成分子间二硫键。,与包涵体相比,分泌型重组蛋白有较高比例的正确构象,生物活性的回收率高,且对蛋白酶不敏感。,蛋白产物N端信号肽序列的存在是蛋白质分泌的前提。,分泌表达形式的优点:,2)目的蛋白易于分离,多数真核生物成熟蛋白N端不
22、含甲硫氨酸残基,当其基因在E.coli中表达时,N端的甲硫氨酸残基往往不能被切除。,3)目的蛋白末端完整:,将外源基因与E.coli信号肽序列重组,一旦分泌型表达,N端的甲硫氨酸残基便可在信号肽剪切过程中被去除。,分泌表达形式的缺点:,1)E.coli的蛋白分泌机制不健全,真核基因很难在E.coli中分泌型表达。,2)少数外源基因即使能分泌表达,表达率也比包涵体方式低得多。,分泌型表达系统的构建,这一过程严格依赖于细菌素释放蛋白,它激活定位于内膜上的磷酸酯酶,导致细菌内外膜的通透性增大。,绝大多数E.coli不能将蛋白质直接分泌到胞外,但有些能将抗菌蛋白(细菌素)分泌到培养基中。,将细菌素释放
23、蛋白编码基因克隆在一质粒上,与另一携带E.coli信号肽编码序列和目的基因的表达质粒共转化E.coli细胞,可实现目的蛋白的分泌。,3、融合型表达,除直接表达外,还可将目的基因与受体菌自身的蛋白质编码基因拼接在一起,作为一个开放型阅读框架进行表达,由这种杂合基因表达的蛋白质称为融合蛋白。,在融合蛋白结构中,通常受体菌的蛋白位于N端,外源蛋白位于C端。,通过在DNA水平,引入蛋白酶切割位点或化学试剂特异性断裂位点,可在体外从纯化的融合蛋白分子中回收外源蛋白。,融合型表达的优点:,1)目的蛋白稳定性高:,对分子量较小的多肽效果更佳。,3)目的蛋白表达率高:,与受体蛋白共用一套完善的表达元件。,目的
24、蛋白需要回收:,融合蛋白需裂解和进一步分离,才能获得目的蛋白。,融合型表达的缺点:,融合型表达系统的构建,构建原则:,1)受体基因能高效表达,表达产物可通过亲和层析纯化。,2)外源基因应装在受体基因下游,为融合蛋白提供终止密码子。,3)两基因拼接位点处的序列设计十分重要,直接决定融合蛋白的裂解工艺。,4)两基因应保持一致的翻译阅读框架。,用于融合蛋白构建的受体蛋白:,谷胱甘肽转移酶(GST):维持良好空间构象硫氧化还原蛋白(TrxA):维持良好空间构象泛素蛋白(Ubi):维持良好空间构象麦芽糖结合蛋白(MBP):促进分泌外膜蛋白(OmpF):促进分泌金黄色葡萄球菌蛋白A(SPA):免疫亲和层析
25、-半乳糖苷酶(LacZ):免疫亲和层析,目的蛋白的回收:,生产药用目的蛋白时,将受体蛋白部分完整除去是必不可少的工序。,融合蛋白中的受体蛋白会影响目的蛋白的空间构象和生物活性,用于人体还会导致免疫反应。,融合蛋白的位点专一性断裂方法:,蛋白位点专一性化学断裂的最佳试剂为溴化氰(CNBr),与多肽链中甲硫氨酸残基侧链的硫醚基反应,生成溴化亚氨内酯,后者在水的作用下肽键断裂,形成两个肽段,上游肽段的甲硫氨酸残基转化为高丝氨酸残基,下游肽段N端的第一个氨基酸残基保持不变。,化学断裂法,特点:,前提:,回收率高(达85%以上);专一性强;产生的目的蛋白N端不含甲硫氨酸,与真核生物中的成熟表达产物接近。
26、,目的蛋白分子内部不能含甲硫氨酸残基。,酶促裂解法-单残基位点,蛋白内切酶,切割位点,梭菌蛋白酶 Arg葡萄球菌蛋白酶 Glu假单孢菌蛋白酶 Lys猪胰蛋白酶 Arg Lys,特点:,N,C,Arg C,N,受体蛋白,目的蛋白,1)断裂效率高。2)每种蛋白酶都有相应的断裂位点。几种断裂位点专一性最强的商品化蛋白酶分别在多肽链中Arg、Glu或Lys残基C末端切开酰胺键,形成不含上述残基的下游肽段。,前提:,外源蛋白内部不能含Arg、Glu或Lys残基。,酶促裂解法-多残基位点,在受体蛋白编码序列与外源基因之间加装一段寡肽编码序列(Ile异亮氨酸-Glu-Gly甘氨酸-Arg),该寡肽为具蛋白酶
27、活性的凝血因子Xa的识别和作用序列,其断裂位点在Arg的C末端。,纯化后的融合蛋白用Xa处理,即可获得不含上述寡肽序列的目的蛋白。,凝血因子Xa的识别序列由4个氨基酸残基(Ile-Glu-Gly-Arg)组成,大多数蛋白质中出现这种寡肽序列的概率极低。-应用广泛。,酶促裂解法:,4、寡聚型表达,通过增加质粒拷贝数,以提高外源蛋白产量往往不能取得满意效果。,随质粒拷贝数不断增加,受体细胞内的大部分能量和原料被用于合成质粒编码蛋白,使细胞正常生长代谢受到影响。,重组质粒除含外源基因外,还携带其它可转录基因(如抗生素抗性基因)。,构建寡聚串联型异源蛋白表达载体,将多拷贝外源基因克隆在一个低拷贝质粒上
28、,以取代单拷贝外源基因在高拷贝载体上表达,可增加外源基因剂量,提高目标蛋白产量。,寡聚型表达的优点:,1)目的蛋白高效表达:,在不提高质粒拷贝数的前提下,增加目的基因的拷贝数,可在一定程度上提高表达量。,2)稳定表达小分子短肽:,短肽由于缺乏有效的空间结构,在细菌细胞中的半衰期较短。,串联短肽具有与蛋白质相似的长度和空间结构,抗蛋白酶降解的能力大幅度提高。,寡聚型表达的缺点:,目的产物回收困难:,寡聚短肽需裂解和进一步分离,才能获得最终分子,裂解后的短肽分子易出现序列不均一性。,寡聚型表达系统的构建,基本战略:,5、整合型表达,将外源基因直接整合在受体细胞染色体DNA的特定位置上,使之成为染色
29、体DNA的组成部分,增加其稳定性。,整合型表达的优点:,目的基因随受体细胞染色体DNA的复制而复制,非常稳定,多用于改良物种的遗传性状。,目的基因稳定表达:,整合型表达的缺点:,目的基因表达率低:,单拷贝整合的目的基因表达率低,可通过强化表达元件补偿。,6、蛋白酶抗性或缺陷型表达系统的构建,无论是在真核还是在原核细胞中,外源蛋白表达后都面临被降解的命运,稳定性甚至不如半衰期较短的受体细胞内源蛋白。,多数情况下,外源蛋白不稳定性归结为对受体细胞蛋白酶系统的敏感性。,外源蛋白的半衰期可通过外源蛋白序列的人工设计、受体细胞的改造控制。,在蛋白质C端引入Asp天门冬氨酸残基,则稳定性显著提高,且Asp
30、残基离C端越近,蛋白质的稳定性越好。,外源蛋白序列的设计,1)C端氨基酸序列对稳定性的影响:,N端含Pro、Glu、Ser、Thr的蛋白质半衰期通常很短,尤其Pro-Glu-Ser-Thr序列(PEST序列),是胞内蛋白酶的超敏感区。,2)N端氨基酸序列对稳定性的影响:,蛋白质N端含高比例的Ala丙氨酸、Asn天冬酰胺、Gln谷氨酰胺、Cys、His,则稳定性显著提高。,受体细胞的改造,1)lon基因缺陷的E.coli受体(lon-):,多数外源蛋白是被E.coli中的蛋白酶La和Ti降解的,二者分别由lon和clp基因编码。采用lon-的突变株,可提高蛋白稳定性。,热休克基因dnaK、dna
31、J、groEL、grpE,以及环境压力特异性因子编码基因htpR的突变株均呈现出对异源蛋白降解作用的严重缺陷。,2)htpR基因缺陷的E.coli受体(htpR-):,E.coli中的热休克蛋白家族对外源蛋白的降解有重要作用,机理是胁迫外源蛋白形成对蛋白酶识别和降解有利的空间构象。,lon-htpR-双缺陷细胞株非常适合高效表达各种不稳定的外源蛋白。,(四)基因工程菌的遗传不稳定性及对策,基因工程菌遗传不稳定性的表现与机制,工程菌遗传不稳定性主要表现为重组质粒的不稳定性。,结构不稳定性:重组DNA分子上某一区域缺失、重排,导致其生物学功能丧失。,分配不稳定性:整个重组DNA分子从受体细胞中逃逸
32、。,工程菌遗传不稳定性的产生机制:,受体细胞中的限制修饰系统对外源DNA的降解。,外源基因的高效表达严重干扰受体细胞正常的生长代谢。,重组质粒在受体细胞分裂时的不均匀分配。,受体细胞的内源性转座元件促进重组DNA的缺失、重排。,改善基因工程菌不稳定性的策略,1、改进载体-受体系统:,1)将R1质粒的parB基因引入质粒,其表达产物可选择性杀死因分配不均匀产生的无质粒细胞。,2)正确设置载体的MCS,防止外源基因插入稳定区。,3)将E.coli的ssb基因克隆在质粒上,受体菌ssb-,ssb编码的蛋白是DNA复制和细胞生存必需的,则丢失质粒的细胞无法增殖。,2、施加选择压力,1)根据载体上的抗药
33、性标记,向培养系统中添加相应的抗生素。,2)根据载体上的营养缺陷型标记,使培养系统中缺失相应的营养组份。,3、控制目的基因的过量表达,1)使用可控型启动子,控制目的基因的定时表达及表达程度。,2)使用可控型复制子,控制质粒的定时增殖或降低质粒的拷贝数。,4、优化基因工程菌的培养工艺,1)培养基组成:限制培养基比丰富培养基更有利于稳定。,2)培养温度:较低的培养温度有利于重组质粒的稳定。,(六)利用重组大肠杆菌生产人胰岛素,胰岛素的结构及其生物合成人胰岛素的生产方法重组人胰岛素的大肠杆菌工程菌的构建,胰岛素的结构及其生物合成,信号肽,B肽,C肽,A肽,N,C,前胰岛素原,1969 Crowfoo
34、t-Hodgkin确定了胰岛素的空间结构;1979 Rutter W和Doodman H克隆了胰岛素基因;,Lilly公司获美国FDA许可,将重组人胰岛素 推向市场,2006 辉瑞公司的胰岛素吸入剂(Exubera)获准上市-第一个非注射给药的胰岛素剂型,人胰岛素的生产方法,迄今,有四种大规模生产人胰岛素的方法:,2)化学合成法:,根据人胰岛素A链和B链的序列,由单个氨基酸从头合成。缺点:生产成本高,限制了产品的广泛应用。,3)化学转型法:,猪胰岛素可从原料丰富的猪胰脏中提取,且猪和人的胰岛素仅在B链C端有1个氨基酸的差异,猪的为Ala丙氨酸,人的为Thr苏氨酸,可将猪胰岛素在体外酶促转化为人
35、胰岛素。,路线:pH为6-7时,胰蛋白酶在过量Thr叔丁酯存在下,将猪胰岛素B链C端的Ala交换下来,形成人胰岛素叔丁酯,再用三氯乙酸脱去叔丁酯基团,最终获得人胰岛素。,缺点:转化率为60%、工艺路线耗时、分离纯化操作复杂、产品价格不菲。,4)基因工程法,1982年,美国Lilly公司用重组E.coli生产人胰岛素,成为全球第一个上市的基因工程药物。1987年,Novo公司推出利用重组酵母菌生产人胰岛素的工艺。,A链和B链分别表达法人胰岛素原表达法A链和B链同时表达法分泌型表达法,基因工程法的战略:,1)A链和B链分别表达法:,化学合成A链和B链基因,基因工程菌的构建战略:,表达产物的后处理:
36、,M,M,N,C,M,M,N,C,-Gal,-Gal,A,B,生产技术评价:,A链和B链上共存在6个Cys残基,体外二硫键的正确配对率低,仅10-20%,成本高达$100/g以上。,2)人胰岛素原表达法:,基因工程菌的构建战略:,B peptide,表达产物的后处理:,生产技术评价:,工艺比A、B链分别表达法繁琐,要使用两种高纯度的酶制剂。但由于C肽的存在,胰岛素原能形成良好的空间构象,3对二硫键的正确配对率高,达80%以上,生产成本仅$50/g。,3)A链和B链同时表达法:,特异性裂解,上述三种基因工程菌的构建均采用胰岛素或胰岛素原编码序列与E.coli的 基因拼接的方法。,产生的融合型重组蛋白表达率高、稳定性强,但不能分泌,以包涵体形式存在于胞质中。,-半乳糖苷酶(-Gal),4)分泌型表达法:,-內酰胺酶(-Lac)能被E.coli分泌到胞外,将胰岛素或胰岛素原编码序列与-Lac基因拼接,获得的工程菌可高效稳定表达分泌型融合蛋白,为后续分离纯化减少了工序。,目前主要采用人胰岛素原表达法生产人胰岛素。,