《南农生物技术制药第二章基因工程药物.ppt》由会员分享,可在线阅读,更多相关《南农生物技术制药第二章基因工程药物.ppt(212页珍藏版)》请在三一办公上搜索。
1、第二章基因工程与药物蛋白生产Genetic Engineering in Medicine and Industry,Some therapeutic products for used in humans,Genentech 公司,1976年,27岁的风险投资人Robert Swanson与University of California的教授Herb Boyer共饮了几杯啤酒,讨论了基因工程技术的商业前景。讨论结束时,他们决定建立一个公司,并取名为Genentech(Genetic Engineering Technology)。,第一个基因工程公司在学术界和商业界的满腹怀疑中诞生了!,G
2、enentech的骄人业绩,美国已批准上市的基因工程药物(1997.7),1,中国已经批准上市的基因工程药物(1998.5),一、基因工程与医药卫生,1、生产基因工程药品(1)传统的某些药品(如动物激素)生产:,控制某种物质合成基因,转基因“工程菌”,基因工程药品,基因表达产物,从动物组织中提取,生产量小,价格昂贵。,(3)基因工程生产的药品,发酵罐,(2)基因工程方法生产药品的方法:,13,二、基因工程菌大肠杆菌表达系统,一:大肠杆菌表达外源基因的优势,二 大肠杆菌表达载体的基本组成,三 常用的大肠杆菌表达载体,四 真核基因在大肠杆菌中的表达,五 大肠杆菌表达真核基因存在的问题,六 基因工程
3、菌遗传不稳定性的表现与机制,七.人胰岛素的生产方法,一:大肠杆菌表达外源基因的优势全基因组测序,共有4405个开放型阅读框架基因克隆表达系统成熟繁殖迅速、培养简单、操作方便、遗传稳定被美国FDA批准为安全的基因工程受体生物,大肠杆菌表达外源基因的劣势缺乏对真核生物蛋白质的复性功能缺乏对真核生物蛋白质的修饰加工系统内源性蛋白酶降解空间构象不正确的异源蛋白细胞周质内含有种类繁多的内毒素(endotoxin),periplasm,heterogous,二 大肠杆菌表达载体的基本组成,一个良好的大肠杆菌表达载体:有抗菌素抗性基因决定载体拷贝数的复制起点(ori)供外源基因插入的多克隆位点。参与控制转录
4、与翻译的必不可少的原件,外源基因在原核寄主细胞中表达,它的编码结构必须是连续的,不间断的,处于寄主启动子有效控制下。,1启动子可使外源基因高水平表达的最佳启动子必须具备以下几个条件1)强启动子,外源基因的蛋白质的表达量占细胞总蛋白的10%-30%以上2)应能呈现出一种低限的基础转录水平3)应该是诱导型的,能通过简单的方式,使用廉价的诱导物得以诱导。,Account for,inducible,b:如果在启动子的上游部位放置一个有效的转录终止子,那么由该启动子驱动的克隆基因的转录便会被限制在最低本底水平。,2 终止子,a:如果在克隆基因编码区的3末端之后,接上一个有效的转录终止子,便能够阻止转录
5、通读过位于下游另一个启动子,c:转录终止子还能增强mRNA分子的稳定性,大大提高蛋白质产物水平。,在构建大肠杆菌表达载体时,通常是添加全部终止密码子,阻止核糖体跳跃(skipping)现象。,大肠杆菌格外偏爱使用终止密码子UAA,当其后连上一个U而形成四联核苷酸的情况下,转译终止效率便会得到进一步加强。,3转译起始序列,mRNA的5末端之独特的结构特征,是决定mRNA转译起始效率的主要因素。,在构建外源基因的高效表达载体时,需认真选择有效的转录起始序列。,未鉴定出通用有效的转译起始序列的保守结构,initiation factor,conserved sequence,universial,4
6、、reporter gene,其编码产物可被快速测定的功能单元。,追踪某些特定的DNA结构(重组质粒)是否已经导入寄主细胞同任何一种目的启动子连接,其表达活性可作为检测启动子功能的依据。,usage,半乳糖苷酶基因lacZ、碱性磷酸酶基因、荧光素酶基因(luciferase)基因、半乳糖激酶基因(galK)氯霉素抗性(乙酰转移酶)基因(cat)四环素抗性基因(tetr),alkaline phosphatase,三 常用的大肠杆菌表达载体启动子,广泛使用的大多数质粒表达载体启动子噬菌体的PL启动子大肠杆菌乳糖操纵子lac启动子色氨酸操纵子trp启动子pBR322质粒的beta内酰胺酶启动子,L
7、actose Operon,图1-1 在大肠杆菌中基因表达的3个重要信号,启动子 核糖体结合位点,基因,终止子,DNA,RNA转录,核糖体结合mRNA位点,图1-2 基因转录起始位点上游序列的比较,TTGACA,TATAAT,PuPy,-35区,-30,-70,正调控区,-20,负调控区,+1,-10区,GC区.CAAT区,TATAAA T,PuAPy,-40,-110,+1,-20,-30,增强子,CCGCCC或GGGCGG或GGCCAATCT T A,原核,真核,图1-3 通过表达载体在大肠杆菌中被表达,P,R,T,mRNA,蛋白质,表达载体,外源基因,将外源基因插入限制性酶切位点,转化大
8、肠杆菌,图1-4 杂交基因的构建和融合蛋白的合成,插入外源基因,ATA TTA,正确融合,N端,C端,不正确融合,外源基因不被翻译,表达,ATA TTA,融合蛋白,亲和层析法纯化,化学试剂除去大肠杆菌肽段,图1-5 在大肠杆菌中表达外源基因长遇到的问题,翻译,转录,转录,大肠杆菌不能切除内含子,转录提前终止,图1-6 真核细胞表达载体常用的4种启动子,(a)GAL启动子,(b)AOX启动子,(c)葡萄糖水解酶启动子,(d)纤维二糖水解酶启动子,四 真核基因在大肠杆菌中的表达,三种表达部位各有不同的优缺点/而且对克隆基因表达产物的制备有很大关系。,在细胞质中表达在细胞周质中表达以分泌到细胞外的形
9、式表达。,1 外源基因在大肠杆菌中表达蛋白质位置,cytoplasm,periplasm,1)细胞质中表达 expressed in cytoplasm,包含体是存在于细胞质中的一种由不可溶性蛋白质聚集折叠而成的晶体结构。,在表达中应尽可能限制包含体产生,并促进形成天然三维结构的蛋白质。多采用与分子伴侣共表达的方法,可能是增加外源蛋白的可溶性和折叠能力的一种有效途径。,insoluble,chaperon,周质:指大肠杆菌一类G-菌中,位于内膜和外膜之间的细胞结构部分。在大肠杆菌中,已成功的使用了各种不同类型信号肽,将细胞质中蛋白的蛋白质转运至周质。,周质中表达外源蛋白质优点:A:周质中蛋白质
10、种类少,周质中表达的外源蛋白质能够被有效的浓缩和纯化。b:周质氧化环境有利于蛋白质按正确的方式折叠c:在周质中蛋白质降解不广泛。,来自原核、真核的外源基因都成功的在大肠杆菌细胞周质中实现了有效表达。,2)周质中表达 expressed in periplasm,3)分泌表达 使在大肠杆菌中表达的外源蛋白质分泌到胞外培养基中进行分离纯化,这种研究思路称为外源蛋白质的分泌表达。,目的蛋白稳定性高:目的蛋白易于分离目的蛋白末端完整,将外源基因与大肠杆菌信号肽编码序列重组在一起进行分泌表达,其N端的甲硫氨酸残基可在信号肽剪切过程中被有效除去,这些真核基因在大肠杆菌中表达时,蛋白质甲硫氨酸残基往往不能被
11、切除。,分泌表达优点:,重组人胰岛素原若分泌到细胞周质中,其稳定性大约是在细胞质中的10倍,许多真核生物成熟蛋白N端不含有甲硫氨酸残基。,intact,excise,外源真核生物基因很难在大肠杆菌中进行分泌型表达;外源基因分泌表达的表达率通常要比包涵体形式低很多,分泌表达缺点,相对其它生物细胞,大肠杆菌蛋白分泌机制不健全。,目前产业化的异源蛋白分泌型重组大肠杆菌工程菌很少,Perfectsound,分泌型重组蛋白具有较高比例正确构象,对蛋白酶不敏感,蛋白质的分泌机制,原核细胞周质中有多种分子伴侣,可阻止分泌蛋白随机折叠,分泌至细胞周质或培养基中重组蛋白很少形成分子间二硫键,与包涵体相比,ran
12、dom,Sulfer,inner,outer,重组大肠杆菌-目的蛋白完全分泌,分泌型目的蛋白表达系统构建,有些G-能将细菌的抗菌蛋白(细菌素)分泌到培养基中,这一过程严格依赖于细菌素释放蛋白,它激活定位于内膜上的磷酸酯酶,导致细菌内外膜的通透性增大。,将细菌素释放蛋白编码基因克隆在一个合适的质粒上,携带大肠杆菌信号肽编码序列和目的基因的表达质粒,转化,受体细胞,完全分泌型受体细胞,转化,permeability,bacteriocin,二种类型 由报告基因编码序列和另一个基因启动子及其它的调节序列构成。用于研究启动子功能及调控作用分子机理。由一种异源蛋白质基因编码序列同寄主细胞诱导型启动子构成
13、。用于生产新型融和蛋白。,2 融和蛋白质表达,将外源基因与受体菌自身的蛋白质编码基因拼接在一起,并作为一个开放型阅读框架进行表达。这种杂合基因表达出的蛋白质称为融合蛋白。,2.1 融和基因,attention,外源基因应装在受体蛋白编码基因下游,为融合蛋白提供终止密码子。在某些情况下,并不需要完整的受体结构基因,2.2 融和蛋白的表达策略,融合蛋白表达质粒的构建原则,受体细胞的结构基因能高效表达,且其表达产物可以通过亲和层析进行特异性简单纯化,两个结构基因拼接位点处的序列设计十分重要,它直接决定融合蛋白的裂解。两个蛋白编码序列应保持一致的翻译阅读框架,在DNA水平上,人工设计引入的蛋白酶切割位
14、点或化学试剂特异性断裂位点,可以在体外从纯化的融合蛋白分子中释放回收异源蛋白,Base on,consistent,使克隆外源基因有效转译 有效转译:取决于核糖体的结合位点,受到编码区起点核苷酸序列影响。可使蛋白质产物稳定,免受寄主胞内酶的降解作用,因此可以得到较高的产率。可能构成一种信号肽指导大肠杆菌蛋白质分配到细胞的正确位置。能够使用亲和层析技术分离纯化融合蛋白。,2.3 表达融合蛋白质的优点,ribosome,3 整合型异源蛋白的表达,工程菌在没有选择压力存在下,可以连续培养而不丢失目的基因表达盒,这对以改良物种遗传性状为目的的基因工程特别有意义,3.1 整合形式表达目的蛋白的特点,目的
15、基因稳定表达,目的基因表达率低,整合型的目的基因随受体细胞染色体DNA一起复制,在大多数情况下相当稳定,单拷贝整合的目的基因表达率受到限制,此时可通过强化表达元件加以补偿,replicate/stability,Species/improvement,intensify,转位因子依赖型的体内重组,同源序列依赖型的体内重组,3.2 DNA体内重组的基本原理,生物细胞内天然存在的一类无复制能力的DNA可移动因子,不同生物种群拥有结构不同的转位因子,噬菌体 G片段(G-Fragment)原核微生物 插入顺序(IS)真核微生物 转座子(Tn、Ty)高等植物 可移动因子(Ac、Ds)高等动物 跳跃基因(
16、mobile gene),转位因子 transposon,转位因子依赖型的体内重组,转位因子的结构,transposon,palindrome,repressor,inversion region,整合形式,同源整合,同源序列依赖型的体内重组,同源整合,一般地说,距离越远、长度越长、同源性越高,重组的频率也就越高,反之亦然。,同源整合,1基因结构存在很大差异。大多数真核基因含有内含子,细菌细胞中没有除去内含子机制;,五 大肠杆菌表达真核基因存在的问题,2 转录信号不同。真核基因转录的mRNA分子不具有结合细菌核糖体所必须的SD序列。细菌RNA聚合酶不能识别真核生物启动子,3 mRNA的分子结构
17、有所差异。绝大多数真核mRNA分子的3末端有poly(A)尾巴,在5末端有一个帽结构。影响mRNA在细菌中的稳定性及与细菌核糖体相结合的能力,阻止正常的转录和转译。,4真核生物的蛋白质-有些是通过前体分子加工来的。在细菌中不存在这种修饰作用。,5细菌的蛋白酶-可以识别和降解真核生物的蛋白质产物,结构不稳定性重组DNA分子上某一区域发生缺失、重排、修饰,导致其表观生物学功能的丧失,六 基因工程菌遗传不稳定性的表现与机制,1 工程菌遗传不稳定性表现形式,基因工程菌的遗传不稳定性主要表现在重组质粒的不稳性,具有下列两种表现形式,分配不稳定性整个重组DNA分子从受体细胞中逃逸,segregative
18、instability,domain,Deletion,region,rearrange,受体细胞中的限制修饰系统对外源重组DNA分子的降解,2 工程菌遗传不稳定性的产生机制,外源基因的高效表达严重干扰受体细胞正常的生长代谢 能量、物质的匮乏和外源基因表达产物的毒性诱导受体细胞产生应激反应,关闭合成途径,启动降解,重组质粒在受体细胞分裂时的不均匀分配 是重组质粒逃逸的基本原因,受体细胞中内源性的转座元件促进重组分子的缺失重排,Deletion,以构建稳定性高质粒:将R1质粒上的parB基因引入表达型载体中:其表达产物可以选择性地杀死由于分配不均匀所产生的无质粒细胞,3 改进载体、受体系统,正确
19、设置载体上的多克隆位点:禁止DNA片段插在稳定区内,将受体细胞的致死性基因安装在载体上,并构建条件致 死性的相应受体系统。eg:大肠杆菌的ssb基因(DNA单链结合蛋白编码基因),根据载体上的抗药性标记,向培养系统中添加相应的抗生素(药物和食品生产时禁止使用抗生素),4 施加选择压力,根据载体上的营养缺陷型标记,向培养系统中添加相应的营养组份(培养基复杂,成本较高),correspond,使用可控型启动子控制目的基因定时表达及表达程度,5 控制目的基因过量表达,使用可控型复制子控制质粒的定时增殖或降低质粒的拷贝数(优化基因工程菌的培养工艺),培养基组成:限制培养基比丰富培养基更有利于稳定,培养
20、温度:较低培养温度有利于重组质粒的稳定,replicon,1982年,美国Ely LiLi公司首先使用重组大肠杆菌生产人胰岛素,成为世界上第一个上市的基因工程药物。1987年,Novo公司,成为世界上第一个上市的基因工程药物。1987年,Novo公司又推出了利用重组酵母菌生产人胰岛素的新工艺。,七.人胰岛素的生产方法,基因工程法生产人胰岛素,体外胰岛素受体结合性能、淋巴细胞和成纤维细胞的应答能力、降血糖作用、血浆药代动力学等指标上均与天然胰岛素没有任何区别具有无免疫原性、注射吸收迅速。充分展示了基因工程在生物医药领域中的巨大潜力。,potential,immunogenic,synthesis
21、,由于A链和B链上共存在六个半胱氨酸残基,体外二硫键的正确配对率较低,通常只有10%-20%.采用这条工艺路线生产正确配对率较低,采用这条工艺路线生产的重组人胰岛素每克成本高达100美元以上。,A链和B链分别表达法,生产技术评价,为了进一步降低生产成本,美国Ely LiLi公司随后又建立了第二条生产重组人胰岛素的工艺路线,基因工程菌的构建战略,人胰岛素原表达法,proinsulin,表达产物后处理路线 B链中第22位上的Arg和第29位上的Lys,由于良好折叠的原因,对胰蛋白酶不敏感,在人胰岛素原表达工艺中,由于C肽的存在,胰岛素原能形成良好的空间构象,三对二硫键的正确配对率也相应提高,折叠率
22、高达80%以上。,生产技术的评价,目前美国Ely LiLi公司采用此工艺年产十几吨的重组人胰岛素。,虽然这条工艺路线不比AB链分别表达法更为简捷,而且还要使用两种高纯度的酶制剂,但理想的折叠率在很大程度上弥补了工艺繁琐的缺陷,使得每克最终产品的成本仅50美元。,一种能促进融合蛋白分泌的工程菌构建策略是将胰岛素或胰岛素原编码序列与beta-內酰胺酶基因拼接,beta-內酰胺酶通常能被大肠杆菌分泌到胞外。获得的工程菌同时具备了稳定高效表达可分泌型融合蛋白的优良特性,为胰岛素的后续分离纯化工序减轻了负担。,分泌型重组人胰岛素表达法,上述三种重组大肠杆菌的构建路线均采用胰岛素或胰岛素原编码序列与大肠杆
23、菌beta-半乳糖苷酶基因拼接的方法,所产生的融合型重组蛋白表达率高、稳定性强,但不能分泌,只要以包涵体的形式存在于胞质中。,什么叫蛋白质工程 指通过改造与蛋白质相应的基因中的碱基顺序,或设计合成新的基因,将它克隆至受体细胞中,通过基因表达而获得具有新的特性的蛋白质(酶)技术。这是一门从改变基因入手,定做新的蛋白质的技术。故有人将其称为“第二代基因工程”1983年,美国生物学家额尔默首先提出了“蛋白质工程”的概念。,蛋白质工程和基因工程蛋白质类药物,1、蛋白质工程的理论设计:包括活性设计、专一性设计、框架(构象)设计等。由于对蛋白质的结构与功能之间的关系认识还不系统,目前的蛋白质设计仅仅是对天
24、然蛋白质的修饰。如:异常血红蛋白的氨基酸取代 去羧基端胰岛素等。,蛋白质工程的一般技术,根据需要合成具有特定氨基酸序列和空间结构的蛋白质;确定蛋白质化学组成、空间结构与生物功能之间的关系;从氨基酸序列预测蛋白质的空间结构和生物功能,设计合成具有特定生物功能的全新蛋白质。,2、基因修饰点突变法 蛋白质结构的改变通过基因修饰来完成基因修饰的方法:基因的全化学合成 按照所需蛋白质的氨基酸顺序,先后合成结构基因、转录的起始信号及终止信号、限制酶切位点等核酸片段,然后用连接酶将各片段连接起来,通过基因工程转移到细菌中进行目标蛋白质的表达。目前用此法已合成了:人血细胞干扰素、胰岛素、生长激素释放抑制激素等
25、基因。,调节基因,启动基因,结构基因,终止基因,连接酶,完整基因,基因直接修饰法 将连接于质粒上的某一蛋白质的基因用酶法去除一小段,然后用合成的核苷酸片段接上,从而获得新的突变体。已修饰过的酶有:内酰胺酶、酪氨酰tRNA合成酶、二氢叶酸还原酶等酶蛋白。,限制性内切酶,外源DNA,限制性内切酶,退火,重组质粒,转化,受体细胞,筛选,表达,带重组体的细胞,目的产物,质粒,目的基因,酶切割,蛋白基因,新突变质粒,盒式突变 1985年Wells提出的一种基因修饰技术,一次可以在一个位点上产生20种不同氨基酸的突变体,可以对蛋白质分子中重要氨基酸进行“饱和性”分析。蛋白质工程的运用蛋白质或肽类药物的改造
26、和新药的研制,酶切割,蛋白基因,新突变质粒,同时获得多个突变体,图3-1胰岛素的分子结构和从前胰岛素原合成胰岛素的简要过程,胰岛素利于重组生产的特点,(胰岛素原=BCA无前导序列),蛋白质工程的应用,图3-2 由人工合成的A,B链的基因合成重组胰岛素,(a)人工合成的基因,(b)合成胰岛素蛋白,pBR322,pBR322,转化的大肠杆菌合成AB融合蛋白,图3-3重组促生长素抑制素的合成,图3-4重组生长素的合成,保留,除去,(a)生长素cDNA片段的准备过程,(b)表达,图3-5 凝血因子基因及其翻译产物,(a)凝血因子基因,(b)凝血因子的翻译后的加工,初级翻译产物(2351个氨基酸),成熟
27、的凝血因子蛋白,加工,重组凝血因子合成的几种方法,在哺乳动物细胞中合成(仓鼠细胞),利用活体动物生产(猪),干扰素的合成,干扰素分子结构,干扰素生产车间,图3-7 利用分离的病毒壳体蛋白作疫苗的原理,分离的病毒壳体蛋白,注射到血液循环,被完整病毒感染,图3-8 重组牛痘病毒可能用途的基本原理,重组牛痘病毒基因组,注射重组牛痘病毒颗粒到血液循环,免疫系统合成抗牛痘病毒和乙型肝炎病毒的抗体,表3-2 在重组牛痘病毒中表达的外源基因,BACK,80,(inclusion bodies IBs),基因工程包含体的纯化,基因工程菌培养液不同表达形式的前处理胞外分泌型表达:离心,收集液相浓缩纯化。胞内表达
28、:胞内可溶性表达:离心,收集菌体细胞破碎离心,收集上清纯化胞内周质表达:离心,收集菌体低浓度溶菌酶或渗透压冲击等溶解目标物离心,收集上清液纯化。不溶性包涵体:离心,收集菌体细胞破碎离心,收集沉淀包涵体洗涤目标蛋白变性溶解复性纯化。,81,外源蛋白在大肠杆菌中的积累,82,包涵体:一种蛋白质不溶性聚集体,包括目标蛋白、菌体蛋白等。目标蛋白一级结构是正确的,但立体结构是错误的,所以没有生物活性。包涵体的形成:大肠杆菌中目标产物的表达水平过高,超过正常代谢水平,过多表达产物聚集在细胞内,形成不溶性的包涵体。高表达产生的积聚物在细胞内部形成不溶物原因?蛋白过量积聚,超过溶解度,导致沉淀;蛋白生成太快,
29、分子间疏水基团相互作用而聚集沉淀;蛋白生成太快,分子内部二硫键的错误连接导致沉淀;表达蛋白过多,与其结合/诱导组分不足,不能形成溶解状态 蛋白质自身不稳定。,包含体的构成,83,基因工程包涵体的纯化方法,收集菌体细胞,细胞破碎,包涵体的洗涤,目标蛋白的变性溶解,目标蛋白的复性,包含体的出现不仅增加了生物分离设计的难度,也为蛋白质折叠机理研究提出了新的课题。欲获得天然活性态的目标产物,必需分离包含体后,溶解包含体并使其中的目标蛋白恢复应有的天然活性。,84,1)包涵体的洗涤细胞破碎后,包含体呈颗粒状,致密。洗涤的重要性:收集的沉淀中,除包涵体外,还包括许多杂质,如膜蛋白、肽聚糖、脂多糖等,复性时
30、会与目标蛋白一起复性形成杂交分子而聚集,给后步纯化带来困难。洗涤剂:温和的表面活性剂、蔗糖、低浓度的弱变性剂(如尿素)或脱氧胆酸等。能溶解除去部分膜蛋白和脂质类杂质。洗涤剂浓度以溶解杂质,不溶解包涵体中表达产物为原则。,85,2)目标蛋白的变性溶解 包涵体中不溶性的目标蛋白必须溶解到液相中,才能进一步纯化。一般水溶液很难将其溶解,只有采用蛋白质变性才能使其形成可溶性的形式。常用变性剂:5-8 mol/L盐酸胍和6-8 mol/L尿素,作用:破坏离子间相互作用;表面活性剂如1-2 SDS,作用:破坏蛋白质肽链间的疏水相互作用。PH9.0的碱溶液和有机溶剂,使用较少。影响变性因素:时间、pH、离子
31、强度、变性剂种类和浓度。,86,原理:在变性剂溶液中,溶解的蛋白质呈变性状态,即蛋白质高级结构被破坏,但一级结构和共价键没有破坏。当部分变性剂被除去后,蛋白质会重新折叠成具有活性的正确构型,该过程称复性。复性方法:稀释法除变性剂 加入大量水或缓冲液。膜分离法除变性剂 透析、超滤、电渗析。层析法:凝胶层析,高效疏水层析,3)目标蛋白的复性,87,蛋白质复性影响因素:变性剂浓度目标蛋白浓度;pH和离子强度;氧化还原条件。还原剂:二硫苏糖醇、-巯基乙醇、还原型谷胱甘肽;氧化剂:氧化型谷胱甘肽;碱性下通空气。,盐酸胍浓度mol/L,红血球碳酐酶复性操作中变性剂与蛋白质浓度对复性的影响,蛋白质浓度 mo
32、l/L,88,肿瘤坏死因子相关凋亡诱导配体蛋白在E.coli中的高密度发酵过程中以两种形式表达:细胞内有活性的可溶性蛋白形式(约占目标蛋白的30%)无活性的包涵体形式(约占目标蛋白的70%)。,悬浮破壁,PBS,洗涤,离心,硫铵沉淀,亲和层析,阳离子交换层析,溶解,复性,亲和层析,湿菌体,发酵液,干净菌体,上清液,包涵体,纯品,活性检测,破壁液,离心,离心液,洗涤,举例:TRAIL的分离纯化,89,1.包涵体的洗涤 粗制包涵体用 50mM磷酸盐缓冲液,含150mM NaCl pH=7.4(1:3 w/v)洗涤2-3次;用含有1M NaCl的磷酸缓冲液洗涤1次(1:3 w/v),将粘附其表面的大
33、部分蛋白及水溶性杂质除去;用6M尿素及0.5%TritonX-100 联合洗涤1次(1:3 w/v),去除另一些杂蛋白,这时得较纯包涵体(纯度达80%左右);用SDS-PAGE电泳检测纯度。,2.包涵体的变性溶解 洗涤后包涵体用含有30mM DTT及5mol/l盐酸胍的Tris 缓冲液 pH=8.0(1:5 w/v)变性溶解 室温搅拌2h,95%以上的包涵体可被溶解;离心,13000rpm,20min 弃沉淀得到溶解液。,90,3.包涵体复性(间歇式流加稀释复性法)以含DTT和ZnSO4的Tris-HCl为复性缓冲液,再添加0.4M L-Arg,0.5M尿素,0.5M NaCl作为蛋白聚集抑制
34、剂,变性溶解液可多次流加,每次流加的时间是以上一次流加蛋白已达到部分复性为准。本实验中,流加间隔时间确定为90min,每次流加浓度为150mg/L,变性液流加次数可高达6次,最终浓度可达到1mg/ml,4缓慢搅拌一段时间,对50mM Tris-HCl,300mM NaCl,0.1M尿素及0.2mM ZnSO4 混合液透析过夜,透析后离心除去复性过程中聚集的蛋白,超滤浓缩(也可用硫酸铵沉淀进行浓缩)得复性蛋白液。,91,5.复性后纯化 复性浓缩后蛋白 金属亲和层析 吸附 洗涤:40mmol/L咪唑,洗除非特异性吸附的杂蛋白 洗脱:100mmol/L咪唑 目标蛋白 纯度达95%以上(由SDS-PA
35、GE和RP-HPLC鉴定)收率75%,92,包含体产物分离工艺(牛生长激素分离提取),93,来自发酵罐的菌体经过离心除去培养液后加入缓冲液悬浮,通入高压匀浆器反复破碎三次。匀浆经过离心和水洗除去细胞碎片,再添加溶菌酶、EDTA和促进剂以除去脂蛋白和未破碎的细胞。包含体经离心沉淀和水洗后进行变性溶解,溶解剂为6mol/L盐酸胍。溶解的同时通入空气氧化以打断错误连接的双硫键。离心除去沉淀,含变性蛋白质的上清液经超滤浓缩后过凝胶柱除去杂蛋白,再加入复性缓冲液进行透析复性。复性过程中产生的絮凝沉淀用离心除去。,包含体产物分离工艺(牛生长激素分离提取),质谱在蛋白质、多肽分析中的应用,质谱在蛋白质、多肽
36、分析中的应用,分子量的测定蛋白质、多肽纯度的鉴定肽质量指纹谱肽序列测定技术 蛋白质的翻译后修饰鉴定其他,蛋白质鉴定,分子量的测定,用ESI-MS和MALDI-TOF-MS测定蛋白质和多肽的分子量,精确度可达0.10.01,这远比其它方法(如SDS-PAGE、凝胶过滤、超离心等)精确。正确测定蛋白质的分子量,可以提供很多信息,如确定分子大小,从氨基酸组成分析的结果求得准确的氨基酸组成,验证已测定的一级结构是否正确等。,分子量测定实例,采用聚丙烯酰胺凝胶电泳,高效凝胶过滤色谱以及电喷雾离子化质谱三种方法对新发现的一种蛋白质(来源于福建尖吻蝮蛇蛇毒,是一种具有类凝血酶活性的弱酸性蛋白质)的分子量进行
37、了测定。,分子量测定实例,天花粉蛋白的一级结构测定,在86年时曾出现差错,当时测定的结果表明它是由234个氨基酸残基组成,分子量为25682Da。90年,我们发现结构测定有误,重新修正了其一级结构。它应由247个氨基酸残基组成,正确分子量为27141.32Da。93年,用MALDL-TOF-MS和ESI-MS测定了天花粉的分子量。,天花粉蛋白(TCS)的MALDI-TOF-MS的分子量图谱,天花粉蛋白(TCS)的ESI-MS的分子量图谱,分子量测定实例,-苦瓜子蛋白的一级结构计算(包括糖部分)的分子量为29156Da,用MALDI-TOF-MS测定的分子量为29074Da,二者相差82Da。这
38、种差异可能是个别氨基酸测定的差错造成,估计整个结构测定不会有大错误。,分子量测定实例,-苦瓜子蛋白其C 端用羧肽酶的方法测定为-S-T-A-D-E-N,但尚不能完全确定。苦瓜子蛋白在190位有一个色氨酸,我们用BNPS-Skatole降解色氨酸,降解后的肽用HPLC分离,得到含有C 端的一段小肽(59个氨基酸残基)用MALDI-TOF-MS测定其分子量为6443与计算得到的59肽的分子量为6442.9非常相符,因此也就证明了C 端59个氨基酸残基的顺序是正确的。,-苦瓜子蛋白Trp降解C 端肽分子量,蛋白质、多肽纯度的鉴定,根据质谱测定分子量的作用,质谱还可用来作蛋白质、多肽纯度的鉴定。只要质
39、量有差异的杂质都可以被检出,此方法灵敏度高,用量少(pmol水平)、速度快,并有独到之处。,蛋白质、多肽纯度的鉴定,实例1:天花粉蛋白C-端微观不均一,即有二个C末端,一个多一个Ala(即247个氨基酸残基),一个少一个Ala(即246个氨基酸残基),用ESI-MS完全能够分辨出来,实例2:如猪胰岛素和人胰岛素混在一起,用MALDI-TOF-MS也能够清楚地分出二个峰。两者的差异仅在猪胰岛素B链的第30位为Ala(89.09Da),而人胰岛素相应的位置为Thr(119.12Da),两者相差30Da(如图13-11)。这些差异用其他方法是很难检出的。,蛋白质鉴定,肽质量指纹谱+基于串联质谱多肽测
40、序 蛋白质鉴定,肽质量指纹谱,由于各种蛋白质的氨基酸序列(一级结构)不同,蛋白质被酶解后产生的肽段序列也各异,肽混合物质量数亦具特征性,称为肽质量指纹谱(peptide mass fingerprint,PMF),可用于蛋白质的鉴定。,PMF 流程,肽质量指纹谱,MALDI-TOF-MS是最有效的分析肽混合物的质谱仪,肽混合物不需分离可直接分析,基质辅助激光电离方法能耐受一定浓度的盐,仪器灵敏度高,标准样品1 pmol 的量就足够,质量数准确度可达0.1 0.01,且操作简单,分析速度快,依仪器型号不同一次可分析十几个到几十个样品。,PMF实例,蓖麻毒素(ricin)利用MALDI-TOF生物
41、质谱技术结合肽质量指纹谱方法,经过数据库检索,建立了鉴定检测Ricin的新方法。,MALDI-TOF质谱的测定,得到Ricin的分子量为62925 Da,Ricin的肽质量指纹谱,共检出22条肽谱峰,将这些肽片段的质谱数据用MASCOT搜索引擎在SwissProt数据库中进行PMF检索,检索参数如表1所示。返回前5个检索结果,如表2所示。其中符合要求的结果(置信区间为得分大于66分)只有一种蛋白即蓖麻毒素:Ricin precursor(P02879,RICI_RICCO),得分107,匹配肽段13条,肽谱的实验值与理论值的对比见表3,其余未检出的肽段中有4条经过与理论值对照也找到了归属。,肽
42、序列测定技术,两种经典测序方法:DNA顺序测定解决不了翻译后加工所导致的氨基酸残基的修饰的问题;Edman 降解不能解决N端封闭的测序的问题。,蛋白梯形测序(protein laddersequencing),使用少量链终止剂,进行快速分步降解,在人为控制下产生一系列肽段,其中每个肽段于下一个之间只相差一个残基;用MALDI-TOF-MS读出肽段信息。用此方法可在磷酸肽中定位磷酸丝氨酸残基。研究N-端封闭的肽和蛋白,必须了解其C-端序列的信息。,蛋白梯形测序(protein laddersequencing),肽测序一般方法(MS/MS),使用串联质谱,利用待测分子在电离及飞行过程中产生的亚稳
43、离子,通过分析相邻同组类型峰的质量差,识别相应的氨基酸残基。其中亚稳离子碎裂包括“自身”碎裂及外界作用诱导碎裂。,基于串联质谱的肽序列测定,用特定蛋白水解酶作用于蛋白质,将得到的肽段送入一级质谱,产生前体离子,经过一定选择的前体离子在碰撞室发生CID。结果是前体离子肽骨架酰胺键的特异性断裂,并产生了一系列可用于确定氨基酸序列的y 型和b 型等离子。获得CID二级质谱图后可算出肽序列。,经过MS/MS分析的多肽片段,N端和C端多肽,G,F,P,N,A,G,F,P,N,A,G,F,P,N,A,G,F,P,N,A,G,F,P,N,A,N-terminal peptides,C-terminal pe
44、ptides,415,486,301,154,57,71,185,332,429,理论质谱图,理论质谱图与实际质谱图,理论质谱图与实际质谱图,标准肽Glu-fib的MS/MS 图谱,MS/MS优点,MS/MS质谱测序可对N 端封闭的肽进行测序;并可以通过CID 得到部分至完全的序列信息后,做出MS 肽谱,这可对修饰的氨基酸残基定性,并确证其位置,包括二硫键的分布。而且质谱技术与分离技术直接相连也可相互验证,同时还可对混合肽进行测序。另外它还有快速、灵敏的优点。,基于MS/MS蛋白质鉴定,获得二级质谱图后可通过下列方法鉴定蛋白质:较常用的肽序列标签鉴定方法(peptide sequence ta
45、g,PST:从一级质谱产生的肽段中选择母离子,进入二级质谱,经惰性气体碰撞后肽段沿肽链断裂,由所得到的各肽段质量数差值推定肽段序列,用于数据库查寻;肽碎片离子搜索:直接用前体离子产生的未解析的CID 图谱与数据库中的CID 图谱比较,如Sequest、Mascot、Sonat 等算法;从头测序法(de novo sequence),通过直接解释MS/MS 数据识别肽序列,这类系统和算法有Lutefisk、SHERENG、PEAKS、AuDeNS等。,基于MS/MS的蛋白质鉴定,串联质谱在蛋白质组学中的应用,测序其它方法,先用几种不同的蛋白水解酶对蛋白质进行酶解,胰蛋白酶胰凝乳蛋白酶嗜热菌蛋白酶
46、(thermo lysin)SV8 酶(staphylococcusaureusV8)各种酶解片段用HPLC 等分离得到的纯肽或简单的混合肽,可用MS/MS 测定其各组分的顺序,然后从不同蛋白水解酶酶解片段顺序,找到其重叠部分,即可得到整个蛋白质顺序。,蛋白质的翻译后修饰鉴定,磷酸化修饰 糖基化修饰巯基和二硫键定位 氨基的乙酰化 泛素化修饰,磷酸化修饰,已知的磷酰氨基酸的类型有四种:1O-磷酸盐,通过羟氨酸的磷酸化形成的,如丝氨酸,苏氨酸,酪氨酸。2N-磷酸盐,通过精氨酸,赖氨酸或组氨酸中的氨基的磷酸化形成的。3乙酰磷酸盐,通过天冬氨酸或谷氨酸的磷酸化形成的。4S-磷酸酯,通过半胱氨酸的磷酸化
47、形成的。,磷酸化肽富集,分离技术有:双向磷酸多肽谱图(2D-PP);高分辨率的凝胶电泳(2DE)和反相高效液相色谱(RP-HPLC)。对于32P标记的磷酸化肽或蛋白可用放射自显影或磷储屏检测,提取后可以高灵敏度MALDI-MS分析;如果32P标记不可行,就要用LC-MS/MS分析,常用HPLC与质谱联用。常用的富集方法有:固定金属亲和色谱(IMAC);抗体免疫沉淀;化学修饰。,质谱检测磷酸化肽和确定磷酸化位点的方法,MALDI-TOF-MS 可以通过肽指纹谱(PMF)鉴定蛋白质,与磷酸酯酶处理相结合可以确定磷酸化位点。原理:磷酸酯酶处理后,磷酸化的肽丢失磷酸基团而产生特定质量数的变化,MALD
48、I-TOF-MS通过检测这种质量数的变化而确定磷酸化位点。,串联质谱(MS/MS)进行前体离子扫描,这一方法是通过检测磷酸基团产生的特定片段来报告磷酸肽的存在。原理:磷酸化肽经CID后会产生磷酸基团的特异性片段,这些特异性的片段在用串联质谱进行前体离子扫描时可作为磷酸肽的“报告离子”。,质谱检测磷酸化肽和 确定磷酸化位点的方法,串联质谱还可进行中性丢失扫描,这种方法是用MS/MS检测经CID后发生中性丢失H3PO4(98 u)的肽段。LC-MS/MS分析磷酸化位点 傅立叶变换质谱进行电子捕获解离,质谱检测磷酸化肽和 确定磷酸化位点的方法,糖基化修饰,蛋白质糖基化可分为4类:N-糖基化 O-糖基
49、化 C-甘露糖化 聚糖磷脂酰肌醇锚(GPI-anchor)糖基化,糖蛋白结构分析示意图,糖基化位点确定,先用蛋白酶将糖蛋白酶解成含有和不含有糖链的肽片段,获得糖蛋白的肽质量指纹谱,再用糖苷内切酶将肽链切除,PMF发生变化,原含有糖肽段的质量由于糖链的丢失在质谱图上发生位移,通过网上数据库检索可以得到位移肽片段的氨基酸序列,而在这个序列中必含有糖基化位点,由此我们可以确定糖蛋白分子中的糖基化位点。,糖基化分析,用糖苷内切酶将糖链切除,将反应前后的质谱图进行比较,就能直接表述糖链的平均质量,而糖蛋白的平均含糖量可由糖链的平均质量占糖蛋白平均相对分子质量的百分比来表示。应用ESI,对PMF中的肽片段
50、进行分析,可以得到蛋白某中间片段的序列,对已知蛋白,依靠此序列,判断其归属,从而对糖蛋白的氨基酸序列加以证实。不同的质谱方法可以产生多糖的源后裂解(PSD)和碰撞诱导解离(CID)谱,这可以给出有关糖的序列,分支及糖间的连接等信息。,糖基化修饰,常用的糖蛋白质分离富集技术有:凝集素亲和技术、肼化学富集法、亲水相互作用色谱法、消除麦克尔加成反应。基于质谱的糖蛋白质鉴定及糖基化位点确定方法有:PNGase F 酶法、Endo H 酶法、-消除麦克尔加成反应、三氟甲基磺酸法。,巯基和二硫键定位,原理:利用碘乙酰胺、4-乙烯吡啶、2-巯基苏糖醇等试剂对蛋白质进行烷基化和还原烷基化,结合蛋白酶切、肽谱技