《医学分子生物学第四章蛋白质及蛋白质组.ppt》由会员分享,可在线阅读,更多相关《医学分子生物学第四章蛋白质及蛋白质组.ppt(180页珍藏版)》请在三一办公上搜索。
1、第四章 蛋白质及蛋白质组,一 蛋白质对生命的重要性二 蛋白质的构件分子氨基酸三 蛋白质分子的基本结构及其与功能的关系四 蛋白质分子的空间结构及其与功能的关系五 蛋白质的单体缔合、超分子装配及蛋白质 蛋白质、蛋白质DNA相互作用六 蛋白质组,第一节 蛋白质对生命的重要性,Protein Berzelius 1838蛋白质是生命的物质基础,一切生命活动离不开蛋白质蛋白质称为功能分子或工作分子(working molecules),1 催化功能蛋白质 酶2 保护和支持功能蛋白质 胶原蛋白3 激素蛋白质,4 运输功能蛋白质 血红蛋白 载脂蛋白 白蛋白5 运动功能蛋白质 肌球蛋白 肌动蛋白6 免疫防御功
2、能蛋白质 IgG MHC HLA,7 凝血功能蛋白质 凝血因子8 基因表达调控功能蛋白质 组蛋白9 识别功能的受体蛋白质,10 信号转导蛋白 G蛋白11 通道蛋白 离子通道 运载蛋白12 周期蛋白 cyclin 9类16种 Cdk(cyclin dependent kinase)7种 阻遏蛋白,13 凋亡蛋白 apoptin 凋亡蛋白活化因子Apaf Bcl-2 caspases14 其他蛋白质,第二节 蛋白质的构件分子氨基酸,蛋白质的元素组成和分子量相对分子量 Mr 上万C、H、O、N、SFe、P、Zn、Mn、Cu、IN含量16%(凯氏(Kjadehl)定氮法的理论基础),蛋白质的基本组成单
3、位:氨基酸蛋白质的构件分子(building-block molecule)氨基酸(amino acid,aa)(命名以羧基为母体),氨基酸的一般结构式(通式)COOH H2N C H R,一、氨基酸的分类,自然界存在300多种氨基酸组成蛋白质的一般只有20种氨基酸L,-氨基酸没有种族差异和个体差异,21 UGA SertRNA Ser 硒代cys(Selenocysteine)(含硒蛋白质)(1)I Chambers,J Frampton,P Goldfarb rt al.EMBO J.1986,5:1221-1227.(2)F Zinoni,A Birkmann,T C Stadtman
4、et al.1986,83:4650-4654.22 UAG 吡咯Lys(pyrrolysine)(巴氏甲烷八叠球菌)(3)G Srinivasan,C M James,J A Krzycki.Science.2002,296:1459-1462.(4)B Hao,W Gong,T K Ferguson et al.Science.2002,296:1462-1466.,生物化学分类酸性 Asp Glu 碱性 Arg Lys His 极性 Ser Thr Cys Tyr Asn Gln Trp Met中性 非极性 Gly Ala Val Leu Ile Phe Pro,氨基酸按-螺旋与折叠结构
5、形成的难易程度进行分类 强形成 易形成 弱易形成 中立作用 易破坏形成 强破坏形成 Glu Lys Asp Arg Tyr Pro Met Phe His Thr Asn Gly-螺旋 Ala Gln Ser Leu Trp Cys Ile Val Val Phe Arg Ser Pro Ile Trp Asn Gly Asp折叠 Tyr Leu His Lys Glu Cys Ala Thr Gln Met,二、蛋白质中氨基酸的组成分析,大部分蛋白质 502000 aa,Mr 5.5-220 kD1)不一定含有全套20种氨基酸2)中性非极性氨基酸一般占3540 Ala Ser Leu最多 G
6、ly Val Glu次多 Trp Met最少 His Cys Tyr次少,第三节 蛋白质分子的基本结构及其与功能的关系一、肽键和肽1 肽键(peptide bond)一个氨基酸的-氨基与另一个氨基酸的-羧基,在一定条件下可以脱水缩合成肽,所形成的酰胺键称为肽键。,R1 R1 OH2N-CH-COOH+HN-CH-COOH H2N-CH-C-N-CH-COOH+H20 H R2 H R2,2 肽氨基酸通过肽键相连的化合物医学中一些重要的多肽谷胱甘肽(GSH)促甲状腺素释放激素催产素(Vigneaud,合成,1953;Noble prize 1955)神经肽类(内啡肽类和脑啡肽类),GSH过氧化物
7、酶,GSH还原酶,NADPH+H+,NADP+,促甲状腺素释放激素,焦谷氨酰组氨酰脯氨酰胺,二、蛋白质的一级结构(primary structure)1969 年,IUPAC规定 专指多肽链中氨基酸(残基)排列的序列(sequence),胰岛素的一级结构,A链 甘异缬谷谷胺半半苏丝异半丝亮酪谷胺亮谷天胺酪半天胺,B链 苯缬天胺谷胺丝亮半甘丝组亮缬谷丙亮酪亮缬半甘谷精甘苯苯酪苏脯赖苏,(H),(H),(OH),(OH),s,s,s,s,s,s,当今世界三大主要蛋白质序列数据库瑞士 Swiss-port欧洲 MIPS美国NBRFRIP统一网址:,三、蛋白质一级结构的测定1.人工测定法1)被测蛋白质
8、样品纯度952)蛋白质分子质量测定与氨基酸组成分析3)蛋白质多肽链N-末端和C-末端测定4)蛋白水解酶不完全水解蛋白质5)小肽片段层析、电泳分离得到特异肽谱指纹图6)各小肽片段用苯异硫氰(PITC)的Edman降解法,或者质谱(MS)分析7)改用氨基酸位点特异的化学方法水解肽段,Edman降解法测序8)比较两套肽谱,拼接9)二硫键的测定与定位10)化学修饰改变肽链的切点,2.自动测定法 0.01mg Edman法(1950年),Edman反应,PTH-AA,3.反向测定法 DNA Pro,质谱方法,质谱方法的改进,使测序容易起来。,The Nobel Prize in Chemistry 20
9、02,for the development of methods for identification and structure analyses of biological macromolecules,四、蛋白质一级结构和功能的关系,(1)相似一级结构的蛋白质必有相似的空间结 构和功能 一级结构是蛋白质发挥生理功能的分子基础 血红蛋白与肌红蛋白 癌蛋白与生长因子或生长因子受体,肌红蛋白与血红蛋白的结构,(2)认识酶、激素前体一级结构的局部断裂与功能激活的分子基础 胰蛋白酶原(trypsinogen)胰蛋白酶(trypsin)前胰岛素原(preproinsulin)109aa胰岛素(in
10、sulin)51 aa,(3)认识蛋白质种属差异和分子进化的亲缘关系 不同种属生物的同一种蛋白质,一级结构相似,但有差异差异决定免疫原性,一般不在活性中心,不影响生物活性保守区域决定空间结构和生物学功能,蛋白质中非关键部位氨基酸残基更换,不会明显改变其活性 胰岛素分子,种属发生树 比较不同生物同一种蛋白质一级结构的差异来推断生物间亲缘关系 不同生物细胞色素C一级结构与人细胞色素C一级结构中氨基酸差异数种类 黑猩猩 恒河猴 兔 猪、牛、羊 马 鸡 海龟 小蝇 小麦 酵母差异数 0 1 9 10 12 13 15 25 35 44,(4)认识蛋白质一级结构的变异与“分子病”(molecular d
11、isease)的关系 Pauling 1949年在研究血红蛋白分子时首先提出“分子病”指DNA结构改变导致表达产物蛋白质一级结构改变和功能异常所造成的疾病,例:镰刀形红细胞贫血,一些临床上常见的“分子病”及其相应的蛋白质异常,五、二硫键,二硫键(disulfide bond)属于共价键,由一条或两条肽链上的两个半胱氨酸残基上的巯基经脱氢氧化生成Anfinsen定律(Noble prize 1972)蛋白质的一级结构决定其空间结构的正确折叠,包括二硫键的正确配对形成,称为Anfinsen定律,Anfinsen 的经典实验:牛胰核糖核酸酶变性与复性实验A classical example is
12、the denaturation and renaturation of ribonuclease(Anfinsen experiment),第四节 蛋白质分子的空间结构及其与功能的关系,Linderstrom-Lang 1952IUPAC 1969,结构名称 结构定义 连接键一级结构(基本结构)肽链中氨基酸排列顺序 共价的肽键二、三、四级结构(3D)肽链中氨基酸空间排布 非共价与二硫键,蛋白质分子结构的不同层次,一级结构(基本结构)氨基酸组成分析及氨基酸序列测定自动序列分析仪,二级结构测定通常采用圆二色光谱(circular dichroism,CD)测定溶液状态下的蛋白质二级结构含量。-螺
13、旋的CD峰有222nm处的负峰、208nm处的负峰和198 nm处的正峰三个成分;而-折叠的CD谱不很固定。,三级结构测定X射线衍射法(X-ray diffraction)和核磁共振技术(nuclear magnetic resonance,NMR)是研究蛋白质三维空间结构最准确的方法。,一、蛋白质分子的二级结构及其与功能的关系 多肽链中相邻氨基酸残基形成的局部肽链空间结构,是其主链原子的局部空间排布-螺旋(-helix)-折叠(-pleated sheet)-转角(-turn)无规则卷曲(random coil)-螺旋(-helix)-环(-loop),(1)螺旋(-helix),61,基本
14、特征1)肽链骨架是右手螺旋结构2)每一螺旋由3.6氨基酸残基组成,螺距5.4nm3)相邻 螺旋间由第1个氨基酸肽键的C=O与第5个氨 基酸肽键的N-H形成氢键,中间包括13个原子,又称3.613螺旋4)氢键方向与螺旋长轴平行,链内氢键是螺 旋稳定的主要因素5)侧链R位于螺旋外侧,其基团大小、形状、带电 状态影响螺旋的形成和稳定6)各种蛋白质中螺旋所占比例各不相同,影响螺旋稳定的因素:1)Pro、Hpro是亚氨基酸不易形成螺旋2)Gly的-R为H,空间站位很小,C自由度大,影响螺旋的稳定3)基团较大的R,C周围空间位阻大不易形成螺旋4)带相同电荷的R集中时,具有静电排斥效应,不易形成链内氢键肌红
15、蛋白几乎全是螺旋,左手螺旋,右手螺旋,(2).-片层(pleated sheet structure)又称-折叠,68,基本特征 1)多肽链呈伸展状态,肽键平面之间略呈锯齿状 侧链交错伸向锯齿状结构的上下方 2)-折叠可由2-5个肽段片层之间经C=O与N-H间 形成的链间氢键维系,氢键的方向与肽链长 轴垂直 3)肽段的反向平行方式排列最稳定 丝心蛋白几乎全是-折叠,-螺旋与-折叠比较,-螺旋-折叠 棒状 片状 肽链紧紧盘绕 肽链几乎完全展开 链内氢键 链间氢键 AA间距0.15nm 0.36nm R螺旋的外部 R在片层的上下 角蛋白 丝蛋白,(3)-转角(-turn)基本特征 肽链出现1800
16、转回折的发夹状结构 球蛋白中此类结构多,常位于分子表面,为蛋白质活 性的重要空间结构部分 Pro常出现在-转角中,(4)无规则卷曲(random coil)基本特征 a、各种蛋白质中没有共同规律可循的肽段的构象,b、虽为无序但仍是蛋白质分子结构与功能的重要肽段更确切地 称之特定卷曲(specific coil),(5)-螺旋(-helix)主要存在于胶原蛋白分子中,每圈螺旋含4.4个氨基酸残基,与螺旋长轴基本平行的氢键维持稳定,氢键跨18个原子,称4.418螺旋,比-螺旋 稍大且疏松的左手螺旋。胶原蛋白分子中三股左手螺旋再盘曲为右手三股超螺旋。,(6)-环,或称连接环 近年来引人关注 规律性较
17、差,与蛋白质的生物识别功能有关,蛋白质二级结构与功能的关系特定的空间结构具有特定的功能 1)角蛋白有大量螺旋,决定其性质稳定,坚韧,富有弹性 2)丝心蛋白富含片层 决定其分子伸展 3)细胞膜上的离子通道由几段-螺旋的 亲水侧之间组成 4)胶原纤维富含-螺旋 三股形成超螺旋,强大抗张力,又不具大的 延伸性,二、维系蛋白质空间结构的连接键除二硫键和配价键外,非共价键又称副键、次级键氢键、疏水键、盐键(离子键)、Van der waals力*维系蛋白质分子二级结构的主要是氢键*维系蛋白质分子三级结构的主要是疏水键*维系蛋白质分子四级结构的主要是盐键,三、蛋白质的超二级结构和结构域 1.蛋白质的超二级
18、结构(super secondary structure)蛋白质分子中的一些二级结构单元,有规则地聚集在一起形成全由螺旋、全由片层或螺旋与片层混合、均有的超二级结构基本形式,具体地说,形成相对稳定的、2 和 T(HTH)、L(HLH)等超二级结构,又称模体(motif)。,钙调蛋白(calmodulim)含 L(HLH)CAP蛋白(cAMP结合蛋白)含 T(HTH)锌指蛋白含2,螺旋转角螺旋(Helix-turn-helix,HTH):HTH是第一个被确立的DNA-结合结构。很多细菌的调节蛋白是以螺旋转角螺旋这种基序存在,如Lac阻遏蛋白,Trp阻遏蛋白、分解代谢激活蛋白(CAP),噬菌体阻遏
19、蛋白(Cro),噬菌体434阻遏蛋白。在酵母中涉及交配型的a1和a2蛋白以及在高等真核生物中的Oct-1和Oct-2蛋白也属于此类型。这种基序包含有两个a螺旋,螺旋之间间隔有一个短的转角,使两个螺旋可通过疏水作用装配起来。第一个螺旋稳定并使第二个螺旋暴露出来,与DNA的大沟作用,而特异性地与碱基接触。因此,第二个螺旋被称为识别螺旋(recognition helix)。上述的相互作用锚定了蛋白质中识别螺旋的位置并稳定了DNA的构象,从而调节不同蛋白和其结合位。,螺旋-环-螺旋(helix-loop-helix,HLH)螺旋-环-螺旋蛋白的基序:有一条含有两个亲水的-螺旋,链长为4050 氨基酸
20、,两个-螺旋由很长的连接区(环)相连,螺旋的一侧有疏水氨基酸,两条链依赖疏水氨基酸的相互作用形成同二聚体或异二聚体,此螺旋区长约1516氨基酸,含有各种保守的残基,连接环的长度不等,一般为1228氨基酸。与DNA结合的是碱性区,长为15 氨基酸,其中有6氨基酸为碱性。在HLH中带有碱性区的肽链称为 碱性HLH(bHLH,protein)。bHLH又分为两类。A类是可以广泛表达的蛋白,包括哺乳动物的E12/E47(可和免疫球蛋基因增强子中的元件结合)和果蝇da(daughterless,性别控制的总开关基因)的产物;B类是组织特异性表达的蛋白,包括哺乳动物的MyoD(肌浆蛋白(myogen)基因
21、的转录因子)和果蝇的AC-S(achaete-scute 无刚毛基因的产物)这种bHLH可能是一种转录调控蛋白,大部分以异二聚体形式存在。,钙结合蛋白中结合钙离子的模体,锌指结构,2.结构域 单个或多个超二级结构,尚可与二级结构进一步集结起来,形成在蛋白质分子空间结构中明显可区分且接近球状的区域,称结构域(domain)3-磷酸甘油醛脱氢酶,大肠埃希菌的cAMP结合蛋白CAP(catabolite gene activator protein),分解物基因激活蛋白质 N端 3 7 大结构域 结合cAMP C端 T 小结构域 识别结合DNA cAMP 大结构域 CAP构象变化 小结构域 DNA
22、RNA pol DNA 转录翻译,免疫球蛋白的结构域 Edelman 2重链2轻链免疫球蛋白 可变区由X 和 Y 上下两层,34个反向平行折叠超二级结构域,再加上二硫键形成 重轻链可变区共同组成免疫球蛋白与抗原分子结合的分子表面部位,其中34个高变区(hypervaliable region)或互补决定区(complementary determining region,CDR)。轻链2632,48 55,90 95位,重链 31 51,84 91,101 110位,90,免疫球蛋白结构域,“一个外显子决定一个结构域”(one gene one domain)“结构域洗牌”(domain sh
23、uffling)或分子重组,四、蛋白质的三级结构(tertiary structure)及其和功能的关系蛋白质的三级结构 蛋白质分子或蛋白质亚基肽链中所有原子的空间排布,但不包括亚基间的空间排布关系。事实上指蛋白质分子整条多肽链中一些二级结构、超二级结构、结构域的主链和侧链在空间进一步折叠盘曲形成的空间结构,包括在一级结构上相距甚远的氨基酸残基的空间排布。,肌红蛋白(myoglobulin,Mb)第一个精确测定三级结构的蛋白质 153aa 4.5nm X 3.5nm X 2.5nm 球状分子 8(A-H)7-27 aa 4 3 random coil E、F间20个疏水aa形成洞穴,结合Fe2
24、+,肌红蛋白(Mb),95,三级结构示意图,分子伴侣(chaperon)助卷曲物是一类帮助肽链折叠的特殊蛋白质热激蛋白(heat shock protein,HSP)HSP 60,HSp 70,HSp 80等10个亚族,分子伴侣(chaperon)通过提供一个保护环境从而加速蛋白质折叠成天然构象或形成四级结构。分子伴侣可逆地与未折叠肽段的疏水部分结合随后松开,如此重复进行可防止错误的聚集发生,使肽链正确折叠。分子伴侣也可与错误聚集的肽段结合,使之解聚后,再诱导其正确折叠。3 分子伴侣在蛋白质分子折叠过程中二硫键的正确形成起了重要的作用,分子伴侣:Hsp70和陪伴蛋白Molecular chap
25、erones:Hsp70(heat shock protein,Mr near 70k,dnaK and dnaJ in E.coli.)Chaperonins(hsp60s or cpn60s,one of them is GroEL and GroES in E.coli.),Hsp70的作用:Hsp结合到未折叠的多肽链的疏水区,从而阻遏了这些疏水区的不适当聚集,“保护”了因热而变性的蛋白质或正在合成还未折叠的多肽。Functions of Hsp70:Hsp70 proteins bind to regions of unfolded polypeptides that are rich
26、 in hydrophobic residues,preventing inappropriate aggregation.These chaperones thus“protect”proteins that have been denatured by heat and peptides that are being synthesized(and are not yet folded).,陪伴蛋白的作用:陪伴蛋白是一个精细的蛋白质复合物,由两种亚基(GroES,Mr60和GroEL,Mr10)组成。陪伴蛋白是一个精巧的蛋白质折叠机器。,ChaperoninsChaperonins are
27、 elaborate protein complexes required for the folding of a number of cellular proteins that do not fold spontaneously.They are machines for proteins folding.,每层7个GroEL 分子两层构成桶状,1个GroES 分子构成一个盖子,蛋白质三级结构和功能的关系结构和功能的统一是生物大分子蛋白质最重要的特征蛋白质具有了三级结构才有生物活性,五、蛋白质的四级结构(quanternary structure)及其和功能的关系 蛋白质的四级结构 蛋白
28、质分子中亚基的空间排列和相互接触的布局,不包括亚基本身的空间结构 蛋白质分子四级结构中,各具独立三级结构的多肽链称亚基(subunit),亚基单独存在时不具生物活性。,血红蛋白最早用于研究一级结构、空间结构、生理功能和分子病,生物学中最基础的“氢原子”6.4nm X 5.5nm X 5nm亲水球状四面体,4亚基 每个亚基表面疏水袋镶嵌一个血红素辅基,其Fe2+与卟啉环上4个吡咯环的N及肽链F段第8位His形成5个配位键,第六个与氧结合,血红蛋白的四级结构,蛋白质四级结构与功能的关系 通过蛋白质构象变化而实现其调节功能的过程称别构调节,是蛋白质进化到分子具有四级结构后出现的一个重要性质 天冬氨酸
29、转氨甲酰酶同工酶II CTP(-)ATP(+)别构调节,血红蛋白别构调节“易化氧和”,亚基 O2分子Fe2+成6配位数,半径变小,落入卟啉环,位移0.06 nm 牵动F8位(92或 87)His及相应肽链,亚基别构 亚基F和H两个螺旋空隙变小,挤出145Tyr,阻断其与FG5位Val氢键 亚基C端游离,转动15,位移0.08nm 破坏 146 His+40 Lys 盐键 146 His+94 Asp 盐键 挤出阻碍其他亚基血红素中亚铁离子与氧结合的含67位E11 Val的侧链“T”型转成松散“R”血红蛋白的正协同作用,第一个亚基与氧结合,促进亚基间8个盐键依次断裂,整个血红蛋白四级结构别构后,
30、使其亚基与氧的亲和力依次增加几倍、几十倍最终骤然增加500倍,“S”型氧解离曲线,血红素与氧结合后,铁原子半径变小,就能进入卟啉环的小孔中,继而引起肽链位置的变动。,113,血红蛋白结合氧前后构象的变化,当血红蛋白结合氧以后,11与22两个二聚体彼此滑动15,其构象由T(tense)型转变为R(relaxed)型。,114,佩鲁茨和他的英国同事肯德鲁使用X射线衍射分析法,以血红蛋白和肌红蛋白作为研究对象。使用的装置能够把一些蛋白质分子和一个大质量原子(如金或汞的原子)结合起来,因为这些大质量原子衍射X射线的效率特别高。他们精确地推断出在没有大质量原子的情况下血红蛋白分子的结构。到1959年,肌
31、红蛋白分子的结构弄清楚了,第二年血红蛋白分子的结构也研究出来了。这样就可以制造出它们的立体模型。结果,佩鲁茨和肯德鲁分享了1962年的诺贝尔化学奖,John Cowdery Kendrew Max Ferdinand Perutz 1962“for their studies of the structures of globular proteins,1964Dorothy Crowfoot Hodgkin,19101994,英国人,使用X射线衍射技术测定复杂晶体和大分子的空间结构。for her determinations by X-ray techniques of the struc
32、tures of important biochemical substances,六、蛋白质构象病,“蛋白质分子构象病理学”Carrel于1997年提出的,一些蛋白质分子因为空间构象的改变或错误折叠从而造成的疾病或病理现象。Carrel R W et al Lancet,1997,350:134138 protein conformational diseases,PCD,蛋白质构象病 因先天新合成的蛋白质分子构象折叠错误或后天已合成蛋白质退行性病变甚至蛋白质构象蔓延等而导致的疾病。特征 较多折叠构象变化,进而蛋白质分子聚集并产生沉淀。,1 镰刀型红细胞贫血 血红蛋白亚基 第六位GluVal
33、 2 亨廷顿舞蹈病 人小脑共济失调,神经退行性疾病 淀粉样蛋白增加,构象中螺旋减少,折叠增加,3 老年痴呆 阿尔茨海默症(Alzheimer disease,AD)中枢神经系统退行性疾病 三种结构异常:老年斑 神经元纤维缠结 脑血管壁上淀粉样蛋白沉淀,1)淀粉样前体蛋白(amyloid precurser protein,APP)的沉淀与积聚,合成与分泌过量。分泌酶(BACE)APP 淀粉样蛋白(amyloid,A)A40 A42(A43)90 10 糖肽 糖肽 40aa 42aa 43aa-helix较多-折叠增多 可溶性多肽 水溶性较差 散发型 纤维化沉淀 正常产物 老年痴呆症,2)早老蛋
34、白1和2(presenilin-1and 2,PS)的积聚,大脑皮层和海马区域出现沉淀蛋白老年斑(senile prague,SP),最终出现神经元纤维缠结(NFT)与脑血管壁淀粉样物质沉积的异常。,4 克雅氏病(Creutzfeldt-Jacob disease,CJD)致死性家族嗜睡症(FEI)蛋白酶抗性蛋白(proteinase-resistant protein,prpc)prpsc 1997年 Noble prize Prusiner 感染因子为朊病毒(prion,proteinaceous infectious particle)比一般含核酸的病毒小100倍,2730 kD,含pr
35、p,1997 Stanley B.Prusiner for his discovery of Prions-a new biological principle of infection,疯牛病中的蛋白质构象改变疯牛病是由朊病毒蛋白(prion protein,PrP)引起的一组人和动物神经退行性病变。正常的PrP富含-螺旋,称为PrPc。PrPc在某种未知蛋白质的作用下可转变成全为-折叠的PrPsc,从而致病。,the prion disease(mad cow disease,PrP misfolding),A stained section of the cerebral cortex
36、from a patient shows spongiform degeneration,错误折叠将导致死亡!Death by misfolding!,第五节 蛋白质的单体缔合、超分子装 配及蛋白质蛋白质、蛋白质DNA相互作用,一、蛋白质单体缔合(monomer association)一些具有独立三级或四级结构和生理功能的蛋白质分子,尚可作为单体(monomer),多个缔合起来形成多聚体(polymer).单体具有活性,与亚基不同 胰岛素,免疫球蛋白,肌球蛋白与肌动蛋白,二、蛋白质超分子装配(supermolecular assembly),生物体内,一些具有独立三级或四级结构及生理功能的蛋
37、白质分子,常可不同种类镶嵌互补装配起来形成更复杂、更高层次的复合物,甚至形成电镜下可以直接观察到的一些超分子装配物。,多酶复合体丙酮酸脱氢酶系23 nm x 35 nm x 30 nm,正立方形,桑葚状12 丙酮酸脱羧酶 8 二氢硫辛酸乙酰移换酶12 二氢硫辛酸脱氢酶蛋白质糖,脂糖蛋白,核小体病毒颗粒 TMV(tobacco mosaic virus)6000 base RNA+141 aa X 2130,三、蛋白质蛋白质相互作用(proteinprotein interaction),反式作用因子的一种调控的形式是蛋白质与蛋白质之间的相互作用,酵母半乳糖代谢中GAL80和GAL4的相互作用就
38、是很好的例子。,酵母半乳糖代谢调控和原核生物Gal操纵中的调控形式是完全不同的:被调节的基因绝大部分都是位于不同的染色体上,不连锁;起负调节作用的蛋白GAL80不直接和DNA结合,而是通过和作为转录激活因子的GAL4蛋白结合,占据其功能域来阻遏转录的;作为正调节因子不仅需要半乳糖作为诱导物,还需要GAL4蛋白作为转录因子,它不是像原核中的正调节蛋白仅和操纵子中的操纵基因结合,使整个基因簇得以转录,而是分别和各个被调节基因上游元件UAS结合,促进转录。,GAL4蛋白和的阻遏蛋白相似有DNA结合功能域,又具有转录活功能域,它以二聚体的形式结合于被调节基因上游特殊序列UASG 上。UASG由4个相同
39、的17bp序列构成,每个序列都呈两侧对称,和一个二聚体结合,那么转录激活是低水平的,若4个序列都和GAL4结合的话,表达达到最高水平。GAL4的结构是利用功能区转换(domain-swapping)实验获得的。其768881氨基酸区域为转录激活功能区,可以和转录因子相结合,这个区域中的851881区域又可特异地和GAL80蛋白相结合。当半乳糖缺乏时,GAL80 就在此区域和GAL4相结合,占据了其转录激活功能区,使其无法和转录因子结合,虽此时的GAL4仍可和UASG结合,但失去了转录激活能力,因此gal基因不转录;当半乳糖存在时它可以和GAL80结合,可能使其构象发生改变,从GAL4上解离下来
40、,这样GAL4又可以和转录因子相结合,恢复了转录活性的功能,四、蛋白质核酸的相互作用(proteinnucleic acid interaction),1 结构包装与代谢重排 核小体 2 基因表达调控 真核基因转录调控 顺式作用元件(DNA)与反式作用因子(protein),检测蛋白质DNA的相互作用,电泳迁移率变动分析(EMSA)DNaseI足迹分析(footprinting)酵母单杂交系统(yeast one-hybrid)体内染色质免疫共沉淀(ChIP),电泳迁移率变动分析(EMSA),(Electrophoretic Mobility Shift Assay,EMSA)是一种检测蛋白质
41、和DNA序列相互结合的技术,最初用于研究DNA结合蛋白和其相关的DNA结合序列相互作用,可用于定性和定量分析。这一技术目前已用于研究RNA结合蛋白和特定的RNA序列的相互作用,已经成为转录因子研究的经典方法。基本原理 蛋白质可以与末端标记的核酸探针结合,电泳时这种复合物比无蛋白结合的探针在凝胶中泳动的速度慢,即表现为相对滞后。该方法可用于检测DNA结合蛋白、RNA结合蛋白,并可通过加入特异性的抗体(supershift)来检测特定的蛋白质,并可进行未知蛋白的鉴定。,DNaseI足迹分析(footprinting),原理:结合蛋白后,可以保护该段分子免受核酸酶的降解。首先要对研究的DNA片段的一
42、端进行放射性标记,然后再与调节蛋白混合。加入DNase I,但加入的量不能太多,以保证DNA分子的部分降解。如果DNA片段未与蛋白结合,将产生一系列的标记的片段。然而结合蛋白区域将不被酶切,这样产生的系列片段是不完全的,受到保护的片段在电泳中是不存在的。在放射性自显影中呈现足迹。,酵母单杂交系统(yeast one-hybrid),酵母单杂交(yeast one hybrid)技术是体外分析DNA与细胞内蛋白质相互作用的一种方法,通过对酵母细胞内报告基因表达状况的分析,来鉴别DNA结合位点并发现潜在的结合蛋白基因,或对DNA结合位点进行分析。运用此技术,能筛选到与DNA结合的蛋白质,并可直接从
43、基因文库中得到编码该蛋白质的核苷酸序列,而无需复杂的蛋白质分离纯化操作 酵母属真核细胞,通过酵母系统得到的结果比其他体外技术获得的结果更能体现真核细胞内基因表达调控的真实情况,体内染色质免疫共沉淀(ChIP),chromatin immunoprecipitation assay 研究体内DNA与蛋白质相互作用的方法。它的基本原理是在活细胞状态下固定蛋白质DNA复合物,并将其随机切断为一定长度范围内的染色质小片段,然后通过免疫学方法沉淀此复合体,特异性地富集目的蛋白结合的DNA片段,通过对目的片段的纯化与检测,从而获得蛋白质与DNA相互作用的信息。,第六节 蛋白质组,蛋白质组(proteome
44、)与蛋白质组学(proteomics)蛋白质组是在整体水平上研究生物体所有基因编码蛋白质的组成与其在生命活动中的规律。蛋白质组学是研究蛋白质组的学科。后基因组计划(Post Genome Project)或功能基因组计划(Functional Genome Project),蛋白质组是澳大利亚学者Williams和Wilkins于1994年首先提出,源于蛋白质(protein)与基因组(genome)两个词的杂合,意指proteins expressed by a genome,即“一个细胞或一个组织基因组所表达的全部蛋白质”。,蛋白质组的概念,蛋白质组学(proteomics),指应用各种技
45、术手段来研究蛋白质组的一门新兴科学,其目的是从整体的角度分析细胞内动态变化的蛋白质组成成份、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,揭示蛋白质功能与细胞生命活动规律。,进 展,各国政府支持,国际著名研究和商业机构加盟:1996年澳大利亚建立了世界上第一个蛋白质组研究中心(Australia Proteome Analysis Facility,APAF),美国国立癌症研究院(NCI)投资1000万美元建立肺、直肠、乳腺、卵巢肿瘤的蛋白质组数据库。NCI和FDA共同投资数百万美元建立癌症不同阶段的蛋白质组数据库。英国建立三个蛋白质组研究中心对已完成或即将完成全基因组测序的生物体进行蛋
46、白质组研究。,Celera公司投资上亿美元独自启动了全面鉴定和分类汇总人类组织、细胞和体液中的蛋白质及其异构体,构建新一代的蛋白质表达数据库的工作。,1997年召开了第一次国际“蛋白质组学”会议 1998年在美国旧金山召开了第二届国际蛋白质组学会议 1999年1月在英国伦敦举行了应用蛋白质组会议,我国也于1998年启动了蛋白质组学研究,在中科院上海生物化学研究所举办了两次全国性的蛋白质组学研讨会,2003成立了中国人类蛋白质组组织(CHHUPO),并分别于2003年9月、2004年8月以及2005年8月召开了中国蛋白质组学首届、第二届及第三届学术大会,2004年10月在中国北京召开了第三届国际
47、蛋白质组学会议。,科技部已将疾病蛋白质组研究列入我国“973”计划项目和“863”计划项目;国家自然科学基金委员会也将“蛋白质组研究”列为重点项目。我国在鼻咽癌、白血病、肝癌和肺癌蛋白质组研究方面取得了较大的进展。,年月日,英国自然周刊在发布人类基因组框架图时,同期登载了一条关于人类蛋白质组研究组织(,)成立的消息,标题就叫“现在是蛋白质组了”。,蛋白质组与基因组的比较 基因组 蛋白质组 数目恒定 种类、数量,结构时空变化 复制高度保真性 翻译后加工修饰 理化性质相似 理化性质差异大 PCR,易于序列分析 难以扩增,重组蛋白操作复杂,任何一种生物的基因组,都是由不编码蛋白质的核苷酸序列和编码蛋
48、白质的核苷酸序列(基因)所组成。基因通常只是基因组的一小部分,例如编码人类蛋白质的核苷酸序列大约占人类基因组的。要想从混杂有大量非编码核苷酸序列的基因组中找出基因,如同沙里淘金。基因组研究的结果表明,一个基因组拥有的“基因”数目是由两部分组成的:通过实验证明确有蛋白质产物的真实基因、根据起始密码和终止密码序列所确定的潜在基因。生物学家们把这两类基因都称为“开放阅读框”(open reading frame,)。因此,一个基因组内的基因数目通常是指的数目。,当一个基因组的全序列测定之后,确定其含有的就成为了主要任务,称为基因注释。目前用于基因注释的方法还有较高的出错率,尤其对于那些存在不连续基因
49、(即在一个基因内插有非编码的核苷酸序列)的复杂基因组,出错的问题更为突出。此外,这些是否与蛋白质存在一一对应关系也是一个问题。一方面,人们已经发现有许多“假基因”(pseudogene)的存在,这些假基因有和真基因相同的,但却从不表达。另一方面,由于存在水平上遗传信息的加工mRNA 编辑(editing),以及蛋白质水平上遗传信息的加工蛋白质剪接(protein splicing),许多蛋白质很难找到直接对应的。如果我们不能确定基因组的“所有”基因,我们从何知道蛋白质组的“全部”蛋白质?,显然,确定基因数目最可靠的方法是通过研究蛋白质组来进行。据最新统计,人类基因组拥有的基因数目大约是在万到万
50、个之间。如果能够把人体种细胞内的全部蛋白质都给鉴定出来,那么我们就有可能真正知道人类基因组的所有基因。但是这样一来,基因组和蛋白质组形成了“循环定义”:蛋白质组是以基因组拥有的所有基因的表达产物来构成,而所有基因的确定又必须通过蛋白质组来给予肯定。可见,要找出一个生物体基因组的所有基因和相应的全部蛋白质,是一项非常困难的任务。,蛋白质组 细胞蛋白质组 亚细胞蛋白质组 定量蛋白质组常用蛋白质分析技术二维电泳(1975 OFarell)荧光染色、核素标记、色谱、质谱、蛋白质芯片技术,双向(二维)凝胶电泳是目前蛋白质组最有效的分离方法,是蛋白质组分离技术的核心。双向凝胶电泳的第一向是以蛋白质等电点(