《遗传信息传递的整体性.ppt》由会员分享,可在线阅读,更多相关《遗传信息传递的整体性.ppt(71页珍藏版)》请在三一办公上搜索。
1、第十九章,遗传信息传递的整体性,Integration of expression and transmission of genetic information,第一节基因组学Genomics,一、基因组就是一种生物拥有的所有遗传信息的总合,是一个细胞(或病毒)所载的全部遗传信息,它代表了一种生物所具有的全部遗传信息。真核生物基因组是指一套完整单倍体DNA(染色体DNA)及线粒体或叶绿体DNA的全部序列,既有编码序列,也有大量存在的非编码序列。细菌基因组包含了拟核和质粒中的DNA序列。病毒基因组有的为DNA(DNA病毒),有的则为RNA(RNA病毒)。,*基因组(genome),二、基因组学
2、包括结构基因组学、功能基因组学和比较基因组学,1.基因组学(genomics)是阐明整个基因组的结构、结构与功能的关系以及基因之间相互作用的科学。,2.研究内容,结构基因组学(structural genomics):遗传图谱、物理图谱、序列图谱以及转录图谱和大规模DNA测序。,功能基因组学(functional genomics):分析鉴定基因组功能。,比较基因组学(comparative genomics):基因组之间比较鉴定,研究生物进化,预测新基因。,三、结构基因组学的主要任务是基因组作图和大规模测序,通过基因作图、构建连续克隆系及大规模测序等方法,结合主要模式生物已知基因组DNA序列
3、,辅以生物信息学和计算生物学技术,解密人类基因组DNA序列和结构。,人类基因组计划(Human Genome Project,HGP):,1遗传作图2物理作图,(一)遗传作图和物理作图是绘制人类基因组草图的重要策略,染色体DNA很长,不能直接进行测序,必须先将基因组DNA进行分解、标记,使之成为可操作的较小结构区域,这一过程称为作图。,遗传作图(genetic mapping):就是确定连锁的遗传标志位点在一条染色体上的排列顺序及它们之间的相对遗传距离,用厘摩尔根(centi-Morgan,cM)表示,当两个遗传标记之间的重组值为1%时,图距即为1 cM。,1遗传作图就是绘制连锁图,遗传图(g
4、enetic map)又称连锁图(linkage map)。,*DNA标记,限制性片段长度多态性(restriction fragment length polymorphism,RFLP)可变数目串联重复序列(variable number of tandem repeat,VNTR)单核苷酸多态性(single nucleotide polymorphism,SNP),限制性片段长度多态性(RFLP):利用特定的限制性内切酶识别并切割基因组DNA,得到大小不等的DNA片段,所产生的DNA数目和各个片段的长度反映了DNA分子上不同酶切位点的分布情况。,可变数目串联重复序列(VNTR):又称微
5、卫星DNA(minisatellite DNA),是一种重复DNA短序列。VNTR基本原理与RFLP大致相同,通过限制性内切酶的酶切和DNA探针杂交,可一次性检测到众多微卫星位点,得到个体特异性的DNA指纹图谱。,单核苷酸多态性(SNP):SNP不以“长度”的差异作为检测手段,而是直接以序列的变异作为标记。SNP是指在基因组水平上由单个核苷酸变异所造成的DNA序列多态性。SNP是人类可遗传的变异中最常见的一种,也是基因组中最为稳定的变异。SNP最大限度地代表了不同个体之间的遗传差异,因而成为研究多基因疾病、药物遗传学及人类进化的重要遗传标记。,物理作图(physical mapping)是在遗
6、传作图基础上制作的更详细的人类基因组图谱。包括:荧光原位杂交图(FISH map)限制性酶切图(restriction map)连续克隆系图(clone contig map),2物理作图就是描绘杂交图、限制性酶切图及克隆系图,荧光原位杂交图(fluorescent in situ hybridization map,FISH map):将荧光标记的探针与染色体杂交确定分子标记所在的位置。限制性酶切图(restriction map):将限制性酶切位点标定在DNA分子的相对位置。,连续克隆系图(clone contig map):采用酶切位点稀有的限制性内切酶或高频超声破碎技术将DNA分解成大
7、片段后,再通过构建酵母人工染色体(yeast artificial chromosome,YAC)或细菌人工染色体(bacterial artificial chromosome,BAC)获取含已知基因组序列标签位点(sequence tagged site,STS)的DNA大片段。,*STS(sequence tagged site,基因组序列标签位点):是指染色体定位明确,并且可用PCR扩增的单拷贝序列,每隔100 kb距离就有一个标志。在STS基础上构建能够覆盖每条染色体的大片段DNA连续克隆系就可绘制精细物理图谱,为大规模DNA测序做好了准备。,(二)通过BAC克隆系、鸟枪法等完成大规
8、模DNA测序,1BAC克隆系的构建是大规模DNA测序的基础 YAC载体装载量偏大(12 Mb),自身稳定性不够。BAC具有插入片段较大(几kb350 kb)、嵌合率低、遗传稳定性好、易于操作等优点。,2鸟枪法是大规模DNA测序的重要方法,全基因组鸟枪法测序(shotgun sequencing)直接将整个基因组打成不同大小的DNA片段,构建BAC文库,然后对文库进行随机测序,最后运用生物信息学方法将测序片段拼接成全基因组序列。,鸟枪法DNA测序的主要步骤:,建立高度随机、插入片段大小为1.6 kb到4 kb左右的基因组文库。高效、大规模的克隆双向测序。序列组装(sequence assembl
9、y)产生一定数量的重叠群(contig)。缺口填补。,鸟枪法(shotgun)测序的的原理与策略,3高通量测序技术大大加快了基因组DNA测序的进行,高通量测序(high-throughput sequencing)技术:不仅具备毛细管电泳测序不具备的优点,还能进行“平行/多点”、“单分子”和“混合”序列分析。这种高通量测序一次实验可以读取几十万到几百万DNA片段的序列,极大加速了基因组测序。,(三)生物信息学是预测基因组结构和功能的重要手段,数据库的建设:汇集了大量DNA序列、蛋白质信息预测基因、基因产物的结构、功能;分析基因-基因、基因-产物、产物-产物之间的相互作用或联系;描述细胞或整体水
10、平的基因表达谱;推测系统发生关系。主要的生物信息中心美国国家生物技术信息中心(NCBI,)欧洲生物信息研究所(EBI,)日本DNA数据库(DDBJ,)GenBank(),四、功能基因组学系统探讨基因的活动规律,功能基因组学:从整体水平上研究一种组织或细胞在同一时间或同一条件下所表达基因的种类、数量、功能及在基因组中的定位,或同一细胞在不同状态下基因表达的差异。主要研究内容包括基因组的表达基因组功能注释基因组表达调控网络及机制,(一)通过全基因组扫描鉴定DNA序列中的基因,对测得的基因组序列进行“注释”,包括鉴定和描述推测的编码序列、非编码序列及其功能。技术支持:人类基因组DNA序列数据库;高性
11、能计算机。改进的十进制计算机进行全基因组扫描,鉴定内含子与外显子之间的衔接,寻找全长ORFs,确定多肽链编码序列。,同源基因:在进化过程来自共同的祖先的基因,通过核苷酸或氨基酸序列的同源性比较,可以推测基因组内相似基因的功能。有效工具:NCBI的序列局部相似性查询(Basic Local Alignment Search,BLAST)程序。操作流程:GenBank中查找基因序列访问号码(accession number),在BLAST界面上输入2条或多条访问号码,就可实现两两或多对序列的比对。,(二)通过BLAST等程序搜索同源基因,(三)通过实验设计验证基因功能,转基因(transgene)
12、基因过表达(over expression)基因敲除(knock-out)基因敲减(knock-down)或基因沉默(gene silencing)合适的模式生物替代人体进行实验,(四)通过转录组和蛋白质组描述基因表达模式,基因表达:RNA的转录和蛋白质的翻译基因的表达模式及调控描述:借助转录组学和蛋白质组学相关技术与方法,第二节 转录组学 Transcriptomics,一、转录组学研究全部RNA的表达及功能,转录组(transcriptome)指生命单元(通常是一种细胞)所能转录出来的所有RNA包括指导蛋白质翻译的mRNA和非编码RNA(non-coding RNA,ncRNA)的总和。R
13、NA功能基因组学,又称RNA组学(RNomics):是分析、鉴定非信使小RNA(small non-messenger RNA,snmRNA)在特定状态下表达差异、功能及其与蛋白质的相互作用。,转录组学(transcriptomics):是在整体水平上研究细胞编码基因转录情况及转录调控规律的科学。转录组的特点:受到内外多种因素的调节,因而是动态可变的。能够揭示不同物种、不同个体、不同细胞、不同发育阶段及不同生理病理状态下的基因差异表达信息。,二、转录组学的核心工作是分析基因表达谱,大规模表达谱或全景式表达谱(global expression profile):是生物体(组织、细胞)在某一状态
14、下基因表达的整体状况。基因功能的研究方法:基因的差异表达方法;基因表达谱芯片(cDNA芯片、EST芯片等)。,(一)采用cDNA芯片可实现大规模已知(序 列)基因表达谱分析,(二)SAGE和MPSS分析可鉴定未知/新基因表达信息,基因表达系列分析(serial analysis of gene expression,SAGE)和大规模平行信号测序系统(massively parallel signature sequencing,MPSS)可实现基因表达谱芯片很难检测某些特定时段表达或表达水平较低的基因或未知基因的表达。,(三)推断未知基因功能,探索生命机制,转录组分析可以提供特定条件下(生理
15、、病理、诱导刺激等)基因表达的信息,通过使用基因碱基序列数据和比较已知及未知功能的基因,推断相应未知基因的功能,揭示特定调节基因的作用机制。,三、芯片、SAGE和MPSS是转录组学研究主要技术,转录组学研究重点:基因转录的区域转录因子结合位点染色质修饰点DNA甲基化位点等研究技术:微阵列(microarray)SAGEMPSS,(一)微阵列是大规模基因组表达谱研究的主要技术,微阵列或基因芯片(DNA chip)原理利用光导化学合成、照相平板印刷以及固相表面化学合成等技术,在固相表面合成成千上万个寡核苷酸探针,并与放射性同位素或荧光物标记的来自不同细胞、组织或整个器官的DNA或mRNA反转录生成
16、的第一链cDNA进行杂交,然后用特殊的检测系统对每个杂交点进行定量分析。优点:可同时对大量基因,甚至整个基因组的基因表达进行对比分析。,微阵列技术的基本步骤,(二)SAGE在转录物水平研究细胞或组织基因表达模式,SAGE的基本原理:用来自cDNA 3端特定位置910 bp长度的序列所含有的足够信息鉴定基因组中的所有基因利用锚定酶(anchoring enzyme,AE)和位标酶(tagging enzyme,TE)切割DNA分子的特定位置(靠近3端),分离SAGE标签,并将这些标签串联起来,然后对其进行测序特点:可全面提供生物体基因表达谱信息可用来定量比较不同状态下组织或细胞的所有差异表达基因
17、,(三)MPSS是以基因测序为基础的基因表达谱分析新技术,MPSS的原理:一个含有能够特异识别转录子的信息标签序列(1020 bp)与长的连续分子连接在一起,测出mRNA的一端包含一个10至20个碱基的标签序列。每一标签序列在样品中的频率(拷贝数)代表了与该标签序列相应的基因表达水平。基因表达水平是以计算mRNA拷贝数为基础,是一个数字表达系统。只要将病理和对照样品分别进行测定,即可进行严格的统计检验,能测定表达水平较低、差异较小的基因,而且不必预先知道基因的序列。,四、RNA组学研究全部非mRNA小RNA的集合,人类基因组序列特点:2万2.5万个基因,与蛋白质合成有关的序列占整个基因组的2%
18、左右,其余98%的基因组序列没有得到注释。RNA组学研究范畴:小分子RNA,包括 snRNA、snoRNA、scRNA、催化性小RNA(small catalytic RNA)、小片段干涉 RNA(small interfering RNA,siRNA)、微小RNA(microRNA,miRNA),第三节,蛋白质组学Proteomics,以细胞、组织或机体在特定时间和空间上表达的所有蛋白质即蛋白质组(proteome)为研究对象,分析细胞内动态变化的蛋白质组成、表达水平与修饰状态,了解蛋白质之间的相互作用与联系,并在整体水平上研究蛋白质调控的活动规律,故又称为全景式蛋白质表达谱(global
19、protein expression profile)分析。,蛋白质组学(proteomics),与蛋白质组研究相关的数据库,蛋白序列数据库(SWISS-PROT/TrEMBL;)基因序列数据库(Genbank,EMBL;)蛋白模式数据库(Prosite;)蛋白质二维凝胶电泳数据库、蛋白三维结构数据库(PDB,;FSSP,)蛋白翻译后修饰数据库(O-GLYCBASE,),一、研究细胞内所有蛋白质组成及其活动规律是蛋白质组学的中心任务,蛋白质组学的研究内容:一是蛋白质组表达模式的研究,即结构蛋白质组学(structural proteomics)二是蛋白质组功能模式的研究,即功能蛋白质组学(fu
20、nctional proteomics),蛋白质组学的主要任务:蛋白质鉴定:可以利用一维电泳和二维电泳并结合生物质谱、Western印迹、蛋白质芯片等技术,对蛋白质进行全面的鉴定研究。翻译后修饰的鉴定:如磷酸化、糖基化、酶原激活等过程。蛋白质功能确定:包括蛋白质定位研究,蛋白质活性,蛋白质相互作用,酶活性和确定酶底物,细胞因子的生物分析,配基-受体结合分析等。,二、二维电泳生物质谱是蛋白质组学研究的常用技术,蛋白质组学研究三大基本支撑技术:二维电泳技术生物质谱技术大规模数据处理,(一)二维电泳是分离蛋白质组的有效方法,二维凝胶电泳(two-dimensional gel electrophor
21、esis,2-DE)原理:等电聚焦(isoelectric focusing,IEF)电泳:利用蛋白质分子的等电点不同使蛋白质得以分离;SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE):按蛋白质分子量的大小进行分离。,蛋白质的二维电泳,(二)生物质谱是蛋白质组鉴定的重要工具,质谱(mass spectroscopy,MS)是蛋白质组学中分析与鉴定肽和蛋白质最重要的手段。主要方法:1用肽质量指纹图谱鉴定蛋白质:蛋白质经过酶解成肽段后,获得所有肽段的分子质量,形成一个特异的肽质量指纹图谱(peptide mass fingerprinting,PMF),通过数据库搜索与比对,便可确定待分析蛋白质分子
22、的性质。,2用串联质谱(MS/MS)鉴定蛋白质:用PMF方法未能鉴定的蛋白质可通过质谱技术获得该蛋白质一段或数段多肽的串连质谱信息(氨基酸序列)并通过数据库检索来鉴定该蛋白质。混合蛋白质酶解后的多肽混合物直接通过(多维)液相色谱分离,然后进入质谱进行分析。,蛋白质的质谱分析(MS谱获得蛋白质的PMF;MS/MS可测定蛋白质的部分氨基酸序列),三、蛋白质相互作用研究是认识蛋白质功能的重要内容,蛋白质-蛋白质相互作用(protein-protein interaction)是维持细胞生命活动的基本方式,主要包括受体与配体的结合、信号转导分子间的相互作用及其机制等。常用的方法有:酵母双杂交(yeas
23、t two-hybrid system)、亲和层析、免疫共沉淀、蛋白质交联和基于绿色荧光蛋白的细胞内蛋白质相互作用研究方法等。,第四节,“组学”在医学中的应用,Omics Application in Medicine,一、疾病基因组学研究疾病相关基因揭示疾病发病机制,疾病基因组学研究的两大任务:疾病基因或疾病相关基因疾病易感性的遗传学基础,(一)定位克隆技术是发现、鉴定疾病基因的重要手段,定位候选克隆(positional candidate cloning):是将疾病相关位点定位于某一染色体区域后,根据该区域的基因、EST或模式生物所对应的同源区的已知基因等有关信息,直接进行基因突变筛查,
24、经过多次重复,可最终确定疾病相关基因。,(二)SNPs是疾病易感性的重要遗传学基础,SNPs 被认为是人类疾病易感性的决定性因素 APOE基因单个碱基变异Alzheimer病 CCR5单个碱基纯缺失突变HIV的抗性 慢乙酰化基因型的吸烟者肝癌 MPO基因启动子(-463GA)低肺癌患病 HER-2 基因编码区的一个SNP 胃癌,二、药物基因组学研究遗传变异对药物效能和毒性的影响,药物基因组学(pharmacogenomics)是功能基因组学与分子药理学的有机结合,它不是以发现人体基因组基因为主要目的,而是运用已知的基因组学知识改善患者的治疗。以药物效应及安全性为目标,研究各种基因突变与药效及安
25、全性的关系,是研究高效、特效药物的重要途径,通过它为患者或者特定人群寻找合适的药物。使药物治疗模式:诊断定向治疗基因定向治疗。,(一)药物基因组学预测药物反应性并指导个体化用药,阐明影响药物吸收、转运、代谢、消除等个体差异的基因特性阐明基因变异所致的不同病人对药物的不同反应性指导合理用药和设计个体化用药,以提高药物作用的有效性、安全性和经济性,(二)基因多态性是药物基因组学的基础和重要研究内容,药物代谢酶多态性:其多态性决定表型多态性和药物代谢酶的活性,并呈显著的基因剂量-效应关系,从而造成不同个体间药物代谢反应的差异,是产生药物毒副反应、降低或丧失药效的主要原因;药物转运蛋白多态性:转运蛋白
26、在药物的吸收、排泄、分布、转运等方面起重要作用,其变异对药物吸收和消除具有重要意义;药物作用靶点多态性:靶蛋白对特定药物产生不同的亲和力,导致药物疗效的不同。,(三)鉴定基因序列的变异是药物基因组学的主要研究策略,主要策略包括选择药物起效、活化、排泄等相关过程的候选基因进行研究,鉴定基因序列的变异。在生物化学与分子生物学水平进行研究,估测它们在药物作用中的意义(SNPs)。在人群中进行研究,用统计学原理分析基因突变与药效的关系。,三、肿瘤基因组解剖工程阐明肿瘤相关基因,基因激活和/或失活及其复杂的相互作用是肿瘤发生的根本原因癌症基因组解剖计划(Cancer Genome Anatomy Pro
27、ject,CGAP;又称肿瘤cDNA工程):拟逐步建立人类肿瘤细胞表达基因索引发展快速分析肿瘤细胞的技术获知与肿瘤相关的基因、蛋白质及其他生物标记物建立肿瘤研究信息(数据与分析工具)、资源(克隆和文库)及技术和方法学平台,(一)CGAP提供了解码肿瘤相关基因所需的信息和技术工具,CGAP包括5个部分:人类肿瘤基因索引(hTGI)指明了在人类肿瘤发生过程中的基因表达;分子表达谱(MP)展示了以前列腺为例从分子水平分析人类组织样品的概念;癌症染色体变异计划(CCAP)描述了与恶性转移相关的染色体改变;遗传注解索引(GAI)指明和描绘了与癌症相关的多态性;小鼠肿瘤基因索引(mTGI)确定了在小鼠肿瘤
28、发生过程中的基因表达()。,(二)CGAP的目标是建立肿瘤细胞基因表达数据库和完整的基因及其变异目录,CGAP 的第一个目标是建立各种不同类型肿瘤的正常、癌前病变、癌细胞基因表达数据库,为肿瘤研究者描绘出完整的肿瘤细胞分子特征。()CGAP的另一目标是建立一套完整的基因及其变异目录,不仅有利于评价癌症的危险程度,而且可以根据遗传变化确定预防或治疗策略,最终根据分子特征达到治疗的目的。,(三)癌症染色体畸变计划是CGAP的另一个任务,染色体畸变包括结构变异和数目变异等鉴定染色体畸变有利于对肿瘤进行诊断、分类和选择性治疗可以与某种肿瘤进行连锁或关联分析,进而定位克隆肿瘤相关基因染色体畸变人基因组B
29、AC 克隆库(),代谢组学(metabonomics)测定一个生物/细胞中所有小分子(Mr1 000)组成,描绘其动态变化规律,建立系统代谢图谱,并确定这些变化与生物过程的联系。,四、代谢组学研究内源性代谢物质的动态变化规律及与生物过程的联系,代谢组学分为4个层次:代谢物靶标分析(metabolite target analysis)代谢谱分析(metabolic profiling analysis)代谢组学代谢指纹分析(metabolic fingerprinting analysis)代谢组学研究对象:生物体液血样、尿样等完整的组织样品、组织提取液和细胞培养液,(一)代谢组学的任务是分析
30、生物/细胞代谢产物的全貌,主要的分析工具核磁共振(nuclear magnetic resonance,NMR):氢谱(1H-NMR)、碳谱(13C-NMR)及磷谱(31P-NMR)。MS:MS按质荷比(m/z)进行各种代谢物的定性或定量分析,可得到相应的代谢产物谱。色谱及联用技术:使样品的分离、定性、定量一次完成,具有较高的灵敏度和选择性。,(二)核磁共振、色谱及MS是代谢组学的主要分析工具,代谢组学研究侧重于代谢物的组成、特性与变化规律,与生理学的联系更加紧密。疾病机体病理生理过程变化代谢产物的改变比较分析与正常人的代谢产物差异发现和筛选出疾病新的生物标记物对相关疾病作出早期预警发展新的有
31、效的疾病诊断方法。药物代谢组学的研究,可阐明药物在不同个体体内的代谢途径及其规律,将为合理用药和个体化医疗提供重要依据。,(三)代谢组学是开展预测医学和个体化医学的重要手段,小 结,生物遗传信息传递具有方向性和整体性的特点。“组学”从整合的角度检视遗传信息的整体性,以解释生命科学的根本问题。基因组学是阐明整个基因组结构、结构与功能的关系以及基因之间相互作用的科学。包括结构基因组学、功能基因组学和比较基因组学。转录组学在整体水平上研究细胞编码基因转录情况及转录调控规律,研究对象即细胞所能转录出来的可直接参与蛋白质翻译的mRNA总和。,蛋白质组学以细胞、组织或机体在特定时间和空间上表达的所有蛋白质为研究对象,分析细胞内动态变化的蛋白质组成、表达水平与修饰状态,揭示蛋白质之间的相互作用及其调控规律。药物基因组学以药物效应及安全性为目标,研究各种基因突变与药效及安全性的关系,药物基因组使药物治疗模式由诊断定向治疗转为基因定向治疗。癌症基因组解剖计划将建立人类肿瘤细胞表达基因索引,为肿瘤的诊断、治疗带来新的希望。代谢组学研究内源性代谢物质的组成、动态变化规律以及与生物过程的联系,代谢组学是基因组学和蛋白质组学的有力补充。,