《兰州大学生物信息学基因芯.ppt》由会员分享,可在线阅读,更多相关《兰州大学生物信息学基因芯.ppt(81页珍藏版)》请在三一办公上搜索。
1、第七章.基因芯片,按物理学家的观点是应将存在于人类基因组上的静的基因图谱,向时间、空间维上展开。为了得到基因表达的功能谱,国际上在核酸和蛋白质两个层次上都发展了新技术。这就是在核酸层次上的 DNA 芯片技术和在蛋白质层次上的大规模蛋白质分离和序列鉴定技术,也称蛋白质谱技术和蛋白质组研究。,第一节.基因芯片的概念,生物芯片技术,生物芯片:指能储藏大量生物信息或快速并行处理多个生物样品的微器件,它的加工运用了微电子工业中十分成熟的光学光刻技术和微机电系统加工中所采用的各种方法,所处理的对象是生物样品,故称之为生物芯片。,生物芯片,亲和力生物芯片,微阵列结构生物芯片,DNA芯片,蛋白芯片,组织芯片,
2、它们的应用原理都是基于生物分子之间的亲和作用力,如抗原和抗体的免疫结合,核酸分子的碱基配对作用等。,它们处理或分离的对象包括实验初期的生物样品到实验结束时的反应产物。,毛细管电泳芯片,PCR反应芯片,介电电泳分离芯片,DNA芯片,cDNA芯片:通过PCR方法制备探针,然后用芯片点样仪把探针点在芯片基质载体上。不要求知道DNA序列。,寡核苷酸芯片:通过在芯片上原位合成;或者先合成寡核苷酸探针,再用芯片点样仪把探针点在芯片载体上。要求DNA的序列已知。特异性好。,有评论(Schena,M.et al.1998)认为DNA芯片技术可以和DNA重组技术及PCR技术相媲美,极大地促进了生物技术,特别是功
3、能基因组研究的进步。目前,DNA芯片技术主要应用于基因的表达分析。它的优势在于只需要少量的生物样品就可以并行分析成千上万个基因的表达情况。,DNA芯片技术的优势,基因芯片研究和应用中所涉及到的生物信息学问题,提取什么信息如何提取信息如何处理和利用信息,确定芯片检测目标芯片设计数据管理与分析,探针设计解决杂交条件一致性问题,芯片优化提高芯片制备效率,公共 数据库,专用 数据库,确定目标选择待检测的目标序列,数据分析分析杂交检测结果及可靠性,基因芯片 数据库,图像处理,数 据 库 查 询 序 列 分 析,生 物 信 息 学 数 据 挖 掘 数 据 可 视 化,杂交检测图像,基因芯片数据流图,第二节
4、.基因芯片(microarray)的原理,电子技术与生物技术的结合基因组研究中最实用的部分之一Affymetrix公司:1.6cm2 40万位点 每点1000万条探针,核酸体外杂交技术,基因芯片原理,基因芯片分析所用到的算法,聚类分类关联分析时间序列分析异常检测可视化,基于芯片的序列分析,、测定未知序列 早期基于芯片杂交的序列分析实验中,芯片上的探针是长度为k(一般为8)的所有寡核苷酸的组合。这是一种完备的探针集合,根据互补关系,通过各个探针的杂交结果确定DNA靶序列中存在的所有k长度片段,形成靶序列的k长度片段谱,然后根据这些片段重构靶序列。,、直接检测目标序列,在同一块芯片上设计多组探针,
5、每一组探针分别检测一条目标序列,探针的长度在20到30之间。一般要求同一组探针之间相互独立,尽可能不重叠或少重叠,以提高探针的敏感性和特异性。,、DNA序列突变检测分析,有两种方法可以进行已知突变点的分析:一种方法是对于目标序列上已知的突变点,以该点为中心,从目标序列选取一个片段,作为设计探针的参考序列。根据参考序列,分别设计四个高度特异的探针,这四个探针除中心位置外均相同并与参考序列互补 另一种方法是对于目标序列上未知的突变点,设计多组探针,其中每一组探针分别检测一种核苷酸替换。同一组中的各个探针长度相同,相互之间交叠,并且每个探针均覆盖对应的突变点。,、基因型和多态性分析,在同一物种不同种
6、群和个体之间,有着多种不同的基因型,这往往与个体的不同性状和多种遗传性疾病有着密切的关系。通过对大量具有不同性状的个体的基因型进行比较,就可以得出基因与性状的关系。为了进行SNPs研究,发现目标序列上可能出现的变化,最直接的方法就是根据已知的目标序列设计一系列寡核苷酸探针,其中每一个探针用于检测目标序列特定位置上的核苷酸是否发生变化,探察位置位于探针的中心。这种方法又称等长等覆盖移位法,第二种方法为单核苷酸分析法。针对目标序列每个位置上所有可能出现的变化设计相应的探针。,基于芯片的基因功能分析,、基因表达分析基因表达是根据基因的DNA模板进行mRNA和蛋白质合成的过程,各种基因的表达存在差异,
7、一种组织中基因表达水平的差异可达1万倍。功能基因研究的一种重要的方法就是采用高通量基因表达检测技术,全面分析基因的表达水平,了解基因的功能。,22,将成千上万个我们克隆到的特异性靶基因固定在一块芯片上,对来源于不同情况细胞的mRNA或逆转录所得的cDNA进行检测,从而对这些基因表达的个体特异性、组织特异性、发育阶段特异性、分化阶段特异性等进行综合评定与判断。,2、基因表达图谱,基于芯片的表达监控实验产生大量的数据,在这些数据背后隐藏着丰富的基因相互作用、基因功能信息,需要通过细致的数据分析揭示这些信息,得到有益的结果,如差异表达分析和聚类分析.这种根据基因芯片获得的新的表达图谱有别于以前的物理
8、图和功能图,它能够更为直接地揭示基因组中各基因相互关系。,3、寻找基因功能,DeRisi等应用酵母cDNA基因芯片研究在有丝分裂和孢子状态下基因转录和表达水平的差异。Affymetrix公司制备的酵母基因表达型芯片,包括酵母基因组开放读码框中的260 000个25mer探针阵列。Wodicka 等采用这种基因芯片对不同生活状态下酵母细胞的基因表达进行了研究。,第三节 基因芯片设计,、基因芯片设计的一般性原则基因芯片设计主要包括两个方面:(1)探针的设计指如何选择芯片上的探针(2)探针在芯片上的布局指如何将探针排布在芯片上。,确定芯片所要检测的目标对象查询生物分子数据库取得相应的DNA序列数据
9、序列对比分析找出特征序列,作为芯片设计的参照序列。数据库搜索得到关于序列突变的信息及其它信息。,在进行探针设计和布局时必须考虑以下几个方面:(1)互补性(2)敏感性和特异性(3)容错性(4)可靠性(5)可控性(6)可读性,、DNA变异检测型芯片与基因表达型芯片的设计,对于DNA序列变异分析,最基本的要求是能够检测出发生变异的位置,进一步的要求是能够发现发生了什么样的变化。从杂交的单碱基错配辨别能力来看,当错配出现在探针中心时,辨别能力强,而当错配出现在探针两端时,辨别能力非常弱。所以,在设计检测DNA序列变异的探针时,检测变化点应该对应于探针的中心,以得到最大的分辨率,、cDNA芯片与寡核苷酸
10、芯片的设计,cDNA芯片设计的关键在于数据库的建立和数据库信息的利用以及各种文库的建立。cDNA芯片制备方法一般采用点样法,多用于基因表达的监控和分析。寡核苷酸芯片制备一般采用在片合成方法。优化是寡核苷酸芯片设计的一个重要环节,包括探针的优化和整个芯片设计结果的优化。,、寡核苷酸探针的优化设计,第四节.基因芯片流程,1.实验设计2.样品制备(指mRNA或总RNA样品,包括对照组和实验组)3.芯片制备(包括PCR,纯化,点样等步骤)4.芯片杂交(将mRNA或总RNA分别进行逆转录生成cDNA,在此步骤中将对照组和实验组cDNA分别标记CY3和CY5荧光信号)5.芯片扫描(采用激光扫描仪,分别用5
11、32nm和635nm波长激光扫描芯片,对于每张芯片,得到CY3和CY5通道两幅图象),6.图象处理(采用专门软件,对图象进行分析,提取每个点上的数字信号),得到原始数据表。7.数据校正和筛选(对cy5或cy3信号进行校正,消除实验或扫描等各环节因素对数据的影响,同时利用筛选规则对数据中的“坏点”,“小点”,“低信号点”进行筛选,并作标记。)8.差异表达基因的确定(采用ratio值对差异基因进行判断,或采用统计方法如线性回归、主成分分析、调整P值算法等对差异基因进行统计推断)9.生物信息学分析(如cluster 算法、差异基因的同源性比对,差异基因的相关文献检索等).,DNA芯片技术过程示意图,
12、Pseudo image,Pseudo image,Normalization and data analysis,传统的Northern blot方法来验证酵母细胞受热激后,HSP26与HSP12两个基因表达发生的变化。1与3是25培养细胞的RNA样,2与4是40培养细胞的RNA样。,a:40培养的酵母细胞芯片扫描图,b:25培养的酵母细胞芯片扫描图,,基因芯片的制作,基因芯片的制作方式,原位合成,直接点样,光引导原位合成,分子印章法,分子印章法,针式点样,喷墨点样,1 针式点样1、玻璃片基的处理:使玻璃表面获得羟基、醛基、氨基等活性基团。2、点样针沾取探针溶液。3、点样针把探针点到玻片表面
13、,让探针末端的化学集团与玻片表面的集团形成共价键。针式点样的优缺点优点:成本低,操作简单,密度高(几千-几十万点/cm2),转移过程中探针溶液损失小。缺点:定量准确性、重现性不好,2202芯片点样仪生产商 Bio-Rad性能介绍 分辨率:1.25um(x,y轴)和0.25um(Z轴),重复性:3um 球面精确性:l0um。一次制成芯片数:126块芯片 每块玻片点样量82,000个点,2 喷墨点样喷墨点样的方式类似于喷墨打印机。将合成用探针溶液放入打印墨盒内,由电脑依据预定的程序在xyz方向自动控制打印喷头在芯片支持物上移动,并根据芯片不同位点探针序列需要将特定的探针试剂(不足纳升)喷印到特定位
14、点。喷印上去的试剂即以固相合成原理与该处支持物发生偶联反应。,GENERAL SCANNING-ScanArray System,中国科学家对基因芯片发展的贡献 东南大学吴健雄实验室的陆祖宏教授创造了分子印章点样技术,并取得专利。至今已取得芯片制作、芯片检验方面的专利35项。,第五节.芯片的假阳性问题,芯片的假阳性率一般用self-to-self实验来确定,就是同一份RNA样品分为2份,一份标记cy5,一份标记cy3,然后和芯片进行杂交,看最后得到多少表达有差异的基因。我们把同一批培养的Hela细胞抽提得到的RNA分为2等份,进行self-to-self比较;也把293细胞的RNA分为2等份,
15、进行self-to-self比较,结果如下:,Hela+Hela,293+293,在人的22000个基因的芯片上,Hela细胞RNA的self-to-self实验,最终得到41个假阳性的基因,假阳性的点,有一部分是芯片上的杂质点造成的,可以通过软件分析来消除,但大部分是不能区分的。,Hela 细胞RNA的self-to-self杂交结果,293+293,在人的22000个基因的芯片上,293细胞RNA的self-to-self实验,最终得到39个假阳性的基因,293细胞RNA的self-to-self杂交结果,但把Hela与293的self-to-self的实验各进行两次实验(荧光交换),取两
16、次实验变化趋势都一致的基因,这时就只有43个假阳性 的基因。,芯片的假阳性的消除,结论:对于一对样品,若要真实了解其中差异表达的基因,建议至少做两张芯片,进行荧光交换。而对一种现象,例如药物对细胞的影响,还要进行生物材料上的重复实验。对于研究肿瘤样品中与正常人的差异表达基因,可以选择多个肿瘤样品,每个样品与正常样品比较,只作一张芯片,而后寻找在多个肿瘤样品中共同变化的基因。,芯片实验的重复次数,定量RT-PCR方法的验证,基因芯片的巨大优势在于它的高通量。由于生物学反应过程中,例如酶学反应、RNA抽提等过程有一些不能完全为人控制的因素存在,因此不能对基因芯片的精确性要求太高。目前国际上也一直认
17、为基因芯片技术是一种半定量的方法。要得到一个重要的生物学结论,往往需要几次的重复。特别是一些本来差异就比较小的样品,例如做了一张含22000个基因的芯片,得到60个差异表达的基因,那么这60个基因中,可能有3040个是假阳性的。捕获这种细微的差异往往需要较多的重复,包括来自生物样品的重复。,第六节.芯片技术的定量性,而对于差异比较大的样品,例如肿瘤和正常样品的比较,可能有上千个基因表达发生了变化,那么在一张芯片的结果中,假阳性的比率会降低,后面的幻灯片比较了Hela与293细胞中基因表达的差异。,Hela293第一次实验得到2330 个变化的基因,Hela+293 A,Hela293第一次实验
18、得到2326 个变化的基因,Hela+293 B,Hela293第一次实验(荧光交换,2张芯片),Hela293第二次实验(荧光交换,2张芯片),变化1.5倍的基因共2326,变化1.5倍的基因共2330,变化一致的基因共1873,占80.5,两次实验的相关性分析,Hela293第一次实验Hela-cy3绿色,293-cy5红色,Hela293第二次实验Hela-cy5 红色,293-cy3 绿色,可以发现在第一次实验中变化为红色的点,在第二次实验中变化为绿色,这样的基因表示是真正变化的基因。,60,第七节.基因芯片的发展方向与应用,1.减小实验误差,提高精确度2.基因芯片的数据处理 3.降低
19、成本 4.基因芯片技术的国产化5.基因芯片与其他类型芯片的有机结合6.资源共享,DNA芯片作为一个技术平台,可以广泛应用于生命科学的多个领域。,DNA芯片的应用领域,DNA芯片平台(基因表达检测),进入平台的生物样品,正常组织,病变组织,待测化合物,得到的结果,疾病预测,疾病诊断,病理研究,药物靶标的确定,药物疗效研究,药物毒性研究,DNA芯片技术应用的例子1,Chen,C.D.,et al.,Molecular determinants of resistance to antiandrogen therapy.Nature Med.,2004,10:33-39.前列腺癌的治疗常用雄性激素受
20、体(AR,androgen-receptor)的拮抗剂来降低血液中睾丸激素,此方法可以有效地抑制癌组织的生长,但容易导致癌组织对雄性激素受体拮抗剂治疗的抗性,此抗性如何产生的,有很多模型来解释。Charles Sawyers等人用含有12,000个基因的DNA microarray分析了7对对雄性激素受体拮抗剂敏感和抗性的样品,发现只有 AR基因在7对样品中高表达。然后通过transgenic overexpression of AR 和 RNA interference等方法进一步证实:Their findings indicate that this AR overexpression a
21、lone is sufficient for this switch.。同时解释了为什么这样。,用于肿瘤抗药性产生的机理研究:,DNA芯片技术应用的例子2,Chiang,M.K.and Melton,M.D.A.,single-cell transcript analysis of pancreas development.Dev.Cell,2003,4:383-393Chiang and Melton用DNA microarray技术建立了胰腺细胞发育过程的模型。生物样品来自an E10.5 mouse pancreatic epithelium.DNA microarray技术中用到了 P
22、CR-based cDNA amplification扩增技术,与含有95个来自胰腺组织基因的定制芯片进行杂交。通过基本表达分析,发现这些形态上不能区分的胰腺表皮细胞实际可以分为3种亚型,它们分化最终细胞类型不一样。,用于细胞的发育研究:,DNA芯片技术应用的例子3,用于药物治疗疗效研究:,Cheok,M.H.et al.,Treatment-specific changes in gene expression discriminate in vivo drug response in human leukemia cells.Nature Genet.,2003,34:85-90.急性淋巴
23、细胞白血病(acute lymphoblastic leukaemia,ALL)病人接受不同的药物组合治疗:mercaptopurine alone,high-dose methotrexate alone,mercaptopurine+high-dose methotrexate,mercaptopurine+low-dose methotrexate四种不同的组合。用含有9600个基因的DNA microarray来研究不同药物处理后的基因表达。The authors identified 124 genes that discriminated between the four trea
24、tments.These findings indicate that gene expression responses are treatment specific,and that combinations do not simply elicit the additive effects of single agents.,DNA芯片技术应用的例子4,用于研究中草药成分的作用机理:,Iizuka,N.,et al.,Identification of common or distinct genes related to antitumor activities of a medica
25、l herb and its major component by oligonucleotide microarray.Int.J.Cancer,2003,107,666-672.用草本植物黄连的初提取物和其中经过纯化的小檗碱来处理肿瘤细胞。使用了含有11,000个基因的DNA microarray。The authors identified common and distinct genes responsible for anti-proliferative activities of purified berberine and C.rhizoma.,利用人22K Oligo芯片(7
26、0 个碱基长度)比较研究两种不同癌症组织中基因表达差异。,利用大鼠5.7K的 Oligo芯片(70个碱基长度)比较药物作用大鼠后的基因表达差异。,水稻14K的cDNA芯片,利用小鼠17K的Oligo芯片(70个碱基长度)比较药物作用小鼠后的基因表达差异。,用酵母6K的cDNA芯片来筛选抗真菌药物,拟南芥27K的Oligo芯片(70个碱基长度),包含有117个与人细胞周期相关的分类芯片,包含有213个与人神经生物学相关的分类芯片,包含有900个与人细胞信号传导有关的分类芯片,海南热带植物研究所定制的香蕉cDNA芯片。,重庆第三军医大定制的线粒体Oligo基因芯片,北大生物系定制的棉花cDNA芯片
27、,中国农大定制的猪cDNA芯片,基因芯片分析软件,AFFYMETRIX公司 Geni Chip Data Mining Tool(DMT)Applied Biosystems BioMergeBioDiscovery公司GeneSightBioDiscovery 的GeneSightHitachi Genetic Slystem的 CHIPSpace、DNASIS、DNASpaceBioDiscovery公司 GeneSight,Stanford大学 Cluster&TreeViewInformax公司的GenoMax挪威Bergen大学 J-expressAxon Instruments Inc.GenePix ProSilicon Genetics公司GeneSpringImaging Research公司ArrayStatApplied Maths公司GeneMathsMedia Cybernetics公司Array-Pro Analyzer,The end,