生物信息学分析课件.pptx

上传人:牧羊曲112 文档编号:1785134 上传时间:2022-12-18 格式:PPTX 页数:58 大小:4.51MB
返回 下载 相关 举报
生物信息学分析课件.pptx_第1页
第1页 / 共58页
生物信息学分析课件.pptx_第2页
第2页 / 共58页
生物信息学分析课件.pptx_第3页
第3页 / 共58页
生物信息学分析课件.pptx_第4页
第4页 / 共58页
生物信息学分析课件.pptx_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《生物信息学分析课件.pptx》由会员分享,可在线阅读,更多相关《生物信息学分析课件.pptx(58页珍藏版)》请在三一办公上搜索。

1、生物信息学Bioinformatics 孙丽丹 2021.11.27,一、引言 二、生物信息学及其发展历史 三、生物信息学基础四、生物信息学主要研究内容 五、生物信息学当前的主要任务,内容,引言,引言,曼哈顿原子弹计划,阿波罗登月计划,人类基因组计划,人类自然科学史上的 大计划,3,引言,基因组计划带来的科学挑战,随着实验数据和可利用信息急剧增加,信息的管理和分析成为基因组计划的一项重要的工作1、信息的整合2、信息的储存3、信息的比较4、信息的分析5、信息的分解,基因组学,功能基因组学,引言,这些过程都需要生物信息学的帮助!,引言,人类基因组计划带来了?,生物信息学,生物信息学的应用医学,引言

2、,新药物设计基因芯片疾病快速诊断流行病学研究:SARS人类基因组计划寄生虫基因组计划,病人健康人,基因芯片诊断,及早治疗,对症下药,引言,此外,生物信息学和人类基因组计划为药物靶标的发现和新药的研制开创了新天地,未来的药物设计将是基于生物信息学的知识挖掘的过程。,通过数据分析首先确立靶标分子,预测蛋白质分子结构,设计药物分子与靶标分子相互作用,生物信息学及其发展历史,生物信息学(Bioinformatics)这一名词的来由,八十年代末期,马来西亚的美籍学者林华安(Hwa A. Lim)认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称“CompBio”;“bi

3、oinformatique”;“bio-informatics(或bio/informatics)” “bioinformatics”,生物信息学?新兴的交叉学科,Mathematical sciences,Computer sciences,Life sciences,So,生物信息学是一门交叉学科,它包含了生物信息的获取、处理、存储、分发、分析和解释等在内的所有方面,它综合运用数学、计算机科学和生物学的各种工具,来阐明和理解大量数据所包含的生物学意义。 (美国人类基因组计划第一个五年总结报告,1995) 采用信息科学技术,借助数学、生物学的理论、方法,对 各种生物信息的收集、加工、储存、分

4、析、解释的一门学 科。收集、加工、储存:计算机科学家分析、解释:生物学家,生物信息学,生物信息学基本思想的产生,生物信息学 的迅速发展,二十世纪50年代,二十世纪80-90年代,生物科学和技术的发展,人类基因组计划的推动,生物信息学的发展历史,20世纪50年代:生物信息学开始孕育20世纪60年代:生物分子信息在概念上将计算生物学和 计算机科学联系起来20世纪70年代:生物信息学的真正开端(序列比对算法)20世纪80年代初期:生物信息分析方法的发展20世纪80年代以后:生物信息服务机构和数据库20世纪90年代后:HGP促进生物信息学的迅速发展,生物信息学的发展历史,生物信息学基础,生物学基础,生

5、物学背景: 分子生物学 细胞生物学 发育生物学 生物化学,分子生物学:核酸的结构、蛋白质的结构、DNA的复制、基因的转录、蛋白质的生物合成,计算机基础,数据库技术:关系数据库网络基础:基于web的数据库系统操作系统:windows, Unix, Linux计算机编程语言:JAVA, Perl/Python, PHP+MySQL, ,数学基础,算法图论动态规划贝叶斯统计马尔可夫模型隐马尔可夫模型神经网络模型遗传算法聚类分析支持向量机,生物信息学主要研究内容,生物信息学主要研究内容,1、生物分子数据的收集与管理2、数据库搜索及序列比较 3、基因组序列分析 4、基因表达数据的分析与处理 5、生物大分

6、子结构预测,通过本门课程的学习,我们将能够:学会搜索各种生物信息学资源;能够利用各种工具搜索核酸蛋白质数据库;能够对未知基因及其产物进行初步的生物信息学分析;能够利用数据库进行序列的拼接和电子克隆;能够进行系统发育树的构建和分析;能够掌握基因组和蛋白质组分析的基础;了解生物信息学的一般概念和基本算法;初步设计本地化的的生物信息学分析软件,学习目标:,引言,生物信息的收集与管理,生物信息学主要研究的信息载体DNA/RNA分子蛋白质分子,DNA核酸序列,蛋白质氨基酸序列,蛋白质结构,蛋白质功能,最基本的生物信息,维持生命活动的机器,第一部遗传密码,第二部遗传密码?,生命体系千姿百态的变化,生物分子

7、数据及其关系,蛋白质结构决定功能,生物分子信息的特征,生物分子信息数据量大 生物分子信息复杂 生物分子信息之间存在着密切的联系,生物信息学数据库资源,模式生物测序3大核酸数据库蛋白质数据库,生物信息学数据库资源,模式生物测序,模式生物基因组计划,模式生物基因组计划 酵母、线虫、果蝇、细菌、拟南芥等共约50多种已完成,70余种正在进行。目前总量已达60亿碱基对!,生物信息学数据库资源,三大核酸数据库,三大基因数据库,GenbankGenbank库包含了所有已知的核酸序列和蛋白质序列,以及与它们相关的文献著作和生物学注释。它是由美国国立生物技术信息中心(NCBI)建立和维护的。NCBI的网址是:

8、。EMBL核酸序列数据库由欧洲生物信息学研究所(EBI)维护的核酸序列数据构成,查询检索可以通过因特网上的序列提取系统(SRS)服务完成。数据库网址是:http:/www.ebi.ac.uk/embl/。DDBJ数据库日本DNA数据仓库(DDBJ)也是一个全面的核酸序列数据库,与Genbank和EMBL核酸库合作交换数据。使用其主页上提供的SRS工具进行数据检索和序列分析。DDBJ的网址是: 。,三大基因数据库之间的关系,生物信息学数据库资源,蛋白质数据库,蛋白质序列数据库,PIRPIR是一个全面的蛋白质序列数据库,它是由美国生物医学基金会NBRF、日本的国际蛋白质信息数据库JIPID和德国的

9、慕尼黑蛋白质序列信息中心MIPS合作建立和维护的。PIR的网址是: 。SwissProt该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所和欧洲生物信息学研究所EBI共同维护和管理。数据库网址是: 。,蛋白质结构数据库,PDBPDB是目前最主要的蛋白质分子结构数据库,目前由美国RCSB管理;以文本格式存放数据,包括原子坐标、物种来源、测定方法、提交者信息、一级结构、二级结构等。PDB的网址是: 。,基因组数据库,蛋白质序列数据库,蛋白质结构数据库,DDBJ,EMBL,GenBank,PIR,PDB,SWISS-PROT,生物分子数据的存储与获取,数据库!搜索!,基因组序列分析

10、,什么是序列分析?拿到一个基因/蛋白质序列,我能做什么?,在数据库中进行序列相似性搜索序列组成/分子量/等电点-初级分析酶切位点分析(载体构建)基因结构分析/启动子序列分析Motif的寻找与序列的模式识别(含跨膜区的预测等)亚细胞定位功能域(domain)预测,序列分析的内容 -为了功能的分析,序列比对,序列比对两个序列的比对是指这两个序列中各个字符的一种一一对应关系,或字符的对比排列。分类:双比对,全局比对,局部比对,多序列比对。AAGCTTAACGTAATCTTAACGT,序列比对,序列比对两个序列的比对是指这两个序列中各个字符的一种一一对应关系,或字符的对比排列。分类:双比对,全局比对,

11、局部比对,多序列比对。AAGCTTAACGTAATCTTAACGT,几个重要的概念:相似性,一致性,同源性,序列的相似性,相似性(similarity)是指一种很直接的数量关系。比如说,A序列和B序列的相似性是80,或者4/5。这是个量化的关系。一致性(identity):两个蛋白质有一定数量的氨基酸在排比的位点上是相同的,即如果38个氨基酸的蛋白质中15个位点相同,我们说它们一致性为39.4%.MSDTPSTGFSIIHPTSSEGQVPPPRHLSLTHPVVAKRISFYKSG-PRNGTIKIYENPARTFTRPYSAKNITIYKEND,所以, 相似性的数值一定比一致性的要( )大

12、 or 相等 or 小,同源性(homology): 指从一些数据中推断出的两个基因或蛋白质序列具有共同祖先的结论,属于质的判断。 就是说A和B的关系上,只有是同源序列,或者非同源序列两种关系。而说A和B的同源性为80都是不科学的。,生物序列的同源性,相似性和同源性关系,一般来说,序列间的相似性越高的话,它们是同源序列的可能性就更高。注意不要等价混用这两个名词。A序列和B序列的同源性为80,记住这种说法是错误的!,主要的blast程序,Blastn1的作用:对于已知的基因,可以分析其相似基因;对于未知的基因片段,可以分析其属于什么基因。Blastn2的作用:对于新基因,可以了解基因的结构特征,

13、 5-UTR和3-UTR 的大小. Blastp的作用:对于已知的蛋白,可以分析其相似蛋白;对于未知的蛋白片段,可以分析其属于什么蛋白。Blastx:分析你的基因编码什么产物?分析你的基因是否是新基因?tBLASTn的作用:已知一种蛋白序列,在另一物种中进行其同源蛋白基因的电子克隆(in silico cloning);寻找一个新的蛋白质序列(如双向电泳得到的)是否已有核酸序列,是否可以克隆。,基因表达数据分析与处理,基因芯片,应用:测序、表达谱分析、基因表达差异分析,生物信息学和基因芯片,生物信息学,基因芯片,促进,丰富,提取什么信息如何提取信息如何处理和利用信息,确定芯片检测目标芯片设计数

14、据管理与分析,生物信息学在基因芯片中的应用,提取什么信息如何提取信息如何处理和利用信息,确定芯片检测目标芯片设计数据管理与分析,生物大分子结构预测,蛋白质结构预测,蛋白质的生物功能由蛋白质的结构所决定,蛋白质结构预测成为了解蛋白质功能的重要途径蛋白质结构预测分为:二级结构预测空间结构预测,蛋白质折叠,复杂结构分析:X射线晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法,Difficult!Expensive!Too Much Time!,纵观当今生物信息学界的现状,大部分人都把注意力集中在:基因组蛋白质组药物设计(蛋白质结构),生物信息学当前的主要任务,生物信息学研究意义,生物信息学将是21世纪生物学的核心,认识生物本质了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系改变生物学的研究方式 改变传统研究方式,引进现代信息学方法在医学上的重要意义为疾病的诊断和治疗提供依据为设计新药提供依据,Thank You!,感谢您的阅读!为了便于学习和使用,本文档下载后内容可随意修改调整及打印。,学习永远不晚。 JinTai College,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号