第一课生物信息学概论课件.ppt

上传人:牧羊曲112 文档编号:1525838 上传时间:2022-12-03 格式:PPT 页数:52 大小:2.76MB
返回 下载 相关 举报
第一课生物信息学概论课件.ppt_第1页
第1页 / 共52页
第一课生物信息学概论课件.ppt_第2页
第2页 / 共52页
第一课生物信息学概论课件.ppt_第3页
第3页 / 共52页
第一课生物信息学概论课件.ppt_第4页
第4页 / 共52页
第一课生物信息学概论课件.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《第一课生物信息学概论课件.ppt》由会员分享,可在线阅读,更多相关《第一课生物信息学概论课件.ppt(52页珍藏版)》请在三一办公上搜索。

1、生 物 信 息 学 概 论Introduction to Bioinformatics,程钢生命科学学院中南民族大学,一、生物信息学发展的背景二、生物信息学概念及其研究内容和特点三、生物信息学的发展现状四、生物信息学课程的特点,一、生物信息学发展的背景,(1)基因组测序计划 海量DNA序列数据,DNA序列是生命的真谛,这个世界上发生的一切事情都与这一序列息息相关。(唯DNA论)人类基因组计划(HGP)1990年启动目标:测定人类基因组的全部DNA序 列, 了解基因及其功能国际大合作:美国、英国、日本、 法国、德国、中国投入:30亿美元结果:2003年完成精细图,产生28亿多个数据(碱基),AG

2、CATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGAC

3、GATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGC

4、AGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGAC

5、CTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCAT

6、GACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATG

7、ACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATG

8、ACGATGCATGACCTAGCAGCATCGAAGTTGCATA,A C G T,相当于2800多本每本1000页每页1000字的“天书”,基因组测序计划 海量DNA序列数据(续),模式生物基因组计划模式生物:小鼠、线虫、拟南芥、果蝇、水稻、酵母、 古细菌、真细菌、病毒 地球生物圈约有140万余种物种, 其中2以上至少有一段DNA序 列被测定。 真核生物 12500 种 哺乳动物 4200 种 真 细 菌 3600 种 古 细 菌 180 种 病 毒 1750 种,DNA序列数据增长趋势,功能基因组研究 功能相关海量数据,转录组EST (Expressed Sequence Tag)DNA

9、 Microarray large scale gene expression analysis蛋白质组2D Gel Electrophoresis protein expression analysisMass Spectrometry protein sequencingYeast Two-Hybrid (Y2H) System protein interaction analysis结构基因组X-ray CrystallographyNMR (Nuclear Magnetic Resonance) Spectroscopy,The Yeast cDNA Microarray Pictur

10、e,基因表达谱数据增长趋势,The number of entries in SwissProt 140,000 now!,蛋白质序列数据增长情况,Tertiary Structure of a Protein,蛋白质结构数据增长情况,各种分子生物学数据库及其增长情况,生物数据爆炸性增长:得到的结论是:生物数据量的积累已达到人类有史以来所记录的文字的数百倍,而且还将以越来越快的速度增长。,16,(2)更为本质的原因是生物学数据的复杂性急待生物信息学的分析方法。,多基因病中致病基因彼此关系和致病性分析。蛋白三维结构和基于结构预测的蛋白之间或者蛋白与药物分子的相互作用和蛋白亚细胞定位。,17,生物

11、信息学是今后所有从事现代生物学(医药学)研究所必需的工具和相关工作人员需要具备的基本技能。,二、生物信息学概念及其研究内容和特点,生物数据爆炸性增长所带来的挑战,AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGAT

12、GCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACG

13、ATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAA,A C G T,海量数据的存储、管理、共享数据 知识,如何将这些数据变为生物学知识?,20,生物信息学基本概念,早在1956年,在美国田纳西州盖特林堡召开的首次“生物学中的信息理论研讨会”上,便产生了生物信息学的概念。1987年,林华安博士正式把这一学科命名为“生物信息学”(Bioinformatics)。被尊称为“生物信息学之父”。生物信息学(Bioinformatics):(1)生物信息学包含了生物信息的获

14、取、处理、储存、分析和解释等在内一门交叉学科,(2)它综合运用数学、计算机科学和生物学的各种工具进行研究,(3)目的在于阐明大量生物学数据所包含的生物学意义。,21,生物信息学当前的主要研究任务,生物数据的收集与服务基因组分析(核酸序列分析)转录组数据分析(基因表达分析)蛋白质组数据分析(七大方面)代谢组数据分析(生化网络以及多数据资源的整合分 析)疾病基因预测(相关数据资源的整合分析)药物靶点发现与药物设计(相关数据资源的整合分析)生物信息分析的技术和方法研究,22,生物信息学当前的主要研究任务,生物数据的收集与服务基因组分析(核酸序列分析)核苷酸多态性的研究是以发现和分析群体(包括相近亚种

15、间)DNA顺序上的差别为基础,揭示这些多态性与基因表达和基因功能的关系,基因型和表现型的内在联系。为我们绘制人类基因组单倍体图和以后绘制其他物种的遗传图谱奠定基础。,23,生物数据的收集与服务基因组分析(核酸序列分析)转录组数据分析(基因表达分析)RNA水平基因表达研究的基本方法有EST、Micro-array,所产生的数据量也非常巨大。但是目前的分析方法和手段都有很多潜力可以挖掘,尤其是数学模型的建立,与基因组数据的整合,对数据真实性的评估等。,生物信息学当前的主要研究任务,24,蛋白质组学: (1)蛋白质组图像数据处理,蛋白及其修饰鉴定(2)构建蛋白质数据库,相关软件的开发和应用;(3)蛋

16、白质结构、功能预测;(4)蛋白质连锁图。,生物信息学当前的主要研究任务,25,代谢组学:新陈代谢是由错综复杂的生化代谢途径所构成的动态网络组成。要揭示代谢的本质是一个长期的目标。但是,我们可以从现有数据出发建立主要或特定代谢途径的模型,如影响人类健康的常见代谢疾病等。,生物信息学当前的主要研究任务,26,生物信息学研究都有其特定的、不断创新的方法学。以系统优化、软件并行化和数据处理技术为主体的海量生物学数据处理体系的建立将基于新的思路和设想。,生物信息学当前的主要研究任务,27,生物信息学的特点,它是一门基于数据积累,尤其是原始数据积累的科学。数据的获取是生物信息学发展的保障和本源。生物信息学

17、研究首先也是基于实验数据的生产、管理和分析。因此,生物信息领域的首要特点是生物学基本数据收集的规模化,数据处理的程序化,数据分析的专门化。,28,生物信息学的特点,极强的竞争性。不仅科研对失败者来说是无情的,而且用户对失败者也是不同情的。被遗弃的算法、工具和不完整的数据库比比皆是。,29,生物信息学的特点,硬件:中高端的服务器和海量数据存储以及个人电脑互联网软件包括了两大方面:算法良好的用户界面,生物信息学研究的意义,科学意义:可望从海量生物学数据分析中获得对生命运行机制和疾病机理等等的深入理解。应用价值:在生物医药研究和生物技术相关产业(生物制药、农、林、牧、渔、环保等)的发展中将发挥越来越

18、重要的作用。,生物信息学研究的意义,产业潜力:自身产业发展潜力很大:1997年1.5亿美元,1998年2.7亿美元, 1999年4.6亿美元,2000年已达7.4亿美元;预测2010年将达千亿美元。竞争优势:强调的是人才智力,是我国赶超世界发达国家最有希望的领域之一,是我国重点支持的方向之一。,三、生物信息学的发展现状,33,生物信息学的发展过程,大致经历了3个阶段:前基因组时代-生物数据库的建立、检索工具的开发、DNA和蛋白质序列分析、全局和局部的序列对位排列;,34,1956年在美国召开过首次“生物学中的信息理论”讨论会 60年代美国建立了手工搜集数据的蛋白质数据库 1962年Zucker

19、kandl基于序列变异分析的分子演化研究 1964年Davies开创了蛋白质结构预测的研究 1970年Needleman等发表了广受重视的两序列比较算法 1970年出现Computer Methods and Programs in Biomedicine期刊 1974年Ratner首先对分子遗传调控系统进行处理分析 1975年Pipas等首先提出用计算机技术预测RNA二级结构 1979年美国洛斯阿拉莫斯国家实验室建立GenBank Science于1980年发表了关于计算分子生物学的综述 1982年欧洲分子生物学实验室提供EMBL服务 1984年日本着手建立国家级核酸序列数据库DDBJ,35

20、,基因组时代-基因寻找和识别、网络数据库系统的建立、交互界面的开发;,美国于1988年成立国家生物技术信息中心(NCBI)欧洲于1993年着手建立欧洲生物信息学研究所(EBI)日本于1995年组建了自己的信息生物学中心(CIB)九十年代以来,生物数据分析技术获得了突飞猛进的发展。同时在国内北京大学于1997年成立了生物信息学中心上海生命科学研究院于2000年成立了生物信息学中心上海市于2002年成立生物信息技术工程研究中心,36,后基因组时代-大规模不同来源的组学数据分析。,各种专业研究机构和公司如雨后春笋般涌现生物科技公司和制药工业内部生物信息学部门的数量与日俱增即使象美国这样的发达国家也面

21、临生物信息人才匮乏的局面许多大学和研究机构已经成立自己的生物信息学中心生物信息专业期刊越来越多:如 Bioinformatics Journal of Computational Biology Briefings in Bioinformatics Acta Biotheoretica Bio Informatics Technology & Systems Bioinform Newsletter 互联网上的生物信息学网点非常繁多,37,Published April 25, 20082007 IF 4.914作者:魏丽萍 博士北京大学生命科学学院生物信息中心主任,教授蛋白质工程与植物基因

22、工程国家重点实验室 副主任于 军 博士中国科学院北京基因组研究所副所长,38,bioinformatics training programs in China.,31个博士,硕士学位点,39,从工具的角度来讲,生物信息学是今后所有生物(医药)研究开发所必需的方法和相关工作人员需要具备的基本技能,所以生物信息学课程的建设对于生物相关专业有重要的实际意义。,四、“生物信息学”课程的特点,如何掌握好“生物信息学”?,生物、计算机、数学等多学科交叉,知识覆盖面广;涉及从基因组序列分析直到药物设计等众多内容,且应用领域宽广;生物信息数据资源与分析工具繁多,实践环节非常重要;理论方法尚不系统成熟,处于迅

23、速发展变化阶段,知识更新快。缺乏合适的教材,课程特点,数学方面,统计学,是生物信息学的数学基础之一;概率论与随机过程理论;运筹学,如动态规划法;最优化理论与算法;几何拓扑学;函数论,如傅里叶变换,小波变换;信息论,神经网络,计算数学;群论,组合数学等。,计算机方面,网络技术和数据库(特别是关系型数据库)管理技术;数据整合和可视化;数据挖掘(Data Mining)与人工智能;算法设计 ;软件研制。,45,本课程基本要求,硬件:中高端的服务器和海量数据存储以及个人电脑(电脑的熟练使用)互联网(熟练的使用)软件包括了两大方面:算法(基本了解)良好的用户界面(熟练的使用),46,本课程高级要求,了解

24、问题掌握方法熟悉资源融会贯通,了解问题,核酸序列分析分子进化与系统发育分析蛋白质结构预测(蛋白质序列分析)基因功能预测(蛋白质序列分析、基因表达数据分析、蛋白质组数据分析、核酸序列分析 )高阶系统的建模与仿真(众多数据资源的整合分析)疾病基因预测(相关数据资源的整合分析)药物靶点发现与药物设计(相关数据资源的整合分析)其它方面的应用研究(相关数据资源的整合分析),掌握方法,数据挖掘与知识发现方法:贝叶斯方法判别分析决策树特征的选择与提取聚类方法HMM (Hidden Markov Model)方法ANN (Artificial Neural Network)方法SVM (Support Vec

25、tor Machine)方法数据库与软件的设计与开发,熟悉资源,数据资源分子生物学数据库数量众多(500种以上)、种类繁多基因组数据库、核酸序列数据库、蛋白质序列数据库生物大分子三维空间结构数据库特殊功能数据库、工具数据库分析软件资源核酸序列分析; 蛋白质序列分析; 其它资源搜索引擎; 电子论坛; ,参考书目,生物信息学概论Introduction to bioinformatics (英) T K Attwood , D J Parry-Smith 著 罗静初 等译北京大学出版社 2002年4月第一版生物信息学手册 郝柏林 张淑誉 编著上海科学技术出版社 2000年10月第一版生物信息学 赵国屏 等 编著 科学出版社 2002年4月 第一版 生物信息学-基因和蛋白质分析的实用指南 Bioinformatics-A Practical Guide to the Analysis of Genes and Proteins Andreas D.Baxevanis B.F.Francis Ouellette 著李衍达 孙之荣 等 译清华大学出版社 2000年8月 第一版,51,思考题,生物信息学的定义,联系方式:电话: 65201076 (O:8号楼213#) Email: cheng_,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号