《生物信息学概述》PPT课件.ppt

上传人:小飞机 文档编号:5553745 上传时间:2023-07-20 格式:PPT 页数:79 大小:5.85MB
返回 下载 相关 举报
《生物信息学概述》PPT课件.ppt_第1页
第1页 / 共79页
《生物信息学概述》PPT课件.ppt_第2页
第2页 / 共79页
《生物信息学概述》PPT课件.ppt_第3页
第3页 / 共79页
《生物信息学概述》PPT课件.ppt_第4页
第4页 / 共79页
《生物信息学概述》PPT课件.ppt_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《《生物信息学概述》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《生物信息学概述》PPT课件.ppt(79页珍藏版)》请在三一办公上搜索。

1、第一章 生物信息学概述,郑珩 副教授中国药科大学生物信息学教研室,什么是生物信息学?(What)为什么要学习生物信息学?(Why)怎样学好这门课程?(How)通过本课程学习,要达到什么要求,1.什么是生物信息学,信息是用符号、信号或消息所包含的内容,来直接或间接描述客观世界,生物信息,分子:,细胞,核酸,蛋白质,多糖,DNA-遗传密码的携带者,引自Neil Campbell著Biology第4版,1996,从基因组序列信息到基因功能,染色体,基因,蛋白质,功能,8,采用信息科学技术,借助数学、生物学的理论、方法,对各种生物信息(包括核酸、蛋白质等)的收集、加工、储存、分析、解释的一门学科。收集

2、、加工、储存:计算机科学家分析、解释:生物学家,生物信息学,What is bioinformatics?,9,生物信息学:研究对象:生物学(核酸蛋白质)研究内容:数学模型;生物学范畴研究工具:计算机科学(程序)研究人员:计算机科学家生物学家,10,生物信息学新兴的交叉学科,Mathematical sciences,Computer sciences,Life sciences,2.Why?,AGCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATC

3、GAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCA

4、TCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGAC

5、GATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGT

6、TGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTT

7、GCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTG

8、CATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATG

9、ACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGT,A C G T,hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheear,hisnat

10、ionundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheearthat this Nation,under GOD,shall have a new birth of freedom;and that government of the People,by the People and for the People shall not perish from the earth,A

11、GCATCGAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGA

12、CGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAG

13、CAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGA

14、CCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCA

15、TGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCAT

16、GACGATTGACCTAGTGCATGACTGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCAT

17、GACGATGCATGACCTAGCAGCATCGAAGTTGCATACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGTTGCATGACGATGCATGACCTAGCAAGTTGCATGACGATTGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGCGATGCATGACCTAGCAAGAAGTTGCATGACGATGCATGACCTAGTGCATGACGATGCATGACCTAGCAGCATCGAAGT,A C G T,15,人类基因组计划开始(Human Genome Project,HGP)人类基因组计划带来了 生物信

18、息学。,第一节 生物信息学发展简史,16,曼哈顿原子弹计划,阿波罗登月计划,人类基因组计划,人类自然科学史上的 3 大计划,17,基因组(Genome):包含细胞或生物体全套的遗传信息的全部 遗传物质。细胞核基因组DNA细胞质(线粒体、叶绿体)基因组DNA,人类基因组:3.2109 bp,18,人类基因组计划准备用15年时间投入30亿美元,完成人全部24(22+X+Y)条染色体中3.2109个碱基对的序列测定,主要任务包括做图(遗传图谱物理图谱以及转录图谱的绘制)、测序和基因识别,其根本任务是解读和破译生物体的生老病死以及与疾病相关的遗传信息。,19,HGP的历史回顾,1984.12 犹他州阿

19、尔塔组织会议,初步研讨测定人类整个基 因组DNA序列的意义1985 Dulbecco在Science撰文“肿瘤研究的转折点:人 类基因组的测序”美国能源部(DOE)提出“人类基因组计划”草案1987 美国能源部和国家卫生研究院(NIH)联合为“人类 基因组计划”下拨启动经费约550万美元1989 美国成立“国家人类基因组研究中心”,Watson担任 第一任主任1990.10 经美国国会批准,人类基因组计划正式启动1998.5 塞莱拉遗传公司成立,宣布3年内完成HGP,James Watson,20,2000 Celera公司宣布完成果蝇基因组测序 国际公共领域宣布完成第一个植物基因组拟南芥全基

20、 因组的测序工作 Nature刊文发表国际公共领域结果 Science刊文发表Celera公司及其合作者结果,Drosophila melanogaster果蝇,Arabidopsis thaliana拟南芥,21,At the White House on June 26,Francis Collins(r),Director of the National Human Genome Research Institute,President Clinton,and J.Craig Venter,President of Celara Genomics,lauded the thousands

21、 of scientists who contributed to the genome sequence.公共领域和Celera公司同时宣布完成人类基因组工作草图,22,2001年2月15日Nature封面,2001年2月16日Science封面,23,我国对人类基因组计划的贡献,24,human,Arabidopsis拟南芥,Thermotoga maritima,Escherichia coli大肠杆菌,Buchnerasp.APS,Rickettsia prowazekii,Ureaplasma urealyticum,Bacillus subtilis,Drosophila mela

22、nogaster,Thermoplasma acidophilum,Plasmodium falciparum,Helicobacter pylori,mouse,Caenorhabitis elegans,rat,Borrelia burgorferi,Borrelia burgorferi,Aquifex aeolicus,Neisseria meningitidis Z2491,Mycobacterium tuberculosis,1,0001,000,0001,000,000,0001,000,000,000,0001,000,000,000,000,0001,000,000,000,

23、000,000,0001,000,000,000,000,000,000,0001,000,000,000,000,000,000,000,000,103 Kilo106 Mega109 Giga1012 Tera 1015 Peta1018 Exa1021 Zetta1024 Yotta,100 Tera-bytes(1014)/a typical gene lab/year All the words ever spoken by human beings account to about 5 exa-bytes(51018)Soon using 1 zetta-bytes(1021)an

24、d 1 yotta-bytes(1024)生物信息量至少是所有人类说过的话的200倍!,至2004年,国际数据库记录的核酸碱基数目已超过200亿!如果用传统的纸张来书写,以每个核苷酸作为一个字符,则需要印制2万本每本1000页每页1000字的书!另外,二维凝胶电泳技术、测序质谱技术以及生物芯片技术的高速发展和广泛应用,也使得大量的数据信息已经无法用传统的文献形式发表,而更多的需以数据库形式,通过文字、图象、超链接等多种方式来记录。,计算机工具的介入,30,生物分子信息的特征,生物分子信息数据量大 生物分子信息复杂 生物分子信息之间存在着密切的联系,31,生物信息学(Bioinformatics

25、)这一名词的来由,八十年代末期,马来西亚的美籍学者林华安(Hwa A.Lim)认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是“CompBio”;之后,又将其更改为兼具法国风情的“bioinformatique”,看起来似乎有些古怪。因此不久,他便进一步把它更改为“bio-informatics(或bio/informatics)”。但由于当时的电子邮件系统与今日不同,名称中的-或/符号经常会引起许多问题,林博士于是将其去除,“bioinformatic

26、s”就正式诞生了,林博士也因此赢得了“生物信息学之父”的美誉。,32,Bioinformatics,第二节 生物信息学的研究领域,基因组序列装配基因识别基因功能预报基因多态性分析基因进化mRNA结构预测基因芯片设计基因芯片数据分析疾病相关基因分析,蛋白质序列分析蛋白质家族分类蛋白质结构预测蛋白质折叠研究代谢途径分析转录调控机制蛋白质芯片设计蛋白质芯片数据分析药物设计,(一)、核酸及基因组信息 1、大规模核酸测序及拼接 2、基因识别与定位 3、基因相关的SNP研究 4、非编码区信息结构分析 5、比较基因组学,一、生物学领域,35,1.大规模基因组测序,36,37,运用计算机软件进行序列拼接,2、

27、基因识别与定位,3.基因相关的SNP研究,Single Nucleotide Polymorphisms(SNP),是指在基因组上单个核苷酸的变异,一般而言,SNP 是指变异频率大于1%的单核苷酸变异,40,基因变异与疾病,4、非编码区信息结构分析,在微生物中,非编码区只占整个基因组序列的10%20;但在高等生物和人类基因组中,非编码序列则占了基因组序列的绝大部分。在人的基因组中,非编码序列超过95%,5、比较基因组学,比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上,对已知的基因和基因组结构进行比较,来了解基因的功能、表达机理和物种进化的学科。,(二)蛋白

28、质及蛋白质组信息 1、蛋白质结构模拟 2、蛋白质功能预测 3、基因表达及蛋白质组信息学,44,蛋白质三维结构测定主要方法:X射线晶体结构分析、多维核磁共振(NMR)波谱分析和电子显微镜二维晶体三维重构(电子晶体学,EC)等物理方法,Difficult!Expensive!Too Much Time!,蛋白质结构及功能预测,蛋白质组研究,(三)、分子相互作用及代谢调控网络,对生物功能的分析表明基因和蛋白质很少单独起作用,它们倾向于成组地通过网状的交互作用而影响生物系统的功能,分子相互作用信息和单个分子的信息一样重要。,48,结构与功能,信号网络代谢途径,细胞重建,系统重建,基因组,基因,后基因组

29、时代,单个基因的结构与功能基因家族代谢途径基因组,(四)、生物进化的研究,序列相似性比较,生物信息数据库数据库接口和检索工具的研制新的算法和软件1、多序列比较方法2、序列拼接与分析3、基因组大尺度作图和功能基因组分析方法4、蛋白质结构和功能预测5、生物大分子结构图形化显示6、细胞代谢过程模拟7、药物设计相关软件开发,二、在计算机领域,第三节 在药学领域应用,一、初始阶段:信息收集 初步调研确定合适的药物作用靶 可行性分析:靶点结构、化合物信息,1、诊断类药物:生物芯片设计 遗传病:基因诊断 感染性疾病:抗体、基因芯片、PCR技术,二、药物设计:,53,病人健康人,基因芯片诊断,及早治疗,对症下

30、药,2、预防类药物:计算机辅助疫苗设计 计算机预测抗原表位,EPIMMUNE http:/,MHCPred,所谓基因组药物(Genomic drug)是指利用基因序列数据,经生物信息学分析、高通过基因表达、高通量功能筛选和体内外药效研究开发得到的新药候选物 实际上利用了反向生物学的原理沿着从基因序列一蛋白质一功能一药物的途径研制新药,其优势是取自庞大的人类基因资源及其编码蛋白质做为原材料,具有巨大的开发潜力。,3、开发基因组药物,58,人类基因组约有10万左右的基因编码10万以上的蛋白质,其中至少5即5000以上的基因编码蛋白质可能具有药物开发前景而目前利用常规技术开发的人类重组蛋白质药物已上

31、市的只有20多种,进入临床实验的只有100多种。,美国的人类基因组科学公司(HGS公司)。根据其1999年2月公布的消息,在功能基因组研究领域,HGS公司己发现95的人类cDNA;克隆了9000个人类分泌蛋白质的全长cDNA;发现了3000个基因的可能医学应用;发现了35个新的白细胞介素类分子和40个新的生长因子类分子;已有3个基因组药物进入临床。,4、寻找药物作用新靶点,基因组比较:抗微生物同源性搜索表达差异分析,理想的抗生素靶标应为微生物细胞存活所必须,在病原体中高度保守,且在人体中不存在或与人类基因有根本差异。,基因组研究促进了新靶标的发现:,63,生物信息学和人类基因组计划为药物靶标的

32、发现和新药的研制开创了新天地,未来的药物设计将是基于生物信息学的知识挖掘的过程,通过数据分析首先确立靶标分子,预测蛋白质分子结构,设计药物分子与靶标分子相互作用,计算机辅助分子建模,分子三维结构可视化。1982年,Dock程序已成功的有HIV蛋白酶抑制剂、二氢叶酸还原酶抑制剂等,5、计算机辅助药物设计,实验发现2-去氧-2,3-双去氢-D-N-乙酰神经氨酸(Neu5Ac2en)对唾液酸酶有抑制作用,但在动物模型中效果不佳。,通过实验测定了唾液酸酶的晶体结构 及酶与抑制剂Neu5Ac2en的晶体结构,抑制活性测定表明4-氨基和4-胍基取代Neu5Ac2en,比其母体Neu5Ac2en分别提高20

33、倍和5000倍,后者已进入临床,有望成为一种新的抗病毒药物。,(三)、开发阶段:药物基因组学 减少药物副作用 避免开发风险,73,生物信息学研究意义,认识生物本质了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系改变生物学的研究方式 改变传统研究方式,引进现代信息学方法在医学上的重要意义为疾病的诊断和治疗提供依据为设计新药提供依据,74,How?,学习内容,75,通过本门课程的学习,我们将能够:了解生物信息学的一般概念和基本算法学会搜索各种生物信息学资源;能够利用各种工具搜索核酸蛋白质数据库;能够对未知基因及其产物进行初步的生物信息学分析;能够利用数据库进行序列的拼接和电子克

34、隆;6能够进行系统发育树的构建和分析;7了解生物信息学分析软件的使用方法;8.了解计算机辅助药物设计的原理和方法。,学习目标:,76,References,郑珩等.药物生物信息学,化学工业出版社,2004张成岗等.生物信息学方法与实践,科学出版社,2002,黄韧等.生物信息学网络资源与应用,中山大学出版社,2003钟扬等.简明生物信息学,高等教育出版社,2001孙啸等.生物信息学基础,清华大学出版社,2005其他,学习方法,多实践,多思考一些论坛:丁香园 生物通 生物谷 小木虫 http:/,78,79,1、什么是生物信息学?2、你认为生物信息学有什么用?对你的生活、研究有影响吗?3、人类基因组计划与生物信息学有什么关系?4、生物信息学研究领域包括哪些?5、生物信息学如何应用到药物研发中?,课堂练习,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号