《信息生物学》PPT课件.ppt

上传人:小飞机 文档编号:5464187 上传时间:2023-07-10 格式:PPT 页数:45 大小:1.38MB
返回 下载 相关 举报
《信息生物学》PPT课件.ppt_第1页
第1页 / 共45页
《信息生物学》PPT课件.ppt_第2页
第2页 / 共45页
《信息生物学》PPT课件.ppt_第3页
第3页 / 共45页
《信息生物学》PPT课件.ppt_第4页
第4页 / 共45页
《信息生物学》PPT课件.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《《信息生物学》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《信息生物学》PPT课件.ppt(45页珍藏版)》请在三一办公上搜索。

1、现代生物学实验技术生物信息与数据处理,毛理凯,本课件在安装微软雅黑字体后有最好效果【详细说明见jiaoan.htm】,2,机房注意事项,不得做课堂以外的事情,一经发现,立刻驱逐并记录通报。严禁随意设置、升级系统。将自己产生的垃圾带走;爱护机房设备。有问题通报老师。部分鼠标不好使,下面垫张白纸就可以了。注意脚不要踢到下面的线。仔细阅读教案,提问前先在本教案上找答案。,3,电脑操作相关事项,登录开机自动进入Ubuntu系统(Linux的一个版本)后,输入用户名owner和密码buxudong!登录。复制教案(可选)点击菜单栏上的“Places/Home Folder”打开文件查看器(File Br

2、owser;相当于Windows的资源管理器),如果没有看到jiaoan.ppt(或jiaoan.htm)文件,按照下列步骤复制。,4,如何复制教案(可选),打开终端窗口(双击桌面上的或单击菜单栏上的黑色Terminal按钮)。在终端窗口输入“scp 192.168.0.1:/home/owner/jiaoan.htm.”后回车(注意最后有个点号),将拷贝教案文件(如有提示则按要求输入密码)。注意:在终端窗口输入密码不会有任何显示!(实际上密码已经输入,输完后回车即可)。回到文件查看器,找到并双击jiaoan.htm即可打开教案(或者先打开Firefox浏览器,从File/File Open菜

3、单中找到该文件再打开)。,5,本课目录,生物数据查询分子进化与系统分析,6,一、生物数据查询,7,网上查资料,Google(“谷歌”)http:/,8,Google查询结果,9,查中文生物文献,10,查英文生物文献,PubMed(),可编程,11,关键词的选择,不是特殊情况,尽量使用名词原形,不使用复数、所有格等尽量使用专业用语,不使用the,of,and,research等常用词作为关键词为了减少遗漏,使用尽可能少而精的关键词,12,PubMed查询结果(1)所有文章,13,PubMed查询结果(2)综述文章,保存搜索结果,查看该文摘要,14,增加搜索选项,15,精确使用PubMed查找(高

4、级搜索),标签(tag),字段(field),关键词(keyword),操作符(operator),检索条件(search terms),16,查找帮助(1),17,查找帮助(2),18,NCBI,美国国家生物技术信息中心(National Center for Biotechnology Information)前身是NIH所属的一个研究所的计算生物学研究室,1988年独立为NCBI,形式上属于国家医学图书馆(National Library of Medicine/NLM)管理着许多著名数据库,如GenBank、Medline、dbSNP、COG、OMIM等提供Entrez、BLAST等服

5、务,19,国际核苷酸序列数据库联盟,International Nucleotide Sequence Database Collaboration(INSDC)包括GenBank美 EMBL欧 DDBJ日 每天这三个数据库作数据同步操作在任何一个数据库操作(查找、投递数据等)是等效的,20,GenBank主页,可编程,21,GenBank结构,GenBank包括三个子数据库CoreNucleotidedbESTdbGSS其中CoreNucleotide还分为更小的BLAST数据库nrhtgswgsenv_nt,22,GenBank查询(1),已知收录号(accession number)的情

6、况,选数据库,输入收录号,查询结果摘要,点击查看详细结果,不知收录号时,如要搜索人体中的解旋酶,可以在下拉框中选择“Nucleotide”后,输入“helicase AND humanorgn”(不要输入引号),23,作业,【作业一般性的要求参见附录一,本作业具体的要求见下。】题目用PubMed搜索你感兴趣的课题相关的 序列 或 综述文献(review)。要求将搜到的文献/序列的基本信息(文献包括标题、杂志名、卷、期、页码、时间、作者,注意不要摘要;序列只要简单注释)上交。文献总篇数/序列总条数限制在20以内。如果超过20不列出超出的部分,只列出实际的总数。在步骤中说明你选择 关键词 和 限制

7、条件 的理由。,24,二、分子进化与系统分析,25,FASTA序列格式,也叫Pearson格式简单使用最多例子(单序列),Name of the sequencectgcgagNcgcgcgatgatagMMM-NNNnnnnatgancgcggcgagcatgtagcatgctagctgtcgcgagcactUUUURRRrrrrrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVvvvcgtaggcagccgcc,“-”表示间隔,26,多序列FASTA,sequence1,E.colict

8、gcgagNcgcgcgatgatagMMM-NNNngnnatgancgcggcgagcatgtagcatgctagctgtcgcgagcactUgaURRRrrrtrrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVagvcgtaggcagccgccsequence2,B.subtilisctgcgagNcgcgcgatgatagctgactNntnatganncgcggcgagcatgtagcatgctagctgtcgcgagcactUctURRRrrrcrrrcggccgagatcag

9、gcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVcgvcgtaggcagccgccsequence3,B.nattoctgcgagNcgcgcgatgatagMcgatcccnatgannncgcggcgagcatgtagcatgctagctgtcgcgagcactUggURRRrrrggrrcggccgagatcaggcgatgcatgcgcagggagcagcgagcgacgagcacagcatgctagctagatgcatgctaVaavcgtaggcagccgcc,27,FASTA序列格式中的核苷酸表示法,28,

10、FASTA序列格式中的氨基酸表示法,29,如何用PubMed找蛋白(BLAST第一步),选Protein,输入关键词,选一个蛋白,30,blastp(1)BLAST主页,点此进入blastp起始页,31,blastp(2)blastp起始页,在这里输入要搜索的蛋白质的收录号(accession number)或序列,点此开始搜索,如果要限制搜索的物种(如水稻),可在Organism处输入Oryza sativa(水稻的拉丁名),32,点此看结果,blastp(3)提交后页面,33,blastp(4)结果页(1.基本信息),34,blastp(5)结果页(2.比对图),35,blastp(6)结

11、果页(3.高分序列),36,blastp(7)结果页(4.高分序列详细结果),consensus,37,比对(MEGA),38,比对,39,比对,40,建树(MEGA),关闭比对窗口后自动弹出对话框,41,建树,42,作业,【作业一般性的要求参见附录一,本作业具体的要求见下。】搜索你所感兴趣的蛋白及其同源物的序列(序列不超过20条),分析这些序列之间的进化关系,建立系统树。将树输出为(File/Export;相当于另存为)Newick格式,将输出的nwk文件的内容(例子见下)复制在作业正文内(不要贴图)。并对结果进行解释。【Newick树例子】(gi|42673|emb|CAA23618.1|

12、_recA_gene_pr.,gi|86449963|gb|ABC96175.1|_RecA_prote.)0.18,(gi|37362719|gb|AAQ91336.1|_RecA_Esche.,gi|86449965|gb|ABC96176.1|_RecA_prote.)0.21,gi|86449967|gb|ABC96177.1|_RecA_prote.);,43,附录一 作业一般性的要求,请严格按照要求(包括一般性和具体要求)做作业,这些要求将作为打分的重要依据。任选以上作业之一上交。作业要包括详细完成步骤,其中的所有引用或用到的网页/文献请注明网址或出处。作业请在第8周(4月19日)

13、之前在上交。,44,附录二 常见问题集,什么是文件的扩展名?怎样才能看到扩展名?扩展名是文件名末尾点号(.)后面的部分,如文件实验报告.doc的扩展名是doc。缺省情况下,Windows XP会(Linux一般不会)隐藏已知的文件扩展名。要想看到扩展名,打开资源管理器,点击菜单项工具/文件夹选项,选择查看标签,去掉隐藏已知文件类型的扩展名复选框即可。什么是纯文本文件?什么是二进制文件?纯文本文件一般也叫文本文件。一个简单的判断文本文件的方法:用记事本(Windows下)或gedit(Linux下)打开这个文件,能够阅读的为纯文本文件,不能阅读的为二进制文件。另一个方法,由扩展名判断。常见的纯文本文件有:文本文件(txt)、网页文件(htm,html)等;常见的二进制文件有:Word文件(doc)、PowerPoint文件(ppt)、Excel文件(xls)、图形文件(jpg,gif,png,.)、音频文件(wav,mp3,.)、视频文件(avi,wmv,rm,rmvb,mov,.)、可执行文件(exe)等。Linux下如何编辑纯文本文件?在终端窗口输入命令gedit&(不要引号),再回车即可。,45,完,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号