《实战NCBI.ppt》由会员分享,可在线阅读,更多相关《实战NCBI.ppt(201页珍藏版)》请在三一办公上搜索。
1、网络资源利用之,实战NCBI,李 铁 臣,皖南医学院生物学教研室,说明:不是检索知识,也不仅仅是文献查询,只是一点免费生命科学的数据库和软件使用(生命科学的信息查询)的个人心得体会,和大家一起分享、探讨。,1.软件:CuteFTP Pro、WhereIsIP,Test:,2.网络:网页快照,讲座内容:一、NCBI简介二、利用NCBI查找基因信息1.如何查找与某种疾病相关的基因;2.如何查找目的基因的序列、确定外显子序列;3.如何验证PCR引物的正确性,三、利用NCBI查找文献-PubMed 1.杂志全称和规范缩写的查询 2.主题词(MeSH)查询 3.相关文献检索-检索词的选择 4.单篇文献查
2、找功能(SCM)5.全文连接功能 6.常见文献数据库简介四、SCI收录的论文引用情况及 杂志的影响因子(IF)查询方法简介,一、NCBI(美国国立生物技术信息中心)简介 1988年,美国的参议员 Claude Pepper 已意识到信息计算机化过程方法对指导生物医学研究的重要性,发起了在1988年11月4日建立国立生物技术信息中心(NCBI)的立法。NCBI是国立医学图书馆(NLM)的一个分支。,NCBI的使命:1.建立关于分子生物学,生物化学,和遗传学知识的存储和分析的自动系统。2.实行关于用于分析生物学重要分子和复合物的结构和功能的基于计算机的信息处理的先进方法的研究。3.加速生物技术研究
3、者和医药治疗人员对数据库和软件的使用。4.全世界范围内的生物技术信息收集的合作努力。,NCBI通过下面的计划来实现它的四项目的:1.基本研究:NCBI有一个多学科的研究小组,集中于计算分子生物学的基本的和应用的研究。2.数据库和软件。3.教育和训练,NCBI特点:1.收集的杂志全,水平高,数据和结论可靠;2.基因的序列集合了众多的研究结果,数据可靠,且没有印刷、书写错误;3.基因序列与发表的论文结合,集合了与某种疾病相关的基因情况,权威性高。,NCBI的网址:http:/www.ncbi.nlm.nih.gov/,杂志文献通过PubMed获得,PubMed是一个网络搜索界面,可以提供对在Med
4、line上的所有杂志引用的访问,包含了链接到参与的出版商网络站点的全文文章。PubMed也可以查询基因序列等信息。,Entrez是NCBI的为用户提供整合的访问序列,定位,分类,和结构数据的搜索和检索系统。Entrez同时也提供序列和染色体图谱的图形视图。Entrez是一个用以整合NCBI数据库中信息的搜寻和检索工具。这些数据库包括核酸序列,蛋白序列,大分子结构,全基因组,和通过PubMed检索的MEDLINE。Entrez的一个强大和独特的特点是检索相关的序列,结构,和参考文献的能力。(略),BLAST是一个NCBI开发的序列相似搜索程序,还可作为鉴别基因和遗传特点的手段。BLAST能够在小
5、于15秒的时间内对整个DNA数据库执行序列搜索。(受网速的影响较大),OMIM(孟德尔人类遗传)总结介绍这个基因的名字及研究历史,对于了解该基因有总括性的作用。建议找到目标基因后,点击该基因的OMIM去看看。其他有关功能,在查询过程中介绍。下面我们从基因查询(p16、CDKN2A)开始。,方法之一:PubMed,点击“PubMed”,二、利用NCBI查询相关基因信息,LocusLink:功能非常强大的搜索工具。NCBI所有的基因基本都连到了LocusLink。可以直接用基因的名字来检索。在Org一栏显示不同的organism,Hs是人,Mm是老鼠,Rn是大鼠等等。在每个基因名字的后面有一些彩色
6、的小字母,那是代表不同的连接。,P是PubMed,连接着PubMed里面以这 个基因名做主题词检索的所有文献。O是OMIM,总结介绍这个基因的名字 及研究历史,对于了解该基因有总括 性的作用。R是Refseq,是该基因的序列。G是Genbank,连着该基因的Genbank信 息,有关该基因的序列。,P 是Protein,连接到该基因的蛋白序列。H是HomoloGene,连接到该基因的所有 同源基因。U是UniGene,解释该基因主要功能相关 的分类。V是Variation,可以找到该基因的SNP信 息。,如果你点击你所要的organism的基因的LocusID,可以进入到该基因的具体介绍。里面
7、有该基因的全名,和其他的名字。以及主要的文献。再往下看,可以找到该基因的染色体定位,还有mRNA、Protein、Genbank Source、Genomic DNA序列等等信息。功能非常强大。,*当我们初次进行某种疾病的分子生物学研究时,常常会因为不知道这种疾病与什么基因相关联,检索工作不知从何而起,而无法确定研究的方向。这时,LocusLink功能将给予你很大的帮助。,LocusLink可以用疾病做主题词来搜索,比如diabetes。你可以找到几乎NCBI里报道过的与diabetes有关的基因,包括相关的signal pathway以及主要起作用的基因,对于了解diabetes领域的研究有
8、提纲挈领的作用。LocusLink还可以查询基因的外显子、内含子等序列信息。点击左边的“LocusLink”,或者直接在地址栏输入:http:/www.ncbi.nlm.nih.gov/LocusLink/进入LocusLink查询。例如:查与胃癌相关基因的情况。,再如:我们查询与高血压(hypertension)相关的基因,用“LocusLink”,查相关基因的序列及外显子(exon)序列的情况。,方法之二:AceView(略),网址:http:/www.ncbi.nlm.nih.gov/IEB/Research/Acembly/index.html,BLAST是一个NCBI开发的序列相似搜
9、索程序,还可作为鉴别基因和遗传特点的手段。BLAST还可用于PCR引物设计后的查询。,进入NCBI主页后,点击上面的“BLAST”,方法之三:BLAST,通常主要通过blastn查询,20222199441 279,也可以1条引物1个查询,exon 14fwd:gtttctgtgttagaaatttexon 14rev:gctttttagagtctactg200 bp product,PCR at 55 deg annealing,同样,反向引物gctttttagagtctactg的blast查询结果如下:,79476792741 203,从blast出来的结果看,老外给的引物的正、反方向正好
10、搞反了。但这对引物合成的序列是我们需要的ABCB4基因吗?还需要继续确认,从文献中已知人类ABCB4基因的mRNA序列编码为M23234,再用Locuslink功能查询属于第几外显子(exon)。,问题出现了:文献上都说有28个exon,老外给我们的引物属于第14 exon。但经Locuslink查询,ABCB4有32个exon,老外给的引物属于第18 exon,怎么办?因为文献上研究的参考序列是M23234,我们再往上查询。,所以人类的ABCB4基因Locuslink的结果:第1个Exon实际上是从第5个Exon开始的,并没有前面的4个Exon,因此,人类的ABCB4基因确实只有28个exo
11、n,老外给我们的引物确实属于第14 exon。所出现的这些情况,主要是由于基因形成成熟的mRNA时,进行不同剪接形成的。研究基因,特别要注意基因的不同剪接形式(splicing form)。,方法之四:PubMed的Nucleotide,进入PubMed选取Nucleotide,进行查询。如我们从文献中已知ABCB4基因的mRNA序列的编号是M23234。,三、利用NCBI查找文献:PubMed 1.杂志全称及规范缩写的查询,进入PubMed,选取“Journals”,2.主题词(MeSH)查询,PubMed最常用的功能:3.相关文献检索检索词的选择,输入:Genes,p16MeSH AND
12、Stomach NeoplasmsMeSH,如果输入:p16 gene AND gastric cancer,4.单篇文献查询功能(Single Citation Matcher),如某篇文章后的参考文献有:1 Zhao GH,Li TC,Shi LH,et al.Relationship between inactivation of p16 gene and gastric carcinoma.World J Gastroenterol,2003,9(5):905,四、常见数据库简介Sciencedirect(SD)http:/,Ovid:http:/,Interscience:http:
13、/Cancer,Username:wnmcgsPassword:wnmcgswnmc03gs wnmc03gs,其他常见数据库简介:Nature*、Cell、Science、Proc Natl Acad Sci USA(www.pnas.org,IF 10.7)、Karger*、ingenta*、Springer、Blackwell-Synergy、Proquest、LWW(Ovid中含有)、OCLC、EBSCO*等等。,ISI(SCI)简介:ISI Web of Science很多研究机构(包括国内)购买了ISI网络版,需要使用密码查询收录文献的引用情况。http:/wos.mimas.ac
14、.uk/,ISI还可以查询相关杂志的影响因子(IF)。,我们可以免费提供2002年(也是最新)的医学和生命科学类的ISI收录的全部杂志的影响因子(IF_2002)。需要者可来遗传医学研究室(皖南医学院教学实验楼508室)Copy(2.1 M)。,国外很多大学购买了ISI,可以直接在该校使用校园网上ISI。http:/,五、网络最锐利的兵器 Google(狗狗)http:/几乎所有的东东都能用google搜到,关键在检索词的选择。,如查下面文献的全文:Gingrich PM.Management and follow-up of abnormal Papanicolaou tests.J Am Med Womens Assoc,2004,59(1):54-60.按正常途径使用PubMed的单篇文献查询功能(Single Citation Matcher)查找全文连接。,再使用杂志全称查询功能(Journals)查找杂志的全称。,得到杂志的全称:Journal of the American Medical Womens Association再使用google的高级搜索功能。,六、丁香园简介http:/,谢谢!,