《实验二常用分子生物学数据库检索方法及数据格式.ppt》由会员分享,可在线阅读,更多相关《实验二常用分子生物学数据库检索方法及数据格式.ppt(32页珍藏版)》请在三一办公上搜索。
1、生物信息学实验课件,邢晋祎生命科学学院Copyright,实验二 常用分子生物学数据库检索方法及数据格式,实验目的,1.了解ncbi所提供的在线entrez检索方法。2.了解EBI所提供的SRS检索方法。3.熟悉查询swiss-prot蛋白质序列数据库的查询。4.详细了解三大核酸序列数据库之一的GenBank数据库平面文件Flat file。5.详细了解蛋白质结构数据库PDB数据库中的pdb文件。,实验材料,计算机,网络。,实验过程,1.Entrez检索方法NCBIAll databaseEntrez查询某一关键词(eg.Helicase,insulin,topoisomerase,gyras
2、e,hemoglobin。)依次点击各个数据库查看,实验过程,GenPept文件下载,平面文件获得查询某一条核酸序列获得平面文件保存或者下载用写字板(记事本)打开,实验过程,2.SRS检索方法。EBISRSEBIchoice database查询某一关键词(eg.Helicase,insulin,topoisomerase,gyrase,hemoglobin。),实验过程,3.Swiss-prot查询方法。Swiss-protSRSEBIchoice database查询某一关键词(eg.Helicase,insulin,topoisomerase,gyrase,hemoglobin)。,4.
3、GenBank flatfile(GBFF)内容。是GenBank数据库的基本信息单位,也是最广泛地用以表示生物序列的格式之一。GenPept文件GBFF可以分成三个部分,头部包含关于整个记录的信息(描述符)。第二部分包含了注释这一记录的特性,第三部分是核苷酸序列自身。所有的核苷酸数据库记录(DDBJ/EMBL/GenBank)都在最后一行以/结尾。,实验过程,5.PDB 文件的获得进入PDB数据库查询某蛋白质的结构(eg:1d3y)下载结构到本地电脑用写字板(记事本)打开,源自PDB结构记录的内容,PDB记录包括两个序列信息备份:隐性序列和显性序列。显性序列在PDB文件中以关键词SEQRES打头逐行存储。隐性序列蕴涵在由PDB文件中的ATOM记录及相应(X,Y,Z)位置坐标构成的化学立体结构中。实践中,许多PDB文件浏览器,如Rasmol,仅用隐性序列重构PDB记录蛋白质的化学图象,而忽略由SEQRES引导的显性序列信息。,文件头部,显性序列,隐性序列,作业:格式同实验一,1.写出Genbank flatfile的详细结构组成。2.写出PDB文件的详细组成。,