《生物信息学课堂操作练习.doc》由会员分享,可在线阅读,更多相关《生物信息学课堂操作练习.doc(16页珍藏版)》请在三一办公上搜索。
1、生物信息学课堂操作练习一、生物信息学科的发展和研究内容通过下列internet上的自教课程,初步了解不同的数据库和分析工具http:/www.ebi.ac.uk/2canhttp:/www.ncbi.nlm.nih.gov/Education二、 生物数据库1. 熟悉各种数据库。2. 重点了解GenBank和SWISS-PROT所包含的各种功能和适用范围。三、 关键词或词组为基础的数据库检索1. 熟练掌握Entrez检索体系。2. 查找与水稻抗病基因Xa21有关的资料(1) 由多少碱基构成?编码多少个氨基酸?(2) exon和intron的位置?(3) 是否有3D structure数据?1)
2、 由多少碱基构成?编码多少个氨基酸? 4623b.p., 1025A.a.; 2) exon和intron的位置? Exon: 242700,35433943 intron: remaining; 3) 是否有3D structure数据? 没有. 3. 查找C. elegans基因组的资料。(1) chromosome I的测序是否已完成?(2) 已知的chromosome I的序列有多少碱基?序列发表在哪份杂志上?期号和页码?1) chromosome I的测序是否已完成? 完成. 2) 已知的chromosome I的序列有多少碱基? 序列发表在哪份杂志上? 期号和页码? 15.0724
3、Mb.p.(15072421b.p.), Science 1999 Jan 1;283(5398):35.4. 查看人类基因组第1染色体上基因的分布。http:/www.ncbi.nlm.nih.gov/mapview/maps.cgi?ORG=hum&MAPS=ideogr,est,loc&LINKS=ON&VERBOSE=ON&CHR=15. 查看Arabidopsis的系谱树,以及Arabidopsis第1染色体上的序列。比较Arabidopsis基因组的资料提供形式与人类基因组有什么不同 (http:/www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwt
4、ax.cgi?id=3701, http:/www.ncbi.nlm.nih.gov/mapview/maps.cgi?taxid=3702&chr=1) 貌似没什么区别比较Arabidopsis基因组的资料提供形式与人类基因组有什么不同。6. 与retrotransposon有关的文献资料有多少篇? 5774, (在pubmed中直接查找关键词, 2009328) 与rice retrotransposon有关的文献有多少篇? 214, (在pubmed中直接查找关键词, 2009328)7 检索我校在2009年1月发表的被PubMed收录的科研论文Huazhong Agricultural
5、 University,297. 熟悉SRS检索体系。8. 熟悉DBGET检索体系。四、 核苷酸和蛋白质序列为基础的数据库检索1. 了解BLAST Frequently Asked Questions的答案。2. 以大麦Mlo基因(Z83834)为查询序列(1) 用Blastn能检索到多少条与Mlo同源的序列?与Mlo同源的序列:共找到63条与Mlo同源的序列(2) 在使用Blastn 检索中,如改变E value的阈值,能检索到多少与Mlo同源的序列?将E value (Expect threshold)由默认的10改为1时,仍有63条同源序列。若将E值改为5e-19时可以找到61条同源序列
6、。(3) 怎样去掉alignment过程中出现的小写字母? 这里所说的小写字母就是出现重复序列时被算法筛选后出现的n。将Algorithm parameters中的Filters and Masking选项里的Low complexity regions前的勾去掉就可以去掉比对过程中出现的小写的n。(4) 用PSIBLAST检索到的与Mlo蛋白同源的序列与用Blastp检索到的同源序列是否有差别?PSI-BLAST的特色是每次用profile搜索数据库后再利用搜索的结果重新构建 profile,然后用新的profile再次搜索数据库,如此反复直至没有新的结果产生为止。PSI-BLAST先用带空
7、位的BLAST搜索数据库,将 获得的序列通过多序列比对来构建第一个profile。PSI-BLAST自然地拓展了BLAST方法,能寻找蛋白质序列中的隐含模式,有研究表明这种方 法可以有效的找到很多序列差异较大而结构功能相似的相关蛋白,甚至可以与一些结构比对方法,如threading相媲美。PSI-BLAST服务可以在 NCBI的BLAST主页上找到,还可以从NCBI的FTP服务器上下载PSI-BLAST的独立程序。首先得到Mlo的蛋白质序列:CAB06083.1;然后用blastp检索。选中PSI-BLAST。第一次检索得到100个同源序列,再以这些序列为基础,再次检索,得到标有new的序列。
8、第三次检索,已经没有含有new的序列,检索结束。(5) 熟悉PHIBLAST 检索方法。(6) 用Mlo基因序列检索蛋白质数据库能找到多少同源序列?使用BLASTX,输入accession number :Z83834,找到100个同源序列3. 从以Mlo基因的氨基酸序列检索到的同源序列中任取两条序列,用BLAST 2 sequences作分析,看它们之间是否存在同源序列。Mlo基因氨基酸序列号:CAB06083 选取两条为:P93766、AAK94905可以看到具有较高的同源性。Identities = 397/432 (91%), Positives = 412/432 (95%)五、 多
9、序列对位排列分析和系谱分析1.用大麦Mlo基因(Z83834)编码的蛋白质序列在数据库中检索同源序列,找出与 Mlo同源程度最高的另外9条序列。对位排列这10条序列,确定这些同源序列的保守区段;分析这些保守区段是否组成已知结构域(domain)或模体(motif)。 1.在NCBI中的nucleotide数据库中输入Z83834,点击链接到蛋白质序列,用FASTA格式输出,复制该蛋白序列2.进入NCBI的BLAST,选择protein blast,粘贴所复制的蛋白序列,进行blast3.在结果中选中同源度最高的10条结果,点击get selected sequences4.在display中选
10、则FASTA,send to 中选则text,复制有内容。5.在EBI的ClustaW分析网页粘贴序列,点击run2.练习使用各种修饰功能修饰对位排列上述10条序列。 1. Boxshade功能 在多序列对位排列结果网页复制序列排列结果 在“Boxshade”网页(ttp:/www.ch.embnet.org/software/BOX_form.html)粘贴序列,在“Input sequence format”栏目选择“ALN”,在“Output format”栏目选择“RTF_new” 在结果网页点击“here is your output number 1”,得结果。2. 颜色修饰 功能
11、“ClustalW Results”网页展示多序列对位排列结果点击“Show Colors”用不同颜色的字母展示对位排列结果3.根据系谱分析,上述10条序列中哪两条序列的同源程度最高? 1. “ClustalW Results”网页展示多序列对位排列结果2. 点击“Show as Phylogram Tree”展示Phylogram Tree,可据此判断同源程度。4.用大麦Mlo基因(Z83834)序列检索数据库,找出与Mlo同源程度最高的另外4条序列。对位排列这5条序列,确定这些同源序列的保守区段;分析这些保守区段是否组成已知结构域(domain)或模体(motif)。 1. 进入NCBI的
12、BLAST, 选择nucleotide blast,粘贴基因序列号Z83834,进行blast2. 在结果中选中同源度最高的5条结果,点击get selected sequences3. 在display中选则FASTA,send to 中选则text,复制所有内容。4. 在EBI的ClustaW分析网页粘贴序列,点击run六、 基因结构分析1. 从核苷酸数据库中选择DNA序列,试用不同的分析工具分析真核生物和原核生物的基因结构,并将分析结果与核苷酸数据库中的结果相比较。2. 掌握GenScan和GeneFinding中的各种分析方法。七、 蛋白质结构分析1. 从数据库中任选一蛋白质的序列作分
13、析对象,熟悉分析蛋白质的一级和二级结构的方法。以猪leptin蛋白为例,在ncbi上查找到其序列,再转至EXPasy 网站http:/www.expasy.ch/ 一级结构 1:PI 、Mw 、氨基酸组成 http:/www.expasy.ch/tools/protparam.html 2:疏水性 http:/www.expasy.ch/tools/protscale.html3:重复序列 http:/www.embl-heidelberg.de/andrade/papers/rep/search.html二级结构 http:/www.cmpharm.ucsf.edu/nomi/nnpredi
14、ct.html(貌似这个网站不能搜) http:/npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html2. 大麦Mlo基因(Z83834)编码的蛋白质是膜镶嵌蛋白质还是膜附着蛋白质?先搜出mlo蛋白的序列,输入http:/bp.nuap.nagoya-u.ac.jp/sosui/sosui_submit.html网站,由图形看出是膜镶嵌蛋白,跨膜六次。3.水稻抗病基因Xa21的产物位于细胞的什么部位?基因Xa21:U37133.1 http:/www.ncbi.nlm.nih.gov/nuccore/1122442在ncb
15、i中输xa21 gene” Oryza sativa”,找到xa21序列。输入http:/wolfpsort.org/得到plas的得分最高,说明该蛋白在细胞膜上4. Xa21基因产物是否糖蛋白?什么类型的糖蛋白?分析是否是糖蛋白在http:/www.cbs.dtu.dk/services/NetOGlyc/和http:/www.cbs.dtu.dk/services/NetNGlyc/说明是N-连接的糖蛋白5. Xa21蛋白的亲水性和疏水性如何?Grand average of hydropathicity (GRAVY): 0.049亲水性分析http:/www.expasy.ch/too
16、ls/protscale.htmlHydropathicity0 ,疏水强 0, 亲水强。说明xa21蛋白有轻度疏水性八、 农业类数据库的利用1. 熟悉各种农业类基因组数据库,重点以Gramene、GrainGenes和ArkDB数据库为例,掌握各种内容的查询方法。2. 分子标记ARKMKR00050536位于火鸡的第几号染色体?它在这条染色体上的遗传位置?ARKMKR00050536位于火鸡第一号染色体,遗传位置是125.800http:/www.thearkdb.org/arkdb/do/getMarkerDetail?accession=ARKMKR000505363. 水稻的JRGP
17、RFLP 2000分子标记遗传连锁图的3号染色体上定位了多少个分子标记?覆盖了多少遗传距离?有32个分子标记,覆盖166.40CMhttp:/www.gramene.org/db/cmap/viewer?mapMenu=&featureMenu=&corrMenu=&displayMenu=&advancedMenu=&ref_map_accs=jrgp-rflp-2000-3&sub=Draw+Selected+Maps&ref_map_start=&ref_map_stop=&ft_centromere=2&ft_est=2&ft_gene=2&ft_genomic-dna=2&ft_ma
18、rker=2&ft_rapd=2&ft_rflp=2&ft_sts=2&prev_ref_species_acc=rice&prev_ref_map_accs=&ref_map_set_acc=jrgp-rflp-2000&ref_species_acc=rice&data_source=Gramene4. 水稻11号染色体上定位的标记CDO534属于什么类型的分子标记?来源于什么物种?.CDO534属于RFLP分子标记,来源于Avena sativa物种http:/www.gramene.org/db/markers/marker_view?marker_id=215147455. 水稻分子
19、标记RG101所在的染色体位点是否有QTL信息?什么类型的QTL?RG101所在的染色体位点有QTL信息 有多种类型的QTL,例如seed number,spikelet density,plant height,spikelet numberhttp:/www.gramene.org/db/cmap/feature?feature_acc=AQCG0056 水稻5号染色体上定位的标记C1018属于什么类型的分子标记?来源于什么组织?序列是否已知?C1018属于RFLP类型的分子标记, 来源于callus组织. 序列已知。http:/www.gramene.org/db/markers/mar
20、ker_view?marker_id=215121667 水稻分子标记RM172所在的染色体位点是否有QTL信息?什么类型的QTL?有 culm lengthhttp:/www.gramene.org/db/markers/marker_view?marker_id=24986341九、 核酸序列的其他分析方法1. 大麦Mlo基因(Z83834)的CG含量是多少?58.89%2. 如何获得Z83834的反向互补序列?sequence/Nuleic Acid/Reverse Complement3. Mlo基因不包含哪种限制性内切酶位点?4. DNA序列AC004765位于几号染色体的什么位点?
21、5.推测Z83834的ORF和翻译产物。http:/www.ncbi.nlm.nih.gov/projects/gorf/orfig.cgi生物信息学课程考试样卷提示:(1)2小时答题时间;(2)课堂开卷,独立完成;(3)答题简明扼要 1请查询有关OsPK7基因的资料,回答下列问题: 1. OsPK7基因的注册号?它来源于什么物种? (6分) 2. OsPK7编码的蛋白质包含有多少个氨基酸?是否为跨膜蛋白?该蛋白可能位于细胞的什么部位? (7分) 3、分离克隆OsPK7基因的工作发表在什么杂志上?杂志卷号、页码、年份?(7分) 1. 答题要点:(1)AB011968,来源自水稻。(2)520
22、aa;不是跨膜蛋白;可能是位于细胞外的可溶性蛋白。(3)文章发表在Mol. Gen. Genet.;2000年263期359-366页。详细:方法:NCBI主页nucleotide中输入基因名查找注册号(ACCESSION 为AB011968)及来源(ORGANISM为Oryza sativa (rice))查找其蛋白质注册号即点击protein_id(结果为BAA83689)点击PubMed即可得到发表该基因的文章: (Mol Gen Genet. 2000 Mar;263(2):359-66.)(或在PubMed上面一排的JOURNAL JOURNAL就可以得到发表文章)是否为跨膜蛋白,方
23、法:1、ExPASy 主页 (http:/www.expasy.ch/)选择topology prediction2、在“Topology prediction”栏目选择“SOSUI”分析工具3、在SOSUI主页选择分析“SOSUI”分析软件4、在SOSUI:Submit a protein sequence网页粘贴序列(将display改为fasta格式在复制粘贴,可能有时候粘贴时要不粘第一排)5、分析结果(This amino acid sequence is of a SOLUBLE PROTEIN)蛋白质定位:1、ExPASy 主页选择 topology prediction2、在“T
24、opology prediction”栏目选择“PSORT” 软件分析蛋白质在细胞中的定位3、在PSORT网页选择分析方法,如选择WoLF PSORT4、选择物种,粘贴序列(将display改为fasta格式在复制粘贴,可能有时候粘贴时要不粘第一排)5、分析结果2任选一种分析工具,分析序列AY066019的基因结构及其编码产物的化学性质。请注明分析工具的名称,以及是否采用某一物种的数据作为参照。 1. 根据你所选用的分析方法,这条序列编码多少个基因?编码序列的位点?分析结果与事实是否相符合?(7分) 2. 预测的基因位于哪条DNA链上?(6分) 3. 预测基因之一(请注明是第几个基因)编码的蛋
25、白质的分子量和等电点是多少?该蛋白质中哪一种氨基酸的含量最高?(7分) 2. 答题要点:(1)采用FGENESH分析方法,选择Human参照。该序列包含一个基因,其编码序列是770955 bp,15621607 bp,17951842 bp,21442565 bp;分析结果与事实符合。(2)预测的基因位于正链上。(3)采用ProtParam分析方法,基因编码产物的分子量:25644.4;等电点:6.44;亮氨酸(L)的含量最高。(4)本题也可以采用不同于(1)(3)的分析方法回答。详细:3. C1018是水稻分子标记遗传连锁图(TTU IRIR 2000)上的一个分子标记,请回答下列有关问题:
26、 1. 这个分子标记被定位于水稻第几号染色体?属于什么类型的分子标记?(6分) 2. 与这个分子标记紧密连锁(两侧)的分子标记的名称是什么? (5分) 3. 这个分子标记的DNA序列是否已知?如果序列已知,它在数据库中的注册号是什么?这条序列来源于什么物种的什么组织?(7分) 3. 答题要点:(1)5号染色体;RFLP标记。(2)R2289和PC17M14。(3)序列已知,注册号:D28215;来源于水稻的愈伤(callus)组织。方法:进入禾本科植物比较基因组数据库主页:Gramene 数据库(http:/www.gramene.org)在species下拉栏中选择RICE在find any
27、thing中选择maker,后面空格中输入C1018,然后搜索在得到的收索结果中选择maker第一条type一栏显示为RFLP,Details 中的source tissue 一栏显示为callus(愈伤组织)点击sequance可以看到序列说明序列已知,并且在序列的最前段可以看到序列号为D28215,来源于水稻。4分析五条DNA序列(X55152、AY888608、X57321、M64087、X66539)的同源性并回答下列问题: 1. 哪两条序列的进化亲缘关系最近?它们之间的同源性是多少? (10分) 2. 哪一条序列与上述其他四条序列均表现出较低的同源性?(10分) 4答题要点:(1)X
28、55152和X57321的进化亲缘关系最近,它们的同源性是83。(2)M64087与其它四条序列均表现出较低的同源性。5你从实验中获得一条由250个氨基酸组成的蛋白质的序列。你想了解该蛋白质的三维结构是否已知。根据你从“生物信息学”课中学到的知识,该如何寻找答案?(20分) 5. 答题要点:(1)采用BLAST分析方法,用这条DNA序列检索PDB结构数据库。本题也可以采用不同于(1)的分析方法回答。1请查询有关OsPK7基因的资料,回答下列问题: OsPK7基因的注册号?它来源于什么物种? (6分) OsPK7编码的蛋白质包含有多少个氨基酸?是否为跨膜蛋白?该蛋白可能位于细胞的什么部位? (7
29、分) 分离克隆OsPK7基因的工作发表在什么杂志上?杂志卷号、页码、年份?(7分)1)AB011968,来源自水稻。(2)520 aa;不是跨膜蛋白;可能是位于细胞外的可溶性蛋白。(3)文章发表在Mol. Gen. Genet.;2000年263期359-366页。 2任选一种分析工具,分析序列AY066019的基因结构及其编码产物的化学性质。请注明分析工具的名称,以及是否采用某一物种的数据作为参照。 根据你所选用的分析方法,这条序列编码多少个基因?编码序列的位点?分析结果与事实是否相符合?(7分) 预测的基因位于哪条DNA链上?(6分) 预测基因之一(请注明是第几个基因)编码的蛋白质的分子量
30、和等电点是多少?该蛋白质中哪一种氨基酸的含量最高?(7分) (1)采用FGENESH分析方法,选择Human参照。该序列包含一个基因,其编码序列是770955 bp,15621607 bp,17951842 bp,21442565 bp;分析结果与事实符合。(2)预测的基因位于正链上。(3)采用ProtParam分析方法,基因编码产物的分子量:25644.4;等电点:6.44;亮氨酸(L)的含量最高。(4)本题也可以采用不同于(1)(3)的分析方法回答。3. C1018是水稻分子标记遗传连锁图(TTU IRIR 2000)上的一个分子标记,请回答下列有关问题: 这个分子标记被定位于水稻第几号染
31、色体?属于什么类型的分子标记?(6分) 与这个分子标记紧密连锁(两侧)的分子标记的名称是什么? (5分) 这个分子标记的DNA序列是否已知?如果序列已知,它在数据库中的注册号是什么?这条序列来源于什么物种的什么组织?(7分) (1)5号染色体;RFLP标记。(2)R2289和PC17M14。(3)序列已知,注册号:D28215;来源于水稻的愈伤(callus)组织。4分析五条DNA序列(X55152、AY888608、X57321、M64087、X66539)的同源性并回答下列问题: 哪两条序列的进化亲缘关系最近?它们之间的同源性是多少? (10分) 哪一条序列与上述其他四条序列均表现出较低的
32、同源性?(10分) (1)X55152和X57321的进化亲缘关系最近,它们的同源性是83。(2)M64087与其它四条序列均表现出较低的同源性。5你从实验中获得一条由250个氨基酸组成的蛋白质的序列。你想了解该蛋白质的三维结构是否已知。根据你从“生物信息学”课中学到的知识,该如何寻找答案?(20分)(1)采用BLAST分析方法,用这条DNA序列检索PDB结构数据库。本题也可以采用不同于(1)的分析方法回答。1教学网站 2 Internet http:/www.ncbi.nlm.nih.gov/Education http:/www.ebi.ac.uk/2can/home.html3 SQL
33、4 GenBank http:/www.ncbi.nlm.nih.gov/5 dbEST (Database of Expressed Sequence Tags) http:/www.ncbi.nlm.nih.gov/dbEST/index.html6 UniGene 数据库 http:/www.ncbi.nlm.nih.gov/UniGene/7 dbSTS (Database of Sequence Tagged Sites) http:/www.ncbi.nlm.nih.gov/dbSTS/index.html8 dbGSS (Database of Genome Survey Seq
34、uences) http:/www.ncbi.nlm.nih.gov/dbGSS/index.html9 HTG (High-Throughput Genomic Sequences) http:/www.ncbi.nlm.nih.gov/HTGS/10 基因组数据库http:/www.ncbi.nlm.nih.gov/sites/entrez?db=genome11 dbSNP单核苷酸多态性数据库http:/www.ncbi.nlm.nih.gov/sites/entrez?db=snp12 EMBL http:/www.ebi.ac.uk/embl13 DDBJ http:/www.ddb
35、j.nig.ac.jp/Welcome-e.html14 EPD (Eukaryotic Promoter Database) http:/www.epd.isb-sib.ch/15 蛋白质数据库SWISS-PROT http:/www.ebi.ac.uk/swissprot16 TrEMBL (Translation of EMBL) http:/www.uniprot.org17 PIR (Protein Information Resource) http:/pir.georgetown.edu18 PRF (Protein Research Foundation) http:/www.
36、prf.or.jp/en/os.html19 Prosite http:/www.expasy.org/prosite20 PDB (Protein Data Bank) http:/www.rcsb.org21 SWISS-3D IMAGE http:/www.expasy.ch/sw3d/22 酶和代谢数据库KEGG主页 http:/www.genome.ad.jp/kegg/23 PKR (Protein Kinase Resource) http:/pkr.genomics.purdue.edu/pkr/Welcome.do24 系谱数据库Taxonomy http:/www.ncbi
37、.nlm.nih.gov/Taxonomy/taxonomyhome.html25 文献数据库PubMed http:/www.ncbi.nlm.nih.gov/PubMed26 OMIM http:/www.ncbi.nlm.nih.gov/sites/entrez?db=OMIM27 美国农部农业图书馆的数据库Agricola http:/agricola.nal.usda.gov/ 28 Entrez检索体系 http:/www.ncbi.nlm.nih.gov/Entrez29 SRS 检索体系 http:/srs.ebi.ac.uk/30 DBGET检索体系 http:/www.ge
38、nome.ad.jp/dbget/31 BLAST (Basic Local Alignment Search Tool) 检索 http:/blast.ncbi.nlm.nih.gov/32 Primer-BLAST http:/www.ncbi.nlm.nih.gov/tools/primer-blast33 FASTA 检索http:/www.ebi.ac.uk/fasta33/index.html34 Blitz 检索 http:/www.ebi.ac.uk/searches/blitz.html35 BLAST 2 sequences http:/blast.ncbi.nlm.nih
39、.gov/36 ExPASy http:/www.expasy.ch37 多序列比对ClustaW分析网页(http:/www.ebi.ac.uk/clustalw/index.html)38 Boxshade 突出相同或相似位点http:/www.ch.embnet.org/software/BOX_form.html39 ESPript 多种修饰 功能http:/espript.ibcp.fr/ESPript/cgi-bin/ESPript.cgi40 基因预测Gene Finding Softberry (41基因预测GenScan(http:/genes.mit.edu/GENSCAN
40、.html)42 基因预测GeneMark(http:/opal.biology.gatech.edu/GeneMark/)43 Gene Feature Searches (BCM http:/dot.imgen.bcm.tmc.edu)44 比较基因组预测基因Twinscan/N-SCAN (http:/mblab.wustl.edu/software/twinscan/)45 美国农部农业图书馆主页http:/www.nal.usda.gov46 禾本科植物比较基因组数据库http:/www.gramene.org47 SoyBase 主页(http:/soybase.org/)48 G
41、rainGenes (http:/www.graingenes.org)49 RMD数据库()50家畜、家禽基因组数据库 ArkDB (http:/www.thearkdb.org)51 从美国微生物系的网页(http:/www.mbio.ncsu.edu/BioEdit/bioedit.html52 ORF finder http:/www.ncbi.nlm.nih.gov/projects/gorf/53 SRS检索主页(http:/srs.ebi.ac.uk)54 Primer3(http:/frodo.wi.mit.edu/)55 electronic PCR(e-PCR)功能定位DN
42、A序列(http:/www.ncbi.nlm.nih.gov/projects/e-pcr/)56NEBcutter 数据库因特网网址数据库信息发布及其它GenBank Release Notesftp:/ncbi.nlm.nih.gov/genbank/gbrel.txtdbEST summary reporthttp:/www.ncbi.nlm.nih.gov/dbEST/dbESTsummarv.htmlEMBL release noteshttp:/www.genome.ad.jp/dbget-bin/show man?emblDDBJ release noteshttp:/www.d
43、dbj.nig.ac.jp/ddbjnew/ddbj relnote.htmlEukaryotic promoter database release noteshttp:/www.genome.ad.jp/dbget/dbget2.htmlSwissProt release noteshttp:/www.genome.ad.jp/dbget-bin/show man?swissprotPIR release noteshttp:/www.genome.ad.jp/dbget-bin/show man?pirPRF release noteshttp:/www.genome.ad.jp/dbg
44、et-bin/show man?prfPDBSTR release noteshttp:/www.genome.ad.jp/dbget-bin/show man?pdbstrProsite release noteshttp:/www.genome.ad.jp/dbget-bin/show man?prositePDB release noteshttp:/www.genome.ad.jp/dbget-bin/show man?pdbKEGG release noteshttp:/www.genome.ad.jp/dbget-bin/show man?pathway核苷酸数据库GenBankh
45、ttp:/www.ncbi.nlm.nih.gov/dbEST http:/www.ncbi.nlm.nih.gov/dbEST/index.htmldbSTS http:/www.ncbi.nlm.nih.gov/dbSTS/index.htmldbGSS http:/www.ncbi.nlm.nih.gov/dbGSS/index.htmlGenome (NCBI)http:/www.ncbi.nlm.nih.gov/entrez/query.fcgi?db=GenomedbSNP http:/www.ncbi.nlm.nih.gov/SNP/HTGShttp:/www.ncbi.nlm.
46、nih.gov/HTGS/UniGenehttp:/www.ncbi.nlm.nih.gov/UniGene/EMBL核苷酸数据库http:/www.ebi.ac.uk/emblGenome (EBI)http:/www.ebi.ac.uk/genomes/向EMBL数据库提交序列http:/www.ebi.ac.uk/embl/Submission/webin.htmlDDBJhttp:/www.ddbj.nig.ac.jp/Plant R gene databasehttp:/www.ncgr.org/rgenes启动子数据库Eukaryotic promoter database http:/www.epd.isb-sib.chhttp:/www.genome.ad.jp/dbget/dbget2.html转录因子数据库FRANSFAChttp:/tran