《我国高校向GenBank递交序列数据状况.ppt》由会员分享,可在线阅读,更多相关《我国高校向GenBank递交序列数据状况.ppt(13页珍藏版)》请在三一办公上搜索。
1、我国高校向GenBank递交序列数据状况,浙江大学生物信息学研究所樊龙江 王建斌2002年1月22日,说明,数据来源:GenBank(NCBI)统计截止日期:2001年12月31日,本文统计了截止1996年12月31日和2001年12月31日由我国及高校直接递交GenBank国际公共数据库的DNA和基因组序列记录情况。具体统计说明见文后。,中国高校记录总数和所占比例情况(一),中国高校记录总数和所占比例情况(二),递交记录情况(不包括台湾、香港)最早提交记录前三位的大学:1989.09.25(复旦大学)1992.01.02(北京大学)1993.10.13(中山大学)提交序列最长的前三大学(超过
2、100000bp):209216bp(上海第二医科大学)139342bp(中山大学)130760bp(浙江大学),最早提交的序列记录,LOCUS AC23SRRN 141 bp mRNA linear BCT 19-MAR-1998 DEFINITION Actinomycete(4153)23S ribosomal RNA.ACCESSION Z26937 JOURNAL Submitted(13-OCT-1993)Qu L.,Zhongshan University,Biotechnology Research Centre,Guangzhou,Guangdong,Peoples Repu
3、blic of China,510275,LOCUS BSPGIA 1822 bp DNA BCT 20-APR-1995DEFINITION Bacillus stearothermophilus pgiA gene for phosphoglucoisomerase isoenzyme A(EC 5.3.1.9).ACCESSION X16639JOURNAL Submitted(25-SEP-1989)Tao W.,Institute of Genetics,Fudan University,Shanghai,Peoples Republic of China,LOCUS X63771
4、807 bp RNA VRL 14-JAN-1992DEFINITION Soybean Mosaic Virus gene for coat protein.ACCESSION X63771JOURNAL Submitted(02-JAN-1992)R.Chu,National Lab.of Plant Genetic Engin.,Biology Department,Peking University,Beijing,100871,China,序列最长的三个记录,LOCUS AF325155 139342 bp DNA circular VRL 11-SEP-2001DEFINITION
5、 Spodoptera litura nucleopolyhedrovirus strain G2,complete genome.ACCESSION AF325155JOURNAL Submitted(01-DEC-2000)State Key Laboratory for Biocontrol&Institute of Entomology,Zhongshan University,135 Xingang Road,Guangzhou,Guangzhou 510275,China,LOCUS AF060568 201239 bp DNA PRI 29-SEP-1999DEFINITION
6、Homo sapiens promyelocytic leukemia zinc finger protein(PLZF)gene,complete cds.ACCESSION AF060568JOURNAL Submitted(20-APR-1998)Shanghai Institute of Hematology,Ruijin Hospital,Shanghai Second Medical University,197,Ruijin Road II,Shanghai 200025,P.R.China,LOCUS AF303045 130760 bp DNA circular VRL 31
7、-AUG-2001DEFINITION Helicoverpa armigera nuclear polyhedrosis virus,complete genome.ACCESSION AF303045JOURNAL Submitted(07-SEP-2000)Institute of Applied Entomology,Zhejiang University,Kaixuan Road 268,Hangzhou,Zhejiang 310029,China,最早递交核苷酸序列记录的大学和递交的数量(不包括台湾、香港),递交记录总数列前十名的大学(不包括台湾、香港),各省(市)记录总数和大学记
8、录数(不包括台湾、香港),各省(市)大学记录数比较,基因组记录情况(不包括台湾、香港),本文统计了截止1996年12月31日和2001年12月31日由我国大学和其他研究机构直接递交GenBank国际公共数据库的DNA和基因组序列数量,有关统计方法说明如下:利用NCBI提供的ENTREZ搜索系统进行初步的检索和统计:(1)先将只要含有中国、台湾、香港和澳门字样的非EST记录均下载:(CHINA OR TAIWAN OR“HONG KONG”)NOT gbdiv estProperties Limits:Modification Date to 2001/12/31,共获得24701个记录(CHI
9、NA OR TAIWAN OR“HONG KONG”)NOT gbdiv estProperties Limits:Modification Date to 1996/12/31,共获得915个记录自编程序并对上述记录分别在记录的“JOURNAL”字段后(“SUBMMIED:.”)进行中国大陆、台湾和香港数据库记录的统计和国内一些主要城市及高校数据库记录的统计等。(2)EST记录数据是通过ENTREZ 检索GenBank数据库gbdiv est子库获得的。(3)用于检索的各高校英文名称均通过各高校的主页上查找得来,通过我国教育部网站获得了我国所有院校合并的信息。检索中对我国主要的高校均进行了统
10、计,然后进行排名。(4)除了特别说明外,文中的记录均指核苷酸序列记录。其他几点说明:(1)如果递交给GenBank数据库的记录中没有“China”、“Taiwan”、“Hong Kong”和“Macao”等字样,而仅注明“PROC”、“PRC”等则不包括在本研究统计范围;(2)在进行高校检索时,仅包括记录中直接出现“University”一词的记录。本研究的原则是不对记录进行任何修订,如果记录中“University”一词输入错误或没有写明具体大学(而实际是由某一大学完成的),将均被排除在外。以上两种情况在本研究的记录中均存在,但仅涉及极少数记录;(3)对中国大陆的检索策略是在有“China”字样的记录中剔除含有“Taiwan”、“Hong Kong”字样的记录来实现的。统计中注意了台湾和香港递交的记录中对“China”一词使用不规范的一些情况。,统计方法说明,