GO,KEGG, Interproscan, COG的相关知识.docx

上传人:牧羊曲112 文档编号:3157657 上传时间:2023-03-11 格式:DOCX 页数:2 大小:37.55KB
返回 下载 相关 举报
GO,KEGG, Interproscan, COG的相关知识.docx_第1页
第1页 / 共2页
GO,KEGG, Interproscan, COG的相关知识.docx_第2页
第2页 / 共2页
亲,该文档总共2页,全部预览完了,如果喜欢就下载吧!
资源描述

《GO,KEGG, Interproscan, COG的相关知识.docx》由会员分享,可在线阅读,更多相关《GO,KEGG, Interproscan, COG的相关知识.docx(2页珍藏版)》请在三一办公上搜索。

1、GO,KEGG, Interproscan, COG的相关知识GO,KEGG, Interproscan, COG的相关知识 NR库作为NCBI主要数据库之一其库容较大,通常情况下能够注释到的基因较多,但同时其中未验证的信息过多,且很多基因功能描述模糊,很多时候会影响到基因功能的具体辨识,因此需要结合其他数据注释结果进行确定。另外,NR库因为在建立之初就包含有物种概念,因此其注释结果中均含有基因的物种来源信息,通过该类信息能够在某种程度上确定所测菌株的物种归属。 GO数据库: 注释来源于Interpro数据库中的quick GO数据库,因此,该数据库结果产出会包含与Interpro数据库注释的

2、信息,以x.iprscan.gene.ipr结尾。Quick GO数据库注释的结果以x.iprscan.go结尾,因为GO数据库三大类之间互有重叠,所以对于同时注释上多个GO分类的基因,可以通过不同大类间的信息来确定其功能。 KEGG数据库: 最优的地方在于拥有描绘已知通路的代谢通路图。其应用举例如下:比如我们关注丙氨酸代谢通路相关基因,这时我们可以通过关键字在x. kegg.list.anno中寻找含有丙氨酸(Alanine)的注释结果。 Interproscan : 是EBI开发的一个继承了蛋白质结构域和功能位点的数据库,其中吧SWISS-PROT,TrEMBL,PROTSITE,PRIN

3、TS,PFAM,ProDom等数据库提供的蛋白序列中的各种局与模式,如结构,motif等信息统一起来,提供了一个较为全面的分析工具。 Swiss-Prot较其他库的优点在于其结果通过了人工验证,可信度较高。 COG: 即Clusters of Orthologous Groups of proteins。构成每个COG的蛋白都是被假定为来自于一个祖先蛋白,并且因此或者是orthologs或是paralogs。Orthologs是指来自于不同物种的由垂直家系进化而来的蛋白,并且典型的保留与原始蛋白有相同的功能。Paralogs是那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的

4、功能。请参考文献获得更多的信息。通过观看其主页和说明文档,可以理解为COG是NCBI的数据库。COG的中文释义即“同源蛋白簇”。COG分为两类,一类是原核生物的,另一类是真核生物。原核生物的一般称为COG数据库;真核生物的一般称为KOG数据库。 COG注释作用:1. 通过已知蛋白对未知序列进行功能注释; 2. 通过查看指定的COG编号对应的protein数目,存在及缺失,从而能推导特定的代谢途径是否存在; 3. 每个COG编号是一类蛋白,将query序列和比对上的COG编号的proteins进行多序列比对,能确定保守位点,分析其进化关系。在具有功能分类的主要数据库(KEGG,GO,COG)中,cog分类的详细程度仅次于KEGG,这将更方便我们确定某个基因的功能。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号