核酸与蛋白质序列分析.ppt

上传人:小飞机 文档编号:6119395 上传时间:2023-09-26 格式:PPT 页数:37 大小:807.50KB
返回 下载 相关 举报
核酸与蛋白质序列分析.ppt_第1页
第1页 / 共37页
核酸与蛋白质序列分析.ppt_第2页
第2页 / 共37页
核酸与蛋白质序列分析.ppt_第3页
第3页 / 共37页
核酸与蛋白质序列分析.ppt_第4页
第4页 / 共37页
核酸与蛋白质序列分析.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《核酸与蛋白质序列分析.ppt》由会员分享,可在线阅读,更多相关《核酸与蛋白质序列分析.ppt(37页珍藏版)》请在三一办公上搜索。

1、2023/9/26,1,郑连友E-,吉林大学 药学院 基因工程教研室,生物信息学,2023/9/26,2,生物信息学,第六章、核酸和蛋白质序列分析,第六章、核酸和蛋白质序列分析,2023/9/26,3,生物信息学,第六章、核酸和蛋白质序列分析,第一节、核酸序列分析,三、DNA序列分析基础四、DNA序列分析方法,2023/9/26,4,生物信息学,第六章、核酸和蛋白质序列分析,三、DNA序列分析基础,1、DNA序列分析内容DNA序列分析 基因序列 基因表达调控信息寻找基因牵涉到两个方面的工作:识别与基因相关的特殊序列信息预测基因的编码区域结合两个方面的结果确定基因的位置和结构 基因表达调控信息隐

2、藏在基因的上游区域,在组成上具有一定的特征,可以通过序列分析识别这些特征。,2023/9/26,5,生物信息学,第六章、核酸和蛋白质序列分析,2、DNA序列功能位点 在DNA序列中,除了基因之外,还包含许多其它信息,这些信息大部分与核酸的结构特征相关联,通常决定了DNA与蛋白质或者DNA与RNA的相互作用。存放这些信息的DNA片段称为功能位点,如启动子(Promoter)、基因终止序列(Terminator sequence)、剪切位点(Splice site)等。,2023/9/26,6,生物信息学,第六章、核酸和蛋白质序列分析,功能位点(functional site)-与特定功能相关的位

3、点,是生物分子序列上的一个功能单元,或者是生物分子序列上一个较短的片段。功能位点又称为功能序列(functional sequence)、序列模式(motif)、信号(signal)等。核酸序列中的功能位点包括转录因子结合位点、转录剪切位点、翻译起始位点等。在蛋白质序列分析中,常使用序列模式这个名词,蛋白质的序列模式往往与蛋白质结构域或者作用部位有关。,2023/9/26,7,生物信息学,第六章、核酸和蛋白质序列分析,DNA序列功能位点示意图,2023/9/26,8,生物信息学,第六章、核酸和蛋白质序列分析,基因组序列中若干个相邻的功能位点组合形成功能区域(functional region)

4、。功能位点分析的任务-发现功能位点特征-识别功能位点,2023/9/26,9,生物信息学,第六章、核酸和蛋白质序列分析,利用共有序列搜索功能位点 共有序列(consensus)又称一致性片段共有序列是关于功能位点特征的描述,它描述了功能位点每个位置上核苷酸进化的保守性例如:NTATN 利用共有序列进行功能位点分析牵涉到两个方面的问题,如何构造共有序列如何利用共有序列在给定的核酸序列上搜索寻找功能位点,并计算所找到的功能位点的可靠性,2023/9/26,10,生物信息学,第六章、核酸和蛋白质序列分析,3、基因识别,基因识别是生物信息学领域里的一个重要研究内容 基因识别问题,在近几年受到广泛的重视

5、 当人类基因组研究进入一个系统测序阶段时,急需可靠自动的基因组序列翻译解释技术,以处理大量已测定的但未知功能或未经注释的DNA序列,2023/9/26,11,生物信息学,第六章、核酸和蛋白质序列分析,(1)原核基因识别 特点:长开放阅读框;高基因;简单的基因结构;原核基因组中的GC 含量高重点在于识别编码区域,2023/9/26,12,生物信息学,第六章、核酸和蛋白质序列分析,非翻译区域(untranslated regions,UTR)编码区域两端的DNA,有一部分被转录,但 是不被翻译,这一部分称为非翻译区域 5UTR-基因上游区域的非翻译区域 3UTR-基因下游区域的非翻译区域,2023

6、/9/26,13,生物信息学,第六章、核酸和蛋白质序列分析,对于任何给定的核酸序列(单链DNA或mRNA),根据密码子的起始位置,可以按照三种方式进行解释。例如,序列ATTCGATCGCAA(1)ATTCGATCGCAA(2)ATTCGATCGCAA(3)ATTCGATCGCAA 这三种阅读顺序称为阅读框(reading frames),2023/9/26,14,生物信息学,第六章、核酸和蛋白质序列分析,一个开放阅读框(ORF,open reading frame)是一个没有终止编码的密码子序列。原核基因识别任务的重点是识别开放阅读框,或者说识别长的编码区域。,2023/9/26,15,生物信

7、息学,第六章、核酸和蛋白质序列分析,基于基因密码子特性的识别方法 辨别编码区域与非编码区域的一种方法是检查 终止密码子的出现频率 终止密码子出现的期望次数为:每21个(64/3)密码子出现一次终止密码子,2023/9/26,16,生物信息学,第六章、核酸和蛋白质序列分析,基本思想:如果能够找到一个比较长的序列,其相应的密码子序列不含终止密码子,则这段序列可能就是编码区域。基本算法:扫描给定的DNA序列,在三个不同的阅读框中寻找较长的ORF。遇到终止密码子以后,回头寻找起始密码子。这种算法过于简单,不适合于处理短的ORF或者交叠的ORF。,2023/9/26,17,生物信息学,第六章、核酸和蛋白

8、质序列分析,真核基因远比原核基因复杂:一方面,真核基因的编码区域是非连续的,编码区域被分割为若干个小片段。另一方面,真核基因具有更加丰富的基因调控信息,这些信息主要分布在基因上游区域。,(2)真核基因识别问题,2023/9/26,18,生物信息学,第六章、核酸和蛋白质序列分析,真核基因结构示意图,真核基因远比原核基因复杂:一方面,真核基因的编码区域是非连续的,编码区域被分割为若干个小片段。另一方面,真核基因具有更加丰富的基因调控信息,这些信息主要分布在基因上游区域。,2023/9/26,19,生物信息学,第六章、核酸和蛋白质序列分析,真核基因识别基本思路 找出基因两端的功能区域:转录启动区;终

9、止区 在启动区下游位置寻找翻译起始密码子 识别转录剪切位点剪切给体位点剪切接受体位点,2023/9/26,20,生物信息学,第六章、核酸和蛋白质序列分析,真核基因识别的主要方法 从头算方法(或基于统计的方法)根据蛋白质编码基因的一般性质和特征进行识别,通过统计值区分外显子、内含子及基因间区域。基于同源序列比较的方法利用数据库中现有与基因有关的信息(如EST序列、蛋白质序列),通过同源比较,帮助发现新基因。,2023/9/26,21,生物信息学,第六章、核酸和蛋白质序列分析,四、DNA序列分析方法,2023/9/26,22,生物信息学,第六章、核酸和蛋白质序列分析,1、遮蔽重复序列,在进行任何真

10、核生物序列的基因辨识分析之前,最好把散布和简单的重复序列找出来并从序列中除去。虽然这些重复序列可能正好覆盖了由RNA聚合酶转录的部分区域,它们几乎不会覆盖启动子和外显子编码区。这样,这些重复序列的定位能为其它基因特征的定位提供重要的反面信息。重复序列还常常会搅乱其它分析,特别是在数据库搜索中。,2023/9/26,23,生物信息学,第六章、核酸和蛋白质序列分析,所用程序(1)CENSOR http:/censor/(2)Repeatmasker http:/,2023/9/26,24,生物信息学,第六章、核酸和蛋白质序列分析,2、开放阅读框分析(ORF),(1)(2)http:/(3)http

11、:/,2023/9/26,25,生物信息学,第六章、核酸和蛋白质序列分析,3、数据库搜索 TBLSTNhttp:/blast,2023/9/26,26,生物信息学,第六章、核酸和蛋白质序列分析,4、启动子分析,2023/9/26,27,生物信息学,第六章、核酸和蛋白质序列分析,(1)、启动子查询/,2023/9/26,28,生物信息学,第六章、核酸和蛋白质序列分析,(2)、启动子分析 http:/,2023/9/26,29,生物信息学,第六章、核酸和蛋白质序列分析,5、内含子剪接位点,2023/9/26,30,生物信息学,第六章、核酸和蛋白质序列分析,(1)GRAIL:,5、内含子剪接位点,2

12、023/9/26,31,生物信息学,第六章、核酸和蛋白质序列分析,(2)SIM4:,2023/9/26,32,生物信息学,第六章、核酸和蛋白质序列分析,6、CpG岛分析,CpG岛,是指哺乳动物基因启动子及其附近大量的CpG位点(CpG表示指C、G以磷酸基连接)。事实上基因组中60%90%的CpG 都被甲基化,未甲基化的CpG 成簇地组成CpG 岛,位于结构基因启动子的核心序列和转录起始点。有实验证明超甲基化阻遏转录的进行。,2023/9/26,33,生物信息学,第六章、核酸和蛋白质序列分析,CpG岛工具用来查找一条DNA序列中CpG岛,使用Gardiner-Garden and Frommer

13、(1987)描述的方法。用一个200bp的窗口移过序列,每次移一个碱基对,进行计算。CpG岛定义为Y值大于0.6并且GC含量大于50%的200bp序列区域。只有符合以上标准,才输入结果。CpG岛经常在脊椎动物基因的5区域发现,因此,这个程序可用来在基因组序列中查找潜在的基因。,2023/9/26,34,生物信息学,第六章、核酸和蛋白质序列分析,(1)WEBGENE的CpG分析,2023/9/26,35,生物信息学,第六章、核酸和蛋白质序列分析,(2)、EBI的CpGPLOT http:/,2023/9/26,36,生物信息学,第六章、核酸和蛋白质序列分析,7、终止信号分析http:/r.it/webgene/wwwHC polya.html,2023/9/26,37,生物信息学,第六章、核酸和蛋白质序列分析,8、基因定位分析,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号