《核酸序列分析》PPT课件.ppt

上传人:小飞机 文档编号:5533430 上传时间:2023-07-19 格式:PPT 页数:138 大小:9.16MB
返回 下载 相关 举报
《核酸序列分析》PPT课件.ppt_第1页
第1页 / 共138页
《核酸序列分析》PPT课件.ppt_第2页
第2页 / 共138页
《核酸序列分析》PPT课件.ppt_第3页
第3页 / 共138页
《核酸序列分析》PPT课件.ppt_第4页
第4页 / 共138页
《核酸序列分析》PPT课件.ppt_第5页
第5页 / 共138页
点击查看更多>>
资源描述

《《核酸序列分析》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《核酸序列分析》PPT课件.ppt(138页珍藏版)》请在三一办公上搜索。

1、核酸序列分析,核酸序列分析是生物信息学应用中的一个重要方面,一般包括:DNA碱基组成、密码子的偏向、内部重复序列、特殊位点(限制性位点及转录、翻译和表达调控相关信号)、编码区分析、一二级结构等。,第一节 核酸序列的检索第二节 核酸序列的基本分析第三节 核酸序列的电子延伸第四节 基因的电子表达、定位分析第五节 基因识别第六节 核酸序列的提交,一、Entrez检索系统()二、SRS 检索系统(http:/srs.ebi.ac.uk),第一节 核酸序列的检索,三、DBGET/LinkDB检索,通过软件,如BioEdit()、DNAMAN(http:/,第二节 核酸序列的基本分析,一、分子质量、碱基组

2、成、碱基分布,二、序列变换,三、限制性内切酶分析,REBASE(Restriction Enzyme Database)限制酶数据库(http:/),1.测序峰图的查看 澳大利亚Conor McCarthy开发的Chromas.exe程序,且BioEdit软件和DNAMAN软件都可以查看。,四、克隆测序的分析,2.核酸测序载体序列的识别与去除,测序克隆被宿主菌核酸序列污染,或目的克隆来自于宿主菌,可通过Blastn直接对GenBank或EMBL数据库进行相似性分析进行判断。,RepBase重复序列数据库,五、重复序列分析,cDNA文库,EST,较长cDNA,全长cDNA,第三节 核酸序列的电子

3、延伸,1.5Kb,500bp,500bp,500bp,500bp,基本过程:1.通过Blast搜索GenBank的EST数据库,选择与待分析的序列具有较高同源性的EST匹配序列;2.将匹配序列和待分析的序列装配产生新序列;3.以新序列作为待分析的序列重复上述过程,直至没有新的匹配序列,从而生成最后的新序列。,第四节 基因的表达、定位分析,原理:将待分析序列与EST数据库进行序列对库检索,然后用与待分析核酸序列具有高同源性的EST序列所对应的组织来源进行推断而得到该基因的组织表达谱。,一、基因的电子表达图谱分析,基本步骤:1.通过Blast搜索GenBank的EST数据库,选择与待分析的序列具有

4、最高同源性比分的EST序列;2.从NCBI的UniGene数据库进行检索,得到相应的UniGene号;3.可通过参与形成UniGene Cluster的序列的组织/细胞来源间接反映待分析序列在哪种组织中表达。,二、基因的电子定位分析,通过序列标签位点(STS)定位通过UniGene/RH技术定位利用基因组序列定位,利用NCBI的电子PCR资源(),1.利用STS数据库进行定位,步 骤:,获得待分析序列对应的UniGene编号,而大部分UniGene序列已经具有明确的定位信息,可以得到待分析序列的基因定位。,2.利用UniGene数据库进行定位,将待分析序列输入基因组数据库进行同源性检索;得到确

5、定的基因组序列后点击“Genome view”观察基因组结构;点击红色标记所指示的染色体列表中选择对应的染色体及区域;浏览器中将显示详细的基因定位结果。,3.利用基因组序列进行定位,BLAST搜索数据库进行基因定位,通过基因组数据库定位-NCBI基因组数据库,基因定位,拟南芥基因组数据库-基因定位,酵母基因组数据库-基因定位,步骤:获取目的序列;预测可能的编码区和非编码区;通过相关的数据以提高基因识别的准确性(数据库搜索);利用生物信息学资源分析序列的功能。,第五节 基因识别,策略:先寻找并去掉重复的和复杂性较性较低的序列,再寻找基因及相关调控区域。,exon,intro,exon,exon,

6、5,3,增强子,非翻译区,非翻译区,GC(-100),CAAT(-70),ATG,TATA(-30),TAA/TAG/TGA,帽位点(+1),终止位点,polyA,真核基因结构模式图,基因组外显子识别从基因组DNA序别中识别出完整的蛋白质编码序列,即外显子部分。外显子与内含子之间无绝对区分;同一基因不同发育时空,外显子组成不相同;假基因的存在降低预测的准确率。EST策略的基因鉴定电子克隆最主要的途径是从EST直接寻找新基因。确定目的EST,构建包含EST的重叠群,再进行ORF的判定及蛋白结构域等功能域的识别。,一、生物信息学识别基因的两种途径,编码区是由核糖体翻译成蛋白质的DNA序列 原核基因

7、:编码区是一段不包含终止子的连续序列。真核基因:编码区是由内含子隔开的若干个可读框架。,二、编码区的分析,终止密码子(TGA、TAA或TAG)数量较少;ORF达到一定的长度;密码子使用的偏好性,第3个碱基G/C出现的频率较高;与已知基因比较有序列相似性;与模板序列的模式相匹配可能指示功能性位点的位置。,编码区的统计特征:,转录起始点、核糖体结合位点、起始密码子、RNA剪接位点、终止密码子、poly(A)位点等。,编码区的一些信号:,分析与基因表达调控相关的信息、各种功能位点及基因转录调控元件。DNA序列上特殊的片段,是蛋白质因子作用的位点,是与基因转录、翻译有关的信号序列。通过模式识别及生物信

8、息软件分析。,三、非编码区的分析,启动子,启动子,转录区,终止子,外显子,内含子,基因的一般结构,TATA box,起始序列,(TATAT/AAT/A),(C/TC/TCAA/GA/G),转录因子结合区,CCAAT,GC,真核生物启动子30bp,TATA box80bp,CAAT box80bp110bp,GCCACACCC或GGGCCGGG,TATA盒使转录精确地起始CAAT盒和GC盒控制转录的起始频率,信号肽,第六节 核酸序列的提交,BankIt,BankIt是NCBI提供的一个在线提交序列的工具。由一系列表单,包括联络信息、发布要求、引用参考信息、序列来源信息、以及序列本身的信息等。用户

9、提交序列后,会从电子邮件收到自动生成的数据条目,Genbank的新序列编号,以及完成注释后的完整的数据记录。,用户还可以在BankIt页面下修改已经发布序列的信息。BankIt适合于独立测序工作者提交少量序列,而不适合大量序列的提交,也不适合提交很长的序列,EST序列和GSS序列也不用BankIt提交。,sequin,1.大量的序列提交可以由Sequin程序完成。2.能方便的编辑和处理复杂注释。3.提交来自系统进化、种群和突变研究的 序列,可以加入比对的数据。4.用于序列的分析,FASTA或ASN.1格式。,在线提交序列过程,1.登陆BankIt页面 2.填写表单内容3.确认表单内容4.等待电子邮件返回信息,RNA analysis,Thanks,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号