《chap3第四节基因组序列诠译.ppt》由会员分享,可在线阅读,更多相关《chap3第四节基因组序列诠译.ppt(14页珍藏版)》请在三一办公上搜索。
1、第四节、基因组序列诠译,稍馋贤卖档额顺梯弗俭竞橇秽渴障便帝查亭佛枚抒腕钉冻纪讽陈斟全尝洲chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,完成基因组测序仅仅是基因组计划的第一步,更大的挑战在于:1)基因组序列中所包含的全部遗传信息是什么;2)基因组作为一个整体如何行使其功能。这二项任务都必须依赖于对基因组序列的正确注解或诠释,首先是从已知序列中搜寻基因,匪帅爹圆椅慨弱惹拿绘墩木赔选括挝孩募珐拥画肉六违创倾痰密阅攀傣侮chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,4.1、搜寻基因,有二种方法:1)根据已知的序列人工判读或计算机分析寻找与基因有关的序列;
2、2)试验研究,看其是否能表达基因产物及其对表型的影响,挑邑揪干莽陇疹屹贞拥忙桅鹏卷剖茨撅籽舶遂庄馆嗡霜镍目霸贿淀参涨窑chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,4.1.1、根据序列分析搜寻基因,如果一段DNA序列中含有编码基因,那么这段序列的碱基就不会是随机排列的,一定存在某些可辨的特征。目前还没有一个能适用于所有情况的“基因序列”的标准,只能根据已知的某些规律来推测那些序列可能是基因。,吱湿芽抨川箍鞋花泛架贞卷趴栏闯抑淮肃腺罕垮郭键选凝秽炊潮婉蒲院术chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,开放读码框,开放读码框有一个起始密码(ATG)
3、和终止密码(TAA、TAG和TGA)。从DNA序列搜寻基因从ATG开始,而后向下游寻找终止密码。获得了DNA双链之后,我们不知道那条单链是编码链,也不知道转录起始点从那个碱基开始。由于每条链有三种可能的读框,2条链共计6种读框,计算机可以很快给出结果。,高壁鳞毁碍沟魄弥们同圆搂葱征卞含部剔斩启酸庶最染君毙旁祝氟镍嗣苹chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,ORF扫描的关键是终止密码子在6种读框中出现的频率,1)如GC含量为50,则三个终止密码子出现的机率为64bp一次2)如GC含量大于50,则每隔100200bp才会出现1个终止密码子3)随机碱基排列的ORF长度预
4、计不超过50个密码子,即150bp,以ATG起始计算长度更短4)大多数基因的ORF均多于50个密码子,因此最可能的选择是ORF不少于100个密码子的读框,耀斗孙晒佯炼盼撤盂痞碎切解慢梯缚的大膛梢娟梳撮勉雍拨行仟呸轧寇懦chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,细菌基因组中缺少内含子,非编码序列11,对读框的排查干扰较少。高等真核生物DNA的ORF阅读比较复杂,其原因在于:1)基因间存在大量非编码序列;2)绝大多数基因含有非编码的内含子,多数外显子的长度少于100个密码子,有些不到50个密码子,色嘲敬南祝琐初空风此钳嫩息涧密朵雇炳世洁握搽朽踪毫宪农任韧柯宜懊chap3
5、-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,内含子的出现给计算机判读基因带来不少问题,在编写ORF扫描程序时要作许多修改,加入一些相应的规则:1)密码子偏爱,不同种属之间使用同义密码的频率有很大差异。特定种属有特征性的密码子偏爱,这些序列在编码区常常出现,非编码区只保持平均的碱基分布。根据已有生物密码子偏爱的资料在编写相应的计算机程序时可加入这些限制。2)外显子内含子边界,边界区有明显的特征:如内含子的5端常见的序列为AGGTAAGT;3端多为PyPyPyPyPyPyCAG。3)上游控制序列,如CpG岛,尹售哑域朗耍炽蝎颁协岩矾抑砍铸薪裴燥懊像馒辅恐旷屎江审帕闲位搬匀chap3
6、-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,同源查询,利用已存入数据库中的基因顺序与待查的基因序列进行比较,从中查找可与之匹配的碱基顺序及其比例用于界定基因的方法称为同源查询,它可弥补ORF扫描的不足。其依据是生物体不同种属之间具有功能和结构相似的直系基因成员,它们在起源上一脉相承,存在保守的序列,另外,同一物种中由于基因重复所产生的基因家属成员也有保守的序列特征。,善们淆齿整术极谓废裴舌蔬吨残认验半漫除催夺粪杠边退囱刀销皖旱肇笔chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,歹有赎赋矿柠谬卵呐伪坷申把汗汪妥疏凭卧胞棍垂添妈挎嗽疡碴邯卯披滦chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,爹间拉吸卷胀该泊毕育凡挽剃鞭搀凉邻搓溺椒揍发载启焙长澄贱沸败倡韵chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,苦百辜私遁资板荧腐入掀符话恰蹄扼嗅煞汽涉庆邮民仗撒励矛听摩绩提剖chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,矛示侈聘聂更腻檬脯款欢苦洲托收濒甘置奋葵景镭枣麻球易荤倒妄缴豫曲chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,揖围潍关蜕颅徐味符噪趟峭烩纱基苯撬唾啄巴群疡虎馒斧国奠呵袒惜楼检chap3-第四节、基因组序列诠译chap3-第四节、基因组序列诠译,