《中国地方鸡种核酸数据库建设与功能设计.ppt》由会员分享,可在线阅读,更多相关《中国地方鸡种核酸数据库建设与功能设计.ppt(25页珍藏版)》请在三一办公上搜索。
1、中国地方鸡种核酸数据库建设与功能设计,汇报人:白云峰 副研究员 单 位:江苏省农业科学院,拒识措努肆替沁蔽磅屋尚怜衰涯莲迄藤幌廉氨键嘛买榆帆粉皋醉感纽职俗中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,汇 报 内 容,研究意义与目的中国地方鸡种核酸序列数据库初步建设数据获取数据库构成数据分析系统功能设计核酸序列特征一般分析核酸序列相似性搜索系统发生分析系统演示未来展望,翔薄疽掺邑嫁必遂洞肪争挺仁击屈腐惑变洋哼布污娇雄焰渔峙神秉盔宫货中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,研 究 意 义,中国是世界上生物多样性最丰富国家之一,地方鸡种是
2、我国具有战略意义的独特资源。亟需构建该领域拥有自身特色和自主知识产权的,与国际主流生物信息数据库接轨的专业二级数据库。当前,农业生物信息数据库主要集中在英、美、日等发达国家。我国大多生物学数据库只能提供镜像和索引服务,无自主知识产权,独立开发并能提供丰富资源和工具的生物信息数据库平台仍很缺乏。目前国内关于医疗和制药领域的生物信息数据库较多,而高质量的农业生物信息数据库数量较少,尚无我国专门化的地方鸡种生物信息数据库系统。生物信息数据库分布分散且格式不统一,将独立的、分散的农业生物信息数据库信息整合,使农业生物信息数据库集成化和标准化。,堪堪披只忠馆帆探冗仇惩肤共梭美砾嘴贡辙豺腺鲜叠述酣贾笔絮滋
3、章憨羡中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,中国地方鸡种核酸序列数据库初步建设,数据获取方面基于Agent智能代理本地化数据获取程序;863合作单位数据提供与数据校验;数据分析数据完整性分析数据特征特征值扫描地方鸡种数据筛选,唇衫矣军嵌餐随头年热梆哉崩匪蹄轻邪斤嚼变汤诅玖阜歪严旅枪咯加仅刽中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,中国地方鸡种核酸序列数据库初步建设,数据标准化基于XML中国地方鸡种核酸序列元数据模型;自定义中国地方鸡种数据结构;数据转导与国际主流数据文件格式的兼容完成中国地方鸡种核酸序列数据库结构设计,膳恃厉颖
4、王酸耀粪贷踏药甘僻粮毙宽畅洱算杨线沃琐炕咱滥反霸洞樟幂捣中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,系 统 功 能 设 计,目标序列分析(以白银耳鸡1条序列AF128321作为本系统分析处理结果示例)功能设计3个层次:序列组成统计特征分析;本地化序列相似性搜索系统发生分析,朋乳执着掉撼捷无石酒场润操形挝疆囊膘价解散咕诸敢粱士荤狄哄搪肯赊中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,核酸序列组成统计特征分析,密码子计数核苷酸统计转换成互补序列互补统计核苷酸组成统计作图二聚体统计密码子使用偏性CpG岛短序列匹配绘制热红外分布图识别开发阅读框
5、ORFs翻译成对应氨基酸序列,奴隧赛睛艳围谓愿炕毕校验垦抛渣划控巷灯酝遮密拽嘻兴肢庐蜒乎俩灵雕中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,待分析序列,ttgttctcaactacgggaacaattttattttttaacctaactcccctactaagtgtaccccccctttcccccccagggggggtatactatgcataatcgtgcatacatttatataccacatatattatggtaccggtaatatatactatatatgtactaaacccattatatgtatacgggcattaatctatattccacatttctcccaat
6、gtccattctatgcatgatccaagacatactcattcaccctccccatagacagttctaaaccactatcaagccacctaactatgaatggttacaggacataaatctcactctcatgctctccccctaacaagtcacctaactatgaatggttacaggacatacatttaactaccatgttctaacccatttggttatgctcgccgtatcagatggatttattgatcgtccacctcacgagagatcagcaacccctgcctgtaatgtacttcatgaccagtctcaggcccattctttccccct
7、acacccctcgccctacttgccttccaccg,沮吮抹待咀瞥拇辖沃咸安朔凸聘诛卑螺幻控龄近腕禽爪喘津总寻蕴凉鸟坝中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,密码子计数结果,AAA:1 AAC:5 AAG:0 AAT:2 ACA:7 ACC:3 ACG:1 ACT:6 AGA:2 AGC:1 AGG:1 AGT:2 ATA:4 ATC:2 ATG:4 ATT:5 CAA:1 CAC:5 CAG:0 CAT:8 CCA:8 CCC:10 CCG:1 CCT:1 CGA:1 CGC:1 CGG:0 CGT:1 CTA:10 CTC:2 CTG:1 CTT:2
8、 GAA:0 GAC:0 GAG:1 GAT:1 GCA:1 GCC:3 GCG:0 GCT:2 GGA:2 GGC:1 GGG:3 GGT:2 GTA:6 GTC:2 GTG:0 GTT:2 TAA:5 TAC:4 TAG:1 TAT:9 TCA:5 TCC:3 TCG:2 TCT:6 TGA:3 TGC:2 TGG:1 TGT:2 TTA:3 TTC:4 TTG:1 TTT:4,牌腕杖瞻郸搐另瑟貉叼冒鹅汐流侗赶值讲垣碘副网祈酮锌住瘫蹦锅稠症谤中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,密码子使用偏性,由于密码子的简并性,每个氨基酸至少对应1种密码子,最多有6种
9、对应的密码子。不同物种、不同生物体的基因密码子使用存在着很大的差异。各种生物体似乎更偏爱使用某些同义三联密码子(即编码相同氨基酸的密码子)。高表达的基因密码子的使用偏性一般比较大。这些偏好可能与两个原因有关:一是避免使用类似终止密码子的密码子;二是这些偏好能够有效地翻译密码子,因为这些密码子对应于生物体中非常丰富的tRNA。真实的外显子一般能反映出这些偏好,而随机选择的三联体序列却不能。,衍扯锰矾渴煽练过苛达反侮符贮翱滩峨橱托攘碉然陪政霜鳞员屋壹币牡郸中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,密码子使用偏性,研究结果表明,基因密码子的使用也与基因编码的蛋白的结构
10、和功能有关。mRNA中的稀有密码子的使用与蛋白质结构域的连接区和规则二级结构单元的连接区有关,翻译速率在连接区会降低,说明蛋白质折叠方式与mRNA序列之间存在一定的相关性。研究结果还表明,蛋白质的三级结构与密码子使用概率有密切的关系,通过对密码子的聚类分析,可以将具有不同三级结构蛋白质的编码基因分成不同的类,而具有相似三级结构蛋白的编码基因则大致聚在同一类中。进一步的研究发现,在不同物种中,类型相同的基因具有相近的同义密码子使用偏性,对于同一类型的基因由物种引起的同义密码子使用偏性的差异较小。,趟盾悼刽顽寺窍禾包击营弧彼彩陋吟苏屁凭衙矣盈虑裁弊囊盏钝动氢红淋中国地方鸡种核酸数据库建设与功能设计
11、中国地方鸡种核酸数据库建设与功能设计,绘制热红外分布图,躁剩詹遭跌擦腑跑库莉强姿岿郧彤处垂光危琉薯俊俄坤甥贾恐弊媳绳盒筑中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,CpG岛分析,在人类基因组中有一半左右的CpG island 与已知管家基因(housekeeping gene)有关联;CpG island很少出现在不含基因的区域和那些发生多次突变的基因中;CpG与一种重要的化学修饰甲基化密切相关。,小郭宇用赫逢政甲膨祥延视高宰渴前亚矾仆峨躇碱竟孰姚缕痛都姐痰越组中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,短序列匹配,在待分析序列中查找
12、特征短片段,如TATA BoxTATA Box,CAAT Box,终止子等,祝昭邪哎听缩葛尔矮汤装淋刽序矽雨中蚜辑走踩绥墓蚕喷胳禽秧蔷圾江婚中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,识别开放阅读框ORFs,开放阅读框(Open Reading Frame:ORF)是基因序列的一部分,包含一段可以编码蛋白的碱基序列,不能被终止子打断。开读框架的预测常与第一个ATG和终止密码子的确定相关。系统以原核生物和真核生物两种模式识别待分析序列的ORFs,傣珍邦审耽恢免袋锌舰艇房剩巍谣诀调哨搅勉纯手竟紧芳矗虾保腾饼曹皑中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库
13、建设与功能设计,中国地方鸡种基因序列比对与相似性搜索,意义与目的:通过搜索序列数据库,找到与新序列同源的已知序列,并根据同源性推测未知序列的生物学功能;对于DNA序列,同源搜索还有助于确定编码区域,确定基因;实现方法:中国地方鸡种核酸序列库+家禽基因组序列库的比对搜索;设定全局最优比对算法+局部最优比对算法2种策略,事林残商衍郧磊智蓑姓绽雕于愉夹赏钾寓谚厌瘦钒拒瑟受淮兴悼钢耸萨毒中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,中国地方鸡种系统发生分析(开发中),由于国内学者对国内地方鸡种mtDNA研究较多,数据库收集到数据较丰富特点。构建地方鸡种mtDNA系统发生专门
14、化分析组件。线粒体DNA非常适合于系统发生分析,因为线粒体DNA从母体完全传到子代,不与父代DNA重组。线粒体DNA具有易分离、进化速度快、母系遗传、缺乏重组和无内含子等特点。使线粒体DNA成为分子系统发育学研究的一类重要的分子标记。mtDNA的控制区即D-loop区为非编码区,不编码蛋白质线粒体DNA中,受到选择压力较小,因此积累了较多的突变,如碱基替换、插入、缺失,以及众多的串联重复序列等。系统采用非加权分组平均法(UPGMA,unweighted pair group method with arithmetic means)构建进化树,浊稠贴趋爆约蝶酶祖策干蜀仑瞎称充皿儿彭冷裁封硼饭呈
15、令蚁持味精毒衍中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,系统功能实现的关键技术,Matlab Bioinformatic Toolbox 引用Imports SystemImports System.ReflectionImports MathWorks.MATLAB.NET.UtilityImports MathWorks.MATLAB.NET.ArraysImports ComponentNameM文件编写与调试MATLAB与.NET数据类型转换,辈泄险瘫苛锐蝴假酪奋指隐馅毒禄奇脑事摈靡突烈痈柬早誊档遂巾帽科酞中国地方鸡种核酸数据库建设与功能设计中国地方鸡种
16、核酸数据库建设与功能设计,M文件编程示例,function HeatMap(mitochondria)for frame=1:3 figure(color,1 1 1)subplot(2,1,1);codoncount(mitochondria,frame,frame,figure,true);title(sprintf(阅读框%d密码子,frame);subplot(2,1,2);codoncount(mitochondria,reverse,true,frame,frame,figure,true);title(sprintf(阅读框%d反义密码子,frame);end,象姐见仆边余锌匆悸
17、裤气燃荫暗两盗屏威再您贩峭健住帖婴注硼护阉樟辨中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,调用MATLAB生物信息学函数,旁刺谦肉阉睦粳竹尧耐联皆絮舔桅帮佛贞佑雷奖吩贸茂昌趋阎既氛舍胯针中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,Matlab与.NET数据类型转换,引自苏金明等Matlab高级编程北京,电子工业出版社,2008,拎敌凡挚蛆蹈造槽乐祥漏佰乓抢渔纷蛊搭饼拄肮紧力呐模活职悸室宗溶榴中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,数据类型转换实例,%利用MatLab构建不同地方鸡种亲缘关系进化树;%定
18、义数组二维data,存储鸡种名称和mtDNA序列;function phylogenyanalysis(data,m)%data=白银耳鸡 AF128320;灵昆鸡 AF128330;寿光鸡 AF512058;丝羽乌骨鸡 AF512060;茶花鸡 AF512078;%for ind=1:5%seqs(ind).Header=dataind,1;%seqs(ind).Sequence=getgenbank(dataind,2,sequenceonly,true);%end%进化距离运算;UPGMA,非加权分组平均法(unweighted pair group method with arithm
19、etic means)Jukes-Cantor,for ind=1:m seqs(ind).Header=dataind,1;seqs(ind).Sequence=dataind,2;enddistances=seqpdist(seqs,Method,Jukes-Cantor,Alphabet,DNA);tree=seqlinkage(distances,UPGMA,seqs);%画出进化树;h=plot(tree,orient,bottom);set(findobj(gca,Type,line,Color,0 10 1),Color,red,LineWidth,2);ylabel(进化距离)
20、title(中国地方鸡种进化关系树)set(h.terminalNodeLabels,Rotation,-45)saveas(gca,C:PhylogenyTree.jpg)%close(all,hidden),驼把硕魄泅纬维诽俺旭旅颧崇兑翱慌型凋炳嘶买甫垃窃窖汕凶滥怔六播篮中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,讨 论,在Windows操作系统下运行具有更广泛的适应性;采用组件技术开发,具有更强适应性、可移植性和复用性;根据中国地方鸡种定制分析组件库,针对性强;构建了中国地方鸡种分子数据存储、共享和分析平台,先进性和创新性强。,擅净挚愧糜雷嫡竖囤肺梭品查元歧钙蛮隶尉脾蹿曰俄古晃咸吟晴檄复烤络中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,展 望,健创第佛北卡旨哺庞效昼庞距痕趁汝栋瞻耍横机拎判闲阐蜀呐献伦阉局瓦中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,瀑针仅蒲含稀简嘴隅骗惕鸿棵双俄戒歌殆恰懂喇桥入嘿渠期佰朱桨例甘教中国地方鸡种核酸数据库建设与功能设计中国地方鸡种核酸数据库建设与功能设计,