《emboss使用》PPT课件.ppt

上传人:小飞机 文档编号:5625644 上传时间:2023-08-03 格式:PPT 页数:29 大小:439.10KB
返回 下载 相关 举报
《emboss使用》PPT课件.ppt_第1页
第1页 / 共29页
《emboss使用》PPT课件.ppt_第2页
第2页 / 共29页
《emboss使用》PPT课件.ppt_第3页
第3页 / 共29页
《emboss使用》PPT课件.ppt_第4页
第4页 / 共29页
《emboss使用》PPT课件.ppt_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《《emboss使用》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《emboss使用》PPT课件.ppt(29页珍藏版)》请在三一办公上搜索。

1、EMBOSS软件包,方林2006-03-06,EMBOSS的特点,European Molecular Biology Open Source Suite软件的分类软件数量统一化输入输出扩展方便图形接口丰富,EMBOSS软件分类,比对序列编辑结果显示酶动力学分析序列特征分析核酸分析蛋白分析系统发育分析信息分析实用工具,EMBOSS的输入序列格式,abi,acedb,clustaln,codata,cbid,embl/em,experiment,fasta/pearson,gcg/gcg8,genbank/gb/ddbj,gff,hennig86,ig,jackknifer,jackknifer

2、non,mega,meganon,msf,nbrf,ncbi,nexus/paup,nexusnon/paupnon,pfam/stockholm,phylip/phylipnon,raw,selex,staden,strider,swissprot/swiss/sw,text,treecon,asis共32种,EMBOSS的输出文件格式,acedb,asn1,clustal/aln,codata,debug,embl/em,fasta/pearson,fitch,gcg/gcg8,genbank/gb,gff,hennig86,ig,jackknifer,jackknifernon,mega

3、,meganon,msf,nbrf,ncbi,nexus/paup,nexusnon/paupnon,phylip,phyplipnon,selex,staden,strider,swiss/sw,text/plain/raw,treecon共30种,USA统一序列地址,format:file:entrydbname:entrylist,几种常用的序列格式,FASTAEMBLGenBankSwissprotClustal ALN,FASTA格式,gi|8392890|ref|NM_000477.3|Homo sapiens albumin(ALB),mRNAAGCTTTTCTCTTCTGTCA

4、ACCCCACACGCCTTTGGCACAATGAAGTGGGTAACCTTTATTTCCCTTCTTTTTCTCTTTAGCTCGGCTTATTCCAGGGGTGTGTTTCGTCGAGATGCACACAAGAGTGAGGTTGCTCATCGGTTTAAAGATTTGGGAGAAGAAAATTTCAAAGCCTTGGTGTTGATTGCCTTTGCTCAGTATCTTCAGCAGTGTCCATTTGAAGATCATGTAAAATTAGTGAATGAAGTAACTGAATTTGCAAAAACATGTGTTGCTGATGAGTCAGCTGAAAATTGTGACAAATCACTTCATACCCTT

5、TTTGGAGACAAATTATGCACAGTTGCAACTCTTCGTGAAACCTATGGTGAAATGGCTGACTGCTGTGCAAAACAAGAACCTGAGAGAAATGAATGCTTCTTGCAACACAAAGATGACAACCCAAACCTCCCCCGATTGGTGAGACCAGAGGTTGATGTGATGTGCACTGCTTTTCATGACAATGAAGAGACATTTTTGAAAAAATACTTATATGAAATTGCCAGAAGACATCCTTACTTTTATGCCCCGGAACTCCTTTTCTTTGCTAAAAGGTATAAAGCTGCTTTTACAGAATGTTGC

6、CAAGCTGCTGAT,EMBL格式,GenBank格式,Swissprot格式,Clust ALN,常用的一些EMBOSS程序,wossnametfmseqretrevseqtranseqgetorfcoderetbacktranseqpepstats,wossname,-search要找的关键字-outfilef输出结果到所给的文件-groups只输出程序所在的组的名字-alphabetic只输出程序名和简单的描述,而不显示程序所在组的名字-noemboss不要在EMBOSS主程序库中搜索-noembassay不要在EMBOSS的附加包中搜索-colon用冒号分隔程序所在的类和父类,er

7、estml Restriction site Maximum Likelihood methodfrestboot Bootstrapped restriction sites algorithmfrestdist Distance matrix from restriction sites or fragmentsfrestml Restriction site maximum Likelihood methodrecoder Remove restriction sites but maintain same translationremap Display sequence with r

8、estriction sites,translation etc.,tfm,tfm是另一个有用的程序,一般配合wossname使用用,它只能显示给定程序的帮助信息。但它显示的帮助信息较为详细,不像通过-help或-v那样只显示参数信息。用法:tfm options program,seqret,使用平率最高的一个程序序列的格式转换特征提取序列的拆分序列操作等,seqret主要参数,-feature 用序列的特征信息-firstonly 只输出第一条序列-sbegin1 n 从n位置开始截取序列-send1 n 截取到n位置-sreverse1 对核酸序列反向取补-sask1 提问截取序列的起始

9、,终止和是否反向取补-snucleotide1 只对核酸进行操作-sprotein1 只对蛋白进行操作-slower1 序列都表示成小写的形式-supper1 序列表示成大写的形式-sformat1 s 输入文件的格式-sdbname1 s 数据库名-sid1 s 序列名-ufo1 s 统一特征名-fformat1 s 特征的格式-fopenfile1 f 特征文件名-osformat2 s 输出文件格式-ossingle2 s 将序列分割成一条序列一个文件的形式-ofdirectory2 f 输出文件的目录-auto 关掉提示-stdout 输出到标准输出-filter 从标准输入读,输出到

10、标准输出,getorf,用于预测序列的开放阅读框常用参数-table 用于翻译的表密码子表-minsize n 最小的ORF-maxsize n 最大的ORF-nomethionine 起始密码子是否编码甲硫氨酸-circular 序列为环状的-noreverse 在或不在反链中预测ORF-flanking n 追加n长度的侧翼序列,revseq,用于对序列进行翻转和取补常用参数-noreverse 是否取反-nocomplement 是否取补,transeq,用于蛋白的翻译常用的参数-frame 翻译那几个相位,对于正链可以为1,2,3,对于反链,为-1,-2,-3-table 密码子表,可

11、以为上面的任何一个-regions 要翻译的范围,可以表示为:24-45,56-78 1:45,67=99;765.888 1,5,8,10,23,45,57,99 数字可以用任何非数字,非字母的符号表示。-trim 是否不显示结束密码子,缺省为*表示,transeq支持的密码子表,0(Standard)1(Standard(with alternative initiation codons)2(Vertebrate Mitochondrial)3(Yeast Mitochondrial)4(Mold,Protozoan,Coelenterate Mitochondrial and Myco

12、plasma/Spiroplasma)5(Invertebrate Mitochondrial)6(Ciliate Macronuclear and Dasycladacean)9(Echinoderm Mitochondrial)10(Euplotid Nuclear)11(Bacterial)12(Alternative Yeast Nuclear)13(Ascidian Mitochondrial)14(Flatworm Mitochondrial)15(Blepharisma Macronuclear)16(Chlorophycean Mitochondrial)21(Trematod

13、e Mitochondrial)22(Scenedesmus obliquus)23(Thraustochytrium Mitochondrial),coderet,用于提取序列的CDS,mRNA或蛋白序列常用的参数有:-nocds 不提取CDS序列-nomrna 不提取mRNA序列-notranslation 不提取translation序列,将蛋白反向翻译成核酸常用参数-cfile f密码子频率文件,格式如下#Codon AA Fraction Frequency NumberGCA A 0.088 10.828 28723GCC A 0.423 52.293 138720GCG A 0.

14、428 52.999 140592GCT A 0.062 7.615 20201TGC C 0.854 7.853 20832TGT C 0.146 1.344 3564GAC D 0.665 36.225 96097GAT D 0.335 18.259 48437GAA E 0.299 15.643 41497GAG E 0.701 36.750 97488TTC F 0.825 30.677 81378TTT F 0.175 6.529 17320GGA G 0.085 7.084 18792GGC G 0.700 58.228 154464GGG G 0.115 9.556 25350.,backtranseq,pepstats,计算蛋白的分子量氨基酸数氨基酸使用频率电荷等电点物理化学性质,pepstats常用参数和类似程序,常用参数:-notermini 是否包含蛋白的N和C端的电荷-aadata s 氨基酸分子量信息的文件,缺省下用标准的氨基酸分子量类似程序有:pepinfo,iep,charge和freak等,EMBOSS的用户接口,JembossEmnuEMBOSS-GUI,Jemboss,EMNU,EMBOSS-GUI,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号