生物信息学课程设计 贝叶斯算法编程实现.doc

上传人:仙人指路1688 文档编号:2389478 上传时间:2023-02-17 格式:DOC 页数:18 大小:293KB
返回 下载 相关 举报
生物信息学课程设计 贝叶斯算法编程实现.doc_第1页
第1页 / 共18页
生物信息学课程设计 贝叶斯算法编程实现.doc_第2页
第2页 / 共18页
生物信息学课程设计 贝叶斯算法编程实现.doc_第3页
第3页 / 共18页
生物信息学课程设计 贝叶斯算法编程实现.doc_第4页
第4页 / 共18页
生物信息学课程设计 贝叶斯算法编程实现.doc_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《生物信息学课程设计 贝叶斯算法编程实现.doc》由会员分享,可在线阅读,更多相关《生物信息学课程设计 贝叶斯算法编程实现.doc(18页珍藏版)》请在三一办公上搜索。

1、算法课程设计报告(算法编程实现类) 贝叶斯算法编程实现院 系 部 门: 重庆邮电大学 学 生 学 号: * 学 生 姓 名: * 指 导 教 师: * 生物信息学院制2013年5月第一部分 贝叶斯算法研究背景、特点与发展31.1 贝叶斯算法研究背景31.2 贝叶斯算法特点31.3 贝叶斯算法发展3第二部分 算法分析与程序流程图设计32.1、基于对问题的分析42.2、基于对问题的java算法分析42.2、程序流程图设计5第三部分 实现设计语言选择与算法编程实现53.1、java算法实现5第四部分 程序测试与结果分析104.1程序测试104.2结果分析11第五部分 总结与心得体会115.1总结与心

2、得体会11第六部分 参考文献126.1参考文献(2个)12第一部分 贝叶斯算法研究背景、特点与发展1.1 贝叶斯算法研究背景贝叶斯分类算法是统计学分类方法,它是一类利用概率统计知识进行分类的算法。在许多场合,朴素贝叶斯(Nave Bayes,NB)分类算法可以与决策树和神经网络分类算法相媲美,且方法简单、分类准确率高、速度快。由于贝叶斯定理假设一个属性值对给定类的影响独立于其它属性的值,而此假设在实际情况中经常是不成立的,因此其分类准确率可能会下降。为此,就出现了许多降低独立性假设的贝叶斯分类算法,如TAN(tree augmented Bayes network)算法。1.2 贝叶斯算法特点

3、和决策树模型相比,朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以 及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。 但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响。在属 性个数比较多或者属性之间相关性较大时,NBC模型的分类效率比不上决策树模型。而在属性相关性较小时,NBC模型的性能最为良好。1.3 贝叶斯算法发展贝叶斯分类理论有最初的朴素贝叶斯于EM算法,灰色关系继续发展为基于改进EM的朴素贝叶斯

4、分类理论。第二部分 算法分析与程序流程图设计2.1、基于对问题的分析对问题进行分析,设X是类标号未知的数据样本,设H为某种假的,如数据养本X属于某特定的类C。对与分类问题,希望确定P(H|X),即给定观测数据样本X,假定H成立的概率。贝叶斯定理给出了如下计算P(H|X)的简单有效的方法:P(H|X)=P(X|H)P(H)/P(X)其中P(H)称为先验概率,P(X|H)表示假设H成立时观查到X的概率。P(H|X)表示后验概率。每一个样本数据用一个n维特征向量X=x1,x2,x3,xn表示,分别描述具有n个属性A1,A1,An的样本的n个度量。假定有m个类C1,C2,Cm,给定一个未知数据样本X(

5、即没有类编号),分类器将预测X属性与最高后验概率的类。也就是说,朴素贝叶斯分类将未知样本分配给Ci(1=iP(Cj|X),j=1,2,m,j不等于i这样最大的P(Ci|X)对应的类Ci称为最大后验假定。由于P(X)对于所有类是常数,只需要P(X|Ci)P(Ci)最大即可。注意假设不是等概率的,那么类的先验概率可以用P(Ci)=si/s计算,其中si是类Ci的训练样本数,而s是训练样本总数。P(X|Ci)=2.2、基于对问题的java算法分析首先需要将所有的训练数据读入到ArrayListArrayList对象集合中去,其中每一条训练数据对应一个ArrayList对象集合。同理用readTest

6、Data()将测试元组读如ArrayList对象集合中去。下面就需要将ArrayListArrayList中的每一组训练元组按照类别属性分开,保存到MapString, ArrayListArrayList对象中去用三重for循环来计算测试元组中每一属性所在每一个类别中概率的之积,并返回最大积所对应的类别名称。2.2、程序流程图设计第三部分 实现设计语言选择与算法编程实现3.1、java算法实现package org.decimalcalculate;import java.math.BigDecimal;public class DecimalCalculate private static

7、 final int DEF_DIV_SCALE = 10;/ 这个类不能实例化private DecimalCalculate() public static double add(double v1, double v2) BigDecimal b1 = new BigDecimal(Double.toString(v1);BigDecimal b2 = new BigDecimal(Double.toString(v2);return b1.add(b2).doubleValue();public static double sub(double v1, double v2) BigDe

8、cimal b1 = new BigDecimal(Double.toString(v1);BigDecimal b2 = new BigDecimal(Double.toString(v2);return b1.subtract(b2).doubleValue();public static double mul(double v1, double v2) BigDecimal b1 = new BigDecimal(Double.toString(v1);BigDecimal b2 = new BigDecimal(Double.toString(v2);return b1.multipl

9、y(b2).doubleValue();public static double div(double v1, double v2) return div(v1, v2, DEF_DIV_SCALE);public static double div(double v1, double v2, int scale) if (scale 0) throw new IllegalArgumentException(The scale must be a positive integer or zero);BigDecimal b1 = new BigDecimal(Double.toString(

10、v1);BigDecimal b2 = new BigDecimal(Double.toString(v2);return b1.divide(b2, scale, BigDecimal.ROUND_HALF_UP).doubleValue();public static double round(double v, int scale) if (scale 0) throw new IllegalArgumentException(The scale must be a positive integer or zero);BigDecimal b = new BigDecimal(Doubl

11、e.toString(v);BigDecimal one = new BigDecimal(1);return b.divide(one, scale, BigDecimal.ROUND_HALF_UP).doubleValue();public static float convertsToFloat(double v) BigDecimal b = new BigDecimal(v);return b.floatValue();public static int convertsToInt(double v) BigDecimal b = new BigDecimal(v);return

12、b.intValue();public static long convertsToLong(double v) BigDecimal b = new BigDecimal(v);return b.longValue();public static double returnMax(double v1, double v2) BigDecimal b1 = new BigDecimal(v1);BigDecimal b2 = new BigDecimal(v2);return b1.max(b2).doubleValue();public static double returnMin(dou

13、ble v1, double v2) BigDecimal b1 = new BigDecimal(v1);BigDecimal b2 = new BigDecimal(v2);return b1.min(b2).doubleValue();public static int compareTo(double v1, double v2) BigDecimal b1 = new BigDecimal(v1);BigDecimal b2 = new BigDecimal(v2);return pareTo(b2);package org.decimalcalculate;import java.

14、io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.util.ArrayList;import java.util.StringTokenizer;import org.bayes.*;public class TestBayes public ArrayList readTestData() throws IOException ArrayList candAttr = new ArrayList();BufferedReader reader = new Buff

15、eredReader(new InputStreamReader(System.in);String str = ;while (!(str = reader.readLine().equals() StringTokenizer tokenizer = new StringTokenizer(str);while (tokenizer.hasMoreTokens() candAttr.add(tokenizer.nextToken();return candAttr;public ArrayListArrayList readTupleData() throws IOException Ar

16、rayListArrayList datas = new ArrayListArrayList();BufferedReader reader = new BufferedReader(new InputStreamReader(System.in);String str = ;while (!(str = reader.readLine().equals() StringTokenizer tokenizer = new StringTokenizer(str);ArrayList s = new ArrayList();while (tokenizer.hasMoreTokens() s.

17、add(tokenizer.nextToken();datas.add(s);return datas;public static void main(String args) TestBayes tb = new TestBayes();ArrayListArrayList datas = null;ArrayList testT = null;Bayes bayes = new Bayes();try System.out.println(请输入训练数据集:);datas = tb.readTupleData();while (true) System.out.println(请输入测试元

18、组:);testT = tb.readTestData();String c = bayes.calculateProbabilityOfClass(datas, testT);System.out.println(The class is: + c); catch (IOException e) e.printStackTrace();package org.bayes;import java.util.ArrayList;import java.util.HashMap;import java.util.Map;import org.decimalcalculate.*;public cl

19、ass Bayes MapString, ArrayListArrayList accordingDateOfClassToSort(ArrayListArrayList datas) MapString, ArrayListArrayList map = new HashMapString, ArrayListArrayList();ArrayList t = null;String c = ;for (int i = 0; i datas.size(); i+) t = datas.get(i);c = t.get(t.size() - 1);if (map.containsKey(c)

20、map.get(c).add(t); else ArrayListArrayList nt = new ArrayListArrayList();nt.add(t);map.put(c, nt);return map;public String calculateProbabilityOfClass(ArrayListArrayList datas, ArrayList testT) MapString, ArrayListArrayList doc = this.accordingDateOfClassToSort(datas);Object classes = doc.keySet().t

21、oArray();double maxP = 0.00;int maxPIndex = -1;for (int i = 0; i doc.size(); i+) String c = classesi.toString();ArrayListArrayList d = doc.get(c);double pOfC = DecimalCalculate.div(d.size(), datas.size(), 3);for (int j = 0; j maxP) maxP = pOfC;maxPIndex = i;return classesmaxPIndex.toString();/* priv

22、ate double pOfV(ArrayListArrayList d, String value, int index) double p = 0.00;int count = 0;int total = d.size();ArrayList t = null;for (int i = 0; i total; i+) if (d.get(i).get(index).equals(value) count+;p = DecimalCalculate.div(count, total, 3);return p;第四部分 程序测试与结果分析4.1程序测试4.2结果分析该截图是在测试算法时过程的截图。运行无误第五部分 总结与心得体会5.1总结与心得体会该算法是贝叶斯算法,使用java语言通过对象集合保存数据再通过三重for循环实现的简单朴素贝叶斯算法,该算法只是适应于一般的情况。不足之处在于没有进行输入验证,如果输入非法字符就会产生异常使程序死掉,如下图:第六部分 参考文献6.1参考文献(2个)1 数据挖掘原理,算法及应用M :西安电子科技大学出版社,2012: 1-1.2 生物信息学M:科学出版社, 2012: 1-1.

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号