朴素贝叶斯算法ppt课件.ppt

上传人:牧羊曲112 文档编号:2069879 上传时间:2023-01-06 格式:PPT 页数:13 大小:114KB
返回 下载 相关 举报
朴素贝叶斯算法ppt课件.ppt_第1页
第1页 / 共13页
朴素贝叶斯算法ppt课件.ppt_第2页
第2页 / 共13页
朴素贝叶斯算法ppt课件.ppt_第3页
第3页 / 共13页
朴素贝叶斯算法ppt课件.ppt_第4页
第4页 / 共13页
朴素贝叶斯算法ppt课件.ppt_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《朴素贝叶斯算法ppt课件.ppt》由会员分享,可在线阅读,更多相关《朴素贝叶斯算法ppt课件.ppt(13页珍藏版)》请在三一办公上搜索。

1、朴素贝叶斯算法,Naive Bayes,算法流程图,朴素贝叶斯算法原理,01,贝叶斯定理朴素贝叶斯算法流程,02,购买电脑实例,03,朴素贝叶斯算法存在的问题及应用,04,Table of Contents,内容大纲,朴素贝叶斯算法原理,朴素贝叶斯算法是分类算法中的一种。朴素贝叶斯的思想基础是这样的:对于给定的待分类项,求解在此项出现的条件下各个类别 出现的概率,哪个 最大。就把此待分类项归于哪个类别。通俗来说,就好比你在街上看到一个黑人,我问你你猜这个人哪里来的,你十有八九猜非洲。为什么呢?因为黑人中非洲人的比率最高,当然人家也可能是美洲人或亚洲人,但在没有其它可用信息下,我们会选择条件概率

2、最大的类别,这就是朴素贝叶斯的思想基础。,条件概率:表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为:为了得出,我们不加证明的给出贝叶斯定理。,贝叶斯分类的基础贝叶斯定理,先验概率和后验概率,先验概率:由以往的数据分析得到的概率。后验概率:得到信息之后再重新加以修正的概率。,朴素贝叶斯算法流程,1.设 为一个待分类项,而每个 为 的一个特征属性。且特征属性之间相互独立(此处是朴素贝叶斯的假设)。2.设 为一个类别集合。3.计算。4.如果 则。,接下来,由于假设各个特征属性都是条件独立的,那么根据贝叶斯定理有如下推导,因为分母对于所有类别为常数,因

3、此将分子最大化即可。即:,朴素贝叶斯分类例子,数据样本用属性age,income,student 和credit rating 描述。类别属性buys computer 具有两个不同值(即yes,no)。设 对应于类buys computer=“yes”,而 对应于类buys computer=“no”。我们分类的未知样本为:X=(age=30,income=medium,student=yes,credit _ rating=fair).,1.我们需要最大化P(X|)P(),i=1,2。每个类的先验概率P()可以根据训练样本计算:P(buys_computer=yes)=9/14=0.643

4、P(buys_computer=no)=5/14=0.357,2.计算后验概率P(X|),i=1,2(假设属性独立),P(age=“30”|buys_computer=“yes”)=0.222P(age=“30”|buys_computer=“no”)=0.600P(income=“medium”|buys_computer=“yes”)=0.444P(income=“medium”|buys_computer=“no”)=0.400P(student=“yes”|buys_computer=“yes”)=0.667P(student=“yes”|buys_computer=“no”)=0.2

5、00P(credit_rating=“fair”|buys_computer=“yes”)=0.667 P(credit_rating=“fair”|buys_computer=“no”)=0.400P(X|buys_computer=“yes”)=0.2220.4440.6670.667=0.044P(X|buys_computer=“no”)=0.6000.4000.2000.400=0.019,3.对每个类,计算P(X|)P()P(X|buys_computer=“yes”)P(buys_computer=“yes”)=0.0440.643=0.028P(X|buys_computer=

6、“no”)P(buys_computer=“no”)=0.0190.357=0.007因此,对于样本X,朴素贝叶斯分类预测buys_computer=”yes”。,朴素贝叶斯算法存在的问题及应用,朴素贝叶斯分类器(Naive Bayes Classifier,或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响。朴素贝叶斯算法目前在过滤垃圾邮件和文字分类方面得到很好的应用。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号