《人工智能ArtificialIntellig.ppt》由会员分享,可在线阅读,更多相关《人工智能ArtificialIntellig.ppt(82页珍藏版)》请在三一办公上搜索。
1、人工智能Artificial Intelligence,不确定性推理Uncertainty Reasoning,本章主要内容,基本概念主观Bayes方法确定性方法证据理论模糊推理,基本概念(1/3),什么是不确定性推理?不确定性推理是建立在非经典逻辑上的一种推理,是对不确定性知识的运用与处理是从不确定性的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性但却合理或者近乎合理的结论的思维过程为什么要研究不确定性推理?日常生活中含有大量的不确定的信息ES系统中大量的领域知识和专家经验,不可避免的包含各种不确定性。,基本概念(2/3),不确定性推理的基本问题:表示问题:即采用什么方
2、法描述不确定性.一般有数值表示和非数值的语义表示方法.计算问题:主要指不确定性的传播和更新,也即获得新信息的过程.主要包括:已知C(A),AB f(B,A),如何计算C(B)已知C1(A),又得到C2(A),如何确定C(A)如何由C(A1),C(A2)计算C(A1A2),C(A1A2)语义问题:指的是上述表示和计算的含义是什么,如何进行解释.,基本概念(3/3),不确定推理方法的分类形式化方法:在推理一级扩展确定性方法.逻辑方法:是非数值方法,采用多值逻辑、非单调逻辑来处理不确定性新计算方法:认为概率方法不足以描述不确定性,出现了确定性理论,确定性因子,模糊逻辑方法等新概率方法:在传统的概率框
3、架内,采用新的计算工具以确定不确定性描述非形式化方法:在控制一级上处理不确定性如制导回溯、启发式搜索等等,本章主要内容,基本概念主观Bayes方法可信度方法证据理论模糊推理,主观Bayes方法,1976年提出的,应用于地矿勘探专家系统Prospector中不确定推理系统包括:不确定性的表示:规则/知识事实/证据不确定性的计算组合证据的不确定算法不确定性的传递算法结论的不确定算法,规则不确定的表示(1/2),if E then(LS,LN)H(P(H)(1)E是规则的前提条件,H是结论,P(H)是H的先验概率,是指在没有任何证据的情况下结论H为真的概率。(2)LS是充分性度量:表示E对H的支持程
4、度,取值范围0,+),其定义为:P(E/H)LS=-P(E/H),规则不确定的表示(2/2),(3)LN是必要性度量:表示E对H的支持程度,取值范围0,+),其定义为:P(E/H)1-P(E/H)LN=-=-P(E/H)1-P(E/H),证据不确定的表示,对于初始证据E,由用户根据观察S给出P(E/S).引入可信度函数C(E/S):(1)C(E/S)=-5,表示在S下,E肯定不存在P(E/S)=0(2)C(E/S)=0,表示在S与E无关,P(E/S)=P(E)(3)C(E/S)=5,表示在S下,E肯定存在,P(E/S)=1(4)C(E/S)为其他值的时候,P(E/S)可以通过线性插值得到。,组
5、合证据不确定的表示,(1)E=E1 E2 En 如果已知P(E1/S),P(En/S),则:P(En/S)=minP(E1/S),P(En/S)(2)E=E1 E2 En 如果已知P(E1/S),P(En/S),则:P(En/S)=maxP(E1/S),P(En/S)(3)对于“非”:P(E/S)=1-P(E/S),不确定性的传递算法,主观Bayes方法推理的任务就是根据证据E的概率P(E)和LS,LN的值,把H的先验概率P(H)更新为P(H/E)或P(H/E)。分下面三种情况讨论:证据肯定存在证据肯定不存在证据不确定,证据肯定存在(1/2),证据肯定存在时:P(E)=P(E/S)=1P(H/
6、E)=P(H)P(E/H)/P(E)P(H/E)=P(H)P(E/H)/P(E)P(H/E)P(H)P(E/H)-=-P(H/E)P(H)P(E/H)引入几率函数O(x)定义为:O(x)=P(x)/(1-P(x),P(x)=O(x)/(1+O(x),证据肯定存在(2/2),O(H/E)=LS O(H)P(H/E)=LS P(H)/(LS-1)P(H)+1)LS的意义:(1)LS1时,O(H/E)O(H),P(H/E)P(H),说明E的存在将增强H为真的概率。E的存在对H为真是充分的,所以称LS为充分性度量(2)LS=1时,O(H/E)=O(H)(3)LS1时,O(H/E)O(H),E导致H为真
7、的可能性下降(4)LS=0时,O(H/E)=0,E的存在将使H为假,证据肯定不存在(1/2),证据肯定不存在时:P(E)=P(E/S)=0,P(E)=1P(H/E)=P(H)P(E/H)/P(E)P(H/E)=P(H)P(E/H)/P(E)P(H/E)P(H)P(E/H)-=-P(H/E)P(H)P(E/H)O(H/E)=LN O(H)P(H/E)=LN P(H)/(LN-1)P(H)+1),证据肯定不存在(2/2),LN的意义:(1)LN1时,O(H/E)O(H),P(H/E)P(H),说明E的不存在将增强H为真的概率。(2)LN=1时,O(H/E)=O(H)(3)LN1时,O(H/E)O(
8、H),E的不存在导致H为真的可能性下降,即E的不存在将反对H为真,说明E对H为真的必要性(4)LN=0时,O(H/E)=0,E的不存在将使H为假。这里也可以看出E对H为真的必要性,所以也称LN为必要性度量,不确定性的传递算法,从上面讨论知:(1)若E越是支持H为真时,则应使LS越大(2)若E对H越是必要时,则应使LN越小LS、LN的取值情况:LS 0,LN 0 只能出现:但不能出现:LS1 LS1,LN1 LS1,LN1 LS1,LN1 LS=LN=1,例一,设有如下知识:r1:if E1 then(10,1)H1(0.03)r2:if E2 then(20,1)H2(0.05)r3:if E
9、3 then(1,0.002)H3(0.3)求:当证据存在及不存在时,P(Hi/Ei)及 P(Hi/Ei)的值各是多少,证据不确定(1/2),证据不定时:0P(E/S)1,后验概率为:P(H/S)=P(H/E)P(E/S)+P(H/E)P(E/S)分四种情况讨论如下:(1)P(E/S)=1 则有P(E/S)=0,证据肯定存在(2)P(E/S)=0 则有P(E/S)=1,证据肯定不存在(3)P(E/S)=P(E),说明E和S无关 P(H/S)=P(H),证据不确定(2/2),(4)当P(E/S)为其他值的时候,通过分段插值计算P(H/S)的值。,0,P(E/S),1,P(E),P(H/E),P(
10、H),P(H/E),P(H/S),例二,当证据 E必然发生,H1的先验概率0.03,H2的先验概率0.01,且有规则:r1:if E then(20,1)H1 r2:if H1 then(300,0.0001)H2求:P(H2|E),结论不确定性的合成,若有n条知识都支持相同的结论,而且每条知识的前提所对应的证据Ei(i=1,n)都有相应的观察Si与之对应,此时只要先对每条知识分别求出O(H/Si)然后就可用下式求出结论不确定性的合成:O(H/S1,Sn)=O(H/S1)O(H/Sn)-O(H)O(H)O(H),例三,当证据E1、E2、E3、E4必然发生后,H的先验概率为0.03,且有规则则:
11、r1:if E1 then(20,1)Hr2:if E2 then(300,1)H求:结论H的概率变化化.,本章主要内容,基本概念主观Bayes方法可信度方法证据理论模糊推理,可信度方法模型,主要包括:知识的不确定性表示证据的不确定性表示组合证据的不确定性表示不确定性的传递算法结论不确定性的合成算法,知识的不确定性表示,产生式规则:If E Then H(CF(H,E)CF(H,E)是该条知识的可信度,称为可信度因子或规则强度,表示当前提条件E所对应的证据为真时,它对结论H为真的支持程度。CF是根据经验对一个事物或现象为真的可信程度的度量CF(H,E)取值为:-1,1,,知识的不确定性表示(续
12、),CF定义:CF(H,E)=MB(H,E)-MD(H,E)MB:信任增长度,它表示因与前提条件E匹配的证据的出现,使结论H为真的信任增长度MD:不信任增长度,它表示因与前提条件E匹配的证据的出现,对结论H的不信任增长度,知识的不确定性表示(续),MB的定义:由条件概率和先验概率定义 1 若P(H)=1MB(H,E)=maxP(H|E),P(H)P(H)-否则 1-P(H)MD的定义:1 若P(H)=0MD(H,E)=min P(H|E),P(H)P(H)-否则-P(H),知识的不确定性表示(续),MB(H,E)和MD(H,E)是互斥的:即一个证据不能既增加对H的信任度,又不能同时增加对H的不
13、信任度 当MB(H,E)0,MD(H,E)=0 当MD(H,E)0,MB(H,E)=0,知识的不确定性表示(续),CF(H,E)的直观意义:(1)CF(H,E)0,则P(H|E)P(H):E的出现增加了H为真的概率,增加了H为真的可信度(2)CF(H,E)0,则P(H|E)P(H):E的出现减少了H为真的概率,增加了H为假的可信度(3)CF(H,E)=0,则P(H|E)=P(H):表示H与E独立,即E的出现对H没有影响CF(H,E)几个特殊的值:(1)前提真,则结论必真,即P(H|E)=1,有CF(H,E)=1(2)前提真,而结论必假,即P(H|E)=0,有CF(H,E)=-1(3)前提与结论
14、无关,即P(H|E)=P(H),有CF(H,B)=0,证据的不确定性表示,证据的不确定性也用CF来表示CF值的来源分两种情况:初始证据:由提供证据的用户给出以前的结论作为新证据:由传递算法推出证据的CF取值范围:-1,1E肯定为真时:CF(E)=1E肯定为假时:CF(E)=-1对E一无所知时:CF(E)=0CF(E)0表示E以CF(E)为真CF(E)0表示E以CF(E)为假,组合证据不确定性算法,(1)E=E1 E2 En 如果已知CF(E1),CF(En),则:CF(E)=minCF(E1),CF(En)(2)E=E1 E2 En 如果已知CF(E1),CF(En),则:CF(E)=maxC
15、F(E1),CF(En),不确定性的传递算法,已知:CF(E)E H CF(H,E)则规定:CF(H)=CF(H,E)max0,CF(E)规定:CF(E)=-CF(E)当证据为假时:CF(H)=0,即该模型没有考虑证据为假时对H所产生的影响当证据为真时,CF(H,E)实际上就是结论H的可信度CF(H),结论不确定性合成算法,r1:if E1 then H(CF(H,E1)r2:if E2 then H(CF(H,E2)求合成的CF(H)(1)首先对每条知识求出CF(H),即:CF1(H)=CF(H,E1)max0,CF(E1)CF2(H)=CF(H,E2)max0,CF(E2)(2)规定:CF
16、1(H)+CF2(H)-CF1(H)CF2(H)CF1(H)=0,CF2(H)=0CF(H)=CF1(H)+CF2(H)+CF1(H)CF2(H)CF1(H)0,CF2(H)0 CF1(H)+CF2(H)其他,可信度模型-例一,r1:A1 B1 CF(B1,A1)=0.8 r2:A2 B1 CF(B1,A2)=0.5 r3:B1 A3 B2 CF(B2,B1 A3)=0.8 初始证据 A1,A2,A3 的CF值均设为1,而初始未知证据 B1,B2 的CF值为0,即对 B1,B2 是一无所知的。求:CF(B1),CF(B2)的更新值,可信度模型-例二,r1:A1 B1 CF(B1,A1)=0.8
17、 r2:A2 B1 CF(B1,A2)=0.6初始证据 A1,A2 的CF值均设为0.5,而初始未知证据 B1 的CF值为0.1。求:CF(B1)的更新值,本章主要内容,基本概念主观Bayes方法确定性方法证据理论模糊推理,证据理论,主要内容:概率分配函数信任函数似然函数证据的不确定性度量规则的不确定性度量推理计算,概率分配函数,定义:U为样本空间,设函数M:2U0,1,且满足:M()=0 AUM(A)=1 则称M为2U上的概率分配函数,M(A)称为A的基本概率数(1)M(A)的作用是把U的任意一个子集A都映射为0,1上的一个数M(A)。它表示证据对U的子集A成立的一种信任度量,是对U的子集的
18、信任分配。(2)概率分配函数不是概率。,证据理论,例:U=红,黄,蓝假设:M(红)=0.3,M(黄)=0,M(蓝)=0.1,M(红,黄)=0.2,M(红,蓝)=0.2,M(黄,蓝)=0.1,M(红,黄,蓝)=0.1,M()=0,信任函数,定义:命题的信任函数Bel:2U0,1,且 Bel(A)=BAM(B)对所有的AU(1)命题A的信任函数的值,是A的所有子集的基本概率分配函数值的和,用来表示对A的总的信任(2)Bel函数又称为下限函数(3)Bel()=M()=0 Bel(U)=BUM(B)=1,似然函数,定义:似然函数Pl:2U0,1,且 Pl(A)=1-Bel(A)对所有的AU(1)Bel
19、(A)表示对A为真的信任度,则 Bel(A)表示对A为真,即A为假的信任度,所以 Pl(A)表示A非假的信任度,它又称为上限函数。(2)Pl(A)=1-Bel(A)=ABM(B)(3)0 Bel(A)Pl(A)1(4)Pl(A)-Bel(A):表示既不信任A,也不信任A的一种度量,可表示对不知道的度量,证据的不确定性度量,(1)以区间(Bel(A),Pl(A)作为证据A的不确定性度量:表示了对A信任程度的上限和下限。A(0,0):表示A为假 A(0,1):表示对A一无所知 A(1,1):表示A为真(2)以函数:f1(A)=Bel(A)+(|A|U|)(Pl(A)-Bel(A)表示证据A的不确定
20、性度量。f1()=0,f1(U)=1 0 f1(A)1 AU,规则的不确定性度量,设U=u1,un,A和B为U的子集,如:A=a1,am,B=b1,bk规则表示如下:A B=b1,bk c1,ck(1)B是结论,用样本空间的子集表示,b1,bk是该子集中的元素(2)c1,ck表示规则的不确定性度量,ci表示bi的可信度(3)ci0,ni=1ci1,推理计算,f1(A1A2)=minf1(A1),f1(A2)f1(A1A2)=maxf1(A1),f1(A2)已知f1(A)A B=b1,bk c1,ck,求 f1(B)(1)求出B的概率分配函数 M(B)=M(b1,bk)=f1(A)c1,f1(A
21、)ck M(U)=1-ki=1 f1(A)ci,推理计算(续),如果有两条知识支持同一条结论:A1 B=b1,bk c1,ck,A2 B=b1,bk c1,ck,则首先分别对每一条知识求出概率分配函数:M1(b1,bk)M2(b1,bk)然后由:M=M1M2求出结论B的概率分配函数M,推理计算(续),概率分配函数的合成定义:设M1和M2是两个概率分配函数,则合成M=M1M2定义为:M()=0 M(A)=K XY=A M1(X)M2(Y)其中x,y是U的子集,并且:K-1=1-XY=M1(X)M2(Y)=XY M1(X)M2(Y),推理计算(续),概率分配函数的合成示例:例一:设U=黑,白,且
22、M1(黑,白,黑,白,)=(0.3,0.5,0.2,0)M2(黑,白,黑,白,)=(0.6,0.3,0.1,0)例二:设U=a,b,c,d M1(b,c,d,U)=(0.7,0.3)M2(a,b,U)=(0.6,0.4),推理计算(续),(2)求出Bel(B),Pl(B),f1(B)Bel(B)=ABM(A)Pl(B)=1-Bel(B)f1(B)=Bel(B)+(|B|U|)(Pl(B)-Bel(B),证据理论示例,例一:已知 f1(A1)=0.8,f1(A2)=0.6,|U|=20 A1A2B=b1,b2(c1,c2)=(0.3,0.5)求:f1(B)例二:已知 f1(A1)=0.53,f1
23、(A2)=0.52,|U|=20 A1B=b1,b2,b3(c1,c2,c3)=(0.1,0.5,0,3)A2B=b1,b2,b3(c1,c2,c3)=(0.4,0.2,0,1)求:f1(B),本章主要内容,基本概念主观Bayes方法确定性方法证据理论模糊推理,模糊推理,处理随机性的理论基础是概率论 处理模糊性的基础是模糊集合论 本节主要内容:模糊集合与操作语言变量模糊推理,模糊集合与操作(1),经典集合是清晰的,即:一个元素x是否属于某一个集合A是明确的,要么x属于A,要么x不属于A,两者必居其一,而且只能居其一。C(x)为特征函数,模糊集合与操作(2),例子:Rule:If the tem
24、perature is higher than 80F,it is hot;otherwise,it is not hot.Cases:Temperature=100F HotTemperature=80.1F HotTemperature=79.9F Not hotTemperature=50F Not hot情绪逻辑的不足 The membership function of crisp logic fails to distinguish between members of the same set.,模糊集合与操作(3),Conception of Fuzzy LogicMany d
25、ecision-making and problem-solving tasks are too complex to be defined precisely however,people succeed by using imprecise knowledge Fuzzy logic resembles human reasoning in its use of approximate information and uncertainty to generate decisions.,模糊集合与操作(4),Natural Language,Consider:Joe is tall-wha
26、t is tall?Joe is very tall-what does this differ from tall?Natural language(like most other activities in life and indeed the universe)is not easily translated into the absolute terms of 0 and 1.,模糊集合与操作(5),Fuzzy logic is a superset of boolean logicIt was created by Dr.Lotfi Zadeh in 1960s for the p
27、urpose of modeling the uncertainty inherent in natural languageIn fuzzy logic,it is possible to have partial truth values.And is an approach to uncertainty that combines real values 01 and logic operationsFuzzy logic is based on the ideas of fuzzy set theory and fuzzy set membership often found in n
28、atural(e.g.,spoken)language.,模糊集合与操作(6),模糊集合:把传统集合论中由特征函数决定的绝对隶属关系模糊化,把集合(0,1)扩散到区间0,1,以表示元素x隶属于子集A的模糊程度。,模糊集合与操作(7),Fuzzy Set deals with degrees of membership and degrees of truth,it is a set with fuzzy boundaries.In classical set theory;fA(x):X 0,1,where fA(x)=In fuzzy sets;A(x):X 0,1,where A(x)=1
29、,if x is totally in A;A(x)=0,if x is not in A;0 A(x)1,if x is partly in A,1,if xA0,if xA,模糊集合与操作(8),Classical tall men example.,模糊集合与操作(9),Crisp and fuzzy sets of tall men,模糊集合与操作(10),Example:“Young”Example:Ann is 28,0.8 in set“Young”Bob is 35,0.1 in set“Young”Charlie is 23,1.0 in set“Young”Unlike s
30、tatistics and probabilities,the degree is not describing probabilities that the item is in the set,but instead describes to what extent the item is the set.,模糊集合与操作(11),Membership function of fuzzy logic,Age,25,40,55,Young,Old,1,Middle,0.5,DOMDegree of Membership,Fuzzy values,Fuzzy values have assoc
31、iated degrees of membership in the set.,0,模糊集合与操作(12),模糊集的逻辑运算 E.g.A=1.0,0.20,0.75B=0.2,0.45,0.50A B=MAX(1.0,0.2),MAX(0.20,0.45),MAX(0.75,0.50)=1.0,0.45,0.75,模糊集合与操作(13),模糊集的逻辑运算 E.g.A B=MIN(1.0,0.2),MIN(0.20,0.45),MIN(0.75,0.50)=0.2,0.20,0.50,模糊集合与操作(14),模糊集的逻辑运算 Example.Ac=1 1.0,1 0.2,1 0.75=0.0,0
32、.8,0.25,语言变量(1),模糊集合的一种应用是计算语言学,目的是对自然语言的语句进行计算,就象对逻辑语句进行运算一样。语言变量可以看作是用某种自然语言和人工语言的词语或句子来表示变量的值和描述变量间的内在联系的一种系统化的方法 模糊集合和语言变量可用于量化自然语言的含义,因而可用来处理具有指定值的语言变量。Fuzzy logic=computing with words,语言变量(2),模糊逻辑的核心概念是语言变量。模糊逻辑的基本思想是将常规数值变量模糊化,使变量成为以定性术语(也称语言值)为值域的语言变量,模糊推理(1),A fuzzy rule can be defined as a
33、 conditional statement as below.IF x is ATHEN y is BDifferences between classical and fuzzy rules.IF height is 1.80THEN select_for_teamIn fuzzy rules;IF height is tallTHEN select_for_team,模糊推理(2),A fuzzy rule can have multiple antecedents.IF height is tallAND age is smallTHEN select_for_teamOr,anoth
34、er exampleIF service is excellentOR food is deliciousTHEN tip is generous,模糊推理(3),模糊推理过程,Crisp Input,Fuzzy Input,Fuzzy Output,Crisp Output,Fuzzification,Rule Evaluation,Defuzzification,Input Membership Functions,Rules/Inferences,Output Membership Functions,模糊推理(4),常用的隶属函数:,模糊推理(5),模糊化:模糊化借助于输入模糊集合的隶
35、属函数转变输入值为隶属度,即模糊化是根据模糊集合转变输入值为隶属度值的过程。模糊估值:由于模糊控制规则的部分匹配特性和规则的前提条件相重叠的事实,通常在一个时刻可能有多于一条的模糊规则被激活,用来决定执行哪个控制规则的方法称为冲突消解过程。规则估值过程确定了每个规则被满足的程度。常用的方法:MinMax方法 Product方法 BoundedSum方法,模糊推理(6),清晰化:通过规则估值得到规则强度后,仍然需要进一步的处理,这个处理给出就是输出的清晰化。这一必须执行的过程,要生成非模糊化的控制动作,为了从截取后的输出模糊集中确定出一个清晰的值,必须首先合并这些输出模糊集。这是通过把所有的输出
36、模糊连接起来,并且在所有的点上取大值来进行的。常用方法:重心法 Truth Value Flow,模糊推理(7),Two Inputs(x,y)and one output(z)Membership functions:low(t)=1-(t/10)high(t)=t/10,Low,High,1,0,t,X=0.32,Y=0.61,0.32,0.68,Low(x)=0.68,High(x)=0.32,Low(y)=0.39,High(y)=0.61,Crisp Inputs,模糊推理(8),规则库:Rule 1:If x is low AND y is low Then z is high R
37、ule 2:If x is low AND y is high Then z is low Rule 3:If x is high AND y is low Then z is low Rule 4:If x is high AND y is high Then z is high,模糊推理(9),推理:Rule1:low(x)=0.68,low(y)=0.39=high(z)=MIN(0.68,0.39)=0.39Rule2:low(x)=0.68,high(y)=0.61=low(z)=MIN(0.68,0.61)=0.61Rule3:high(x)=0.32,low(y)=0.39=lo
38、w(z)=MIN(0.32,0.39)=0.32Rule4:high(x)=0.32,high(y)=0.61=high(z)=MIN(0.32,0.61)=0.32,模糊推理(10),估值:Low(z)=MAX(rule2,rule3)=MAX(0.61,0.32)=0.61 High(z)=MAX(rule1,rule4)=MAX(0.39,0.32)=0.39,Low,High,1,0,t,0.61,0.39,模糊推理(11),清晰化:Center of Gravity,Low,High,1,0,0.61,0.39,Crisp output,Center of Gravity,模糊推理(12),清晰化:Center of Gravity,模糊推理(13),