粗糙集理论ppt课件.ppt_三一办公31ppt.com

资源描述

《粗糙集理论ppt课件.ppt》由会员分享，可在线阅读，更多相关《粗糙集理论ppt课件.ppt（110页珍藏版）》请在三一办公上搜索。

1、2011年5月,粗糙集理论及其应用(Rough Sets Theory and Its Applications ),中国民航大学粗糙集理论与机器学习研究生课件,Outline,1.Rough sets理论概述2.Rough sets理论的基本原理3.信息系统约简4.决策表约简5.离散化方法,1.1 Rough sets的快速入门方法,认真研读Rough Sets Theory的创始人、波兰数学家Z. Pawlak于1982年发表的第一篇论文“Rough Sets”。【注】：最好直接阅读英文论文原文。研读王珏等人1996年在模式识别与人工智能上发表的关于Rough Sets理论及其应用的综述

2、性文章。参考李德毅的不确定性人工智能、杨善林的智能决策方法与智能决策支持系统参考史忠植编著的高级人工智能、知识发现等教材中讨论粗糙集的有关章节。【注】：国内王国胤、刘清、张文修、曾黄麟等人先后出版了关于Rough Sets的教材，也可适当参考。,1.Rough sets理论概述,Rough set快速入门方法（续）,认真研读如下3篇典型的论文： 1 Pawlak, Z., et al. Rough set approach to multi-attribute decision analysis. European Journal of Operational Research, 72: 44

3、3-459, 19942 Grzymala-Busse, D. M., et al. The usefulness of a machine learning approach to knowledge acquisition. Computational Intelligence. 11(2):268-279, 19953 Jelonek, J., et al. Rough set reduction of attributes and their domains for neural networks. Computational Intelligence, 11(2): 339-347,

4、 1995,1.2 粗糙集理论概述 1.2.1 粗糙集理论的提出自然界中大部分事物所呈现的信息都是：不完整的、不确定的、模糊的和含糊的经典逻辑无法准确、圆满地描述和解决粗糙集理论主要是为了描述并处理“含糊”信息。,粗糙集理论的提出（续1）,“含糊”（Vague）1904年谓词逻辑创始人G. Frege (弗雷格)首次提出将含糊性归结到 “边界线区域”(Boundary region)在全域上存在一些个体，它既不能被分类到某一个子集上，也不能被分类到该子集的补集上“模糊集”（Fuzzy Sets）1965年美国数学家L. A. Zadeh首次提出无法解决G. Frege提出的“含糊”问题

5、未给出计算含糊元素数目的数学公式,粗糙集理论的提出（续2）,“粗糙集”（Rough Sets）1982年波兰数学家Z. Pawlak首次提出将边界线区域定义为“上近似集”与“下近似集”的差集指出在“真”、“假”二值之间的“含糊度”是可计算的给出计算含糊元素数目的计算公式借鉴了集合论中的“等价关系”（不可区分关系）求取大量数据中的最小不变集合（称为“核”）求解最小规则集（称为“约简”）,粗糙集理论的提出（续3）,粗糙集理论中的一些基本观点“概念”就是对象的集合“知识”就是将对象进行分类的能力(“各从其类”)“知识” 是关于对象的属性、特征或描述的刻划不可区分关系表明两个对象具有相同的信息提出上近

6、似集、下近似集、分类质量等概念,1.2.2 粗糙集理论的发展历程,1970s，Pawlak和波兰科学院、华沙大学的一些逻辑学家，在研究信息系统逻辑特性的基础上，提出了粗糙集理论的思想。在最初的几年里，由于大多数研究论文是用波兰文发表的，所以未引起国际计算机界的重视，研究地域仅限于东欧各国。1982年，Pawlak发表经典论文Rough sets，标志着该理论正式诞生。,粗糙集理论的发展历程（续1）,1991年，Pawlak的第一本关于粗糙集理论的专著Rough sets: theoretical aspects of reasoning about data；1992年，Slowinski主编

7、的Intelligence decision support: handbook of applications and advances of rough sets theory的出版，奠定了粗糙集理论的基础，有力地推动了国际粗糙集理论与应用的深入研究。1992年，在波兰召开了第一届国际粗糙集理论研讨会，有15篇论文发表在1993年第18卷的 Foundation of computing and decision sciences上。,粗糙集理论的发展历程（续2）,1993和1994年，分别在加拿大、美国召开第二、三届国际粗糙集与知识发现（或软计算）研讨会。1995年，Pawlak等人在A

8、CM Communications上发表“Rough sets”，极大地扩大了该理论的国际影响。19961999年，分别在日本、美国、美国、日本召开了第4-7届粗糙集理论国际研讨会。2000年，在加拿大召开了第二届粗糙集与计算趋势国际会议。,粗糙集理论的发展历程（续3）,20012002，中国分别在重庆、苏州召开第一、二届粗糙集与软计算学术会议。2003年，在重庆召开粗糙集与软计算国际研讨会。2004年，在瑞典召开RSCTC国际会议（年会）。2005年，在加拿大召开RSFDGrC国际会议（年会）。,1. 3 粗糙集理论的优点及局限性,主要优点除数据集之外，无需任何先验知识（或信息）对不确定性

9、的描述与处理相对客观【说明】：Bayes理论、模糊集理论、证据理论等都需要先验知识，具有很大的主观性。,粗糙集理论的优点及局限性（续）,局限性缺乏处理不精确或不确定原始数据的机制对含糊概念的刻划过于简单无法解决所有含糊的、模糊的不确定性问题需要其它方法的补充解决办法与模糊集理论相结合与Dempster-Shafer证据理论相结合,1. 4 粗糙集理论在知识发现中的作用,在数据预处理过程中，粗糙集理论可以用于对遗失数据的填补。在数据准备过程中，利用粗糙集理论的数据约简特性，对数据集进行降维操作。在数据挖掘阶段，可将粗糙集理论用于分类规则的发现。,粗糙集理论在知识发现中的作用（续）,在数据挖掘阶段

10、的主要作用通过布尔推理挖掘出约简的规则来解释决策通过熵理论将规则的复杂性和预测的误差分析溶入到无条件的度量中与模糊集理论、证据理论构成复合分析方法搜寻隐含在数据中的确定性或非确定性的规则在解释与评估过程中，粗糙集理论可用于对所得到的结果进行统计评估。,1. 5 粗糙集理论的研究现状,在理论研究方面数学性质：研究其代数与拓扑结构、收敛性等粗糙集拓广：广义粗糙集模型、连续属性离散化与其它不确定性处理方法的关系和互补：与模糊集理论、Dempster-Shafer证据理论的关系和互补粒度计算：粗糙集理论是其重要组成之一高效算法：导出规则的增量式算法、简约的启发式算法、并行算法、现有算法的改进,粗糙集理

11、论的研究现状（续）,在数据挖掘领域的应用发现数据之间（精确或近似）的依赖关系评价某一分类（属性）的重要性剔除冗余属性数据集的降维发现数据模式挖掘决策规则在其它领域的应用金融商业,“知识”的定义使用等价关系集R对离散表示的空间U进行划分，知识就是R对U划分的结果。“知识库”的形式化定义等价关系集R中所有可能的关系对U的划分表示为：K = (U, R),2.1 基本概念,2.Rough sets理论的基本原理,基本概念（续1）,“信息系统”的形式化定义S = U, Q, V, f，U：对象的有限集Q：属性的有限集，Q=CD，C是条件属性子集，D是决策属性子集V：， Vp是属性P的域f：U A V

12、是总函数，使得对每个xi U, q A, 有f(xi, q) Vq一个关系数据库可看作一个信息系统，其“列”为“属性”，“行”为“对象”。,基本概念（续2）,基本集合（Elementary set）/ 原子(Atom)关系R的等价类(Equivalence classes)U/R表示近似空间A上所有的基本集合（原子）不可区分（等价、不分明）关系U为论域，R是UU上的等价(Equivalence)关系（即满足自反、对称、传递性质）A=U, R称为近似空间，R为不分明关系 (indiscernibility，或不可区分关系、等价关系)若x, yU，(x, y)R，则x, y在A中是不分明的（不可

13、区分的）,基本概念（续3）,不可区分（等价、不分明）关系（续）设PQ， xi, xj U, 定义二元关系INDP称为不分明关系为：称xi, xj在S中关于属性集P是不分明的，当且仅当p(xi)=p(xj)对所有的pP成立，即xi, xj不能用P中的属性加以区别。若x, yU，(x, y) R，则x, y在A中是不分明的（不可区分的）对所有的pP，INDP是U上一种的等价关系,不可区分关系（等价关系）示例,可知，U = 1, 2, 3, 4, 5, 6R = 2 weather, road, time, accident 若P = weather, road，则xIND(p) = x INDwe

14、ather xINProad = 1, 3, 6, 2, 5, 4 1, 2, 4, 3, 5, 6 = 1, 2, 4, 3, 6, 5 ,不可区分关系（等价关系）示例（续）,在信息系统S = U, Q, V, f中，设XU是个体全域上的子集，PQ则X的下和上近似集及边界区域分别为：,PX是XU上必然被分类的那些元素的集合，即包含在X内的最大可定义集； X是U上可能被分类的那些元素的集合，即包含X的最小可定义集。 Bnd(X)是既不能在XU上被分类，又不能在U-X上被分类的那些元素的集合。,2.2 集合的上近似 & 下近似,图6.1 集合的上、下近似概念示意,X,上、下近似关系举例：,X1

15、= u | Flu(u) = yes = u2, u3, u6, u7 RX1 = u2, u3 = u2, u3, u6, u7, u5, u8,X2 = u | Flu(u) = no = u1, u4, u5, u8 RX2 = u1, u4 = u1, u4, u5, u8, u6, u7,The indiscernibility classes defined by R = Headache, Temp. are:u1, u2, u3, u4, u5, u7, u6, u8.,上、下近似集的图示：,R = Headache, Temp.U/R = u1, u2, u3, u4, u5

16、, u7, u6, u8 X1 = u | Flu(u) = yes = u2,u3,u6,u7X2 = u | Flu(u) = no = u1,u4,u5,u8,RX1 = u2, u3 = u2, u3, u6, u7, u5, u8,RX2 = u1, u4 = u1, u4, u5, u8, u6, u7,u1,u4,u3,X1,X2,u5,u7,u2,u6,u8,2.3.1 集合的近似精度和粗糙度 & 分类质量设S = U, Q, V, f为一信息系统，且XU， PQ，则S上X的近似精度为：,设S为一信息系统，PQ，且令=X1,X2, , Xn是U的一个分类（子集族），其中XiU

17、，则的P-下近似和P-上近似分别表示为：,2.3 粗糙集的数字特征,分类的近似精度为：,由属性子集PQ确定的分类的分类质量为：,分类质量表示通过属性子集P正确分类的对象数与信息系统中所有对象数的比值。这是评价属性子集P的重要性的关键指标之一。,2.3.2 近似分类精度和近似分类质量,一个申请信用卡的训练集：,原始属性集A = c1, c2, c3, c4的分类质量：,令R = c2, c4，重新计算分类质量，得,给定K=（U,S），R IND(K), 对于集合X关于系统参数R的重要度为,2.3.3 系统参数的重要度,划分关于系统参数R的重要度,给定K=（U,S）， P, Q IND(K

18、), 定义,2.3.4 知识的依赖度,为知识Q依赖于知识P的程度，简记为：,衡量通过知识P准确划入到分类U/Q的等价类中的程度。,2.3.5 包含度用于变精度模型、概率模型等,2.3.6 知识的不确定型的度量信息熵、条件熵、互信息等,2.3.5 包含度用于变精度模型、概率模型等,2.3.6 知识的不确定型的度量信息熵、条件熵、互信息等,知识必要性：给定知识库K=（U,S）和等价关系簇PS, R P,若 IND(P) = IND( P-R ) 成立，则称知识R为P中必要的，否则称R为P中不必要的。如果每一个RP, R 都是P中必要的，则P为独立的，否P为不独立的依赖的。,2.4 知识约简,2.

19、4.1 知识的约简和“核”,知识约简：给定知识库 K=（U,S）和等价关系簇PS, 对任意的G P, 若G满足：（1）G是独立的（2）IND(G)=IND(P)则称G是P的一个约简， GRED(P) RED(P)表示P的全体约简组成的集合。,知识的核：给定知识库 K=（U,S）和等价关系簇PS, 对任意的 R P , 若R满足：,则称知识R为P中必要的，P中所有必要的知识组成的集合称为P的核，记为CORE(P),定理,由于,R1必要的,R2、R3不必要的，CORE(S) = R1,RED(S)= R1,R2, R1, R3 ,2.4 知识约简,2.4.2 知识的相对核和相对约简,知识的相对

20、必要性,回顾,知识的相对约简：给定知识库 K=（U,S）和等价关系簇P，QS, 对任意的G P, 若G满足：（1）G是Q独立的，即G为P的Q独立子族（2）则称G是P的一个Q约简，,3.信息系统约简,3.1 知识表达系统,: IS,: DT,代数关系：经典信息系统、模糊信息系统数据完备性：完备的和不完备的信息系统数据分布：随机信息系统和非随机信息系统属性值：格值信息系统,3.2 信息系统的类型,3.3 信息系统的属性约简算法,（1）,缺点：只能得到其中一个属性约简,（2）,由于盲目删除属性约简算法，得到所有约简时需要的时间和空间代价太大，需要启发式策略缩短搜索路径。,（3）,定理：信息系统的核等

21、于该信息系统的差别矩阵中所有简单属性（单个属性）元素组成的集合,案例,3.4 信息系统的值约简,Outline,1.Rough sets理论概述2.Rough sets理论的基本原理3.信息系统约简4.决策表约简5.离散化方法,4.决策表的知识约简,4.1 知识表达系统,: IS,: DT,关于核的计算，有人提出了差别矩阵（discernibility matrix，也译作可辨识矩阵）。在信息系统S = (U, CD, V, f)中，C为条件属性，D为决策属性，设为对象全集U按决策属性D被分成不相交的类族，即 = X1,X2,Xm，则S中C的差别矩阵M(C) = mi,jnxn定义为,其中，1

22、 i j n。差别矩阵与信息系统的核有如下关系：对所有的cC, cCORE(C,D)的充要条件是，存在i, j(1 i j n)，使得mi,j = c。“含糊”是指分别属于两个不同类的对象具有完全相同的条件属性，在差别矩阵中，xi, xj是含糊的充要条件是存在i, j(1 i j n)，使得mi,j = -1。,因决策d = 接受，拒绝，故上表按决策属性d可分为两个等价类：x1, x4, x6, x7和x2, x3, x5, x8。根据差别矩阵的计算公式可得：,差别矩阵与“核”有如下关系：属性c是条件属性C和决策属性D的“核”的充要条件是，存在i, j(1ijn)，使得mij = c。由上述

23、矩阵可知，存在i=4, j=5，使得m4,5 = c2，故表1的“核”为c2。,实例：考虑下面的决策表，条件属性为a,b,c,d，决策属性为e。,由上述差别矩阵很容易得到核为：c差别函数fM(S)为：c(ad)，即(ac)(cd)得到两个约简a, c和c, d,根据得到的两个约简，可得两个约简后的新决策表,例如：下表是医学诊断的一个信息系统I=(U, A)。其中，U = e1, e2, ., e7, A = A, T F。为方便表达，用1表示“是”，0表示“否”；2表示体温“很高”，1表示体温“高”，0表示体温“正常”，则表1.1的简化形式如表2所示。表医学诊断信息系统的描述,表简化后的决

24、策系统,表对应决策为1的决策矩阵,将决策矩阵中的每行的元素进行合取，然后进行简化，得到相应的必然规则： (T, 1) (A, 1) (T, 1) (A, 1) (F, 1)得 (T, 1) (A, 1) (F, 1) (1) (T, 2) (A, 1) (T, 2) (A, 1) (T, 2) (F, 1)得 (T, 2) (A, 1) (F, 1)(2) (A, 0) (T, 2) (T, 2) (T, 2) (F, 1)得 (T, 2) (A, 0) (F, 1)(3)又由（2）和（3）式可知，不管属性A（头痛）是否发生，只要属性T（体温）“很高”（值为2）时，则决策属性F（流感）一定为

25、1，即表明一定是得了“流感”，故有(T, 2) (F, 1) (4),1.3.5 属性之间的相关程度在信息系统S=(U, CD, V, f)中，设D*= X1,X2,Xm，属性子集PC关于决策属性D的“正区域”定义为：,P关于D的正区域表示那些根据属性子集P就能正确分入的所有对象。条件属性子集PC与决策属性D的相关程度（也称依赖程度）定义为：,显然，0 k(P, D) 1。k(P, D)为计算条件属性子集P与决策属性D之间的相关程度提供了非常有力的手段。,一个属性pPC的有效值(significant value)定义为：,【说明】：属性p的有效值越大，说明其对条件属性与决策属性之间的影响

26、越大，即其重要性也越大。,1.3.6 属性的有效值（重要性）,已知上表的“核”CORE(C, D) = c2，设R = CORE(C, D) = c2，计算属性A的重要性程度：,属性的重要性计算举例,属性的重要性计算举例（续）,属性值约简(Attribute Value Reduction)也称最小复合(Minimal Complex)。设B是一个由决策值对(d, w)表示的所有对象（概念）的下或上近似，集合B依赖于一个属性值对的集合T，当且仅当,集合T是B的最小复合，当且仅当B依赖于T，且无ST，使得B依赖于S。,1.3.7 属性值约简,设a = Age，b = pregnancies，c

27、= body-fat，d = Cholesterol，条件属性C = a, b, c, d，决策属性D = Breast-cancer，得如下差别矩阵：,得“核”CORE(C, D) = a, c, d。经属性约简后，删除多余属性c，即pregnancies，故得如下表所示的简化决策表。,由上表可知，该表存在两个决策值对：(Breast-cancer, no)和(Breast-cancer, yes)，且D1 = (Breast-cancer, no) = x1, x2, x5, x7, x10D2 = (Breast-cancer, yes) = x3, x4, x6, x8, x9 此外，

28、有如下属性值对：A1 = (Age, 29.41) = x1, x4, x7A2 = (Age, 42.56) = x2, x3, x6, x8A3 = (Age, 57.64) = x5, x9, x10B1 = (body-fat, 18.28) = x1, x2, x5, x6, x7, x10B2 = (body-fat, 29.37) = x3, x4, x8, x9C1 = (Cholesterol, 188.197) = x1, x6, x7, x10C2 = (Cholesterol, 198.320) = x2, x3, x4, x5, x8, x9,(1) 因B2 = (b

29、ody-fat, 29.37) = x3, x4, x8, x9 D2 = (Breast-cancer) = x3, x4, x6, x8, x9，令T = B2，T即为B的最小复合，故可得规则：(body-fat, 29.37) (Breast-cancer, yes) (1) 同时，根据最小复合的定义可知，任何与B2一起构成集合T的情况，均非最小复合。 (2) 由于A1D1且A1D2，B1D1且B1D2，令T = A1, B1，即T = A1, B1 = x1, x4, x7, x1, x2, x5, x6, x7, x10，有,且不存在T T，使得B依赖于T，故可得规则(Age, 29

30、.41) & (%body-fat, 18.28) (Breast-cancer, no) (2),(3) 同理，令T = A1, C1，得,【说明】：虽然T = A1, C1也是一个最小复合，但由于交集x1, x7与(2)中相同，说明两者实际上是同一条规则，故应略去。要略去哪一条规则（或者说要保留哪一条规则），则还需考虑哪些属性更重要，即应取最关键的属性所组成的规则。在该例中，由差别矩阵的计算结果可知，属性body-fat的重要性大于属性Cholesterol，因此略去A1与C1组成的规则。,属性值约简举例（续）,(4) 令T = A1, C2，得A1 C2 = x4 B2，故此种情况

31、已被B2所包含，故不必单独生成一条规则。 (5) 令T = A2, B1，得A2 B1 = x2, x6 D1，且 D2，故不能生成一条规则。 (6) 令T = A2, C1，得A2 C1 = x6 D2 = x3, x4, x6, x8,x9，故有(Age, 42.56) & (Cholesterol, 188.197) (Breast-cancer, yes) (3) (7) 令T = A2, C2，得A2 C2 = x2, x3, x8 D1，且 D2，故不能生成一条规则。 (8) 令T = A3, B1，得A3 B1 = x5, x10 D1 = x1, x2, x5, x7,x10，

32、故有(Age, 57.64) & (body-fat, 18.28) (Breast-cancer, no) (4),(9) 令T = A3, C1，得A3 C1 = x10 A3 B1 = x5, x10，故已被规则(4)所包含，无需生成一条规则。 (10) 令T = A3, C2，得A3 C2 = x5, x9 D1，且 D2，故不能生成一条规则。 (11) 令T = B1, C1，得B1 C1 = C1 = x1, x6, x7, x10 D1，且 D2，故不能生成一条规则。 (12) 令T = B1, C2，得B1 C2 = x2, x5 D1 = x1, x2, x5, x7,x10

33、，有(body-fat, 18.28) & (Cholesterol, 198.320) (Breast-cancer, no)(5),属性值约简举例（续）,因此，共得5条规则：(body-fat, 29.37) (Breast-cancer, yes) (1)(Age, 29.41) & (body-fat, 18.28) (Breast-cancer, no) (2)(Age, 42.56) & (Cholesterol, 188.197) (Breast-cancer, yes) (3)(Age, 57.64) & (body-fat, 18.28) (Breast-cancer, no

34、) (4)(body-fat, 18.28)& (Cholesterol, 198.320) (Breast-cancer, no) (5)【注意】：若取T = A1, B1, C1，则必然存在T的真子集T，如T = A1, B1 T，或 A1, C1，使得,即为上述步骤(2)和(3)两种情况，表明T = A1, B1, C1不是最小复合。其余情况类似，故不赘述。,属性可分为定量属性(Quantitative attributes)和定性属性(Qualitative attributes)，其中定性属性又被分成有序定性属性(Ordered qualitative attributes)和无序定

35、性属性(Unordered qualitative attributes)。如“年龄”为有序定性属性，它可分为年轻、中年及老年等；而“性别”为无序定性属性，它包含男、女两种类型，但并无一定的顺序。针对无序定性属性，有人提出了属性域约简(Attribute Domain Reduction，简称ADR)的概念。属性域约简的基本思想是，设某个需要约简的无序定性属性p的属性域基数card(Vp)为N，构造一个具有N个二进制属性(binary attribute)的表，原表中属性p的每个值就相应地转化为新表的一个二进制属性，然后对新表按照属性约简的方法进行约简，即得属性域约简的结果。【说明】：若有

36、兴趣，请参见关于Rough sets的补充材料举例说明粗糙集理论的有关概念及公式。,1.3.8 属性域约简,1.4 计算实例,长期以来，中东局势一直动荡不安且变幻莫测，有人对该地区的局势进行了较深入的研究，并总结出中东局势所牵涉的主要国家/地区及其关心的主要问题，如下表所示。,其中，联合国（UN）大会的决议(f) 为决策属性，其它均为条件属性。问题1：请利用Rough Set理论中的相关原理及公式计算下列问题：（1）试写出根据决策属性f所得到的等价类。（2）设P = a, c，试分别计算决策属性f分别为Reject和Accept时的下近似PX和上近似P*X。【注意】：应该有四个近似集。

37、（3）请写出差别矩阵（Discernibility Matrix），并给出“核”（Core）。（4）请根据差别函数计算属性约简，并给出最佳约简属性。,问题2：针对上表中的数据，试根据Shannon信息熵计算公式和决策树中的ID3算法求解下列问题：（1）请分别选择a, b, c, d, e作为测试属性时，试求出它们的条件熵。（2）请画出依据信息熵和ID3算法对上表中给出的实例集所生成的决策树。问题3：请比较两种方法所得结果，并解释之。,计算实例（续）待求解问题,实例分析（续）：关于问题(1)的解答,【问题(1)】：试写出根据决策属性f所得到的等价类。【解答】：对决策属性f而言，有2

38、个等价类，分别为对应于Reject： 1, 4, 5对应于Accept： 2, 3, 6,实例分析（续）：关于问题(2)的解答,【问题(2)】：设P = a, c，试分别计算决策属性f分别为Reject和Accept时的下近似PX和上近似P*X。【注意】：应该有四个近似集。【解答】：因P=a,c，故有U/P=1, 2, 3, 5, 4, 6对应于Reject，因其等价类为1, 4, 5，故有下近似集：1上近似集：1, 2, 3, 4, 5, 6对应于Accept，因其等价类为2, 3, 6，故有下近似集：上近似集：2, 3, 4, 5, 6,实例分析（续）：关于问题(3)的解答,【问题(3)】

39、：请写出差别矩阵（Discernibility Matrix），并给出“核”（Core）。【解答】：差别矩阵为：“核”为：b, e,实例分析（续）：关于问题(4)的解答,【问题(4)】：请根据差别函数计算属性约简，并给出最佳约简属性。【解答】：由分类质量计算公式可知，原始属性集的分类质量为1，又因“核”为b, e，故可能的属性约简为： a, b, e b, d, e根据分类质量计算公式可知，上述2种属性约简的分类质量均为1，都是最佳属性约简。,实例分析（续）：课后习题,问题2：课后习题。问题3：课后习题。【提示】：请参考本课程的课件第四讲不确定性推理概述中的有关方法解答。,1.5 课后研

40、读论文,1 Pawlak, Z., et al. Rough set approach to multi-attribute decision analysis. European Journal of Operational Research, 72: 443-459, 19942 Grzymala-Busse, D. M., et al. The Usefulness of a machine learning approach to knowledge acquisition. Computational Intelligence. 11(2):268-279, 19953 Jelonek, J., , et al. Rough set reduction of attributes and their domains for neural networks. Computational Intelligence, 11(2): 339-347, 1995【说明】：文献1必读，文献2,3可选。,

展开阅读全文