《《教育信息处理》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《教育信息处理》PPT课件.ppt(27页珍藏版)》请在三一办公上搜索。
1、第三节熵函数的展开,一、联合熵二、条件熵三、互信息Kullback信息量(不讲),一、联合熵,设有两道多重选择问题X、Y。问题X有r个预选答案,问题Y有c个预选答案。通过测试,学生对问题X选中第s个预选答案,对问题Y选中第t个预选答案的概率为pst.这是一种同时的选择概率。称对一个项目选择s,对另一个项目选择t的概率分布为联合概率分布。,三、互信息,基于联合熵和条件熵,我们可以定义互信息为:I(X;Y)=H(X)-H(X|Y)或定义互信息I(X;Y)为I(Y;X)=H(Y)-H(Y|X)可以证明,互信息I(X;Y)和互信息I(Y;X)是相等的,互信息的另一种定义方法是直接定义X和Y之间的互信息
2、为由上式可以得到 I(x;y)=H(x)+H(Y)-H(XY),互信息的性质:,一般情况下,有0I(X;Y)minH(X),H(Y),第四节测试问题的信息量,一、测试问题信息熵的计算二、等价预选项数(等价选项个数)三、对不确定程度的判断四、互信息在标准化试卷评分中的应用,给定的问题是:从外观上看,12个小球完全相同,在这12个小球中,仅有一个小球的重量与其它小球不一样。请使用天平,能否在三次以内找出这个重量不同的小球,并且指明该小球比其它小球是重还是轻。,分析与求解:比较12个小球,并判定轻、重,应是12x2种比较当中的一种。在比较的过程中,开始的不确定程度为log244.585(bit)通过左边轻、右边轻或平衡的判断,每使用一次天平,不确定程度减少log31585bit。由此,使用两次天平,所得到的信息量为2log33170(bit)该信息量小于4585(bit)。使用三次天平,所得到的信息量为3log347555(bit)该信息量大于4585bit)。它表示,如果使用三次天平,可完全消除不确定程度,即通过三次使用天平,可找出不同的小球,解决给定的问题。,