《应用多元统计分析课后习题答案高惠璇第六章习题解答.ppt》由会员分享,可在线阅读,更多相关《应用多元统计分析课后习题答案高惠璇第六章习题解答.ppt(38页珍藏版)》请在三一办公上搜索。
1、应用多元统计分析,第六章部分习题解答,2,第六章 聚类分析,6-1 证明下列结论:(1)两个距离的和所组成的函数仍是距离;(2)一个正常数乘上一个距离所组成的函数仍是距离;(3)设d为一个距离,c0为常数,则仍是一个距离;(4)两个距离的乘积所组成的函数不一定是距离;,3,第六章 聚类分析,(2)设d是距离,a 0为正常数.令d*=ad,显然有,4,第六章 聚类分析,故d*=ad是一个距离.(3)设d为一个距离,c0为常数,显然有,5,第六章 聚类分析,故d*是一个距离.,6,第六章 聚类分析,7,第六章 聚类分析,6-2 试证明二值变量的相关系数为(6.2.2)式,夹角余弦为(6.2.3)式
2、.,证明:设变量Xi和Xj是二值变量,它们的n次观测值记为xti,xtj(t=1,n).xti,xtj 的值或为0,或为1.由二值变量的列联表(表6.5)可知:变量Xi取值1的观测次数为a+b,取值0的观测次数为c+d;变量Xi和Xj取值均为1的观测次数为a,取值均为0的观测次数为d 等等。利用两定量变量相关系数的公式:,8,第六章 聚类分析,9,第六章 聚类分析,故二值变量的相关系数为:,(6.2.2),10,第六章 聚类分析,利用两定量变量夹角余弦的公式:,其中,故有,11,第六章 聚类分析,6-3 下面是5个样品两两间的距离阵,试用最长距离法、类平均法作系统聚类,并画出谱系聚类图.解:用
3、最长距离法:合并X(1),X(4)=CL4,并类距离 D1=1.,12,第六章 聚类分析,合并X(2),X(5)=CL3,并类距离 D2=3.,合并CL3,CL4=CL2,并类距离 D3=8.,所有样品合并为一类CL1,并类距离 D4=10.,13,第六章 聚类分析,最长距离法的谱系聚类图如下:,14,第六章 聚类分析,合并X(1),X(4)=CL4,并类距离 D1=1.,用类平均法:,15,第六章 聚类分析,合并X(2),X(5)=CL3,并类距离 D2=3.,合并CL3,CL4=CL2,并类距离 D3=(165/4)1/2.,所有样品合并为一类CL1,并类距离 D4=(121/2)1/2.
4、,16,第六章 聚类分析,类平均法的谱系聚类图如下:,17,第六章 聚类分析,6-4 利用距离平方的递推公式,来证明当0,p0,q0,p+q+1时,系统聚类中的类平均法、可变类平均法、可变法、Ward法的单调性.,证明:设第L次合并Gp和Gq为新类Gr后,并类距离DL Dpq,且必有Dpq2Dij2.新类Gr与其它类Gk的距离平方的递推公式,当0,p0,q0,p+q+1 时,这表明新的距离矩阵中类间的距离均 Dpq DL,故有DL1 DL,即相应的聚类法有单调性.,18,第六章 聚类分析,对于类平均法,因,故类平均法具有单调性。对于可变类平均法,因,故可变类平均法具有单调性。,19,第六章 聚
5、类分析,对于可变法,因,故可变法具有单调性。对于离差平方和法,因,故离差平方和法具有单调性。,20,第六章 聚类分析,6-5 试从定义直接证明最长和最短距离法的单调性.证明:先考虑最短距离法:设第L步从类间距离矩阵 出发,假设,故合并Gp和Gq为一新类Gr,这时第L步的并类距离:,且新类Gr与其它类Gk的距离由递推公式可知,设第L+1步从类间距离矩阵 出发,,21,第六章 聚类分析,故第L1步的并类距离:,即最短距离法具有单调性.类似地,可以证明最长距离法也具有单调性.,22,第六章 聚类分析,6-6 设A,B,C为平面上三个点,它们之间的距离为,将三个点看成三个二维样品,试用此例说明中间距离
6、法和重心法不具有单调性.,解:按中间距离法,取=-1/4,将B和C合并为一类后,并类距离D1=1,而A与新类Gr=B,C的类间平方距离为,23,第六章 聚类分析,故中间距离法不具有单调性。按重心法,将B和C合并为一类后,并类距离D1=1,而A与新类Gr=B,C的类间平方距离为,当把A与B,C并为一类时,并类距离,24,第六章 聚类分析,故重心法法不具有单调性。并类过程如下:,当把A与B,C并为一类时,并类距离,A,B,C,25,第六章 聚类分析,解一:利用如果样品间的距离定义为欧氏距离,则有,6-7 试推导重心法的距离递推公式(6.3.2);,26,第六章 聚类分析,27,第六章 聚类分析,2
7、8,第六章 聚类分析,解二:因样品间的距离定义为欧氏距离,利用,29,第六章 聚类分析,利用,30,第六章 聚类分析,故有,31,第六章 聚类分析,6-8 试推导Ward法的距离递推公式(6.3.3);,解:Ward法把两类合并后增加的离差平方和看成类间的平方距离,即把类Gp和Gq的平方距离定义为,利用Wr的定义:,32,第六章 聚类分析,33,第六章 聚类分析,34,第六章 聚类分析,(当样品间的距离定义为欧氏距离时),记GrGp,Gq,则新类Gr与其它类Gk的平方距离为,利用重心法的递推公式(6-7题已证明)可得:,35,第六章 聚类分析,36,第六章 聚类分析,6-9 设有5个样品,对每
8、个样品考察一个指标得数据为1,2,5,7,10.试用离差平方和法求5个样品分为k类(k5,4,3,2,1)的分类法bk及相应的总离差平方和W(k).,解:计算样品间的欧氏平方距离阵,合并 1,2 CL4,并类距离D1=(0.5)1/2=0.707,并利用递推公式计算新类与其它类的平方距离得,37,第六章 聚类分析,合并 5,7 CL3,并类距离D2=(2)1/2=1.414,并利用递推公式计算新类与其它类的平方距离得,合并 CL3,10=5,7,10 CL2,并类距离D3=(32/3)1/2=3.266,并利用递推公式计算新类与其它类的平方距离得,38,第六章 聚类分析,合并 CL4,CL2=1,2,5,7,10 CL1,并类距离D4=(245/6)1/2=6.39,并利用递推公式计算新类与其它类的平方距离得,分类法bk及相应的总离差平方和W(k):,