《商务统计学Ch10.ppt》由会员分享,可在线阅读,更多相关《商务统计学Ch10.ppt(75页珍藏版)》请在三一办公上搜索。
1、Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-1,第10章两个样本数值数据假设检验和单向方差分析,商务统计学(第5版),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-2,学习目标,在本章,你将学到:如何对以下差异进行假设检验两个独立总体的均值差异两个相关总体的均值差异两个独立总体的比例差异两个独立总体的方差差异如何使用单向方差分析对多总体的均值差异进行假设检验如何在单向方差分析中进行多重比较,Business
2、 Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-3,两个样本检验,两个样本检验,总体均值,独立样本,总体均值,相关样本,总体方差,均值1与均值2对比,同组样本处理前后对比,方差1与方差2对比,例:,总体比例,比例1与比例2对比,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-4,两个均值之间的差异,总体均值,独立样本,目标:两个总体均值差异的假设检验或构造置信区间,1 2,差异的点估计:,X1 X2,*,1 和2 未知,假设相同
3、,1 和 2 未知,假设不相同,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-5,两个均值之间的差异:独立样本,总体均值,独立样本,*,用Sp估计未知的。使用混合方差t检验。,1 和 2 未知,假设相同,1 和 2 未知,假设不相同,用S1 和 S2 估计 1 和 2。使用 不同方差t检验。,不同的数据来源不相关独立样本的选择不受总体变化的影响,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-6,两个总体均值的
4、假设检验,左尾检验:H0:1 2H1:1 2即,H0:1 2 0H1:1 2 0,右尾检验:H0:1 2H1:1 2即,H0:1 2 0H1:1 2 0,双侧检验:H0:1=2H1:1 2即,H0:1 2=0H1:1 2 0,两个总体均值,独立样本,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-7,两个总体均值,独立样本,左尾检验:H0:1 2 0H1:1 2 0,右尾检验:H0:1 2 0H1:1 2 0,双侧检验:H0:1 2=0H1:1 2 0,a,a/2,a/2,a,-ta,-ta/2,ta,
5、ta/2,拒绝 H0如果 tSTAT-ta,拒绝H0如果 tSTAT ta,拒绝H0如果tSTAT ta/2,1 2 假设检验,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-8,1-2假设检验,1和2 未知且相同,假设:样本是随机的独立的 总体是正态分布或者两个样本容量都超过30 总体方差未知,但是假设是相同的,*,总体均值,独立样本,1 和 2 未知,假设相同,1 和 2 未知,假设不相同,Business Statistics:A First Course,5e 2009 Prentice-Hal
6、l,Inc.,Chap 10-9,混合方差是:检验统计量是:其中 tSTAT 有 自由度=(n1+n2 2),(续),*,1-2假设检验,1和2 未知且相同,总体均值,独立样本,1 和 2 未知,假设相同,1 和 2 未知,假设不相同,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-10,1 2 的置信区间是:其中 t/2 有自由度=n1+n2 2,*,1-2置信区间,1和2 未知且相同,总体均值,独立样本,1 和 2 未知,假设相同,1 和 2 未知,假设不相同,Business Statistics
7、:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-11,混合方差t检验例子,你是一个公司的金融分析师。在NYSE和NASDAQ列出的股票表中股息是否不同?你收集到如下数据:NYSE NASDAQ数据 21 25样本均值 3.27 2.53样本标准差 1.30 1.16,假设总体接近正态分布且具有等方差,均值是否不同(=0.05)?,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-12,混合方差t检验例子:计算检验统计量,检验统计量是:,(续),H0:1
8、-2=0 i.e.(1=2)H1:1-2 0 i.e.(1 2),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-13,混合方差t检验例子:确定假设检验,H0:1-2=0 即(1=2)H1:1-2 0 即(1 2)=0.05df=21+25-2=44临界值:t=2.0154检验统计量:,决策:结论:,拒绝 H0,a=0.05,有证据表明均值不同,t,0,2.0154,-2.0154,.025,拒绝 H0,拒绝 H0,.025,2.040,Business Statistics:A First Cours
9、e,5e 2009 Prentice-Hall,Inc.,Chap 10-14,混合方差t检验例子:1-2的置信区间,因为我们拒绝H0,我们能有95%的把握确定NYSE NASDAQ?NYSE-NASDAQ,95%置信区间 因为0不在区间里,我们有95%的把握确定NYSE NASDAQ,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-15,*,1-2假设检验,1和2 未知且不同,总体均值,独立样本,1 和 2 未知,假设相同,1 和 2 未知,假设不相同,假设:样本是随机的独立的 总体是正态分布或者两个
10、样本容量都超过30 总体方差未知,但是假设是不相同的,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-16,(续),*,Excel或Minitab可以用来进行适当的运算,1-2假设检验,1和2 未知且不同,总体均值,独立样本,1 和 2 未知,假设相同,1 和 2 未知,假设不相同,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-17,相关总体的差异匹对检验,两个相关总体的均值检验 样本匹对或组队 重复度量(前/
11、后)使用匹对值间的差异:消除对象间的方差假设:两个总体都是正态分布或者,如果不是正态,则使用大样本,相关样本,Di=X1i-X2i,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-18,相关总体的差异匹对检验,第i个差异值表示为Di,其中,相关总体,Di=X1i-X2i,总体均值差异匹对的点估计是D:,n 是匹对样本中的对数,样本标准差是SD,(续),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-19,D检验统
12、计量是:,匹对样本,其中 tSTAT 自由度是 n-1,差异匹对检验:确定tSTAT,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-20,左尾检验:H0:D 0H1:D 0,右尾检验:H0:D 0H1:D 0,双侧检验:H0:D=0H1:D 0,匹对样本,差异匹对检验:可能假设,a,a/2,a/2,a,-ta,-ta/2,ta,ta/2,拒绝 H0 如果tSTAT-ta,拒绝 H0 如果 tSTAT ta,拒绝 H0如果tSTAT ta/2,其中 tSTAT 自由度是n-1,Business Stat
13、istics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-21,D 置信区间是,匹对样本,其中,差异匹对的置信区间,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-22,假设你让你的销售人员去“售后服务”训练车间。此训练前后抱怨数会有差异吗?你收集了如下数据:,差异匹对检验例子,抱怨数:(2)-(1)售货员 前(1)后(2)差异,Di C.B.6 4-2 T.F.20 6-14 M.H.3 2-1 R.K.0 0 0 M.O.4 0-4-21,D=
14、,Di,n,=-4.2,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-23,训练前后抱怨数是否有差异?(=0.01)?,-4.2,D=,H0:D=0H1:D 0,检验统计量:,t0.005=4.604 d.f.=n-1=4,拒绝,/2,-4.604 4.604,决策:不拒绝 H0(tstat 不在拒绝域),结论:抱怨数没有大的变化,差异匹对检验:求解,拒绝,/2,-1.66,=.01,Business Statistics:A First Course,5e 2009 Prentice-Hall,In
15、c.,Chap 10-24,两个总体比例,目标:检验某一假设或构造两个总体比例的差异的置信区间,1 2,差异的点估计,总体比例,假设:n1 1 5,n1(1-1)5n2 2 5,n2(1-2)5,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-25,两个总体比例,总体比例,总体比例的混合估计是:,其中 X1 和 X2 是样本1和2的观测值,在零假设下,我们假设零假设是真的,所以我们假设1=2 以及将两个样本估计量混合在一起,Business Statistics:A First Course,5e 20
16、09 Prentice-Hall,Inc.,Chap 10-26,两个总体比例,总体比例,1 2 的检验统计量是Z统计量:,(续),其中,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-27,两个总体比例的假设检验,总体比例,左尾检验:H0:1 2H1:1 2即,H0:1 2 0H1:1 2 0,右尾检验:H0:1 2H1:1 2即,H0:1 2 0H1:1 2 0,双侧检验:H0:1=2H1:1 2即,H0:1 2=0H1:1 2 0,Business Statistics:A First Cours
17、e,5e 2009 Prentice-Hall,Inc.,Chap 10-28,两个总体比例的假设检验,总体比例,左尾检验:H0:1 2 0H1:1 2 0,右尾检验:H0:1 2 0H1:1 2 0,双侧检验:H0:1 2=0H1:1 2 0,a,a/2,a/2,a,-za,-za/2,za,za/2,拒绝 H0如果ZSTAT-Za,拒绝H0如果ZSTAT Za,拒绝 H0如果ZSTAT Za/2,(续),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-29,两个总体比例的假设检验例子,在选举A的时候
18、,男性与女性投赞成票的比例有没有显著性的差异?在一个随机样本中,72个男候选人有36个投赞成票,50个女候选人中有31个投赞成票在显著性水平是0.05下进行检验,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-30,假设检验是:,H0:1 2=0(两个比例一样)H1:1 2 0(两个比例有显著性的差异),样本比例是:男:p1=36/72=.50女:p2=31/50=.62,总体比例的混合估计是:,两个总体比例的假设检验例子,(续),Business Statistics:A First Course,5
19、e 2009 Prentice-Hall,Inc.,Chap 10-31,1 2 检验统计量是:,两个总体比例的假设检验例子,(续),.025,-1.96,1.96,.025,-1.31,结论:在投票选举时,男性与女性投赞成票的比例没有显著性的差异,拒绝 H0,拒绝 H0,临界值=1.96For=.05,决策:不拒绝 H0,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-32,两个总体比例的置信区间,总体比例,1 2 置信区间是:,Business Statistics:A First Course,5
20、e 2009 Prentice-Hall,Inc.,Chap 10-33,方差的假设检验,两个总体方差的检验,F 检验统计量,H0:12=22H1:12 22,H0:12 22H1:12 22,*,假设 FSTAT,S12/S22,S12=样本1的方差(较大样本方差)n1=来自总体1样本的容量S22=样本2的方差(较小样本方差)n2=来自总体2样本的容量n1 1=分子自由度n2 1=分母自由度,其中:,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-34,F临界值来自F表有两个自由度:分子和分母其中在F
21、表中,分子自由度确定列分母自由度确定行,F分布,df1=n1 1;df2=n2 1,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-35,确定拒绝域,H0:12=22H1:12 22,H0:12 22H1:12 22,拒绝 H0 如果 FSTAT F,拒绝H0 如果 FSTAT F/2,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-36,F检验例子,你是一个公司的金融分析师。在NYSE和NASDAQ列出的股票表
22、中股息是否不同?你收集到如下数据:NYSE NASDAQ个数 2125均值3.272.53标准差1.301.16NYSE和NASDAQ 的方差在=0.05 水平下有没有差异?,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-37,F检验例子求解,确定假设检验:H0:21=22(方差没有差异)H1:21 22(方差有差异),确定F临界值,=0.05:分子 d.f.=n1 1=21 1=20分母 d.f.=n2 1=25 1=24F/2=F.025,20,24=2.33,Business Statistic
23、s:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-38,检验统计量是:,0,/2=.025,F0.025=2.33,拒绝 H0,不拒绝H0,H0:12=22H1:12 22,F检验例子求解,FSTAT=1.256 不在拒绝域,所以不拒绝H0,(续),结论:没有足够的证明方差存在差异,在=.05下,F,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-39,一般方差分析,研究者控制一个或多个观察因素每个因素包含两个或多个水平水平可以是数值的或绝对的不同的
24、水平生成不同的组把每一个组作为来自不同总体的样本观察相关样本间的影响每组是一样的吗?实验设计:收集数据,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-40,完全随机设计,实验对象指定随机的组假设对象是齐次的仅仅一个因素或独立变量有两个或多个水平单因素的方差分析(ANOVA),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-41,单向方差分析,计算三个或更多组的均值差异例:五个品牌的轮胎在发生事故时预期移动距离的
25、第一第二第三假设总体是正态分布总体有相同方差样本是随机独立的,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-42,单向方差分析假设,所有的总体均值是相同的即,不受因素影响(每组间的均值没有变化)至少一个总体均值是不一样的即,有一个因素影响 不意味着所有的总体均值是不同的(有些可能是一样的),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-43,单向方差分析,零假设是真的所有的均值是一样的:(没有因素影响),Bu
26、siness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-44,单向方差分析,零假设不是真的至少一个均值是不一样的(影响因素存在),or,(续),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-45,方差分离,总离差可以分为两部分:,SST=Total Sum of Squares(总离差)SSA=Sum of Squares Among Groups(组间离差)SSW=Sum of Squares Within Groups
27、(组内离差),SST=SSA+SSW,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-46,方差分离,总离差=多因素下独立数据值的总差异(SST),组内离差 在某一因素下数据间的差异(SSW),组间离差=样本均值间的差异(SSA),SST=SSA+SSW,(续),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-47,总离差分离,因素产生的差异(SSA),随机误差产生的差异(SSW),总离差(SST),=,+,Bu
28、siness Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-48,总均方,其中:SST=总均方c=组别的数量nj=组j的观测值数量Xij=组j的第i个观测值 X=全局均值(所有数据的均值),SST=SSA+SSW,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-49,总离差,(续),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-50,组
29、间离差,其中:SSA=组内离差平方和c=组别数nj=组j的样本容量 Xj=组j的样本均值 X=全局均值(所有数据的均值),SST=SSA+SSW,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-51,组间离差,不同组间的差异,间均方=SSA/自由度,(续),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-52,组间离差,(续),Business Statistics:A First Course,5e 2009
30、Prentice-Hall,Inc.,Chap 10-53,组内离差,其中:SSW=组内平方和c=组别数nj=组j的样本容量 Xj=组j的样本均值Xij=组j的第i个观察值,SST=SSA+SSW,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-54,组内离差,每组间离差相加知道所有的组,内均方=SSW/自由度,(续),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-55,组内离差,(续),Business St
31、atistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-56,求均值平方,均值平方通过相关的自由度划分多方面的均值平方和得到,间均方(d.f.=c-1)内均方(d.f.=n-c)总均方(d.f.=n-1),Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-57,单向方差分析表,离差来源,平方和,自由度,均方(方差),组间,c-1,MSA=,组内,SSW,n-c,MSW=,总离差,SST,n 1,SSA,F,c=组别数n=所有组的样本容量和df=
32、自由度,SSA,c-1,SSW,n-c,FSTAT=,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-58,单向方差分析F检验统计量,检验统计量 MSA 是间均方MSW 是内均方自由度df1=c 1(c=组别数)df2=n c(n=所有组的样本容量和),H0:1=2=cH1:至少两个总体均值是不一样的,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-59,单向方差分析F统计量的解释,F统计量是组间离差估计与组内离
33、差估计的比率比率必须是正的 df1=c-1 代表小的 df2=n-c 代表大的,决策:拒绝 H0如果FSTAT F,否则不拒绝H0,0,拒绝 H0,不拒绝H0,F,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-60,单向方差分析F检验例子,你想要知道3个不同高尔夫俱乐部的距离是否不同。在每一个俱乐部使用自动化设备随机的测量了5个距离值。在0.05的显著性水平下,距离均值是否不同?,Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227
34、206251 216 204,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-61,单向方差分析F检验例子:散点图,270260250240230220210200190,距离,Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227 206251 216 204,俱乐部,1 2 3,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-62,单向方差分析
35、F检验例子计算,Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227 206251 216 204,X1=249.2X2=226.0X3=205.8X=227.0,n1=5n2=5n3=5n=15c=3,SSA=5(249.2 227)2+5(226 227)2+5(205.8 227)2=4716.4,SSW=(254 249.2)2+(263 249.2)2+(204 205.8)2=1119.6,MSA=4716.4/(3-1)=2358.2,MSW=1119.6/(15-3)=93.3,Business Statist
36、ics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-63,FSTAT=25.275,单向方差分析F检验例子计算,H0:1=2=3H1:j 不相同=0.05df1=2 df2=12,检验统计量:决策:结论:,拒绝 H0,在=0.05,有证据表明至少一个j 与其它值不同,0,=.05,F=3.89,拒绝 H0,不拒绝H0,临界值:F=3.89,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-64,单向方差分析Excel 输出,单向方差分析Minitab
37、 输出,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-65,One-way ANOVA:Distance versus Club Source DF SS MS F PClub 2 4716.4 2358.2 25.28 0.000Error 12 1119.6 93.3Total 14 5836.0S=9.659 R-Sq=80.82%R-Sq(adj)=77.62%Individual 95%CIs For Mean Based on Pooled StDevLevel N Mean StDev-
38、+-+-+-+-1 5 249.20 10.40(-*-)2 5 226.00 8.80(-*-)3 5 205.80 9.71(-*-)-+-+-+-+-208 224 240 256Pooled StDev=9.66,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-66,Tukey-Kramer过程,说出哪个总体均值是显著不同的例:1=2 3在单向方差分析中拒绝同等均值可以成对比较绝对均值差异与临界极差的对比,x,1,=,2,3,Business Statistics:A First Course,
39、5e 2009 Prentice-Hall,Inc.,Chap 10-67,Tukey-Kramer 临界极差,其中:Q=分子自由度为c,分母自由度为n-c的学生极差分布的右侧临界值(参见附录 E.8 表)MSW=内均值 nj 和 nj=组j 和组 j的样本容量,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-68,Tukey-Kramer 过程例子,1.计算绝对均值差:,Club 1 Club 2 Club 3254 234 200263 218 222241 235 197237 227 20625
40、1 216 204,2.在附录E.8表中找到c=3 和(n c)=(15 3)=12下Q的值:,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-69,Tukey-Kramer 过程例子,5.所有的绝对均值差异比临界极差大。因此在5%的显著性水平下每一对的均值有显著性差异。因此,我们有95%的把握宣传俱乐部1的距离均值比俱乐部2,3大,俱乐部2比俱乐部3大。,3.计算临界极差:,4.对比:,(续),Business Statistics:A First Course,5e 2009 Prentice-Ha
41、ll,Inc.,Chap 10-70,单向方差分析假设,随机性与独立性从c组里选择随机样本(或随机分配给有关因素)正态分布每组的样本值来自于正态的总体同方差所有的总体样本有相同的方差可以使用Levene检验,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-71,单向方差分析Levene检验,检验总体同方差假设首先,定义零假设和备择假设:H0:21=22=2cH1:不是所有的2j 都相同第二,计算每一个值与组内中位数的绝对差。第三,对这些绝对差使用单向方差分析。,Business Statistics:A
42、 First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-72,同方差Levene检验例子,H0:21=22=23H1:不是所有的2j 都相同,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-73,同方差Levene检验例子,(续),因为p值比0.05大,我们不能拒绝H0 以及推出方差相同。,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-74,小结,两个独立样本的对比两个均值差异的混合方差t检验两个均值差异的不同方差t检验构造两个均值差异的置信区间两个相关样本的对比(成对样本)均值差异的匹对t检验构造均值差异的置信区间,Business Statistics:A First Course,5e 2009 Prentice-Hall,Inc.,Chap 10-75,小结,两个总体比例的对比构造两个总体比例差异的置信区间构造两个总体比例的Z检验两个总体方差差异的F检验单向方差分析单向方差分析原理单向方差分析假设C均值差异的F检验多重对比的Tukey-Kramer过程同方差Levene检验,(续),