统计学7类型数据检验.ppt

上传人:牧羊曲112 文档编号:6373777 上传时间:2023-10-21 格式:PPT 页数:34 大小:470.50KB
返回 下载 相关 举报
统计学7类型数据检验.ppt_第1页
第1页 / 共34页
统计学7类型数据检验.ppt_第2页
第2页 / 共34页
统计学7类型数据检验.ppt_第3页
第3页 / 共34页
统计学7类型数据检验.ppt_第4页
第4页 / 共34页
统计学7类型数据检验.ppt_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《统计学7类型数据检验.ppt》由会员分享,可在线阅读,更多相关《统计学7类型数据检验.ppt(34页珍藏版)》请在三一办公上搜索。

1、1,商业统计学,类型数据分析,第十二讲,2,类型数据分析,目的:本讲结束后,学生们应能够:,将类型数据整理为列联表 解释卡方分布的性质 运用卡方分布进行同质性检验 运用卡方分布进行独立性检验 解释卡方检验的SPSS输出结果,3,类型数据分析,讲课提纲,列联表 交叉列联表所讲述的内容 总体之间的同质性 两个变量之间的独立性 将统计学运用于具体情形 SPSS发挥的作用,4,列联表-交叉列联表所讲述的内容,收集抽样单位特征或特点方面的资料,整理 数据以反映每种类型的计数情况,与“类型”有联系的观察值被称为类型数据,5,列联表-交叉列联表所讲述的内容,例题 1根据同一特征对两个样本进行分类,CF(商业

2、广告片)在电视上播放之前,通常要经过检验和修改。一名软饮料生产商想在电视上播放一个新的商业广告片。他为这个广告制作了两个版本,即CF-A和CF-B。这名生产商想对广告片的两个版本进行初步的检验。为此,他将其中一个版本的广告片播放给一半观众看,另一个版本的广告片播放给另一半观众看,然后他对这些观众进行电话调查并将他们的反应分为以下几类:,不记得记得只记得广告内容 观看过的内容 广告中的要点,6,列联表-交叉列联表所讲述的内容,这两个不同版本的商业广告片是否在人们头脑中留下了同样的印象?,7,列联表-交叉列联表所讲述的内容,8,列联表-交叉列联表所讲述的内容,例题 2根据两种特征对一个样本进行分类

3、,劳工合同期限与行业类型之间是否具有联系?,9,列联表-交叉列联表所讲述的内容,卡方(2)分布-,它由一系列分布组成,其具体形状取决于一个参数,即自由度(df),卡方分布是一种抽样分布,卡方分布倾向右侧,随着自由度(df)增大,卡方分布将接近正态分布,10,列联表-交叉列联表所讲述的内容,11,列联表-交叉列联表所讲述的内容,卡方检验的基本思想-,比较观察频数和期望频数,如果观察频数接近期望频数,则可以作为接受原假设(H0)的证据,运用卡方检验-,检验同质性,检验拟合优度,检验独立性,检验总体方差是否相等,12,总体之间的同质性,当把从两个样本中抽取的数据根据同一特征进行了分类并表示为列联表之

4、后,目的是检验不同总体的反应类型是否相同,为了回答这个问题,我们利用卡方检验来检验同质性,13,总体之间的同质性,例题 1:两个不同版本商业广告片的反应类型,每种版本的商业广告片代表一个总体,每一种反应类型代表未知的总体比例,14,总体之间的同质性,原假设为具有“同质性”或“相似的反应类型”,可以将其写成,H0:pA1=pB1,pA2=pB2,pA3=pB3,15,总体之间的同质性,根据H0,pi可以被估计为,和,如果原假设为真,两个总体的每种反应类型都应当具有相同的比例,让我们分别用一些常见的比例符号p1,p2,p3来表示,16,总体之间的同质性,期望频数-,17,总体之间的同质性,检验统计

5、量,如果观察频数与期望频数相差很大,我们就认为原假设为假,18,总体之间的同质性,2=0.674+0.502+2.006+0.770+0.573+2.292=6.817,2值是否过大,使得我们不得不拒绝H0?,将该值与从2表中获得的“临界值”进行比较,查表之前需要知道 1.自由度d.f.=(r1)(c1)2.右尾上面的面积()显著水平,19,总体之间的同质性,20,总体之间的同质性,自由度 d.f.=(21)(31)=2,显著水平,=0.05,=5.99,临界值,6.817 5.99数据显示:当显著水平=0.05时,检验统计量太大,因此我们应当拒绝H0,观众在观看完两种不同版本的商业广告片之后

6、,其反应类型会有明显的差异,21,总体之间的同质性,进行卡方同质检验的步骤,1.构造假设,2.建立列联表并计算期望频数,3.计算检验统计量,4.计算自由度 并查找临界值,5.进行决策并得出结论,22,总体之间的同质性,H0:各个总体的反应类型具有相同的概率 HA:与其他总体相比,有些总体的反应类型有不同的概率,检验统计量,自由度=(r 1)(c 1),拒绝 H0 如果2,(检验统计量 临界值),23,两个变量之间的独立性,当按照两种特征对数据进行了归类并将其表示为双向列联表时,实质性问题是:这两种特征是否在总体中进行了独立分布?,为了回答这个问题,我们需要利用2 来进行独立性检验,24,两个变

7、量之间的独立性,思考一下,当显著水平=0.05时,劳工合同期限是否与行业类型有联系?,25,两个变量之间的独立性,1.构造假设,H0:合同期限与行业类型相互独立 HA:合同期限与行业类型相互不独立,2.计算期望频数,如果原假设为真,则我们预计可以得到,P(期限 行业)=P(期限)P(行业),26,两个变量之间的独立性,因此,可以根据下表计算期望频数,27,两个变量之间的独立性,3.检验统计量,=4.157,自由度=(2 1)(3 1)=2,4.临界值,=5.99,5.4.157 5.99(即检验统计量 临界值)接受 H0数据显示:当显著水平=0.05时,合同期限与行业类型相互独立,28,两个变

8、量之间的独立性,H0:两个因子相互独立 HA:两个因子相互不独立,检验统计量,自由度=(r 1)(c 1),拒绝 H0 如果2,(即 检验统计量 临界值),29,将统计学运用于具体情形-SPSS发挥的作用,定义数据 变量图,有三个变量有待定义:行业、期限、计数,30,将统计学运用于具体情形-SPSS发挥的作用,输入数据 数据图,将3栏、6排数据按以下方式输入,根据计数衡量各种情形(数据 衡量情形),31,将统计学运用于具体情形-SPSS发挥的作用,进行分析 菜单条,1.在菜单条中单击 分析 描述统计学 交叉列表,2.将行业规定为行,期限规定为列 单击小格 并且 检查期望数和各行的百分比 单击统

9、计并且方检验 和Phi and Cramers V,3.单击OK,32,将统计学运用于具体情形-SPSS发挥的作用,SPSS 输出结果,可以用皮尔生卡方来表示卡方检验统计值,2=4.157自由度=2p 值=0.125(0.05),由于p 值,因此我们接受 H0,即数据支持原假设:即行业类型与合同期限是相互独立的,33,将统计学运用于具体情形-SPSS发挥的作用,行业类型与期限交叉列表,10,187,48,245,14.1,180.1,50.8,245.0,4.1%,76.3%,19.6%,100.0%,13,107,35,155,8.9,113.9,32.2,155.0,8.4%,69.0%,

10、22.6%,100.0%,23,294,83,400,23.0,294.0,83.0,400.0,5.8%,73.5%,20.8%,100.0%,计数,每一类行业,的期望数,计数,每一类行业,的期望数,计数,每一类行业,的期望数,制造型,非制造型,行业类型,总计,少于,2年,2 4年,4年,以上,期限,总计,34,将统计学运用于具体情形-SPSS发挥的作用,卡方检验,4.157,a,2,.125,4.058,2,.131,.068,1,.795,400,皮尔生卡方,可能性比例,线性,关系,有效情形数量,数值,自由度,非对称的显,(双侧),小格(.0%)表示期望数小于5,最小期望数为8.91,a.,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号