心理学统计第七部分非参数统计课件.ppt

资源描述

《心理学统计第七部分非参数统计课件.ppt》由会员分享，可在线阅读，更多相关《心理学统计第七部分非参数统计课件.ppt（54页珍藏版）》请在三一办公上搜索。

1、第十九章二项分布,A基本概念,二项分布的来源二项分布的正态近似比率z检验,本书前面的章节主要介绍了参数统计的方法，如果变量为等距或等比数据，且数据分布服从正态分布（或t分布等），那么我们可以采用参数统计方法进行分析。如果所有数据都是称名或者顺序数据，或者等距/等比数据不满足参数统计的分布假设，就需要采用非参数统计方法。比如，期末考试6道判断题，一个学生她答对多少道题才算她考试通过呢？,对于这样的问题，即使这个学生完全不会，那她也很可能蒙对3道题，那她蒙对4道、5道、6道的概率是多少呢？根据概率的乘法原则，几个独立事件同时出现的概率等于这些事件发生概率之积。这样做对X道题的概率为这个公式代表的

2、分布称为二项分布。,当一个事件或者观察可以被分类到两个具有一定发生概率的类别中的一个且是唯一一个时（男女、对错等），就可能产生一个二项分布，也成为伯努利分布；这样的事件被称为二分事件。对应的两个类别的概率通常用P和Q表示，P+Q=1.扔硬币就是一个典型的二分事件，P=Q=0.5，随着试验次数（扔的次数）N增加，二分事件所对应的发生概率P和Q不会变化。通常把第一类别（概率P的时间）的实验次数称为X，即二项分布的变量。,上面的问题中，P=Q，做对X道判断题的概率分布如下图所示。随着试验的总次数N增加，二项分布越来越接近正态分布。,如果考试题目为单选题（三选一），P不等于Q，则二项分布不对称。即使P

3、不等于Q，但只要N足够大，二项分布也越来越对称，越来越接近正态分布。,N足够大的标准：如果P=0.5，当N大于25时，二项分布近似于正态分布；如果P不接近0.5时，NPQ最少是9时才可将二项分布近似为正态分布。,总之，对于二分事件，只要N足够大，二项分布就接近于一个均值为NP，标准差为的正态分布。如果期末考试题为判断题，总题数50，该同学做对多少道才算她通过呢？一般来说，只要她做的题目数大于一半，且概率足够小（0.05），那么我们就可以认为她不是蒙的，可以通过。既然当N足够大时，该分布服从正态分布，那么我们可以通过Z临界计算需要答对的题数。,显著水平0.05下，单侧Z临界为1.65。当学生答

4、对的题目数大于等于31题时，可让其通过。,B基本统计过程,符号检验过程符号检验的前提假设赌徒谬误,二项分布的一个重要应用是，比较不容易定量的两个刺激。比如设计一个实验来检验面孔知觉偏好是不是天生的，选择30个婴儿，同时给他们呈现一张面孔图片和一张彩球图片，看婴儿是不是更关注面孔图片。结果发现有20个婴儿看面孔更多一点。如果记录下了每个婴儿关注两张图片的时间，也就是差异可以量化，那么可以采用配对t检验来检验这个差异。如果当时具体的时间没有记录下来，只记录了每个婴儿看哪张图片更多一些，那么可以采用符号检验来比较。,符号检验属于非参数检验，但可采用参数检验所使用的六步方法：提出假设选择统计检验和显著

5、水平选择样本和收集数据求拒绝区域计算检验统计量做出统计推断,提出假设：零假设：婴儿关注面孔和彩球一样多，P=0.5；备择假设：婴儿对面孔和彩球关注不同P0.5或P0.5选择统计检验和显著水平：每个婴儿关注面孔和彩球的具体时间没有被记录下来，所以适合的检验是符号检验，显著水平选择0.05双侧.,选择样本收集数据：二分事件，第一类别为关注面孔更多的事件，总数用X表示，则X=20求拒绝区域：由于N=30较大，二项分布近似于正态分布，在显著水平双侧0.05下，拒绝区域为大于1.96或者小于-1.96.,计算检验统计量对于正态分布曲线是光滑和连续的，而二项分布却是离散和阶梯状的。对于二项分布

6、而言，取某个值X的概率等于X-1到X之间长方形的面积；而对正态分布而言，X对应的概率是从X-0.5到X+0.5之间的面积。这个差异需要进行连续性校正，当N100时可不做连续性校正。,做出统计推断 Z分数落在拒绝区域外，接受零假设，即婴儿对面孔没有注意偏好。,符号检验的前提假设：二分事件：每个简单事件或者试验只属于两个分类中的一个或另一个，而不会同时在两个分类或第三个分类中，P+Q=1；独立事件：实验中的每次试验互不干扰；固定过程：P和Q在实验的每轮试验中保持不变；正态近似：如果N不够大，需要查符号检验对应的表格，不能用正态逼近；任意分布检验：因变量分布可不是正态分布。,在二分事件中，最常见的

7、就是赌徒谬误，即认为事件的概率会在一串某一分类的结果接连出现后改变来弥补损失以保证分类间的平衡。比如，我们知道扔硬币很多次，正面朝上的次数和背面朝上的次数将接近相等，所以当连续几次都是正面朝上时，我们会觉得下次背面朝上的概率会变大，这就是赌徒谬误。实际上，由于每次抛硬币都是与之前无关的独立事件，因此正面朝上的概率不会变。,符号检验的应用当只知道配对观测值的差异方向而不知道差异量或者差异量远不能近似于正态分布时，不能采用配对t检验，应该采用符号检验；当配对t检验和符号检验都可以应用时，符号检验比配对t检验的统计检验力要低。之前讲过的皮尔逊相关和斯皮尔曼等级相关的关系与此类似。,第二十章卡方检

8、验,A基本概念,卡方分布期望频次和观测频次卡方统计量卡方临界值各种不同的单因素卡方检验,上一章中我们介绍了二分事件的计数数据服从二项分布，可以采用符号检验对二者差异进行检验。比如从我们心理学院的两个专业中找30名同学去参加义务劳动，师范类找了20个人，非师范类找了10个人，非师范生认为挑选不公平，剥夺了他们为社会做贡献的权利，那么这次挑选真的不公平吗？,我们可以通过符号检验来分析零假设：两个专业同学被选的机会均等，即P=0.5显著水平选择0.05双侧N=30，近似于正态分布，0.05显著水平下，拒绝区域为大于1.96或者小于-1.96,采用连续性校正的公式做出统计推断接受零假设，两个专业的学

9、生被选的概率是相等的。,如果上边的问题变了，30志愿者不分专业从大一、大二、大三三个年级中挑选，结果大一15人、大二10人、大三5人，这样的挑选平等吗？很显然，上边的事件也不再是二分事件，它涉及到了三个类别，相应的分布也不再是二项分布，而是多项分布。在二项分布中，各个值对应的概率我们可以轻松求得，但是在处理二分事件时，我们依然将它近似为正态分布；对于多项分布，计算则比较复杂，这样就更需要采用近似的方法进行分析。,在参数统计中比较一个变量两个水平之间的差异可以用两样本t检验和方差分析，F值为t值的平方，服从F分布，F检验可用于处理多水平间的差异。类似的，二项分布近似的正态分布可以处理二分事件间的

10、差异，对其平方得到的分布可以处理多个类别间的差异。,假设平方前的z分数服从正态分布，那么z的平方会服从另外一种不同的数学分布，即卡方分布。,卡方分布的形状是由它的自由度决定的。卡方分布的自由度等于类别数减1，即k-1。从上图可以看出，除非自由度非常大，否则所有的卡方分布会倾向于正偏态。与F检验类似，卡方检验也是单侧的。,对于二分事件分子部分X-NP。NP代表的概率为P的情况下该类别的期望频次fe，而X代表实际或观测到的频次fo。对于k种类别的情况，,卡方检验的自由度为k-1，通过查表确定拒绝区域,前边的那个问题，零假设：志愿者是随机选的，即三个年级的学生被选中的概率相等，均为1/3。自由度为3

11、-1=2，卡方临界为5.99，计算统计量小于临界值，接受零假设，志愿者的挑选各年级是机会平等的。,如果卡方计算值大于临界值，也就是显著的，意味着在期望频次和实际频次之间存在不匹配。但是要确切知道到底是那两组存在差异，还需要进一步的分析（两两进行符号检验或卡方检验，对进行Bonferroni校正）。,前边我们讲的是单因素卡方检验，也称为拟合度检验，经常用于测量实际频次和基于理论的或假设的总体分布的期望频次之间的拟合度。实际应用中存在以下几种情况：1、检验无差假说：也就是假定期望频次相等，如前边的挑选志愿者的例子；,2、检验假设分布的概率卡方分布拟合度最初的应用就是基于某个连续变量的样本分布来检

12、验它的总体分布形态。比如检验期末考试成绩是否服从正态分布。选取100个学生，如果服从正态分布，那么将会有34个人的z分数在01之间，大约13个人落在12之间，3个人落在2以上，负数区域有同样的人数，这就是期望频次。把100名同学的成绩转化为z分数，统计出实际频次。然后用卡方检验来分析。如果显著，则不服从正态分布；否则，服从。,B基本统计过程,二因素列联表关联皮尔逊卡方检验卡方检验的假设,A部分我们对单因素卡方检验进行了介绍，在实际的心理学研究中往往会牵涉到两个以上的变量之间的关系。所以二因素卡方检验要比单因素卡方检验更为常用。比如，我们想看一下学生对授课教师的性别是否存在某种偏好。这样就涉

13、及到两个两个变量学生的性别和老师的性别。,两个课堂的情况如下表所示，两个课堂老师分别为男和女，各30人，男老师班上5个男生25个女生，女老师班上15个男生15个女生。下表称为列联表或交叉分类表,从上表可以看出，大多数男生选了女老师课堂，大多数女生选了男老师课堂，这似乎体现了一种相关，即异性偏好。但这是否是一种随机产生的巧合呢？我们可以采用关联皮尔逊卡方检验来决定是否决绝零假设。在二因素卡方检验中，零假设是两个变量之间没有关系，即一个变量在不同类别中的分布不会随另一个变量不同水平的变化而变化。换句话说，零假设认为两个变量相互独立，互不影响。因此关联皮尔逊卡方检验也被称为独立性卡方检验。,在独立性

14、卡方检验中，自由度等于两个变量自由度之积，df=(R-1)(C-1)，本例中等于1，在0.05显著水平下卡方检验的拒绝区域为大于3.84。统计量的计算依然采用公式其中k为单元格数目，也就是类别数目，期望频次为,括号内计算得到的期望频次，则做出推断，课堂上教师的性别与选课同学的性别存在相关，学生选课时对授课教师性别存在异性偏好。,卡方检验的前提假设：互斥互补的类别：每个观测值都会落入一个而且仅可以落入一个类别中；观测值相互独立：可通过让每个被试只代表一次观测值来满足；期望频次的大小：比较保守的规则是每个期望频次都大于5（df=1时，都要大于10）；相对宽松的规则是每个期望频次都大于1，并且不多于

15、20%的期望频次小于5.,第二十章顺序数据的统计检验,前两章我们讲了对于二分事件和N分事件，其数据为计数数据，这样的情况不符合参数统计的假设，比较各个类别之间的差异我们可以采用符号检验和卡方检验。在教育心理学的很多研究中，其数据也不遵从等距，或者其分布为较强的偏态分布，这时我们可以这些数据用顺序数据来表达，采用非参数统计的方法来分析。五名男生期末考试成绩为98，96，94，90，80，六名女生成绩为97，95，93，92，91，89，问10名同学成绩存在性别差异吗？,对于这样一个问题，我们不能确定数据是否服从正态分布，因此无法采用两样本t检验，这时可以采用秩和检验。秩和即秩次之和或等级之和

16、。秩次即按大小排序后的序号，一般从大到小排序。括号里就是每个数据对应的秩次男： 98(1)，96(3)，94(5)，90(9)，80(11)女： 97(2)，95(4)，93(6)，92(7)，91(8)，89(10),排序之后，将容量较小的样本中各数据的等级相加，用T表示。T=1+3+5+9+11=19查秩和检验表，若T=T2，则表明两样本具有统计学意义。查下表可知，在双侧0.05显著水平下， T=T1，男女生期末考试成绩存在差异。在上边的例子中，两个样本量均小于10.,当两个样本量均大于10时，秩和T的分布接近于正态分布。其平均数为标准差为n1为较小的样本量这样z分数等于,假设11个男生成

17、绩排名为1,3,5,6,9,11,16,20,21,22,2312名女生成绩排名为2,4,7,8,10,12,13,14,15,17,18,19正态分布平均数为132，标准差为16.25，秩和T为137，则z=0.311.96，所以男女生成绩无差异。,比较来自两个被试组的数据差异时，如果数据总体服从正态分布，我们可以采用两独立样本t检验来分析；如果两组数据总体不服从正态分布，可采用秩和检验来分析。两组数据可以来自两组被试，也可以来自一组被试的两次测量，如果数据服从正态分布，则可采用配对t检验来分析；如果不服从正态分布，则可采用Wilcoxon符号等级检验法来分析。,如果被试样本N=25，该方法具体步骤如下：第一步：求出成对观测数据的差di，并将di的绝对值按大小顺序编上等级（从小到大）；第二步：等级编号完成以后恢复正负号，分别求出正等级之和T+和负等级之和T-，选择T+和T-中较小的一个作为Wilcoxon检验统计量T；第三步；作出判断。根据显著性水平查附表，得到临界值T，若TT，则拒绝原假设H0。,比如，对10名研究生刚入学和毕业时进行压力指数测量，结果如下，问两次是否有明显变化？,T+=8+4+3+7+9=31T-=1+6+2+5=14则T=14，查表，双侧检验0.05下，N=10，临界值为11，TT临界，两次无显著差异。,当N25时，一般认为T的分布近似于正态分布,

展开阅读全文

心理学统计 第七部分 非参数统计课件.ppt

心理学统计第七部分非参数统计课件.ppt