心理与教育统计学第6章概率分布.ppt

上传人:牧羊曲112 文档编号:5727567 上传时间:2023-08-14 格式:PPT 页数:143 大小:2MB
返回 下载 相关 举报
心理与教育统计学第6章概率分布.ppt_第1页
第1页 / 共143页
心理与教育统计学第6章概率分布.ppt_第2页
第2页 / 共143页
心理与教育统计学第6章概率分布.ppt_第3页
第3页 / 共143页
心理与教育统计学第6章概率分布.ppt_第4页
第4页 / 共143页
心理与教育统计学第6章概率分布.ppt_第5页
第5页 / 共143页
点击查看更多>>
资源描述

《心理与教育统计学第6章概率分布.ppt》由会员分享,可在线阅读,更多相关《心理与教育统计学第6章概率分布.ppt(143页珍藏版)》请在三一办公上搜索。

1、心理与教育统计学,第6章 概率分布,6.1 概率的基本概念6.2 二项分布6.3 正态分布6.4 样本分布,6.1 概率的基本概念,在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象,称为随机现象。例如掷硬币、抛骰子等概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科。,6.1.1 什么是概率,随机事件的频率,当n无限增大时,随机事件A的频率会稳定在一个常数P,这个常数就是随机事件A的概率。,(一)后验概率(或统计概率),(6.1),(6.2),观察随机事件A出现的次数的方式来决定A的概率,称为后验概率。,(二)先验概率(古典概率),古典概率模型要求满足两

2、个条件:试验的所有可能结果(或基本事件)是有限的;每一种基本事件出现的可能性相等。,n为基本事件的总数;m为事件A包含的基本事件的数目。,(6.3),在事件A发生之前,可以通过计算确定的概率,称为先验概率。,Dewey.G统计了约438023个字母,得到的英语中特定字母的频率,历史上的投掷硬币试验,投掷硬币的概率是统计概率与古典概率?,6.1.2 概率的基本性质,1任何随机事件的概率都是在0与1之间的正数,即:0 P(A)12不可能事件的概率等于零,即:P(A)=0 3必然事件的概率等于1,即:P(A)=1,(一)概率的公理系统,(二)概率的加法定理,若事件发生,则事件就一定不发生,这样的两个

3、事件为互不相容事件。两互不相容事件和的概率,等于这两个事件概率之和,即,(6.4a),(6.4b),(三)概率的乘法定理,若事件发生不影响事件是否发生,这样的两个事件为互相独立事件。两个互相独立事件同时出现的概率,等于这两个事件概率的乘积,即,(6.5a),(6.5b),例:某一学生从个试题中任意抽取一题,进行口试。如果抽到每一题的概率为15,则抽到试题或试题的概率是多少?如果前一个学生把抽过的试题还回后,后一个学生再抽,则个学生都抽到试题1的概率是多少?,该学生抽到试题1或者试题2为不相容事件:,四个学生均抽到试题1为独立事件:,例:一个口袋装有6只球,其中4只白球、2只红球,从袋中取球两次

4、。考虑两次取球方式(a)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。(b)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一球。请问这两种情况下取到一只白球和一只红球的概率。,放回取样,第一次取到白球,第二次取到红球:,第一次取到红球,第二次取到白球:,取到一只白球和一只红球的概率:,不放回取样,第一次取到白球,第二次取到红球:,第一次取到红球,第二次取到白球:,取到一只白球和一只红球的概率:,问题:小明的班上有83名同学,至少有一位同学与小明的生日相同的概率?(一年按365天计算),82名同学与小明的生日均不相同的概率为:,至少一位同学与小明的生日相同的概率为:,问

5、题:83人的班上,至少两人生日相同的概率为多少?,“与小明生日相同的概率”与“班级人数”的关系,“至少两人生日相同的概率”与“班级人数”的关系,人数,概率,人数,概率,小明的小组有6人,(1)有人与小明出生月份相同的概率为多少?(2)至少2人出生月份相同的概率为多少?,信不信?可以试一试!,(1),(2),6.1.3 概率分布类型,概率分布是指对随机变量取不同值时的概率的描述,一般用概率分布函数进行描述。概率分布是总体的分布,而频率分布是样本的分布。概率给出的是单个结果发生的可能性,概率分布是对随机变量所有可能结果的可能性分布描述,通常可以写成某个函数式形式。,学生身高次数分布表,次数,频率,

6、频率密度,150 159 168 177,150 159 168 177,150 159 168 177,151 160 169 178,151 160 169 178,151 160 169 178,学生身高次数分布图,全国学生身高概率分布图,151 160 169 178,151 160 169 178,概率,概率密度,概率分布中的曲线高度一般为概率密度,面积表示概率,横坐标为样本值;有少数情况下,曲线高度表示概率(如P179二项分布)。,(一)离散分布与连续分布,依随机变量的类型,可将概率分布分为离散分布与连续分布。当随机变量只取孤立的数值时,这种随机变量称为离散随机变量,离散随机变量的

7、概率分布称为离散分布。连续随机变量的概率分布称为连续分布。心理与教育统计学中最常用的离散型分布是二项分布,最常用的连续型分布是正态分布。,(二)经验分布与理论分布,依分布函数的来源,可将概率分布分为经验分布与理论分布。经验分布是指根据观察或实验所获得的数据而编制的次数分布或频率分布。经验分布往往是总体的一个样本。理论分布有两个含义,一是随机变量概率分布的函数(如正态分布),二是按某种数学模型计算出的总体的次数分布(如二项分布)。,(三)基本随机变量分布与抽样分布,依所描述的数据的样本特性,可将概率分布分为基本随机变量分布与抽样分布。基本随机变量分布是随机变量各种不同取值情况的概率分布,如二项分

8、布与正态分布。抽样分布是从同一总体内抽取的不同样本的统计量的概率分布,如平均数分布,方差分布,相关系数分布等。,谢谢!,复习,古典概率与统计概率,加法原理:,乘法原理:,频率与概率频率分布与概率分布,6.2 二项分布,二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里创立的,所以又叫贝努里分布。二项分布是心理与教育统计中常用的一种基本随机变量分布。,6.2.1 二项试验,二项试验又称为贝努里试验,它必须满足以下几个条件:任何一次试验恰好有两个结果,成功与失败。共有n次试验,并且n是预先给定的任一正数。每次试验各自独立,各次试验之间无相互影响。某种结果出现的概率在任何一次试验中都

9、是固定的。,是否为二项试验?(1)投掷硬币试验(2)一个口袋装有6只球,其中4只白球、2只红球,从袋中取球两次。(a)放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。(b)不放回抽样,第一次取一球不放回袋中,第二次从剩余的球中再取一球。,6.2.2 二项分布函数,二项定理:,项数:二项展开式中共有n1项。指数:p的指数,从n0下降;q指数从0n为上升。每项p与q指数之和等于n。系数:n个元素中依次取0n个元素的组合数。,11 11 2 11 3 3 11 4 6 4 11 5 1 0 10 5 11 6 15 20 15 6 1,杨辉三角形,用 n 次方的二项展开式来表达在 n 次

10、二项试验中成功事件出现的不同次数(X0,1)的概率分布,叫做二项分布函数。二项分布是一种离散型随机变量的概率分布。,设有n次试验,各次试验彼此独立的,每次试验某事件出现的概率都是p,某事件不出现的概率都是q(1-p),则对于某事件出现X次(0,1,2,n)的概率分布为:,式中:,(6.6),例 10个硬币投掷一次,或1个硬币投掷10次,问5次正面向上的概率是多少?,解:根据题意,n=10,p=q=0.5,X=5,例 已知某长一批产品中一级品率为0.2现在从中随机地抽查20只。问20只元件中恰好有6个一级品的概率是多少?,解:n=20,p=0.2,q=0.8.x=6,某人进行射击练习,如果每次射

11、击击中的命中率为0.02,独立射击400次,试求至少击中两次的概率。,解:击中的次数为x,其对应概率为:,一个口袋装有6只球,其中4只白球、2只红球,从袋中取球两次。放回抽样,第一次取一只球,观察其颜色后放回,搅匀后再取一球。求取到一只白球与一只红球的概率。,解:实验次数n=2,取到白球的次数x=1,白球的概率p=4/6,红球的概率q=2/6.,6.2.3 二项分布的性质,(一)二项分布是离散型分布,概率直方图是阶跃式。因为X为不连续变量,用概率条图表示更为合适。,1个硬币投掷5次,正面向上0,1,2,3,4,5次的概率分别为:,5次,10次,20次,40次,80次,160次,当p=q时,图形

12、是对称的。当n趋近于无穷大时,二项分布趋近于正态分布。,p=q=0.5,p=0.2,q=0.8,当pq,二项分布为负偏态。当n很大,偏态逐渐降低,最终趋近于正态。当pq时,且nq5.这时二项分布为正态分布的近似形。,5次,10次,20次,40次,80次,160次,(二)二项分布的平均数和标准差,如果二项分布满足pq且 nq5(或者pq且 np5时,二项分布接近于正态分布。可用下面的方法计算二项分布的平均数和标准差。二项分布的平均数为,二项分布的标准差为,(67),(68),求p=0.2,q=0.8,n=160次的二项分布的平均值和标准差。,解:np=0.2160=325,该二项分布接近正态分布

13、。,6.2.4 二项分布的应用,二项分布函数除了用来求成功事件恰好出现X次的概率之外,在教育中主要用来判断试验结果的机遇性与真实性的界限。,例如,一个学生凭猜测做10个是非题,平均可以猜对5题。什么情况下可以说他是真会而不是猜测呢?,做对8道题的累加概率达到0.989,8道题以上即可认为是真会做。,例如,一个学生凭猜测做10个四选一的选择题,什么情况下可以说他是真会而不是猜测呢?,做对5道题以上即可认为是真会做。,统计游戏,小时候经常看到有这样的游戏,在一块倾斜的板上有n排钉子,在钉子的下方有n1个格子,对应的奖励。自侧方弹出一个玻璃球,任其自由下落,在下落的过程中让小球碰到钉子时,会改变下落

14、方向。每碰装一次时,玻璃球向两边下落的可能性相等。一块钱可以玩5次,中间对应的奖励很小,两侧对应的奖励可能有5元、10元。,Galton钉板概率模型,请问每个格子内的概率是多少?,0.5,0.5,1,0.25,0.5,0.25,10.5 0.50.25 0.5 0.250.125 0.375 0.375 0.1250.0625 0.25 0.375 0.25 0.0625,实践作业:每人投掷硬币10次,记录数字向上的次数。小组收集数据后发给班长,请班长在周六前发给我。,谢谢!,复习,式中:,(6.6),二项分布函数:,p=q=0.5,80次,160次,20次,6.3 正态分布,正态分布也称为常

15、态分布,是连续型随机变量概率分布的一种,是在数理统计的理论与实际应用中占有最重要地位的一种理论分布。心理与教育中大量的现象均按正态形式分布,如智力高低、成绩好坏、社会态度等。正态分布由棣莫弗于1733年发现的。拉普拉斯、高斯对正态分布的研究也做出了贡献,故有时称正态分布为高斯分布。,是圆周率 3.14159e是自然对数的底 2.71828X为随机变量取值为理论平均数;为理论标准差;y为概率密度,即正态分布的纵坐标。,(6.7),6.3.1 正态分布的特征,正态分布的形式是对称的,它的对称轴是经过平均数的垂线。正态分布的中央点(即平均数)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯

16、,拐点位于正负1个标准差处,曲线两端向X轴无限接近。,3.正态曲线下的总的面积为1,经过平均数的垂线将正态曲线下的面积划分为相等的两个部分,各为0.5。曲线下的面积为概率,可由积分公式计算:,(6.8),4.正态分布是一族分布。它随随机变量的平均数、标准差的大小与单位的不同而有不同的分布形态。标准正态分布的=0,=1。标准正态分布通常写作N(0,1)正态分布。,(6.9),=2,=1,=0,=1,=-2,=1,平均数决定了正态曲线在横轴上的位置,=0,=0.5,=0,=1,=0,=2,标准差大的正态曲线低阔,标准差小的正态曲线高窄。,5.正态分布中各差异量数值相互间有固定的比率。P102,P1

17、63s=1.2533AD=1.4826Qs标准差;AD平均差;Q四分位差。,6.正态分布曲线下,标准差与概率(面积)有一定的数量关系。,6.3.2 正态分布表的编制和使用,(一)正态分布表的编制与结构 利用积分公式可求出正态曲线下任何区间的面积,但需要计算。统计学家编制了标准正态分布表,使其使用非常方便。使用正态分布表时,首先应该确定其编制方法:1)从Z=-开始。2)Z=0开始。本书中采用Z=0开始。,P概率,Y概率密度,Z分数,正态分布表一般分为三栏:1)Z分数(X-)/,一般罗列到3.99。2)概率密度(y)某一Z分数对应的曲线纵坐标高度。当Z=0时,y=0.39893)概率值(P)不同Z

18、分数点与平均数之间的曲线下的面积。,(二)正态分布表的使用,依据Z分数求概率(p)(1)求某Z分数值与平均数(Z=0)之间的概率。,(2)求某Z分数以上或以下的概率,Z分数,(3)求两个Z分数之间的概率。,Z1,Z2,2.从概率(p)求Z分数(1)已知从平均数开始的概率值求Z值。,(2)已知正态分布两端的概率值求该概率值分界点的Z值。,Z分数,P概率,(3)若已知正态曲线下中央部分的概率,求Z分数,Z分数,P概率,3.已知概率或Z值,求概率密度y。,Z分数,P概率,6.3.3 次数分布的检验方法,(一)皮尔逊偏态量数法,s为标准差,SK为偏态量数;当SK=0时,分布对称;当SK0时,为正偏态;

19、当SK0时,为负偏态。,(7.1a),(7.1b),(二)峰度、偏度检验法,偏度系数:,偏度系数用来反映呈单峰的数据偏斜程度和方向。,当g1=0时,分布是对称的;当g10时,分布为正偏态;当g1200时,偏度系数才可靠。,(7.2),峰度系数用来反映呈单峰的数据表现出来的峰态情况。,峰度系数:,(7.3),g20 高窄,g2=0 正态,g20 低阔,当观测数据N1000时,峰度系数才可靠。,(三)观察直方图,(四)累加次数曲线 比较数据的累加频率分布曲线与累加正态分布概率曲线。,6.3.4 正态分布理论在测验中的应用,(一)化等级评定为测量数据,在心理与教育评价中,对有些心理量,如爱好、意志强

20、弱等常用等级评定法赋予一定的评价分数或等级分数,不同评价者的标准可能不同,等级分数界线宽,不一定是等距尺度。应该将等级评定等距化。,被评定的心理量为正态分布,才能将等级评定转化为等距数据。,表1为3位教师对100名学生的学习能力所作等级评定的结果。表2为3名学生从3位老师那里获得的评定等级,试将其转化为Z分数。,表1 教师对学生的评定结果,表2 教师对3名学生的评定结果,(二)确定测验题目的难易度,题目难易度一般用答对者的百分数确定,但是百分数不是等距尺度,有时要比较不同难易度题目之间的难度距离,需要将难易百分数根据正态分布概率转换为难度分数。,用未通过率计算Z分数,(三)划分等级分数线,公司

21、对新员工工作绩效进行考核。设全体员工的绩效得分呈正态分布,平均得分80分,标准差12分。现根据考核结果“奖优罚劣”:对得分最高的10%员工提升工资和职位,对得分最低的30%员工实行换岗再培训。已知甲、乙两名员工的考核得分分别是90和60分,问他们是否得到提升或换岗?,查表Z2=-0.52,Z1=1.28,90分的员工不能升职,60分的员工会轮岗,由,得:,谢谢!,6.4 样本分布,样本分布指样本统计量的分布,在科学研究中,一般是通过一个样本进行分析,只有知道了样本统计量的分布规律,才能依据样本对总体进行推论。在谈及样本统计量的分布时,首先要保证各个样本是独立的,各个样本都服从同样的分布。样本的

22、取样方法应该用随机抽样的方法。,研究总体与从中抽取的样本之间的关系是统计学的中心内容。对这种关系的研究可从两方面着手:(1)抽样分布:从总体到样本,这就是研究抽样分布(sampling distribution)的问题,统计量的概率分布称为抽样分布;(2)统计推断:从样本到总体,这就是统计推断(statistical inference)问题。,统计推断是以总体分布和样本抽样分布的理论关系为基础的。为了能正确地利用样本去推断总体,并能正确地理解统计推断的结论,须对样本的抽样分布有所了解。我们知道,由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统计量(如,S)也将随样本的不同

23、而有所不同,因而样本统计量也是随机变量,也有其概率分布。我们把统计量的概率分布称为抽样分布。,由总体随机抽样(random sampling)的方法可分为有复置抽样和不复置抽样两种。复置抽样:指每次抽出一个个体后,这个个体应返回原总体;不复置抽样:指每次抽出的个体不返回原总体。对于无限总体,返回与否都可保证各个体被抽到的机会相等。对于有限总体,就应该采取复置抽样,否则各个体被抽到的机会就不相等。,导言,一、抽样的目的 运用样本推断总体试验测定所得 样本数据;试验目的 获得总体信息因此要研究 样本与总体关系 如何通过对样本数据的分析获得总体信息,总体,从总体抽取样本,从样本推断总体,导言,总体,

24、从总体抽取样本,从样本推断总体,二、样本平均数及其分布:,许多 Si 形成样本标准差抽样分布。,许多 形成样本平均数抽样分布。由样本平均数构成的总体称为样本平均数的抽样总体。,和一个标准差Si。,每一个样本有一个样本平均数,样本平均数 抽样分布,样本平均数分布,原始数据的分布,样本平均数分布图示,n=2,n=3,n=4,n=5,n=6,随机抽样1000次,1.总体分布为正态,方差已知,样本平均数的分布为正态分布。,平均数分布的平均数;平均数分布的标准差,一般称为标准误,可用SE表示。,(7.4a),(7.4b),2.总体分布为非正态,方差已知,这时样本足够大时,样本平均数的分布为渐近正态分布。

25、,(7.5a),(7.5b),6.4.2 样本标准差和方差分布,标准差分布图示,n=2,n=3,n=4,n=5,n=6,随机抽样1000次的标准差,自正态分布的总体中抽取容量为n的样本,当样本量足够大时(n30),样本方差及标准差分布趋近于正态分布。,(7.6a),(7.6b),(7.6c),二、样本平均数及其分布:,抽样分布总体与原总体有什么关系?与?与?抽样分布总体与原总体关系如下:1、样本平均数分布的平均数等于原总体平2、样本平均数分布的标准差等于原总体标即,(标准误),准差除以,均数,即,标 准 误标 准 误(平均数抽样总体的标准差)的大小反映样本平均数 的抽样误差的大小,即精确性的高

26、低。标准误大,说明各样本平均数 间差异程度大,样本平均数的精确性低。反之,小,说明各样本平均数 间的差异程度小,样本平均数的精确性高。的大小与原总体的标准差成正比,与样本含量n的平方根成反比。从某特定总体抽样,因为是一常数,所以只有增大样本含量才能降低样本平均数 的抽样误差。,注意,样本标准差与样本标准误是既有联系又有区别的两个统计量。二者的区别在于:样 本 标 准 差 S 是 反 映 样 本中各 观测值 x1,x2,xn,变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。样本标准误是样本平均数,的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高

27、低。,对于大样本资料,常将样本标准差S与样本平均数 配合使用,记为 S,用以说明所考察性状或指标的优良性与稳定性。对于小样本资料,常将样本标准误 与样本平均数 配合使用,记为,用 以表示 所考察性状或指标的优良性与 抽样误差的大小。,3、若原分布为正态分布,平均数分布亦为正态分布。若原分布是非正态分布,当n增大时,平均数分布亦趋向正态分布。所以n30时,可以认为新分布符合正态分布。,例3-4,某品种葡萄总体,果穗长=30cm,=10.8cm,随机抽50个果穗,所得样本平均数与相差不超过3cm的概率是多少?解:已知U=查附表3得P(yU+0.28,以及y U-0.28)=0.78P(U-0.28

28、y U+0.28)=1-0.78=0.22=22%以上做法对不对 不对!分析:已知、,求|-|3cm的概率,求样本平均数的信息,算U值须用,上面的解答错用。,?,正确做法:从样本均数分布规律入手样本均数分布解:U=查附表3得P(yU+1.96,以及y U-1.96)=0.05P(U-1.96y U+1.96)=1-0.05=0.95,若题目改为某葡萄品种总体,果穗长=30cm,=10.8cm,若从其中抽取50个穗,问50 穗中,长度与相差不超过3cm的果穗共有多少穗?解:U=P=0.22=22%500.22=11(穂),例3-5 某枇杷单果重=30g,=9.6g,今从中抽取50个分析:已知总体

29、分布=30,=9.6,问解:,的概率是多少?,的概率P?,样本中,果,其平均单果重,查附表3得两尾概率0.46,那么单尾概率=0.46/2=0.23,所以平均单果重小于等于29g的概率为0.23。,若将是题目改成:某枇杷品种平均单果重=30g,=9.6g,问单果重小于29g的概率是多少?解:U=P(29X30)=0.0398P(X29)=0.5-0.0398=0.4602,查附表3得两尾概率0.92,那么单尾概率=0.92/2=0.46,所以单果重小于等于29g的概率为0.46。,总体平均数已知,总体标准差未知时,样本平均数的分布?以样本标准差S代替所得到的统计量 记为t由于采用S来代替,使得

30、t 变量不再服从标准正态分布,而是服从t分布,t值的计算公式:,为n个抽样样本的标准差,df=n-1为自由度,或用 表示,样本容量;,总体均值;,(7.7),自由度统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的自变量的个数,称为该统计量的自由度。统计学上的自由度包括两方面的内容:首先,在估计总体的平均数时,由于样本中的 n 个数都是相互独立的,从其中抽出任何一个数都不影响其他数据,所以其自由度为n。在估计总体的方差时,使用的是离差平方和。只要n-1个数的离差平方和确定了,方差也就确定了;因为在均值确定后,如果知道了其中n-1个数的值,第n个数的值也就确定了。这

31、里,均值就相当于一个限制条件,由于加了这个限制条件,估计总体方差的自由度为n-1。例如,有一个有4个数据(n=4)的样本,其平均值m等于5,即受到m=5的条件限制,在自由确定4、2、5三个数据后,第四个数据只能是9,否则m5。因而这里的自由度=n-1=4-1=3。推而广之,任何统计量的自由度=n-k(k为限制条件的个数)。,(一)t分布的特点,n=2 df=1,n=5 df=4,n=10 df=9,n=1000 df=999,n能否等于1?,t分布的特点,1.平均值为0;2.以平均值0左右对称;3.变量取值在-+;4.当样本量趋于时,t分布为正态分布,方差为1;5.当n-130时,t分布接近正

32、态分布,方差大于1,随着n-1的增大而方差趋于1.,(二)t分布表的使用,t值,p,(三)样本平均数的分布,1.总体分布为正态,方差未知时,样本平均数的分布为t分布。,其中:,平均数分布的标准差为:,(7.8),2.当总体为非正态分布,其方差由未知时,若满足n30这一条件,样本平均数的分布近似为t分布。,复习,1.总体分布为正态,方差已知,样本平均数的分布为正态分布。,2.总体分布为正态,方差未知时,样本平均数的分布为t分布。,6.4.4 卡方分布,2分布是统计分析中应用较多的一种抽样分布。从一个服从正态分布的总体中,每次随机抽取随机变量:,由,得:,(一)卡方分布的计算:,总体为正态分布,已

33、知总体平均数。,总体为正态分布,总体平均数未知,可用样本平均数代替。,S2分布实质是卡方分布,df=n-1,(7.9a),(7.9b),(二)卡方分布的特点,df=4,df=10,df=20,1.2分布是一个正偏态分布,df越小,越偏斜,df 时,卡方分布趋近于正态分布。2.2值都是正值。3.2分布的和也是2分布,其自由度为各个卡方分布自由度之和。,总体1:,总体2:,总体k:,4.如果df2,这时卡方分布5.2分布为连续型分布,但有些离散型分布也近似2分布。,(三)x2分布表,P,6.4.5 F分布,设有两个正态分布的总体,其平均值与方差分别为:,总体1:,总体2:,(7.10a),由于:,

34、当从同一个总体中进行抽样时,,分子的自由度为,分母的自由度为,(7.10b),(7.10c),(一)F分布的特点,df1=5,df2=5,df1=5,df2=10,df1=5,df2=20,df1=5,df2=1000,df1=5,df2=5,df1=10,df2=5,df1=20,df2=5,1.F分布形态是一个正偏态分布,它的分布曲线随分子、分母的自由度不同而不同。2.F总为正值。3.当分子的自由度为1,分母的自由度为任意值时,F值与分母自由度相同概率的t值(双侧概率)的平方相等。,分子自由度为1时,分母自由度为20时:,自由度为20时:,(二)F分布表,F值,附表4单侧检验,P,附表3双侧检验:,/2,/2,作业,第六章知识点命题题型:选择题只交电子版,SPSS操作,检验数据的正态性,偏度系数,峰度系数,谢谢!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号