《体育统计与SPSS应用00统计基础ppt课件.pptx》由会员分享,可在线阅读,更多相关《体育统计与SPSS应用00统计基础ppt课件.pptx(78页珍藏版)》请在三一办公上搜索。
1、福建师范大学体育科学学院梅 雪 雄,体育统计基础,体育统计与SPSS应用,基本概念,总体:在一个统计问题中,通常把需要研究的同质的对象的全体称为总体。总体通常指的是研究工作所关心的变量,如研究某市初一男生的生长发育状况,以身高为指标,则总体指的是该市所有初一男生的身高,而不是这一具体的人群。个体:总体中的每一个元素称为个体。如一个身高数据,一个考试成绩等。总体中包含的个体数目可以是有限的,也可以是无限的。包含有限个体的总体称为有限总体,包含无限个体的总体称为无限总体。如一个班的学生,参加期未体育考试的成绩就是有限总体;而中学生的健康水平则是无限总体。体育科学研究中所涉及的总体,通常是无限总体。
2、,(一)总体、样本与抽样研究,样本:从总体中抽取出来的一部分个体,称为总体的一个样本。样本中所含个体的数量叫样本容量。从总体中抽取样本的过程叫抽样。如研究某市初一男生的身高状况,抽测了 600人,这些身高数据就构成了一个容量为 600的样本。,抽样研究:我们研究的对象一般是总体,但往往很难对总体中的每一个个体进行全面的观测。通常采用的方法是在总体中进行抽样观测,然后通过样本对总体做出推论。这种方法就叫作抽样研究。,为什么要进行抽样研究?,减少工作量,提高研究效益。 对小总体进行“普查”,由于一次测试并不能完全代表某个个体的“真值”,所以仍将其看作是抽样研究。有损试验和破坏性试验,只能进行抽样研
3、究。,样本容量大,对总体的代表性就高。,样本容量是否越大越好?,No!,样本容量并非越大越好。样本容量太大不仅会增加人力、物力、财力的消耗,还会加大试验条件控制上的困难。因此,在研究工作中不必盲目追求大样本。样本容量的确定应保证既能达到所需的研究精度,又能使人力、物力、财力的消耗尽可能小。,(二)统计量与参数,关于样本特征的统计指标称为统计量。 统计量通常用英文字母表示。统计量来自直接测定的样本,因此常是已知的。但统计量的值不是唯一的,它会随样本的不同而改变。,关于总体特征的统计指标称为参数。 参数通常用希腊字母表示。总体参数值是唯一确定的,但往往又是未知的。需由样本统计量来估计总体参数。,(
4、三)统计误差,随机误差:在同一条件下测量某一指标,由于各种随机因素的影响,造成测得值时大时小,没有确定的规律,由此产生的误差叫随机误差。随机误差一般都是由众多微小的偶然因素造成。在统计工作中,随机误差无法避免,且无法消除,但它却有一定的统计规律性。在实际工作中,我们常假设这种误差不存在,即将其忽略不计。,某个指标在某一时刻、某一状态下的实际值叫真值,测得值与真值之间的差异就是误差。,过失误差:在测试工作中,由于人为错误造成测试结果的误差叫过失误差。这种误差常产生于看错、读错、听错、记错及仪器操作错误,其对测试结果的影响有时要比其他几类误差对测试结果的影响大得多。因此,测试人员在工作中一定要精益
5、求精,严格遵守操作规范,尽力避免出现过失误差。,系统误差:由于测试系统某些环节的偏差而造成测试结果呈倾向性的偏大或偏小,这种误差叫系统误差。如测试开始之前未校准仪器,场地器材出现故障,某些标准掌握过宽或过严等,都会造成系统误差。系统误差不能随样本的增大而减小。在收集数据的过程中,应校准测试仪器,严格控制测试条件,尽量避免出现系统误差。若发现存在系统误差,应认真分析确定其大小,通过系统校正加以消除。,抽样误差:由抽样引起的样本统计量与总体参数之间的差异叫抽样误差。由于样本只是总体的一部分,不是总体,通过样本去推断总体,必然存在误差。因此,只要是抽样研究,抽样误差就不可避免。,影响抽样误差大小的主
6、要因素有:变量本身的离散程度;样本的大小;抽样方法。 抽样误差有一定规律,我们可以根据概率原理估计其大小和范围,并通过抽样程序加以控制,将其缩小到最低限度和控制在允许范围内。,假设检验概述,常用描述统计量,结 束,0.1.1.1 算术平均数(Mean),算术平均数简称平均数或均数,表示某变量所有取值的平均水平,即某变量全部值的和除以值的个数所得到的商。平均数是数据集中趋势的主要量度,是最常用的一个统计量。,如果一组数据X1,X2,XN代表一个大小为N的有限总体,则其总体平均数为:,如果一组数据x1,x2,xn代表一个大小为n的有限样本,则其样本平均数为:,0.1 常用描述统计量,0.1.1 集
7、中趋势量数,算术平均数具有反应灵敏、确定严密、简明易懂、计算方便、受抽样的影响较小并能作进一步的代数运算等优点,是应用最广泛的一种集中量数。在体育研究中,很多情况下都可以用算术平均数来反映数据的集中趋势。但算术平均数易受极端值(极大值或极小值)的影响,因此,计算算术平均数时一般要预先排除极端值。,例0.1:10名学生跳高的成绩为142,157,165,148,169,160,150,146,170,165(cm),试计算算术平均数。,解:该组学生跳高成绩的算术平均数为,0.1.1.2 几何平均数(Geometric Mean),几何平均数是n个观测数据连乘积的n次方根:,几何平均数也反映数据的
8、集中趋势。一组观测值中,相邻的后一数据与前一数据之比称为发展速度。如果一组发展速度接近于一个常数,即数据按一定的比例变化时,欲求该组发展速度的平均水平,应当使用几何平均数。,例0.2:某省从1999年至2008年参加普通高校招生体育专业统考的人数及发展速度如下,试求9年来统考人数的平均发展速度。,解:9年来统考人数的平均发展速度为,0.1.1.3 调和平均数(Harmonic Mean),调和平均数是n个观测值倒数的算术平均数的倒数,亦称倒数平均数:,调和平均数也反映数据的集中趋势。调和平均数常用来描述有关平均速度方面的问题。在每一速度所适用的距离相同时,应当用调和平均数来计算平均速度。,注意
9、:如果是每一速度所适用的时间相同(而不是距离相同),欲求平均速度时,仍宜用算术平均数。,往返的平均速度为:,根据速度、距离、时间三者的关系式,亦可得:,例如,一辆卡车以20千米小时的速度行驶了6千米,然后以30千米小时的速度返回。,(20+30)2=25,例0.3:已知某小组8名学生60米途中跑的速度分别为8.6,8.4,8.8,8.1,8.3,8.0,7.6,8.4(ms)。试求该组学生60米途中跑的平均速度。,解:该组学生60米途中跑的平均速度为,0.1.1.4 中位数(Median),把一组数据按从小到大(或从大到小)的顺序排列,处于序列中点的数就称为中位数。它是将数据个数平均分为大小相
10、等的两部分的那个数,可能是序列中的某一个原始数据,也可能不是原始数据而是通过计算得到的一个数。中位数也反映数据的集中趋势,它不会受到极端数值的影响,具有较高的稳健性。,一组大小为n的数据,按从小到大(或从大到小)的顺序排列后,若n为奇数,则中位数就是(n+1)/2位置上的数,即:,若n为偶数,则中位数是第n/2与第n/2+1位置上两个数值的平均数,即:,当数据分布呈偏态时,或一组数据中有极端值时,或一组数据的两端有模糊数据时,一般不能用算术平均数来反映该组数据的平均水平。此时可用中位数来反映该组数据的平均水平。中位数易计算、易确定、不受极端值影响。但由于求中位数时不是每个数据都加入计算,故中位
11、数有较大的抽样误差,不如平均数稳定。此外,中位数还难以作进一步的代数运算。所以中位数不如平均数应用广泛。,例0.4:求以下两组数据的中位数: 16,4,19,22,17,9,13,2,10 1,27,23,15,24,17,6,24,19,8,解:,将数据从小到大排列,可得2,4,9,10,13,16,17,19,22。n=9,为奇数,则中位数为,将数据从小到大排列,可得1,6,8,15,17,19,23,24,24,27。 n=10,为偶数,则中位数为,0.1.1.5 众数(Mode),众数是指在一组数据中出现频率最高的数值。众数也是反映数据集中趋势的量度,当数据分布呈偏态时,或一组数据中有
12、极端值时,或一组数据的两端有模糊数据时,可以用众数来反映该组数据的平均水平。,众数一般通过统计频数获得。但它不是唯一的,在一组数据中可能会出现多个众数。,例4.5:24名学生的身高(cm)数据如下,求该组学生身高的众数。,解:计算每个身高值出现的频数如下表所示。,可以看出,在该组数据的所有数值中,最大频数6对应的是170,故该组学生身高的众数为170cm。,0.1.2.1 全距(Range,范围、极差),0.1.2 离散程度量数,全距也称为范围或极差,是一组数据中最大值(Maximum)与最小值(Minimum)之差。全距反映数据的离散趋势,在样本容量相同的情况下,全距大的一组数据要比全距小的
13、一组数据更为分散。,0.1.2.2 方差(Variance)与标准差(Standard Deviation),一组数据中各个数值与该组数据的平均数之差称为离差。,平均离差:,平均绝对离差:,平均离差平方和:,方差是一组数据离差平方的平均值,即离差平方和除以数据个数所得的商。标准差是方差的平方根。,总体方差:,总体标准差:,样本方差:,样本标准差:,方差和标准差具有反应灵敏、计算严密、受抽样变动的影响较小、具有可加性等优点,是统计分析中应用最广泛的反映数据离散程度的统计量。,方差和标准差反映一组数据关于平均数的离散程度,对同类型的数据,方差和标准差越大,数据之间的差异就越大;方差和标准差越小,数
14、据之间的差异就越小。,0.1.2.3 平均数标准误(Standard Error of Mean),由于抽样的缘故,由样本计算出的统计量的值与总体相应参数的真值大多是不尽相同的,这种差异就是抽样误差。,平均数标准误是一个总体中理论上一切可能的样本容量为 n的样本平均数的标准差。它反映了样本平均数与总体平均数之间的差异程度,即抽样误差的大小。平均数标准误越大,抽样误差就越大;平均数标准误越小,抽样误差就越小。,某种统计量的标准差称为该种统计量的标准误差,简称为标准误。,平均数标准误的计算公式为:,当总体标准差未知时,以样本标准差S替代, 则平均数标准误的估计值为:,原始数据的标准差反映的是原始数
15、据X的离散程度,而平均数标准误 反映的是一切可能样本平均数 的离散程度。显然,平均数标准误比原始数据的标准差小。并且,平均数标准误受样本容量 n的影响。样本容量越大,平均数标准误就越小;反之,样本容量越小,平均数标准误就越大。,例0.6:求例4.5中24名学生身高的极差、标准差和平均数标准误。,解:,求标准差,求平均数标准误,求极差,0.1.2.4 变异系数(Coefficient of Variation),标准差是一个很好的衡量数据离散程度的统计量。但标准差有具体的计量单位,并且受到数据平均水平的影响,常常会给不同总体之间的对比分析带来不便。,例如,身高以厘米为单位,肺活量以毫升为单位,两
16、者的离散程度就不能直接用标准差进行比较。,又如,虽然100米跑成绩和1500米跑成绩都以秒为单位,但两者平均水平相差太大,两者的离散程度也不能直接用标准差进行比较。,对于单位不同或平均水平相差很大的变量离散程度的比较,可以运用变异系数加以解决。,变异系数是标准差与平均数的百分比:,变异系数也是一种反映数据离散程度的指标。变异系数是没有单位的相对数,可用于不同单位数据离散程度的比较,还可以用于单位相同但平均数相差较大的数据离散程度的比较。变异系数越大,数据的离散程度越大;变异系数越小,数据的离散程度越小。,例0.7:某生若干次立定跳远均数为2.64米,标准差为0.11米;十字变向障碍跑均数为13
17、.88秒,标准差为0.42秒,试比较两项数据的离散程度。,立定跳远:,解:计算两项的变异系数,十字变向障碍跑:,因为4.17%3.03%,所以立定跳远成绩的离散程度比十字变向障碍跑成绩的离散程度大。,0.1.2.5 标准化 Z 分数(Standardized Value),设一组数据的平均数为 ,标准差为 S。将变量Xi减去平均数再除以标准差而得到的值就称为该变量的标准化 Z 分数,即:,标准化 Z 分数表示变量 Xi 偏离平均数多少个标准差。它是一个排除了数据自身基数大小和单位影响的相对分数,可用于从不同总体中抽取的变量的比较,分析数据偏离平均数的方向和距离。,某数据的 Z 分数为 0 时,
18、表示该数据正好等于平均数;若 Z 分数大于 0,则表示该数据大于平均数;若 Z 分数小于 0,则表示该数据小于平均数。Z 分数的绝对值越大,表示数据与平均数的差异越大。,例0.8:求例0.1中10名学生跳高成绩的标准化 Z 分数。,判断数据是否为异常值的 3S 法: 观察一组数据的标准化 Z 分数。若某数据的标准化 Z 分数大于 3(或小于-3),则表示该数据偏离平均数超过 3 个标准差,可考虑将其剔除,以保证统计分析结果的准确可靠。,0.1.3 位置量数,在统计工作中,经常需要了解数据在序列中的排列位置。例如,在制定学生体质健康评价标准时,将某项测试数据从小到大排列后,可以将排列在10%以下
19、的数据定为不及格,将排列在10%至25%的数据定为及格,将排列在25%至75%的数据定为中等,将排列在75%至90%的数据定为良好,将排列在90%以上的数据定为优秀。这就需要找到位于10%、25%、75%、90%位置的数据,以此作为划分评价等级的标准。反映数据在序列中的排列位置的统计量就称为位置量数。,0.1.3.1 四分位数(Quartiles),将一组数据由小到大(或由大到小)排列后,用 3 个点将全部数据分成四等分,与这 3 个点位置相对应的数据称为四分位数,分别记为Q1、Q2、Q3。,其中Q3到Q1之间的距离称为四分位间距;四分位间距的一半称为四分位差,记为Q。四分位差越小,说明中间的
20、数据越集中;四分位差越大,说明中间的数据越分散。,第 2四分位数Q2实际上就是中位数。,0.1.3.2 十分位数(Deciles),将一组数据由小到大(或由大到小)排列后,用 9 个点将全部数据分成十等分,与这 9 个点位置相对应的数据称为十分位数,分别记为D1、D2、 D9。,十分位数意味着,有10%的数据落在D1下,有20%的数据落在D2下,有90%的数据落在 D9下。,第 5十分位数D5实际上就是中位数。,0.1.3.3 百分位数(Percentiles),将一组数据由小到大(或由大到小)排列后,用99个点将全部数据分成100等分,与这99个点位置相对应的数据称为百分位数,分别记为P1、
21、P2、 P99。,百分位数意味着,有1%的数据落在P1下,有2%的数据落在P2下,有99%的数据落在 P99下。,第50百分位数P50实际上就是中位数。,百分位数经常被用来制定评价标准。例如:,2005年福建省16岁汉族男生身高(cm)百分位数如下。试建立 5 级评价标准。,年龄 P3 P5 P10 P25 P50 P75 P90 P95 P97 16 157.5 160.9 163.3 166.6 170.9 174.2 177.1 178.9 179.8,可建立 5 级评价标准: 差 :163.2 较差:163.3 166.5 一般:166.6 174.1 良好:174.2 177.0 优
22、秀:177.1,0.1.4 分布形态量数,0.1.4.1 概率的概念(Probability),随机事件的发生是带有偶然性的,但随机事件发生的可能性还是有大小之别的。 例如,足球比赛前,裁判员用抛挑边器的方法让双方队长选择场地以示机会均等,是因为挑边器“红面朝上”和“绿面朝上”的可能性都是1/2。一次射击,可能出现的结果是命中0,1,2,3,10环,即可能出现的事件有11个,对于一名优秀射手来说,显然命中8、9、10环的可能性比较大。,反映数据分布形态高低宽窄和对称性等特征的统计量称为分布形态量数。,在一个随机试验中,任一随机事件发生可能性的大小称为事件的概率,记作(A)。 概率具有以下几条基
23、本性质: 1随机事件A发生的概率满足:0P(A)1; 2若A为必然事件,则P(A)1; 3若A为不可能事件,则P(A)0。,0.1.4.2 分布的概念(Distribution),若用一个变量来表示随机试验的结果,它随着试验结果的不同而取不同的值,这个变量就称为随机变量。,要了解随机变量的变化规律,需要知道它可能取哪些值或取值范围是什么,并要知道它以多大的概率取这些值。用数学方法对随机变量取值的规律进行描述,这种规律就称为随机变量的概率分布,简称分布。,连续型随机变量的概率分布需要采用密度函数来表示。,若存在非负函数f(x),该函数在-至+区间上的积分是一个有限的值,即 ,而随机变量X取值于区
24、间(a,b)的概率可以用该函数在该区间上的积分来表示,即有 ,则称f(x)为随机变量X的密度函数。,离散型随机变量的概率分布通常用分布列来表示:,连续型随机变量的密度函数具有以下一些性质:,函数值非负,即f(x)0,其几何意义是分布曲线在x轴的上方。,随机变量X落在区间(a,b)内的概率等于它的密度函数在该区间上的定积分,其几何意义是概率P(aXb)等于区间(a,b)上分布曲线与x轴所围成的曲边梯形的面积(阴影部分)。,概率=面积,由于X是必然事件,所以,其几何意义是分布曲线与x轴所包围的全体面积等于 1。,对于不同的随机变量,可以求得各种不同的概率分布或近似分布。常用的概率分布有正态分布、t
25、分布、f分布、X2分布等。,0.1.4.3 正态分布的概念(Normal),若连续型随机变量X的密度函数为: 其中,,都是常数,且有0,-X,则称随机变量X服从参数为、的正态分布。记作(,)。,正态分布曲线特性: 1.对称。 2.非负。 3.单峰。 4.X的取值范围是整个X轴。 5.确定分布的位置。 6.确定分布的形状。越大,图象越扁平;越小,图象越高窄。,从理论上和实践上都可以证明,若某项数据受到众多随机因素的影响,且其中又没有哪一种因素起着绝对的支配作用,则该项数据一般来说是服从正态分布的。正态分布在体育运动实践中有着广泛的应用。如人的身高、体重、跳远成绩、射击误差等等,都服从或近似服从正
26、态分布,呈现“中间高,两头低,两侧对称”的特征。,如果随机变量X服从平均数为、标准差为的正态分布,记作XN(,),其规律如图所示。,如果随机变量 服从平均数为、标准差为 的正态分布,记作 N( , ),其规律如图所示。,4.1.4.4 标准正态分布,参数,决定正态分布曲线的位置和形状。但对于不同的问题,往往会有不同的和,要利用上述密度函数来解题是比较困难的。,为此,我们可以采用公式对各种正态分布进行标准化变换,使不同的正态分布都转化为平均数为0,标准差为1的标准正态分布。记作: Z(0,1)。,0.1.4.5 峰度系数(Kurtosis),峰度系数反映数据分布形态的陡缓程度,它是与正态分布相比
27、较的统计量。峰度系数为0表示其数据分布形态与正态分布的陡缓程度相同;峰度系数大于0表示其数据分布形态比正态分布陡峭,为尖顶峰;峰度系数小于0表示其数据分布形态比正态分布平坦,为平顶峰。,0.1.4.6 偏度系数(Skewness),偏度系数反映数据分布的对称性,它也是与正态分布相比较的统计量。偏度系数为0表示其数据分布形态与正态分布相同,为对称的;偏度系数大于0表示分布左偏,右侧有长尾;偏度系数小于0表示分布右偏,左侧有长尾。偏度系数的绝对值大小反映分布的偏斜程度。,0.1.4.7 t 分布,1分布曲线对称于直线 t =0,曲线单峰,在t =0处达最大值,向两侧逐渐下降。,2t 的取值区间为(
28、,),曲线永不与横轴相接。,3t 分布有一簇曲线,其形状由自由度 n决定。不同的自由度有不同的分布曲线。自由度较小时,曲线矮宽;自由度较大时,曲线接近于正态分布;当自由度n时,t 分布曲线与正态分布曲线重合。,t 分布既适用于小样本,也适用于大样本。因此,在SPSS中,许多属于正态分布的问题都采用 t分布来处理。,1X2值都是正值,分布曲线在纵轴的右侧。,2X2分布是一个正偏态分布,有一簇曲线,其形状随自由度n取不同数值而不同。自由度越小,分布越偏斜;自由度越大,图形越接近于正态分布。当自由度n时,分布曲线与正态分布曲线重合。,0.1.4.8 X2 分布,0.1.4.9 F分布,2F分布有两个
29、自由度,第一自由度n1和第二自由度 n2。,1F值都是正值,分布曲线在纵轴的右侧。,3F分布是一个正偏态分布,有一簇曲线,其形状随自由度n1、n2取不同数值而不同。,在研究工作中,我们所了解的是样本,但目的是要找出关于总体的规律。由于对总体的特征不清楚,就先提出一个假设,再根据样本提供的信息来确定是接受还是拒绝这个假设。这种方法在统计学上称为假设检验。,0.2 假设检验概述,0.2.1 假设检验的基本概念,已知一样本统计量 ,问它是否来自一已知均数为0的总体。或者说,该样本所由抽取的总体的均数是否等于0,即判断“=0”是否成立。,已知一样本分布,问它的总体分布是否是正态分布。,为了验证某一新训
30、练方法的效果,进行对照实验。通过测试,获得对照组的平均数和标准差、实验组的平均数和标准差。若要判断新训练方法是否有效,也就是问两样本各自的总体水平是否不同,即判断“1=2”是否成立。,对同一组对象,测得实验前的样本平均数和标准差、实验后的样本平均数和标准差。如果实验后的样本平均数大于实验前的样本平均数,问实验后的总体水平是否高于实验前的总体水平,即判断“21”是否成立。,这些问题,都要求根据已知样本去判断关于总体特征的某种看法是否正确,这都属于统计推断中的假设检验。 如果总体分布是已知的,只是对其参数作假设检验,这种检验就称为参数检验;如果总体分布是未知的,这时所涉及的检验就称为非参数检验。,
31、0.2.2 假设检验的基本原理,进行假设检验时,一般需建立两个相互排斥的假设,即原假设和备择假设。原假设用H0表示,备择假设用H1表示。原假设是检验的前提;而备择假设是与原假设相对立的假设,是当否定了原假设时应当接受的假设。,原假设是作为检验的前提而提出来的,通常是关于当前样本所属总体(参数值)与已知总体(参数值)无区别的假设。原假设应该是受到保护的,没有充足的理由是不能被拒绝的。而在很多情况下,我们真正感兴趣的往往是备择假设,接受备择假设可能意味着得到某种有特别意义的结论。因此,对备择假设应取慎重态度,只有当有充足的理由拒绝原假设时才能接受备择假设。,小概率事件:如果随机事件发生的概率小于或
32、等于一个事先规定的较小水平时, 就认为其是小概率事件。,小概率事件原理:小概率事件在一次试验中几乎是不会发生的。,怎么会是黑球?,设一样本来自某个已知总体,则样本所属总体的参数值应该就是这个已知总体的参数值。现在,我们来考察样本统计量的值在以该已知总体参数值为中心的抽样分布上出现的概率如何。如果样本统计量的值出现在抽样分布的中心值附近,而这种情况正符合检验的前提,应当接受原假设,从而证实此样本来自该总体的推断。,如果样本统计量的值偏离中心值较远,使得此事件出现的概率小到小于或等于一个事先规定的较小水平,就认为小概率事件发生了。而根据小概率事件原理,在随机抽样的条件下,一次试验竟然抽到与总体参数
33、值有那么大差异的样本,几乎是不可能的。这里出现了矛盾。,如何解决这个矛盾呢?解决的办法只有拒绝原假设,接受备择假设,即认为此样本不是来自该总体,而是属于另外的总体。由此可作出此样本所属总体的参数值与已知总体的参数值有本质差异的推断。,以正态分布为例,若随机变量X服从平均数为0、标准差为0 的正态分布,即 XN(0,0),根据平均数抽样分布的原理,则样本均数 服从平均数为0、标准差为 的正态分布,即 。,若有一样本,其样本均数为 ,设其所属的总体具有均数。若要判断该样本是否来自于均数为0的已知总体,实际上是判断该样本所属总体均数是否与已知总体均数 相等。对这种情况,可以建立原假设H0:=0,而备
34、择假设为1:0。,现建立统计量则 Z 服从标准正态分布,即ZN(0,1)。,给定一个小概率值(01),把值平均分到分布曲线的两端去,在标准正态分布表上可查得临界值 。根据正态分布的性质,有: 或者,:显著性水平1-:置信水平,若计算出的Z值落在H0的接受域内,有 ,简记作P。因未导致小概率事件发生,应接受原假设。,若计算出的Z值落在H0的拒绝域内,有 ,简记作P,故认为小概率事件发生了。而根据小概率事件原理,由一次随机抽样计算出的Z值不应该偏离中心值0那么远。因此,只能拒绝原假设H0 ,接受备择假设H1。,4.2.3 单侧检验与双侧检验,在做假设检验时,若将显著性水平平均分到理论抽样分布的两侧
35、,就称为双侧检验。双侧检验的拒绝域在分布曲线的两侧。,如果将显著性水平置于理论抽样分布的一侧(左侧或右侧),则称为单侧检验。单侧检验的拒绝域在分布曲线的一侧。,由于单侧检验是把显著性水平置于分布曲线的一侧,即检验的临界值比较靠近中心点,因而单侧检验的拒绝域就比双侧检验大。这就使得单侧检验比双侧检验更容易拒绝原假设0 而接受备择假设1。,在实际工作中,究竟应该采用双侧检验还是应该采用单侧检验,要根据问题的具体要求及有关总体的比较信息而定。一般来说,若仅要判断是否有差异,应采用双侧检验。若要回答高低、大小、优劣及是否有效等问题,则应采用单侧检验。,0.2.4 显著性水平的选择,显著性水平的大小,影
36、响到检验的接受域和拒绝域的大小。检验的结果是接受原假设H0还是接受备择假设H1与显著性水平有关。如果取得很大,则原假设H0的接受域较小而拒绝域较大,结果是原假设H0很容易被拒绝;反之,如果取得很小,则原假设H0的接受域较大而拒绝域较小,结果是原假设H0难以被拒绝。,限制显著性水平体现了“保护原假设”的原则。值取得越小,对原假设的保护程度就越大;值取得越大,对原假设的保护程度就越小。原假设是统计推论的前提,应该受到保护,所以的值不宜过大,通常取为0.05、0.01等。若很小时H0仍被拒绝,则就有充分的理由相信H0确实不真。,在实际应用中,的值究竟取多大,还应视具体问题的背景和要求以及错误地拒绝或
37、接受原假设H0所造成的不利影响等情况而定。,小概率事件在一次试验中几乎是不会发生的。但这并不意味着小概率事件绝对不会发生。如果不断地进行独立重复试验,则小概率事件迟早会发生。因此,根据小概率事件在一次试验中是否发生而作出接受或拒绝原假设0的结论,就有可能犯错误。,0.2.5 假设检验的两类错误,设有两个不同的分布,其总体均数分别为1和2,12。现抽得一个样本,平均数为 ,设其所属的总体具有参数,问是否大于1。,原假设0:1,备择假设1:1 。给定显著性水平,则可以找到一个临界值 ,从而确定0 的接受域和拒绝域。,若样本确实属于均数为1的总体,其均数因随机性而落在了1分布的拒绝域内,从而导致原假
38、设0被错误地拒绝了,这是第一类错误。犯第一类错误的概率为。但是,如果样本实际上属于均数为2的总体,其均数因随机性而落在了1分布的接受域内,从而导致原假设0被错误地接受了下来,这是第二类错误。犯第二类错误的概率为。,与的关系,犯两类错误的概率和没有明确的解析关系,但相互有关联。当样本容量固定时,犯一类错误概率的减小会导致犯另一类错误概率的增加。即越小,越大;越大,越小。也可以说,取得越小,接受域越宽,越容易接受原假设,虽然犯弃真错误的可能性减小了,但犯纳伪错误的可能性却增大了。因此,在进行假设检验时,显著性水平并非取得越小越好。,的大小与1 和2 间的距离有关,两值越接近,越大;两值离得越远,就
39、越小。,单侧检验的拒绝域较大,因而导致较小的。,样本容量n的增大可以使平均数标准误 变小,从而导致密度函数曲线变陡峭。因此,要同时降低犯两类错误的概率和,或者要在保持(或)不变的条件下降低(或),需要增大样本容量。,0.2.6 假设检验的步骤,1.根据问题的具体情况提出原假设H0和备择假设H1。在提出假设时,就要考虑到是采用双侧检验还是单侧检验。一般来说,双侧检验和单侧检验原假设的形式是相同的,但备择假设的形式却不一样。,进行两均数差异的 t 检验时假设的建立,2.在H0成立的前提下,选择合适的抽样分布,构造一个检验统计量,并根据样本数据计算该统计量的值。常用的检验统计量有Z值、值、值、2值等。,3.给定显著性水平 (小概率值),查相应的分布表找临界值,从而确定H0的拒绝域和接受域。查表时应特别注意区分双侧检验还是单侧检验,两者的临界值是不同的。 在SPSS中,通常直接给出检验的显著性概率,而不必查表找临界值。,4.将算出的统计量与查得的临界值对比,确定统计量在其抽样分布上的概率的大小,作出接受还是拒绝原假设的判断。 统计推断的一般规则: P0.05时,对应的统计推论“不具显著性”。 P0.05时,对应的统计推论“具显著性”。 P0.01时,对应的统计推论“具高度显著性”。,进行两均数差异的 t 检验时统计推断的规则,