《教育统计学》PPT课件.ppt

上传人:小飞机 文档编号:5518794 上传时间:2023-07-16 格式:PPT 页数:142 大小:1.39MB
返回 下载 相关 举报
《教育统计学》PPT课件.ppt_第1页
第1页 / 共142页
《教育统计学》PPT课件.ppt_第2页
第2页 / 共142页
《教育统计学》PPT课件.ppt_第3页
第3页 / 共142页
《教育统计学》PPT课件.ppt_第4页
第4页 / 共142页
《教育统计学》PPT课件.ppt_第5页
第5页 / 共142页
点击查看更多>>
资源描述

《《教育统计学》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《教育统计学》PPT课件.ppt(142页珍藏版)》请在三一办公上搜索。

1、教育测量与评价2011.0211.06,教材:华东师范大学王孝玲编著课时数:6472课时,3-4学分。章节数:共十五章,三大部分描述统计,推断统计,抽样设计,教育统计学,695013,两个理论基础,“凡物的存在必有其数量”(美国心理学家桑代克18751949)“凡有数量的东西都可以测量”(美国测量学者麦柯尔),复杂的因果关系:随机现象,在因果关系复杂的条件下无法根据已知的有限原因精确地预测结果因为即使在已知条件相同的情况下,每一次预测也都是有偏差的随机现象,学生成绩心理测验得分候车人数作物产量产品质量收入支出等等,随机现象,在一定的条件下,可能出现也可能不出现,可能这样出现,也可能那样出现的一

2、类现象。特征:条件不能完全决定结果。研究内容:出现的可能性有多大,不出现的可能性有多大,或者这样出现的可能性有多大,那样出现的可能性有多大。,数量差异性与数量规律性,数量差异性:一定条件下,出现可能不一样;数量规律性:通过大量试验和观察,总结出随机现象的规律。数量规律性:平均数;方差、标准差;比率、百分比;相关系数等。非数量规律性:数量分布,二、统计学和教育统计学,统计学就是研究随机现象的数量规律性的一门数学分支。,1、统计学含义:,Statistics原意是国力、国势,定义1:统计学是研究统计原理和方法的科学。P1,定义2:统计学是研究如何搜集、整理、分析反映事物总体信息的数字资料,并以此为

3、依据,对总体特征进行推断的原理和方法。研究什么(对象)、怎么做?干什么(目的),“研究搜集、整理、分析数字资料推断“总体特征”原理和方法,部分推断全体,2、教育统计学的含义:,教育统计学是运用数理统计的原理和方式研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验所获得的数字资料,并以此为依据,进行科学推断,从而揭示蕴含在教育现象中的客观规律。,(教育与心理统计学),三、统计学与教育统计学的内容,数理统计学1.统计学教育统计学应用统计学 农业统计学 人口统计学,2.统计学或教育统计学具体内容:,三、统计学与教育统计学的内容,统教计育学统或计学,描述统计,推断统

4、计,实验设计,统计图表集中量数差异量数相关分析,统计估计假设检验,参数估计非参数估计,点估计区间估计,参数检验非参数检验,样本选择与分配实验误差分析因子分析,方差分析回归分析,抽样设计,三、统计学与教育统计学的内容,1、描述统计(descriptive statistics):对已获得的数据进行整理、概括,显现其分布特征的统计方法。P2(主要是对样本数据的处理),2、推断统计(inferential statistics):根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测的统计方法。(在一定风险下,部分推断全体),3、实验设计(experimen

5、tal statistics):为提示实验中自变量与因变量的关系,在实验之前所制订的实验计划。,1.确定现象2.随机现象,随机事件,随机变量。统计处理的变量都是随机变量。,五、统计学中几个基本概念,3.个体(Case)、总体(Population)与样本(Sample)总体无限总体与有限总体;表示数目样本大样本(n30)与小样本(n30)总体与样本是相对的,4.统计量(Statistic)与参数(Parameter)统计量:样本上的数字特征;参数:总体上的各种数字特征。,总体,样本,统计量,描述统计,作出推断,随机抽样,描述,总体、样本与个体,一、统计数据,来源数据 种类 特性:统计分类,:报

6、表,:二分法和四分法,变异性、规律性,1、按数据观测方法和来源:,数据种类(数据的水平),二分法,2、按数学属性:,(百分制的分数理论上讲是间断的,但由于数据密度大较多,实际处理时归入连续型数据处理,连续型数据处理较方便,类似以后也有,总体比率用正态分布处理。),间断型随机变量,取值个数有限的数据人数个数名次五分制得分,连续型随机变量,取值个数无限的数据身高体重智商时间长短百分制得分,问题:为什么要进行数据分类?,数据有不同属性(可分);不同类型数据用不同统计方法处理。,1、按数据观测方法和来源:点计数据(计数数据)与度量数据(测量数据)。2、按数学属性:间断(离散)数据与连续数据。,数据种类

7、(数据的水平),四分法,3、按数据测量水平,称名数据等级(顺序)数据等距数据等比数据(比率数据),(标题、表号、标目、线条、数字、表注)六部分;(标题、图号、标目、图形、图注)五个方面。简单表、分组表(1个标志)、复合表(2个及以上标志直条图(条形图)、圆形图、线形图、频数分布图,多变量图:散点图、雷达图、脸谱图等,二、统计表、统计图,例1.小教本011(30名)教育统计学单元考试成绩58、61、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90。,频数分布表制作步骤,58、6

8、1、88、74、81、66、70、93、72、91、66、99、89、98、90、98、90、64、93、89、100、91、92、97、90、94、99、92、92、90。,一般不少于5组,也不要超过15组。组距指的是每一个组内包含的距离(用i表示)斯特奇斯(H.A.Sturges)根据经验公式:,本例为i=7.11,将组距调节为10,即每10分为一个组。组数:42/10=4.2,应该分5组。,1)求全距R:,全距指的是全部观察值中最大值与最小值之差。,R=xmax-xmin=10058=42。,2)决定组数k和组距i。KR/i,频数分布表制作步骤,3)决定组限组限就是每一组的起点值和终点值

9、。4)登记频数,小教本011教育统计学单元考试学生成绩频数、累积频数分布表,小教本011教育统计学单元考试学生成绩频数分布直方图,第三章常用的特征量,1.集中量:平均数、中位数、众数;百分位数2.差异量:全距、四分位距、平均差、方差和标准差、差异系数;百分位距。3.地位量:4.相关量:5.分布形态量:偏态量、峰态量。,集中量,集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分布中大量数据向某一点集中的情况。,集中量包括算术平均数、加权平均数、几何平均数、调和平均数、中位数、众数等。,算术平均数,算术平均数是所有观察值的总和除以总频数所得之商,简称为平均数或均数。,样本平均数 总体平均数

10、,算术平均数的优点,反应灵敏;严密确定,简明易懂,计算方便;适合代数运算;受抽样变动的影响较小;样本算术平均数是总体平均数的最好估计值,算术平均数的缺点,易受两极端数值(极大或极小)的影响;,一组数据中某个数值的大小不够确切时就无法计算其算术平均数。,这种“两极端数值”存在的问题,可用什么办法解决?,中位数(Md),中位数是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。,中位数的原始数值计算方法:单数:12 14 15 15 17 18 20 23 24:17双数:12 14 15 15 17 18 20 23 24 25:17.5,中位数的应用及其优缺点,中

11、位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。它适用于以下几种情况:,(1)一组数据中有特大或特小两极端数值时;,(2)一组数据中有个别数据不确切时;,(3)资料属于等级性质时。,众数(Mo),众数是集中量的一种指标。对众数有理论众数及粗略众数两种定义方法理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据中频数出现最多的那个数。,众数的优缺点,众数虽然简明易懂,但是它并不具备一个良好的集中量的基本条件。它主要在以下情况下使用:当需要快速而粗略地找出一组数据的代表值时;当需要利用

12、算术平均数、中位数和众数三者关系来粗略判断频数分布的形态时;利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。,正态,正偏态,负偏态,P34,加权平均数,加权平均数是不同比重数据(或平均数)的平均数。计算公式为:,二、差异量,1.差异量:表示一组数据变异程度或离散程度的量。,2.类型:全距、四分位距、平均差、方差和标准差、差异系数;百分位距。,注:差异量越大表明数据越参差不齐,分布范围越广。,二、差异量,1、全距(Range):R=xmax-xmin,例1 10、50、58、61、63、69、71、71、71、78、81、83、86、86、88、99。(16),3、百分位距P

13、D:P93 P7 P90 P10,4、平均差:,5、方差和标准差:,2、四分位距QD(Q3 Q1)/2,=99-10=89,二、差异量例1 10、50、58、61、63、69、71、71、71、78、81、83、86、86、88、99。,5、方差和标准差:,计算方法:1)原始数据法;2)计算工具法;3)其他,1)原始数据法:,3)计算工具法:,4)数学软件:spss等,2)频数分布表计算法:,问题讨论:一组数据的标准差,大好呢?还是小好?,二、差异量,6、相对差异量:差异系数,用途:1)比较不同单位资料的差异程度(单位不同)2)比较单位相同而平均数相差较大(对象不同)3)判断特殊差异情况,正常

14、范围:5%CV35%不 正 常:CV35%平均数无意义CV5%数值计算正确性,应用1)非零点;条件:2)等比量表。,三、分布形态量偏态量与峰态量,1、偏态量,SK0:分布对称SK0:偏态,SK0:正偏SK0:负偏,2、峰态量,Ku0.263:正态峰Ku 0.263:非正态,Ku 0.263:低阔峰Ku 0.263:高狭峰,偏态量,负偏,正偏,第五章概率及概率分布,概率的一般概念概率分布:离散分布与连续分布二项分布与正态分布正态曲线的面积与纵线正态分布在测量上的应用,5.1概率(probability)的一般概念一、概率的定义二、概率的性质,0P(A)1P(A)0:不可能事件P(A)1:必然事件

15、,三、概率的加法和乘法,小概率事件A:p(A)0.05小概率原理:小概率事件在一次试验中,几乎不可能发生。,5.2二项分布(bionimal distribution),二、二项分布函数,2.二项分布函数,在n次试验中成功事件P恰好出现x次的概率,例在男生占2/5的学校中随机抽取10个学生,问正好抽到4个男生的概率是多少?至多抽到2个男生的概率是多少?,1)是否是二项试验?,2)共试验次数?,3)所求随机事件出现次数?,例在男生占2/5的学校中随机抽取10个学生,问正好抽到4个男生的概率是多少?至多抽到2个男生的概率是多少?,解:,随机抽取一个学生即随机试验一次,因为试验结果只有两个:“男生”

16、与“女生”,而且抽到男生与抽到女生是没有关系的,故此试验是贝努利试验。,正好抽到4个男生的概率:,至多抽到2个男生的概率是:,二项分布(bionimal distribution),5.2二项分布(bionimal distribution),三、二项分布图,二项分布的形态:,Pq:对称,pq:偏态,1)当n时,二项分布正态分布;,2)当np5且nq 5时,二项分布开始接近正态分布。,5.2二项分布(bionimal distribution),四、二项分布的平均数和标准差,当二项分布开始接近正态分布时,在n次二项试验中成功事件出现的平均数和标准差是:,例从我们班中随机抽取10名同学,从理论上

17、讲,平均应抽到男生多少个?标准差是多少?,五、二项分布的应用,1.求n次二项试验中成功事件出现的概率;2.判断试验结果的机遇性与真实性的界限(1的反向)。,正态分布 的图形特点,正态分布的密度曲线是一条关于 对称的钟形曲线.,特点是“两头小,中间大,左右对称”.,即,取x=附近值的可能性大,取偏离x=越远的值的可能性越小。,5.3正态分布(normal distribution)二、正态曲线的面积与纵线,2.标准正态曲线下的面积及Z值计算:2)查表法,A、已知Z值求面积P:,a)求P(0zz1):,b)求P(zz1)或P(z-z1):,c)求P(z1zz2):,例1,P(0z1.96)、P(-

18、2.58z0),例2,P(z1)、P(z-1.96)、P(z1.96),例3,P(1z2)、P(-1z2)、P(-1.96z1.96),例某班48人的数学考试成绩分布呈正态分布,其平均分为75分,标准差为10,问理论上说65至85分之间当有多少人?,已知:,n=48,求 P(65x85),分析:由正态分布图,,要求65至85之间的理论人数,,即,,解:,=-1,查表得:,P(-1Z1),2P(0Z1),20.3413,0.6826,P(65x85)48,P(-1Z1)48=0.682648,32.8,所以,,只要知道这部分在全部48人中的份额,,48,5.3正态分布(normal distri

19、bution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;2.确定录取的分数线;3.确定等级评定的人数;4.品质评定数量化。,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用 1.将原始分数转换成标准分数Z值;,例1.2001年某市公务员选拔考试甲、乙二人成绩:,0.22,1.12,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;,结论:Z甲 Z乙,标准分数体系:,T=KZ+C,T10Z50,例1.2001年某市公务员选拔考试甲、乙二人成绩:,1.06,0

20、.91,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;,例1.2001年某市公务员选拔考试甲、乙二人成绩:,T10Z50,标准分数体系:,T=KZ+C,60.6,59.1,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;2.确定录取的分数线;,例1某年高考平均分500,标准差100,考分呈正态分布,某考生得到650分。设当年高考录取率为10,问该生能否被录取?,录取率10%X0=?,P(ZZ0)0.1,P(0 Z Z0)0.4,Z01.28,

21、X0=628,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用,1.将原始分数转换成标准分数Z值;2.确定录取的分数线;,例2某项职业录取考试,在参加的1600人中准备录取200人,考试分数接近正态分布,去年同样考试的平均分数为74分,标准差为11,问今年录取分数会多少?,求录取率 p=n/N,P(ZZ0)p,P(0 Z Z0)0.5-p,Z0,已知录取人数 求最低录取分数,查表,5.3正态分布(normal distribution)三、正态分布在测验记分方面的应用 3.确定等级评定的人数;,例2如果100个人的教育实习成绩呈正态分布,现将其分成优、良

22、、中、合格、不合格五个等距的等级,问各等级应有相应的多少人?,等距分点,已知等级数k求各等级人数ni,确定相应界值Zi,求相应面积Pi,第六章抽样分布及总体平均数的推断,总体分布、抽样分布、样本分布样本平均数与总体平均数离差统计量的形态总体平均数的估计假设检验基本原理总体平均数显著性检验抽样分布参数估计假设检验,6.1抽样分布及有关性质,例2某市共有3600人大学生参加了全市大二学生的统一英语测试,现在随机抽取50人为样本,其平均分数为85分,标准差10分,试问该市平均分数为多少?,平均数抽样分布:容量为50,一切可能个的样本平均数的频数(频率)分布。,所有样本平均数的平均数,抽样分布的平均数

23、,平均数,6.1抽样分布及有关性质,总体分布:总体内个体数值的频数分布。抽样分布:某一种统计量的概率分布。样本分布:样本内个体数值的频数分布。,平均数抽样分布、标准差抽样分布、中位数抽样分布,抽样分布,6.1抽样分布及有关性质,1.分布概念及相关符号,总体分布:总体内个体数值的频数分布。抽样分布:某一种统计量的概率分布。样本分布:样本内个体数值的频数分布。,平均数标准差,又称平均数标准误,反映了抽样误差的大小。,平均数抽样分布标准差 意义?,6.1抽样分布及有关性质,1.分布概念及相关符号2.平均数抽样分布的几个定理,4)总体不是正态分布,如果样本容量较大,则反映总体和的样本平均数的抽样分布,

24、也接近正态分布。,又称平均数标准误,反映了抽样误差的大小。,1),2),3)从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布(平均数抽样分布),也呈正态分布,6.1抽样分布及有关性质,3.样本平均数与总体平均数离差统计量的形态,1)总体标准差 已知:正态分布。Z分布:,2)总体标准差 未知:,t分布,6.1抽样分布及有关性质,3.样本平均数与总体平均数离差统计量的形态,1)已知:Z分布,2)未知:t分布,t分布(t-distribution)英国统计学家高赛特(W.S.Gossett)1908年以笔名“student”发表的一篇论文中推导的一种分布。因此也称为学生分布。,6.2 总体

25、平均数的估计,例2某市共有3600人大学生参加了全市大二学生的统一英语测试,现在随机抽取50人为样本,其平均分数为85分,标准差10分,试问该市平均分数为多少?,一、总体参数点估计,评价标准:1.无偏性2.有效性P87 3.一致性,二、总体参数区间估计,6.2 总体平均数的估计,二、总体参数区间估计,一)总体标准差 已知:Z估计,例2某种零件的长度服从正态分布。已知总体标准差=1.5厘米。从总体中抽取100个零件组成样本,测得它们的平均长度为10.00厘米。试估计在99%置信水平下,全部零件平均长度的置信区间。,解:因为总体标准差=1.5已知,所以的分布服从正态分布,即可用Z估计。所以,,所以

26、,全部零件平均长度99%的可能在(9.61,10.39)范围内。,=100.39,1)已知:Z估计,2)未知:t估计,t分布(t-distribution)英国统计学家高赛特(W.S.Gossett)1908年以笔名“student”发表的一篇论文中推导的一种分布。因此也称为学生分布。,二、正态总体均值的区间估计,二、正态总体均值的区间估计,对于给定的置信度(1-)及自由度(n-1),总体均值 的置信区间:,一)总体标准差 已知:Z估计,二)总体标准差 未知:t估计,6.2 总体平均数的估计,二、正态总体均值的区间估计,一)总体标准差 已知:Z估计,二)总体标准差 未知:t估计,例3某市共有3

27、600人大学生参加了全市大二学生的统一英语测试,现随机抽取50人为样本,其平均分数为85分,标准差10分,试求总体平均数的95%的置信区间?,解:因为总体标准差未知,所以的分布服从t分布,即可用t估计。所以,,因为n=50,所以df=n-1=49,查t表 得,6.2 总体平均数的估计,二、总体参数区间估计,一)总体标准差 已知:Z估计,二)总体标准差 未知:t分布,A.大样本 n30:,B.小样本 n30:,例.从某小学三年级随机抽取17名学生,其阅读能力的平均得分为29.92,标准差为4.1。试估计该校三年级阅读能力总体平均数95%和99%置信区间。,问题:在1908年t分布理论提出前,怎样

28、解决 未知的估计问题?,6.2 总体平均数的估计,二、正态总体均值的区间估计,一)总体标准差 已知:Z估计,二)总体标准差 未知:t估计,总体平均数区间估计,一、正态总体标准差 已知:Z估计三、正态总体标准差 未知:t估计1.小样本2.大样本t估计或近似Z估计,6.3假设检验(本章节内容),假设检验的有关概念假设检验基本思路假设检验基本步骤及二类错误总体平均数假设检验(某总体平均水平有无显著变化?),6.3假设检验,一、假设检验有关概念1.假设与假设检验2.小概率事件及小概率原理,3.假设检验基本思路4.假设检验的一般步骤:,1)提出假设:,2)选择检验统计量并计算其值:Z检验或t检验3)选择

29、检验的形式:双侧检验或单侧检验4)规定显著性水平:5)统计决断:,拒绝区域,6.3假设检验,例1某班进行比奈智力测验,结果,已知比奈测验的常模,问该班智力水平(不是这一次的测验结果)是否确实与常模水平有差异?,n=100,1)提出假设:,2)选择检验统计量并计算其值:因为总体标准差已知,故采用Z检验。所以,,3)选择检验的形式:因为没有资料表明,该班智力水平是否高于或低于常模水平,所以采用双侧检验。,4)统计决断:,因为 Z2,即该班智力水平与常模水平,有显著性差异。,所以0.01p0.05,2.58=Z0.01/2,,Z0.05/2=1.96,Z2,所以在0.05显著性水平上接受H1,而拒绝

30、H0,,0.95,*,6.3假设检验,例 P104 17 某市7岁男童体重平均数为21.61千克,标准差为2.21千克,某小学70名7岁男童体重平均数为22.9,问该校7岁男童体重与该市是否一样?,1)提出假设:,2)选择检验统计量并计算其值:因为总体标准差2.21已知,故采用Z检验。所以,,3)选择检验的形式:因为没有资料表明,该校7岁男童体重是否高于或低于全市7岁男童体重,所以采用双侧检验。,4)统计决断:,因为Z0.01/2=2.584.88*,,即该校7岁男童体重与全市7岁男童体重,有极其显著性差异。,所以,p0.01,所以在0.01显著性水平上接受H1,而拒绝H0,,6.3假设检验,

31、例2某区初三英语测验平均分数为80,该区某校25份试卷的平均分数和标准差分别为83和10。问该校初三英语平均分数与全区是否一样?,1)提出假设:,2)选择检验统计量并计算其值:因为总体标准差未知,故采用t检验。所以,,3)选择检验的形式:因为没有资料表明,该校初三英语成绩是否高于或低于全区水平,所以用双侧检验,4)统计决断:因为n=25,所以df=n-1=24,查t表 得,因为t=1.470.05,所以接受H0,而拒绝H1。,即该校初三英语平均成绩与全区水平没有显著差异。,t=1.47,6.3假设检验,一、假设检验有关概念1.假设与假设检验2.小概率事件及小概率原理,3.假设检验基本思路4.假

32、设检验的一般步骤:5.假设检验的二类错误:,1)第一类错误:“以真为假”弃真错误,2)第二类错误:“以假为真”取伪错误,假设检验是概率条件下的反证法,在假设检验中,一般都首先控制第一类错误。,6.3假设检验,二、平均数的显著性检验小结,1)提出假设:,2)选择检验统计量并计算其值:Z检验或t检验3)选择检验的形式:双侧检验或单侧检验4)规定显著性水平:5)统计决断:,正态总体,第七章平均数差异的显著性检验,1.需要考虑的问题?2.需要知道什么?3.共同点:显著性差异检验4.不同点:两个样本,需考虑的问题:两总体是否正态分布;两样本是否相关两总体方差12和22是否已知;如果未知,则是否12=22

33、;两样本为大样本还是小样本。,平均数差异的抽样分布,一、正态总体相关样本r已知,平均数差异的抽样分布,一、正态总体相关样本r已知,1)提出假设:,2)选择检验统计量并计算其值:Z检验或t检验或3)选择检验的形式:双侧检验或单侧检验4)规定显著性水平:5)统计决断:,平均数差异显著性检验步骤,差异显著性检验的主要过程:,1、确定两总体(样本)是否相关;2、根据问题要求,确定检验形式(双侧或单侧);3、看总体标准差是否已知;(已知Z检验)4、独立且未知,方差是否齐性;(齐性t、不齐性t)5、看是大样本还是小样本;6、判断样本Z、t或t值是否落入小概率区域;7、若落入小概率区域,还需确定差异的显著性

34、级别。,7.2 相关样本平均数差异的显著性检验,一、配对组的情况(等组实验),例1:为了揭示小学二年级的两种识字教学法是否有显著性差异,根据学生的智力水平、努力程度、识字量多少、家庭辅导力量等条件基本相同的原则,将学生配成10对,然后把每对学生随机地分入实验组和对照组。实验组施以分散识字法,而对照组施以集中识字法,后期统一测验如下表。(79.571)(3.459),1)提出假设:,2)选择检验统计量并计算其值:因为相关样本且总体标准差未知,故采用t检验。所以,,3)选择检验的形式:因为没有资料可以说明,两种教学方法哪一种效果好,所以采用双侧检验。,79.5、71,和9.12、9.94 r=0.

35、704,样本均值和标准差:,3.46,4)统计决断:因为n=10,所以df=n-1=9,查t表 得,因为t=3.46 3.25=t(9)0.01/2,所以p0.01,所以在0.01显著性水平上接受H1,而拒绝H0。,即这两种教学方法有极其显著性的差异。,因为t=3.462.262=t(9)0.05/2,,需进一步查t(9)0.01/2,,*,平均数差异的抽样分布,二、正态总体独立样本,r=0,贝赫兰斯费舍(Fisher)问题,直至1957年柯克兰与柯克斯解决方案最佳。,7.4 方差齐性检验,一、F分布,由例1、2可知,独立样本,总体标准差未知条件下,进行差异显著性检验,首先,首先 要进行总体方

36、差齐性检验。,用总体标准差估计值S,总体标准差未知下,怎样判断?,即只要检验 无显著性差异即可,F检验,,英国统计学家费舍首创,第十章 2 检验,10.1 2分布及2检验,一、2检验的特点,2检验是根据样本频数分布,对总体分布进行推断 的假设检验。,2检验与测量数据假设检验的区别:,测量数据假设检验,数据属性,总体分布,检验对象,2检验,连续型,间断型,正态分布,未 知,总体参数,非总体参数,10.1 2 分布及2检验,一、2检验的特点,二、2检验的统计量,三、2的抽样分布,四、2检验应用,例1 从某大学随机抽取54位老年教师,其中健康状况属于好的有15人,中等的有23人,差的有16人,问该校

37、老年教师健康状况好、中、差的人数比率是否是1:2:1?,解:1、提出假设,H0:健康状况好、中、差的人数比率是1:2:1H1:健康状况好、中、差的人数比率不是1:2:1,2、选择统计量并计算,实际频数:,理论频数:,ft1=541/4=13.5,ft2=542/4=27,ft3=541/4=13.5。,根据零假设,,=1.22,3、统计决断,df=k-1=2,查 2 值表,,2=1.22,P0.05,根据2 检验统计决断规则,,所以在0.05显著水平上保留零假设,拒绝备择假设。,即该校老年教师的健康状况,好、中、差人数的比率是1:2:1。,2检验能解决的问题,调查人们对于某社会现象的看法,结果

38、如下。问三种态度人数有无显著差异?同质性检验,2检验能解决的问题,表中314名学生的考试成绩是否服从正态分布?数据正态性的检验,2检验能解决的问题,对3627名中小学生的心理测验得到如下结果(部分),问性格类型与智力水平之间有无关联?相关性(或独立性)检验,第二节单向表的2检验,把实得的点计数据按一种分类标准编制成表就是单向表(单因素),二、一个自由度的2检验,当df=1,其中只要有一个组的理论值ft5,就要运用亚茨(Yates)连续性校正法:,例.某区中学团员比例为0.8,现从该区某中学随机抽取20人,其中团员12人,问该校团员的比例与全区是否相同?,(答案:3.830.05),ft1=20

39、 0.8=16,ft2=200.2=4,实际频数:,理论频数:,5,且df=2-1=1,,团员,非团员,三、次数分布正态性的2检验,P177,自由度为K-3,第三节双向表的2检验,在双向表的2检验中,如果要判断两种分类特征,即两个因素之间是否有依从关系,这种检验称为独立性2检验。,例1家庭经济情况属于上、中、下的高三毕业生,对于是否报考师范大学有三种不同态度(愿意、不愿意、未定),其人数如下表。问学生是否愿意报告师范大学与家庭经济情况是否有关系?,解:1、提出假设,H0:学生是否愿意报考师范的态度与家庭经济状况无关系H1:学生是否愿意报考师范的态度与家庭经济状况有关系,例1家庭经济情况属于上、

40、中、下的高三毕业生,对于是否报考师范大学有三种不同态度(愿意、不愿意、未定),其人数如下表。问学生是否愿意报告师范大学与家庭经济情况是否有关系?,2、选择统计量并计算,i=1,2,3j=1,2,3,根据零假设及学生对报考师范大学的态度与家庭经济状况之间关系的双向表,可计算出相应理论频数。,=10.48,3、统计决断,df=(r-1)(c-1),查 2值表,,0.01P0.05,根据2检验统计决断规则,,所以在0.05显著水平上保留 H1,拒绝 H0。,即学生是否愿意报考师范大学的态度与家庭经济状况有关系。,=(3-1)(3-1)=4,r=3,c=3,*,第十一章相关分析,相关意义积差相关等级相

41、关质与量的相关品质相关,相关关系,变量间关系不能用函数关系精确表达一个变量的取值不能由另一个变量唯一确定当变量 x 取某个值时,变量 y 的取值可能有几个各观测点分布在直线周围,相关的概念两个变量之间不精确、不稳定的变化关系称为相关关系。,第一节相关的意义,相关的概念两个变量之间不精确、不稳定的变化关系称为相关关系。分类:正相关、负相关、零相关相关系数用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。一般用 r 表示。1r 1,相关系数(取值及其意义),r 的取值范围是-1,1 1r 1|r|=1,为完全相关 r=1,为完全正相关 r=-1,为完全负正相关 r=0,不存在相关

42、关系-1r0,为负相关 0r1,为正相关|r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切,相关及相关系数的几点说明,相关系数的值,仅仅是一个比值,不等距,也不是百分比,因此,不能直接作加、减、乘、除。r=0.2,r0.4,r=0.8如果两个变量之间存在因果关系,则这种关系可以用相关关系体现出来。相关不等于因果:相关系数只能描述两个变量之间的变化方向及密切程度,并不能揭示二者之间的内在本质联系。,样本、总体相关系数(correlation coefficient),若相关系数是根据总体全部数据计算的,称为总体相关系数,记为若是根据样本数据计算的,则称为样本相关系数,记为 r,第十二章

43、回归分析,主要内容:一元线性回归一元线性回归方程的检验一元线性回归方程的应用多元线性回归简介变量间的关系:相关系数双向关系回归方程单向关系,什么是回归分析?,从一组样本数据出发,确定变量之间的数学关系式;利用所求的关系式,由一个变量(自变量)来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。,一元线性回归模型,一元线性回归方程,回归线拟合的常用原则,就是使各点与该线纵向距离的平方和为最小。,回归线,回归线拟合的常用原则,就是使各点与该线纵向距离的平方和为最小,回归方程,确定回归线的方程称回归方程。,由x估计Y,由Y估计x,由Y估计X,估计方程的求法(例题分析),【例2】根据第十

44、一章例子的数据男青年前臂长y对身高x的线性回归方程,回归方程为:y=4.897+0.2348 x,第十四章抽样设计(技术),统计的质量取决于数据的质量推断统计学各种方法运用的前提就是要先获得对总体有足够代表性的样本资料或实验数据,推断可靠性三因素:数据的质量、统计方法及数据处理的准确性、样本对总体的代表性,怎样抽?抽多少?,第一节抽样调查与抽样方法,从总体中抽取部分个体组成样本,对该样本进行观察,进而推断未知总体情况,称为抽样调查。抽样调查分为非概率抽样调查和概率抽样调查两大类。,常用的抽样方法,简单随机抽样分层随机抽样机械抽样(系统抽样)整群抽样和多阶段抽样,简单随机抽样,从总体的N个个体中

45、,完全以随机形式(不加人为干扰地)抽取n个个体组成一个样本。在抽取的过程中,总体中每个个体被抽到的概率是均等的,并且在任何一个个体被抽取之后总体内成分不变(抽样的独立性)。,分层随机抽样,一种有人为干预的限制性随机抽样。按有关的因素或指标将总体划分为互不重叠的几个部分(层),再从各部分(层)中随机地(独立地)抽取一定数量的个体,最后将各个部分(层)中抽取的个体合在一起,组成一个样本。,分层抽样的抽样比例,等比例分层抽样最优配置法内曼配置法,nh:各层要抽取人数nnh;Nh:h层的总人数h:h层的标准差,机械抽样,又称为系统抽样、等距抽样,其做法是,先将总体中的所有个体按顺序编号,然后每隔一定的

46、间隔k抽取个体,组成样本。,整群抽样,以整群为单位的抽样方法,即从总体中抽出来的个体同属于某个群体。使用整群抽样的目的主要是为了方便和节省费用。整群抽样也有缺点,它抽取的个体在总体中分布不均匀,因此抽样误差常常大于简单随机抽样。,第二节样本容量的确定,估计总体平均数时的必要样本容量,:标准差:估计最大允许误差,若未知,例1 拟估计上海市高校四级英语考试的总体平均数,根据历次考试成绩的标准差为13,这次估计的最大允许误差为2分,可信度为95%,问应当抽多少人?,解:,由=13,=2,1-=0.95,所以,162.3,163,所以应当抽163人。,若未知,第十五章 教育测量与评价理论,第一节 教育

47、测评概述,一、教育测量(一)测量的定义测量是根据法则给事物分派数字。(史蒂文斯1951)测量这一定义包含了三个要素:1、法则给事物的属性分派数字的依据2、事物属性测量的对象或目标3、数字描述事物属性的符号,1、按数据观测方法和来源:点计数据(计数数据)与度量数据(测量数据)。2、按数学属性:间断(离散)数据与连续数据。,数据种类(数据的水平),四分法,3、按数据测量水平,称名(名义)数据等级(顺序)数据等距数据等比数据(比率数据),大小加减加减乘除,判断:1)表示男、女的数据(记号)属于,名义,比率,名义量表,2)百分制记分的数学成绩属于,等距量表,3)五级记分的实习成绩属于,等级(顺序)量表

48、,定类:区别类别,定序:排列顺序,定距:决定差异,定比:决定比率,适用统计检验,2检验,非参数检验,Z、t、F检验,Z、t、F检验,间断型数据,连续型数据,总体,样本,统计量,描述统计,作出推断,随机抽样,参数,描述,描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法。(主要是对样本数据的处理),推断统计:根据样本所提供的信息,运用概率的理论进行分析、论证,在一定可靠程度上对总体分布特征进行估计、推测的统计方法。(在一定风险下,部分推断全体),抽样设计,三、统计学与教育统计学的内容,统教计育学统或计学,描述统计,推断统计,实验设计,统计图表集中量数差异量数相关分析,统计估计假设检验,参数估计非参数估计,点估计区间估计,参数检验非参数检验,样本选择与分配实验误差分析因子分析,方差分析回归分析,抽样设计,本课程结束语,凡物皆可统计!“凡物的存在必有其数量”“凡有数量的东西都可以测量”“在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。”用统计数据评说,会更好!,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号