教育统计学ppt课件 2 数据的初步整理.ppt

上传人:牧羊曲112 文档编号:1912053 上传时间:2022-12-25 格式:PPT 页数:70 大小:1.25MB
返回 下载 相关 举报
教育统计学ppt课件 2 数据的初步整理.ppt_第1页
第1页 / 共70页
教育统计学ppt课件 2 数据的初步整理.ppt_第2页
第2页 / 共70页
教育统计学ppt课件 2 数据的初步整理.ppt_第3页
第3页 / 共70页
教育统计学ppt课件 2 数据的初步整理.ppt_第4页
第4页 / 共70页
教育统计学ppt课件 2 数据的初步整理.ppt_第5页
第5页 / 共70页
点击查看更多>>
资源描述

《教育统计学ppt课件 2 数据的初步整理.ppt》由会员分享,可在线阅读,更多相关《教育统计学ppt课件 2 数据的初步整理.ppt(70页珍藏版)》请在三一办公上搜索。

1、课前作业,期中考试成绩与花在学习上的时间的关系;抽烟大学生与不抽烟大学生花在学习上的时间有差异吗?身体锻炼对情绪有什么效应?到快毕业了还没考过四级的学生有些什么特征?喝咖啡的人与不喝咖啡的人在焦虑水平上有差异吗?咖啡摄入对情绪有什么影响?英文书阅读量与四级阅读理解成绩有什么关系?男性和女性购买衣物时挑选时间有差异吗?,exercises,请说出自变量和因变量的差异和关系。,请判断下列各问题分别应该由哪种研究来回答,描述性研究,相关研究,固定组比较研究还是实验研究?,心理与教育统计学,第一章数据的初步整理,本章要点:1. 频数分布表的绘制;2. 频数分布图的绘制;3. 散点图、线形图、条形图和圆

2、形图;,第一章数据的初步整理,第一节 频数分布表及相关概念,次数分布一批数据中各个不同数值所出现的次数情况。或者是指一批数据在量尺上各等距区组内所出现的次数情况。,tables of frequency distribution,2007年1月份龙泉市医院出生的20名新生婴儿的体重如下:(单位:kg)3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6,tables of frequency distribution,2007年1月份龙泉市医院出生的20名新生婴儿的体重如下:(单位:kg)

3、3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6,2.8 2.9 3.2 3.3 3.4 3.4 3.5 3.5 3.5 3.6 3.6 3.6 3.7 3.7 3.8 4.0 4.3 4.5 4.7 4.8,次数分布表其实质是反映一批数据在各等距区组内的次数分布结构。编制次数分布表主要有下列一些步骤:1. 求全距;2. 定组数;3. 定组距;4. 写出组限;5. 求组中值;6. 归类划记;7. 登记次数;,tables of frequency distribution,1. 求全距

4、全距(以符号R表示)是指一批数据中最大值(Max)与最小值(Min)之间的差距。R=Max-MinR=4.8-2.8=2注:全距也叫两级差或者极差。,tables of frequency distribution,2007年1月份龙泉市医院出生的20名新生婴儿的体重如下:(单位:kg)3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6,2. 定组数定组数(以符号K表示)就是要确定把整批数据划分为多少个等距的区组。组数的大小要看数据的多少而定;一般说来,当一批数据的个数在200个以内时,

5、可以取8-18组;100个数据以内分5-12组。鉴于此,我们把上例中的组数定位6。如果数据来自于一个正态的总体,可以用下列公式来确定组数:,tables of frequency distribution,?,3. 定组距组距(以符号i表示)通过对全距R与组数K的比值取整来确定。组距一般原则是取奇数或5的倍数。对于本例而言R/K=2/6=0.33,故组距可取0.4:注:本例中的数字均含一位小数点,所以组距既不能取整,当然也不是奇数或5的倍数。,tables of frequency distribution,的整数部分 1,组距,组数=,全距,4. 写出组限组限是每个组的起始点界限,也有人称之

6、为边界值。,tables of frequency distribution,20名新生婴儿的体重如下:3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6,4. 写出组限组限(以符号i表示)是每个组的起始点界限,也有人称之为边界值。,tables of frequency distribution,20名新生婴儿的体重如下:3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6,4.

7、写出组限组限(以符号i表示)是每个组的起始点界限,也有人称之为边界值。,tables of frequency distribution,为了使数据不落在各组的边界上,在组距不变的情况下,我们把边界值取的比实际数据多一位小数。,5. 求组中值组中值是每个组的组中点在量尺上的数值,其计算公式为:组中值(组实上限组实下限)2,tables of frequency distribution,2.95,3.35,3.75,4.15,4.55,4.95,6. 归类划记用唱票的方式把每个数据准确地划归到所属的组别。,tables of frequency distribution,20名新生婴儿的体重如

8、下:3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6,7. 登记次数根据划计的结果,点计各组的次数或频数(用符号f表示。)。,tables of frequency distribution,20名新生婴儿的体重如下:3.8 3.4 3.4 3.5 2.8 3.3 4.0 4.5 3.6 3.5 3.7 3.7 4.7 2.9 3.2 3.5 3.6 4.8 4.3 3.6,2,7,6,2,2,1,20,讨论,体重在标准体重范围(3.553.95kg)内的婴儿有多少个?,20,8. 相

9、对次数分布表各组的次(频)数f与总次(频)数N之间的比值,符号为 。则有:,tables of frequency distribution,0.1,0.35,0.3,0.1,0.1,0.05,1,相对次数能反映各组数据的百分比结构。相对次数也叫频率。,9. 累计次数分布表,tables of frequency distribution,10. 累计相对次数分布表和累计百分数分布表,tables of frequency distribution,0.05,0.15,0.25,0.55,0.90,1.00,课堂作业,1一组数据的最大值与最小值的差叫做_2将数据分组后,落在各小组内的数据个数称

10、为_3一组数据的全距为40,最小值为57,则最大值为_4一个样本的样本容量是30,全距为15,分组时取组距为 3,为了使数据不落在边界上,可将数据分为_组, 各组的次数总和为_,频率之和_5已知10个数据:1,2,2,3,3,3,4,4,4,4,其中 4出现的次数是_,相对次数为_6一组数据的最大值为100,最小值为45,若选取组距为 10,则这组数据可分成_组,全距,次数,97,6,30,4,6,0.4,1,exercises,已知有一个20个数据的数列中最大值为38,最小值为13;若将这些数据分为6组制成频数分布表,若组距为整数则组距为_。,5,最大值为38,最小值为13,6组,exerc

11、ises,全社会都非常关注青少年的视力,我校对在校的全体学生的视力进行了一次检测,从中随机抽取了50名学生的检测结果作为样本,其中最大值为5.4,最小值为2.4。若组距定为0.3则列频数分布表时应把数据分为_组,最大值为5.4,最小值为2.4,0.3,11,组距,课前作业,1.在频数分布表中,各小组的频数之和 ( )A. 小于数据总和 B. 等于数据总和C. 大于数据总和 D. 不能确定,2.为了绘制一组数据的频数分布表,首先要算出这组数据的变化范围,数据的变化范围是指数据的( ) A. 最大值 B. 最小值 C. 最大值与最小值的差 D. 数据的个数,3.在一次抽样调查中收集了一些数据,对数

12、据进行分组,绘制了下面的频数分布表:(1)已知最后一组(89.599.5)出现的频率为15%,则这一次抽样调查的容量是_ 。,(2)第三小组(69.579.5)的频数是_,频率是_;,4.有若干个数据,最大值是124,最小值是103,用频数分布表描述这组数据时,若取组距为3,则应分为 ( )A6组 B7组 C8组 D9组,5.已知一个样本: 27,23,25,27,29,31,27,30,32, 28,31,28,26,27,29,28,24,26, 27,30。那么频数为 8 的范围是 ( ) A. 24.5 26.5 B. 26.528.5 C. 28.530.5 D. 30.532.5,

13、6.在1000个数据中,用适当的方法抽取50个作为样本进行统计,频率分布表中54.557.5这一组的频率是0. 12,那么估计总体数据落在54.557.5 之间的约有 () A.120个; B.60个; C.12个; D.6个;,7.为了了解某中学初三年级250名学生升学考试的数学成绩,从中抽取50名学生的数学成绩进行了分析,求得下面是 50名学生数学成绩的统计表,数据统计表中的数据a=_ ,b=_。,估计该校初三年级这次升学考试数学平均成绩为_分(免做),表2.1 八年级某班全体学生英语学科期末考试成绩的频数分布表,(1)请完成该表,并说出该班80分以上有多少学生?,(2)数据分组时的组距为

14、多少?,(3)估计全距至多为多少?,2,2,0,6,5,5,10,10,59,0.25,0,20,1,表2-1 某班全体学生英语期末成绩的频数分布表,表号,标目,表注,标目,顶线,表线,数字,底线,标题,注:表中的数据来源于某教材中的例2,统计表的结构和组成要素,第一章数据的初步整理,第二节 频数分布图的绘制,次数分布图为了更直观、更形象地表达一个次数分布的结构形态及特征,我们可以进一步从次数分布表出发,绘制出相应的次数分布图。次数分布图有两种表达方式:次数直方图次数多边图,graphs of frequency distribution,次数直方图由若干宽度相等、高度不一的直方条紧密排列在同

15、一基线上构成的图形。,graphs of frequency distribution,某班一次数学测验成绩如下: 63,84,91,53,69,81,61,69,91,78,75,81,80,67,76,81,79,94,61,69,89,70,70,87,81,86,90,88,85,67,71,82,87,75,87,95,53,65,74,77,graphs of frequency distribution,1. 求全距R=Max-Min=95-53=42,某班一次数学测验成绩如下: 63,84,91,53,69,81,61,69,91,78,75,81,80,67,76,81,79

16、,94,61,69,89,70,70,87,81,86,90,88,85,67,71,82,87,75,87,95,53,65,74,77,graphs of frequency distribution,2. 定组数和组距,5,42,?,某班一次数学测验成绩如下: 63,84,91,53,69,81,61,69,91,78,75,81,80,67,76,81,79,94,61,69,89,70,70,87,81,86,90,88,85,67,71,82,87,75,87,95,53,65,74,77,graphs of frequency distribution,3. 写出组限第一组(最低

17、分所在组)的下限应该是怎样设定?,53,53,61,61,63,65,67,67,69,69,69,70,70,71,74,75,75,76,77 ,78,79,80,81,81,81,81,82,84,85,86,87,87,87,88,89,90,91,91,94,95,4,10,13,11,2,40,表2-1 某班一次数学测验成绩的频数分布表,注: 本数据纯属虚构,如有雷同,定是巧合,第一步:以细线条标出横轴和纵轴,使其垂直相交。美观的要求:53 ;按比例等间隔地标出刻度;,第一步:以细线条标出横轴和纵轴,使其垂直相交。美观的要求:53 ;按比例等间隔地标出刻度;横轴代表测验分数量尺,纵

18、轴代表各组次数的量尺,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,52.5,62.5,72.5,82.5,92.5,102.5,测验分数,次数,第二步:画出直方条,直方条的宽度与组距i相应,其高度则由相应组别的次数f决定。,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,52.5,62.5,72.5,82.5,92.5,102.5,测验分数,次数,4,10,13,11,2,优点:直观形象,凸显次数之间的相对大小及分布形态;缺点:各组确切的次数不明,因此往往在图上标出;,第三步:在直方图的横轴下方标上图的编号和图的题目,并检查图形结构的

19、完整性。,测验分数,次数,Y轴名称,填充图案,轮廓线,基线,刻度标记,图号,图题,X轴名称,图2-1某班一次数学测验成绩的频数分布图,次数多边图利用闭合的折线构成多边形以反映次数变化情况的一种图示方法。,graphs of frequency distribution,第一步:横轴和纵轴的画法相同,只是要在横轴上最低组和最高组之外各增加一个次数为0的组。,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,52.5,62.5,72.5,82.5,92.5,102.5,测验分数,次数,112.5,42.5,第二步:在两轴所在的直角坐标平面山,分别以每个组的组中值为横坐标,

20、相应的次数为纵坐标,画出各个点。,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,52.5,62.5,72.5,82.5,92.5,102.5,测验分数,次数,112.5,42.5,第三步:用线段把相邻的点连起来。一批数据的个数不是很多时,所绘制的次数多边图常表现为不规则的多边形。从理论上讲,当一批数据的个数足够大,随着分组时组距的不断变小,绘制成的次数多边图会越来越光滑。若分为无数组时,就形成一条极光滑的曲线,这便是统计学上的次数分布曲线。,0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,52.5,62.5,72.5,82.5,92.5

21、,102.5,测验分数,次数,112.5,42.5,为了解各年级段的观众对某电视剧的收视率,某校初三(1)班的一个兴趣小组,调查了部分观众的收视情况并分成A、B、C、D、E、F六组进行整理,其频率分布直方图如图:,A,D,F,B,C,E,2,4,8,18,12,6,9.5 19.5 29.5 39.5 49.5 59.5 60.5,请回答:1. E组的频数为( ),被调查的观众为( )人。2. 收视率50%以上的观众有( )人。,请观察右图,并回答下列问题:, 被检查的矿泉水总数有多少种?, 被查矿泉水pH最低组的组中值是?, 组界为6.97.3这一组的频数、频率分别是多少?(每一组包括前一个

22、边界值,不包括后一个边界值), 根据我过2001年公布的生活饮用水卫生规范,饮用水的pH应在6.58.5的范围内,被检测的矿泉水不符合这一标准的有多少种?占总数的百分之几?,1,4,6,10,5,6,32种,5.9,频数为10,频率为0.3125,5种,15.625%,每年的6月6日是全国的爱眼日,让我们行动起来,爱护我们的眼睛!某校为了做好全校2000名学生的眼睛保健工作,对学生的视力情况进行一次抽样调查,如图,是利用所得数据绘制的频数分布直方图。请你根据此图提供的信息,回答下列问题:,第1组,第2组,第3组,第4组,第5组,视力,605040302010,(1)本次调查共抽测了-名学生;,

23、(2)视力在4.9及4.9以上的同学约占全校学生比例为-,,(3)如果视力在4.87以下者均属视力不良,那么调查中共有-名学生视力不良。,160,37.5%,100,4.1,4.7,5.0,4.4,5.3,频数(名),(4)这个图的结构完整吗?,2. 下面的频数分布直方图反映了某城市抽查一些家庭每月水电费的开支(单位:元).请根据该直方图,回答下列问题:,(1)被调查家庭的样本容量是多少?,(2)数据分组的组距是多少?,(3)频数最大一组的组中值是多少?,(4)自左至右第3组的频数、频率分别是多少?,(5)每月水电费开支为多少元之间的家庭约占55%,11,7,12,350,100,6,150,

24、开支(元),250,1,3,200,300,某城市部分家庭每月水电费开支 的频数分布直方图,频数(个),40,50元,150元,频数是11,频率是0.275,第一章数据的初步整理,第三节 其他统计图,散点图(scatter diagram)用平面直角坐标系上点的散布图形(密集程度和趋势)表示两种事物之间的相关关系。横轴:自变量X,连续变量和离散变量;纵轴:应变量Y,只能是连续变量;纵轴与横轴的起点可根据资料的情况而定。,制作散点图应注意:1. 在平面直角坐标系中,横轴上的点一般代表自变量,纵轴上的点一般代表因变量;横轴可作连续变量或离散变量的量尺,纵轴一般代表连续变量的量尺。2. 点的描绘依二

25、元观测数据而定,用细线划坐标轴,用稍粗的黑点描绘各坐标点。3. 注意图形的调和比例和必要的图注说明。,图?-? x变量与y变量的散点图,线形图线形图是以起伏的折线来表示某种事物的发展变化及演变趋势的统计图。线形图的特点:形象较为生动,从图上可以看出某事物或现象的变化趋势适用于描述两种事物在时间序列上的变化趋势;也适用于描述一事物随另一事物发展变化的趋势模式;还适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系;,绘制要领:横、纵坐标轴的画法及量尺设计与散点图相同;根据数据资料在坐标轴上画出圆点,然后用稍粗的线段把相邻的点一次联接;同一坐标轴上可以划几条线形图,以便于比较分析;,

26、图?-? 不同民族人民平均寿命折线图,民族,平均寿命,条形图用宽度相同的长条来表示各个统计事项之间的数量关系。有两种形式:简单或复合条形图。简单条形图 是用同类的直方长条来比较若干统计事项之间的数量关系的一种图示方法,它适用于统计事项仅按一种特征进行分析的情况。绘制简单条形图需注意:各直方长条的宽度相同,色调一致;相邻长条之间的间隔要适当,一般而言其间距大约是直方长条宽度的0.5-1倍。,复合条形图 是指用两类或三类不同色调的直方长条来表示多特征分类下的统计事项之间的数量关系的一种图示方法;绘制条形图应注意:各类直方长条的宽度要相同;不同类型的直方长条应用不同类型的色调加以区别,并在图形右上方

27、适当位置标明图例;把要比较的统计事项(二重分类)的直方长条靠在一起,在横轴上标明的分类项目的直方长条之间要相互隔开,其间距一般取直方长条宽度的0.5-1倍。,圆形图圆形图是以单位圆内各扇形面积所占整个圆形面积的百分比来来表示各统计事项在总体中所占相应比例的一种图示方法。适用于描述具有百分比结构的分类数据;,圆形图的主要制作步骤如下:1. 以适当的半径作一圆代表事物总体;2. 分别以统计事项在总体中的比例乘以圆周角求出各相应扇形的圆心角;3. 根据计算结果将整个圆分成若干扇形部分,并在其中标上各自的百分比数值;4. 用不同的色调对不同的扇形加以区分,并在图形的右边标上图例以便阅读;5. 在图形的

28、适当位置上,注明总体事物的数量,亦可把总体事物的数量体现在图题中;6. 注意整个图形的对称与协调,在图形下边的适当位置标上图号和图题。,圆图:用于表达事物内部的百分构成比大小。各个扇形面积(3.6)的大小反映了各组成部分百分比(1)的大小。从12点钟处开始绘制,顺时针方向排列。,图?-? 不同民族人数构成比圆形图,7%,12%,12%,69%,共100人,1.要清楚地表明一病人的体温变化情况,应选择的统计图是( ) A.扇形统计图 B.条形统计图 C.折线统计图 D.以上都不是,2.某音乐行出售三种音乐CD,即古典音乐、流行 音乐、民族音乐,为了表示这三种音乐唱片的 销售量的百分比,应该用 (

29、 ) A.扇形统计图 B.折线统计图 C.条形统计图 D.以上都可以,3.某班有50人,其中三好学生10人,优秀学生干部5人,在扇形统计图上表示三好学生和优秀学生干部人数的圆心角分别是( ) A.72,36 B.100 ,50 C.120 ,60 D.80 , 40 ,4.如图,某校共有学生700人,图中扇形A、B、C分别参加语、数、英三个兴趣小组的人数的百分比,规定每人只能参加一个兴趣小组且每人均参加课外小组,则不参加数学小组的学生有( ) A.441人; B.259人; C.451人; D.249人,5.如图是60篇学生调查报告进行整理,画出的频数分布直方图. 已知从左到右4个小组的频率分

30、别是0.15,0.40,0.30,0.15,那么在这次评比中被评为优秀(分数大于或等于80分为优秀,且分数为整数)的调查报告有( ) A18篇 B24篇 C25篇 D27篇,6.如图是某乡镇企业20022004年创造的利润折线统计图,利润最高的一年比最低的一年多百分之几?,这3年平均每年创造利润多少万元?,(结果保留一位小数),例1. 某区教育部门要了解初中学生阅读课外书籍的情况, 随机调查了本地区500名初中学生一学期阅读课外书的本数,并绘制了如图的统计图请根据统计图反映的信息回答问题。,(1)这些课外书籍中,哪类书的阅读数量最大?,(2)这500名学生一学期平均每人阅读课外书多少本?,(3)若该地区共有2万名初中学生,请估计他们一学期 阅读课外书的总本数,解:(1) 这些类型得课外书籍中,小说类课外书阅读数量最大;,(2) (2.03.56.48.42.45.5)100500=5.646(本) 答:这500名学生一学期平均每人阅读课外书6本。,(3) 200006120000(本) 或 2612(万本) 答:他们一学期阅读课外书得总数是12万本。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号