《中职统计基础知识分布数列课件.ppt》由会员分享,可在线阅读,更多相关《中职统计基础知识分布数列课件.ppt(99页珍藏版)》请在三一办公上搜索。
1、分布数列的概念,分布数列是指在统计分组的基础上,将总体单位按类入组,并汇总各组内单位数,形成总体中单位数在各组间的分布。分布数列或称次数分布,或称为分配数列。,分布数列或称_,_。将统计数据按其分组标志进行分组的过程,实际上就是度量分布形成的过程。,将,分布数列的概念,在分布数列中,各组拥有的总体单位数称为改组的次数(或频数),与总体单位总数的比值称为频率。,分布数列的两个组成要素:一是分成的各组,二是各组的次数。,.,.,例如,,某班50名学生,调查其考分资料如下:,77 65 83 56 68 70 99 65 73 72 88 66 74 63 71 84 62 52 80 78 84
2、79 81 64 58 82 76 62 73 75 89 79 61 65 54 92 86 73 68 51 69 64 78 63 76 68 72 77 81 76,.,.,表3-1,见后面统计整理的步骤,练习次数分布中的次数是指()A划分各组的数量标志B分组的组数C分布在各组的单位数D标志变异个数,分布数列的概念,频率表明各组标志值对总体的相对作用程度,频率越小,改组标志值所起的作用越小,若频率越大,改组标志值所起的作用越大。,多选在次数分布数列中,()A总次数一定,频数和频率成反比B各组的频数之和等于100C各组频率大于零,频率之和等于一D频率越小,则该组的标志值所起的作用越小,请
3、思考:判断:频数越小,则该组的标志值所起的作用越小,分布数列的分类,用品质标志进行分组所得到的分布数列,叫做品质分布数列,简称品质数列;用数量标志进行分组得到的分布数列,叫做变量分布数列,简称变量数列。,品质分布数列举例,变量分布数列举例,变量分布数列举例,变量分布数列举例,.,.,单项式变量分布数列组距式变量分布数列,变量分布数列的种类,变量分布数列,.,.,(即一个组只有一个变量值),单项式分组,单项式分组适用于:变量值变化范围不大、不同变量值个数较少的离散变量。,居民家庭按子女数分组:,0 1 2 3,(离散变量),例如:,见后面组距式分组,单项式变量分布数列,每一组都是由单个的组值(整
4、数或小数)表示,则称为单项式变量分布数列。,若是离散变量,其变量值不多,变动范围不大,宜编制单项式变量分布数列,组距式变量分布数列,每一组都是由数域(区间)表示,则称为组距式变量分布数列。若是离散型变量,其变量值较多,变动范围较大,或是连续变量宜编制组距式变量分布数列,.,.,将相邻几个变量值并为一组(形成一个区间),即一个组有一个变量值的变动范围。,例如:,企业按人数分组,499及以下 500 999 1000 2999 3000及以上,工人按工资分组,600 700 700 800 800 1200 1200 1500,组距式分组适用于:变量值变化范围较大、不同变量值个数较多的离散变量及连
5、续变量。,(离散变量),(连续变量),注意:连续型变量的数值不能一一列举,故其只能采用组距式分组。,见前面单项式分组与组距式分组,组距式分组(应注意),组距式变量分布数列举例,组距式变量分布数列:等距式变量分布数列、异距式变量分布数列,等距式变量分布数列,异距式变量分布数列,练习属于变量数列的有()A单项式数列B品质数列C等距数列D异距数列,练习属于变量数列的有()A按大学生所学专业分配B按运动员年龄分配C按企业利润分配D按工人劳动生产率分配,练习企业资产总额分组()A只能使用单项式分组B只能使用组距式分组C可以使用单项式分组,也可以使用组距式分组D无法分组,将某地区30个商店按零售额多少分组
6、而编制的分配数列,其变量值是()A零售额B商店数C各组零售额D各组的商店数,分布数列一些相关基本概念,1.组限组限是指每个组两端的变量值,其中,每个组最小值为下限,每个组最大值为上限。确定组限时,最小组的下限应小于最小变量值,最大组的上限应大于最大变量值。,499及以下 500 999 1000 2999 3000及以上,600 700 700 800 800 1200 1200 1500,.,.,组限及划分方法,工人按工资分组:,企业按人数分组:,重叠组限,不重叠组限,见后面组限的划分方法,组限的划分,(只适用于离散变量),500及以下 500 1000 1000 3000 3000及以上,
7、当某单位的变量值刚好等于相邻两组的上下限时,一般把此值归到作为下限的那一组中,即遵循“上限不在内”原则。,练习 按连续变量分组,第一组4555,第二组5565,第三组6575,第四组75以上,则()A、55在第一组 B、65在第二组 C、65在第三组 D、75在第三组,C,分布数列一些相关基本概念,2.闭口组闭口组是指各组上下限齐备的组3.开口组开口组是指首组或者末组上限或下限不齐全的组。若组距分组中,出现极端值,即最大变量值和最小变量值相差悬殊,为避免出现空白组,首组或末组用“以下”或者“以上”来表示,.,.,例如:,企业按人数分组,499及以下 500 999 1000 2999 3000
8、及以上,工人按工资分组,600 700 700 800 800 1200 1200 1500,(离散变量),(连续变量),判断下列是闭口组还是开口组,.,.,组距=本组上限前组上限,(通用公式),组距=本组上限本组下限,(重叠组限),组距与组数一般是用整数表示。,学生按考分分组(分)50 60 60 70 70 80 80 90 90 100,分布数列一些相关基本概念,练习某小区居民人均月收入最高为5500元,最低为2500元,据此分为6组,形成等距数列,其组距应为()A 500 B600 C550 D650,分布数列一些相关基本概念,全距,全距=最大变量值最小变量值,分布数列一些相关基本概念
9、,组数组数是指某个变量数列划分成多少个组。组数的多少一般与变量的区间范围有关,组数应为整数。,练习组数与组距的关系是()A组数越多,组距越小B组数越多,组距越大C组数与组距无关D组数越少,组距越小,.,.,组中值,指各组上限和下限之间的中点数值。,(假定组内标志值均匀分布),(考分:52 54 57 58 59),按考分分组 50 60 60 70 70 80 80 90 90 100,55,75,65,85,95,(考分:51 52 53 54 55),不均匀分布,50,55,60,均匀分布,50,55,60,组中值,闭口组组中值,.,.,开口组组中值 若第一组出现“以下”或最末组出现“以上
10、”字样的组叫做开口组。,首组组中值,=首组上限相邻组组距的一半,=末组下限+相邻组组距的一半,末组组中值,50 102,100+102,其组中值的确定:.,首组:,末组:,按考分分组 组中值 50 60 55 60 70 65 70 80 75 80 90 85 90 100 95,50以下,100以上,45,105,练习在组距数列中,对各组的上限与下限进行简单平均,得到的是()A组中值B组平均数C组距D组数,练习某连续变量,其末组为开口组,下限为500,又知其邻组组中值为480,则其末组的组中值为()A490 B500 C510 D520,四、填空题,1.对于连续变量划分组限时,相邻组的组限
11、必须_。2.次数分布数列是由_和_两个要素组成。,.,.,3.统计分组的关键在于_。4.对总体只按一个标志进行分组称为_分组,对总体按两个或两个以上标志层叠起来进行分组称为_分组。5.组距式分组根据其分组的组距是否相等可以分为_ 分组和_分组。,.,.,单项式变量分布数列的编制步骤,1.将变量值按顺序排列起来2.每个变量为一组3.汇总出各组次数并编制整理表,组距式变量分布数列的编制步骤,1.将原始数据按顺序排列起来2.计算全距3.确定组限、组距和组数4.写出组限并据以归总计算各组次数。(不重复不遗漏)5.编制整理表,变量数列的图形显示方法,1.直方图直方图是指在横纵轴之间以直方条形来显示频数分
12、布的图形。左纵轴表示频数,右纵轴表示频率,横轴表示变量值。,判断直方图是指在横轴和纵轴之间以直方条形来显示频率的分布的图形(),变量数列的图形显示方法,2.折线图折线图是指将直方图个条形顶端中点两两连接起来,所形成的的图形。,变量数列的图形显示方法,3.圆滑曲线图当各组组距无限缩小时,折线图相邻条形的重点将无限接近。折线图的折现变圆滑,而成为曲线。,常用的变量分布图形()A直方图B折线图C面积图D圆滑曲线图,三、统计汇总统计汇总是指在统计分组基础上,将总体各单位及其标志值归集到各组中,并计算出各组单位总量、总体单位总量和各组标志总量、总体标志总量,据以得到总体指标的工作过程。,1.总体单位总量
13、方面的汇总(次数汇总或频数汇总)是指汇总各组单位数和总体单位数,最终汇总结果就是总体单位总量,形成变量分布数列。,例如:调查某中职学校财会班所有学生的基本情况,那么学生总数则是总体单位总量的汇总。,2.绝对数标志值汇总指总体各单位的绝对数标志值在各组的加总,形成各组标志总量,最终汇总结果为总体标志总量。,例如:所有学生的成绩加总求和得到的总量就是绝对标志值的汇总。,3.平均数和相对数标志值的汇总总体各单位的平均数和相对数标志值不能直接加总,因此,汇总这两类标志值的时必须先把他们的绝对数分子和分母分解出来,然后再把分子和分母进行加总,通过对加总结果的对比计算,来汇总总体各单位在各组的平均数和相对
14、数的标志值。,例如劳动生产率应该是总产出与对应对应的活劳动消耗之比,汇总结果也必须是这一含义。,(二)统计汇总的技术和方法统计汇总按照组织方式或形式划分为:逐级汇总和集中汇总,逐级汇总就是按照一定的统计管理体制,自上而下地对调查资料进行逐级汇总。逐级汇总的优点是:能满足各地区、各部门对统计资料的需要,同时便于就地审核和订正原始资料缺点:费事较长,发生差错的概率大,集中汇总就是将全部调查资料集中到组织统计调查的最高一级机关进行一次汇总优点:可以缩短汇总时间,减少汇总差错缺点:原始资料如有差错不能就地更正,整理结果有时不能及时满足各地区、各部门的需要,统计汇总按照具体操作划分为:手工汇总和计算机汇
15、总这里只介绍手工汇总的常用方法手工汇总使用算盘或小型计算器进行的汇总。,1.划记法(又称“点线法”)通过画线等符号来计算各组单位数的一种手工汇总数据的方法。划记法优点:简单易行缺点是:只适合于汇总各组单位数与总体单位总量。,步骤(1)先将调查资料按大小顺序排列(2)根据同限分组法的规定来逐个判断每个数据应属于哪一组,便在该组名下划一下记号,最后依各组内记号的数目计算出各组次数。,2.过录法(登记法)将调查资料过录到事先设计好的过录表上,计算出各组的单位数及标志值的合计数,从而得到汇总表的一种手工汇总数据的方法。,优点:汇总内容适用广泛,既能汇总单位数,也能汇总标志值缺点:全部资料都要过录,工作
16、量大,也容易产生过录差错,3.折叠法折叠法是指在汇总大量格式相同的调查表时,将所有调查表或报表中需要汇总的项目和数值全部折叠,并一张一张地叠放在一起,然后直接汇总同一纵栏或同一横栏中的数字。,4.卡片法将调查资料先摘录到特制的卡片上,一张卡片为一个调查单位,然后利用卡片进行分组汇总。,优点:卡片无论进行多少次分组,各单位资料只需要过录一次,检查也比较容易,一般用于大规模的专门调查和分组复杂的资料整理工作。,5.分票法基层企业普遍使用的汇总方法,将采集来的原始记录,按照统计台账所设指标的要求进行分组和分类,然后将各组或各类原始记录加总计算,填写到统计台账,其实质就是过录法的简单运用。,四、统计整
17、理结果的显示(一)统计表统计是最常用、最规范的统计资料的表达方式。统计表包括一切编制和显示统计资料的表格,如调查表、整理表或汇总表、分析表。,1.统计表的意义统计表是指统计资料经过准确的汇总后,得到了一系列说明总体特征的指标数值,将这些指标数值按一定的次序,用表格的形式显示出来。,统计表不仅是表现统计资料的重要形式,而且是汇总和累计统计资料的重要手段,还是统计分析的有力工具。,2.统计表的结构(1)从形式上看,统计表由总标题、横行标题、纵栏标题、数字资料4部分构成,(2)从内容上看,统计表包括主次和宾词两部分。主词是统计表所要说明的对象,通常列在统计表的左边宾词是说明总体特征的各种统计指标,包
18、括指标名称和指标数值,通常列在统计表的右边。,.,.,2003年我国各产业国内生产总值及构成,总标题,指标数值,纵栏标题,横行标题,见备注页,主词,宾词,见后面统计表的种类(简单分组表),.,.,统计表的结构,外形结构,总标题,横行标题,纵栏标题,指标数值,内容结构,主词,宾词,见后面表3-9,统计表是一种由纵横交叉的直线所组成的、左右两边不封口的表格,一般应当包括()A表名B行标题C列标题D表内的指标数值,根据统计表在统计调查和统计资料整理分析中的作用()A简单分组表B调查表C整理表D分析表,统计表的结构从内容上看,由()构成A总标题B横行标题、总行标题C主词D宾词,统计表是从内容上看包括主
19、词和宾词两部分,前者是说明总体特征的统计指标,后者是统计表所要说明的总体(),3.统计表的分类(1)按照统计表的作用不同,统计表可以分为调查表、汇总表或整理表、分析表。调查表是在统计调查中登记、搜集原始资料的一种表格汇总表或整理表是用统计汇总或整理的一种表格分析表是用于对统计资料进行分析的一种表格,按照统计表的主词是否分组和分组程度,即统计表可以分为简单表,分组表和复合表简单表是指统计总体未做任何分组的统计表,即统计表的主词仅罗列总体各单位的名称按时间顺序排列起来的统计表,第三章 统计整理,中国体育代表团在悉尼奥运会上获金牌的项目,获金牌项目金牌数 占总数比例跳水枚 0.1786举重枚 0.1
20、786乒乓球枚 0.1429羽毛球枚 0.1429体操枚 0.1071射击枚 0.1071柔道枚 0.0714田径枚 0.0357跆拳道枚 0.0357,品质数列(简单表),分组表,是指统计表的主词按某一个标志进行分组的统计表。分组的主词可以按品质标志分组,也可以按数量标志分组,分组表,复合分组表,是指统计表的主词按两个或者两个以上的标志进行分组的统计表。复合分组就是把几个分组标志结合在一起,可以揭示现象受多种因素影响的特征和规律性。,2012年某地人口城乡及性别分布表(复合分组表),对统计总体按一个标志进行分组后形成的统计表叫()A简单表B分组表C复合分组表D汇总表,统计表的形式应该是()A
21、上下不封顶,左右不开口B上下要封顶,左右要开口C上下要封顶,左右不开口D上下不封顶,左右要开口,(二)统计图统计图是利用几何图形或具体形象来表明现象数量关系的图形。将统计资料绘制成统计图,可使复杂的数字的通俗化、形象化、便于理解、记忆和比较。因此,统计图具有简明具体、生动形象、通俗易懂、给人明确、深刻印象的特点,下列关于统计表的说法中正确的是()A统计表是最常用,最规范的统计资料表达形式B统计表由总标题、横行标题、纵栏标题和数字资料四个组成部分C分组表的主词只能按数量标志分组D统计表的左右两端习惯上不画线,采用不封闭的开口表示,第五节 统计表,第三章 统计整理,(二)统计表的编制规则,(1)统
22、计表的各种标题要力求简明、确切和概括地反映出资料的主要内容,总标题还应标明资料所属的时间和地点。,(2)表的内容要简明扼要,分组层次不宜过多。表中主词各行和宾词各栏,一般应按先局部后整体的原则排列,即先列出各个项目后列出总计;当不需要列出全部项目时,可先列出总计,尔后列出一些必要的项目。,(3)如果统计表的栏数较多,通常要加编号。主词栏和计量单位等栏常用甲、乙等文字标明,其它各栏常用(1)、(2)、(3)等数字编号。,第五节 统计表,(4)表中数字要填写整齐,位数对准。没有数字的格内用“”表示;缺某项数字或因小可略而不计时,用“”标明。统计表数字部分不就留下空白。,(5)当表内指标数值的计量单
23、位相同时,应将计量单位标写在统计表的右上角;若计量单位不统一,但横行的计量单位相同,可单设计量单位栏,纵栏的计量单位相同可与纵栏标题写在一起。(6)统计表的表式一般是开口式的,即表的左右两端不画纵线,上下基线应用粗线。(7)对于某些需要特殊注明的统计资料,应在统计表的下方加注说明。,2.统计图的基本要素(1)图形(用图形来代表统计数值的大小)(2)坐标(3)图注(4)图目(5)标题,3.常用的几种统计图(1)条形图以宽度相等、高低不同的条形来表示统计资料的图形(2)曲线图利用升降起伏的曲线来表示统计资料的图形(3)平面图以几何图形的面积大小或各组成面积大小来表示统计资料的图形(4)统计地图利用点、线、面或事物的形象,在地区上显示统计资料的图形,(三)文字叙述文字叙述是以文章、字句的形式叙述整理结果。这种方法主要用于口头汇报或发言,目的是避免因现场组织语言出问题,在一般统计分析报告中,也多采用这种方法。,