《统计学期末总复习.ppt》由会员分享,可在线阅读,更多相关《统计学期末总复习.ppt(52页珍藏版)》请在三一办公上搜索。
1、统计学,第一章,1.统计的含义、特点2.统计总体和总体单位3.标志与统计指标,第二章,调查对象和调查单位、报告单位统计调查的分类按收集资料的组织形式按调查对象包括的范围,统计调查的组织方式统计报表普查重点调查典型调查抽样调查,第三章,1.统计分组,2.统计分组的作用 划分现象的不同类型 说明现象的内部结构 揭示现象之间的依存关系,第三章,3、分组标志的选择4、统计分组的方法 品质标志分组 数量标志分组,3.某行业管理局所属32家企业2007年的产品销售收入数据(单位:万元)如下:152 124 129 116 100 103 92 95 105 119 114 115 87 103 118 1
2、42 117 108 105 110 107 137 120 136 98 88 123 115 119 138 112 146 根据上面的数据进行适当分组,编制频数分布表。,4.按组距方式分组:第一组5565;第二组6575;第三组7585;第四组85以上,则数据()A.65在第一组 B.75在第二组 C.75在第三组 D.85在第三组 5.频数分布表中各组频率的总和应该()A小于1 B.等于1 C.大于1 D.不等于1,第四章,总量指标和相对指标总量指标的概念和分类六种常用的相对指标结构相对指标比例相对指标比较相对指标强度相对指标动态相对指标计划完成程度相对指标,平均指标和变异指标,加权算
3、术平均数调和平均数众数中位数方差离散系数异众比例,均值加权算术平均数,设分组后的各组的标志值为:x1,x2,xk 相应的频数为:f1,f2,fk则,加权算术平均数的计算公式为:,均值调和平均数,设分组后的各组的标志值为:x1,x2,xk 各组相应的标志总量为:m1,m2,mk则,调和算术平均数的计算公式为:,众数、中位数,众数:出现次数最多的变量值;中位数:数据排序后处于中间位置上的值;,Me,方差,反映了各变量值与均值的平均差异;计算公式:,未分组数据:,组距分组数据:,(1)计算乙车间200名工人的平均产量和产量的标准差;(2)分别计算甲、乙车间工人产量的变异系数(离散系数),说明哪个车间
4、工人的平均产量具有较大的代表性。,6.某厂甲车间160名工人生产某产品的平均产量为100件,产量的标准差为21.89件。又知乙车间200名工人产量的分组资料如下:,第五章,时间数列的水平分析和速度分析发展水平 平均发展水平 增长量(逐期增长量,累计增长量,平均增长量)发展速度(定基发展速度,环比发展速度,平均发展速度)增长速度(定基增长速度,环比增长速度,平均增长速度)增长1%的绝对值,绝对数,相对数,平均数,-1,第五章 时间序列,计算:()第二季度平均月产量;()第二季度平均人数;(3)二季度每人平均产量,已知下列资料,第六章,统计指数的概念和分类指数化因素和同度量因素,加权综合指数、平均
5、数指数 拉氏指数(数量)帕氏指数(质量)指数体系与因素分析常用价格指数,第七章,抽样的组织方式简单随机抽样类型抽样等距抽样整群抽样多阶段抽样抽样误差抽样平均误差抽样极限误差,区分,第七章,单一总体均值的区间估计(方差已知或大样本)单一总体均值的区间估计(方差未知且小样本)单一总体比例的区间估计总体均值区间估计时样本容量的确定总体比例区间估计时样本容量的确定,单一总体均值的区间估计(方差已知或大样本),1.假设:已知总体标准差;总体正态分布;如果不是正态,可被正态分布逼近(样本容量 n 30)2.置信区间:,单一总体均值的区间估计(方差未知且小样本),1.假设:总体标准差未知;总体服从正态分布;
6、样本容量 n 30;2.置信区间:,单一总体比例的区间估计,1.假设:总体服从二项分布;可以用正态分布近似估计,即n p 5 且 n(1-p)5;,3.置信区间:,2.引理:,样本容量的确定,估计总体均值时:估计总体比例时:,8.某高中随机抽查了10个高二的男学生,平均身高170厘米,标准差12厘米。(1)用矩估计法估计该高中高二男生的平均身高;(2)若该高中高二男生的身高服从正态分布,问该高中高二男生平均身高的所在范围(=0.05)。,9.某工业区有300家企业,用简单随机重复抽样的方法抽出50家作为样本,调查其年利润额,资料如下:年利润额(万元):1200 1300 1500 1600 企
7、业数(家):5 15 20 10 要求:(1)用矩估计法估计该工业区企业的平均年利润额及其方差;(2)以95%的可靠性估计该工业区企业的平均年利润额和利润总额的区间。,10.某地区为了解该地区贫困家庭的生活情况,随机抽取200户家庭,其中20户在国家规定的生活贫困线以下,请问在95%的置信水平下,该地区有百分之多少的家庭在国家规定的生活贫困线以下?,11.一项研究计划估计在一片森林中平均每年一棵树长高了多少,研究人员准备用95的置信水平,并希望估计出的均值的误差不超过0.5cm。以前的研究显示样本的标准差为2cm。请问,这项研究的样本容量需要多大才能满足要求?,12.在简单重复随机抽样时,当允
8、许误差缩小一半,则n 要()A.缩小4倍 B.增大4倍 C.增大2倍 D.缩小2倍 13.在其它条件不变的情况下()A.总体方差越大,所需的样本容量越少 B.总体方差越大,所需的样本容量越多 C.允许的误差越小,所需的样本容量越少 D.允许的误差越大,所需的样本容量越多,14.在抽样设计中,最好的方案是()A.抽样误差最小的方案 B.抽样单位最小的方案 C.调查费用最少的方案 D.在一定误差要求下费用最小的方案,单一总体均值的假设检验(方差已知或大样本)单一总体均值的假设检验(方差未知且小样本)单一总体比例的假设检验两个总体均值差的假设检验两个总体比例之差的假设检验,总体均值的假设检验:(1)
9、方差已知或大样本:(2)方差未知且小样本:,总体比例的假设检验:(1)单一总体:,15.已知在正常生产的情况下某种汽车零件的重量(克)服从正态分布,在某日生产的零件中抽取10 件,测得重量如下:55.1 53.8 54.2 52.1 54.2 55.0 55.8 55.1 55.3 54 如果标准差不变,该日生产的零件的平均重量是否有显著差异(取=0.05)?,16.正常人的脉搏平均为72次/分,现测得10例慢性四乙基铅中毒患者的脉搏(次/分)如下:54 67 68 78 70 66 67 70 65 69 问四乙基铅中毒患者和正常人的脉搏有无显著差异?(假定中毒患者脉搏服从正态分布,=0.0
10、5),17.某企业生产的某种型号电池,长期统计资料表明其平均寿命为1000(小时)。现从该厂生产的一批产品中,随机抽取20只,测得其平均寿命为960(小时)的样本标准差为90(小时)。根据这个数字能否断定新生产的这批电池为合格品?(=0.05),18.一家制药公司声称,某地区大概有22%的儿童缺钙,一个研究组织对400名该地区的儿童进行了研究,发现其中有80名儿童缺钙。根据该研究组织的数据,能否认为这家制药公司的论断是正确的?(=0.05),方差分析的表现形式方差分析的本质方差分析的基本思想、原理、过程,看软件结果:,第八章,相关分析 一元线性回归分析,相关分析,Pearson相关系数,计算公
11、式:,相关系数的性质,1.-1 r 1;2.如果r0,则两个变量正相关;如果r=0,则两个变量无线性关系;3.|r|0.95 存在显著性相关;|r|0.8 高度相关;0.5|r|0.8 中度相关;0.3|r|0.5 低度相关;|r|0.3 关系极弱,认为不相关;,相关系数的检验,(1)提出假设:(2)计算检验的统计量:(3)确定显著性水平,并作出决策:若,拒绝原假设;若,不拒绝原假设。,一元线性回归分析,寻找一条直线,使得所有点到该直线的垂直距离的平方和最小。,19.产品产量与单位成本的相关系数是0.85,销量与利润的相关系数是0.75,产量与利润的相关系数是0.80,因此()A.产量与利润的
12、相关程度最高 B.销量与利润的相关程度最高 C.产量与单位成本的相关程度最高 D.看不出哪对变量的相关程度高,20.在一元线性回归方程中,若回归系数b=0,则表示()A.y对x的影响是显著的 B.y对x的影响是不显著的 C.x对y的影响是显著的 D.x对y的影响是不显著的,21.在其他条件不变的情况下,某种商品的需求量(y)与该商品的价格(x)有关。现对给定时期内的价格与需求量进行观察,得到如下所示的一组数据。价格x(元)10 6 8 9 12 需求量y(件)60 72 70 58 55(1)计算价格与需求量之间的Pearson相关系数,并说明相关方向和程度;(2)拟合需求量与价格的一元线性回归方程。,求解过程,相关系数的检验,(1)提出假设:(2)计算检验的统计量:(3)取,查表得:由,拒绝原假设,即认为总体上价格与需求量之间相关关系显著。,求解过程,随堂测验,某企业职工人数和管理人员数资料如下:求该企业第一季度平均管理人员在全部职工人数中占的比重。,Thank You!,