统计学教程4ppt课件.ppt

上传人:sccc 文档编号:5432868 上传时间:2023-07-06 格式:PPT 页数:60 大小:3.59MB
返回 下载 相关 举报
统计学教程4ppt课件.ppt_第1页
第1页 / 共60页
统计学教程4ppt课件.ppt_第2页
第2页 / 共60页
统计学教程4ppt课件.ppt_第3页
第3页 / 共60页
统计学教程4ppt课件.ppt_第4页
第4页 / 共60页
统计学教程4ppt课件.ppt_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《统计学教程4ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学教程4ppt课件.ppt(60页珍藏版)》请在三一办公上搜索。

1、统计学,叶 思 荣,东 南 大 学经济管理学院,第 四 章,第四章 统计分析(一),41 抽样调查,一抽样调查工作中的概念,二抽样误差,三总体参数估计,42 相关与回归分析,五 抽样设计,一 一般概念,二 一元线性回归方程,三 线性回归方程 分析,四 一元线性回归预测,五 多元线性回归与相关分析,四总体参数假设检验,六 相关分析,第四章 抽样调查与推断,41 抽样调查的基本概念,42 抽样误差,43 总体参数估计,一总体参数假设检验,二双侧检验与单侧检验,44 总体参数检验,三总体平均数的检验,四总体方差的检验,五假设检验的两类错误分析,45,一抽样组织设计,二抽样单位数的确定,抽样调查与推断

2、 按照随机的原则从统计总体中抽取一部分单位组成样本,对样本进行调查,运用数理统计的原理,以样本指标数值为依据,对总体作出具有一定可靠性推断的过程。,抽样调查的特点:,部分推断总体,完全随机原则,抽样误差,1.,2.,3.,抽样,调查,推断,认识,抽样调查工作中的概念:,总体,全及总体,抽样总体,N,n,平均数,全及平均数,抽样平均数,成数,全及成数,P,抽样成数,p,p,P,抽样调查的目的,总体方差及标准差:,全及总体,平均数,成 数,方 差,标准差,样 本,平均数,成 数,方 差,标准差,样本方差及标准差:,分 组,具有某种标志,不具有某种标志,取值,1,0,数量,n1,n0,=p,统计误差

3、,登记误差,代表性误差,(抽样调查),破坏了随机原则,(系统偏差),遵守了随机原则,(随机误差),抽样误差 在抽样调查中排除了登记误差和系统偏差以后的随机误差。,1、一般概念,1、2、3、4、5,1、2、3,2,1,1、2、4,2.33,0.67,1、2、5,2.67,0.33,1、3、5,3,0,2、3、4,3,0,3、4、5,4,-1,N,n,m,0 1 2 3 4 5 6 7 8 m,样本,数理统计可以证明,在所有m个样本中,其样本指标数值与全及指标数值存在如下关系:,2、抽样平均误差,抽样平均误差,抽样平均数,抽样成数,抽样方法,重复抽样,不重复抽 样,1,2,3,n,1,2,3,n,

4、某企业生产2#电池,从1000只电池中随机地抽取100只进行检查,结果如下:,例,数量,X,xf,-1.2-0.7-0.20.30.81.3,2.881.962.043.511.921.69,有关指标计算,重复抽样,抽样平均数的抽样平均误差:,抽样成数的抽样平均误差:,不重复抽 样,国家规定,2#电池的合格标准:,则抽样合格率为:,。,重复抽样,不重复抽 样,或 2.37%,数理统计可以证明,不管总体的分布是一个什么样的分布,抽样指标数值的分布是一个正态分布。,.,.,3、抽样极限误差,数理统计可以证明,在所有m个样本中,其样本指标数值与全及指标数值存在如下关系:,有95.45%的样本,有99

5、.73%的样本,有68.27%的样本,样本指标数值与全及指标数值之差落在某一个给定范围内的可能性用概率来表示:,t,1,68.27%,2,95.45%,3,99.73%,1.95,95.00%,1.5,86.64%,2.5,98.76%,1.44,85.00%,精度,可靠程度,t,精度,t,可靠程度,精度,t,可靠程度,精度,可靠程度,n,要求在95%的可靠程度下确定抽样的精度,若要求抽样极限误差的精度在0.0561安培以内,确定其抽样的保证程度,p,P,优良性标准:,1.,2.,3.,一致性,n,=1,无偏性,有效性,1、点估计,2、区间估计,在95%的可靠程度下,抽样极限误差为:,则有:,

6、=5.37675.5233(A),=89.35%98.65%,在99.73%的可靠程度下,抽样极限误差为:,则有:,=5.33785.5622(A),=86.89%100.00%,要求这1000只电池的平均电流强度在5.35655.5435安培之间的可靠程度是多少?,要求这1000只电池的合格率在90%97%之间的可靠程度是多少?,=1.69,=0.4545,=1.27,=0.3980,=0.8525,总体参数假设检验 利用样本的实际资料计算统计量的取值,并以此来检验事先对总体某些数量特征所作的假设是否可信,作为决策取舍依据的一种统计分析方法。,随机性差异,本质性差异,A,A*,由于样本的原因

7、所引起的差异,由于总体产生了重大变化产生的差异,1、,建立假设,原假设:,H0,备择假设:,H1,2、,决定检验的显著性水平,3、,确定检验统计量,4、,进行比较,做出接受或拒绝原假设的决策,1、基本概念,双侧检验:,1-,若:,或,则,拒绝H0,接受H1。,左单侧检验:,右单侧检验:,2、双侧检验与单侧检验,例,某汽车轮胎厂,根据历史统计资料结果,平均里程为25000公里,标准差为1900公里。现从新批量的轮胎中随机抽取400个轮胎作试验,求得样本平均里程=25300公里,试按5%的显著性水平判断新批量轮胎的平均耐用里程与通常的耐用里程有没有显著的差异,或者它们属于同一总体的假设是否成立,取

8、=0.05,拒绝区间的概率各为/2=0.025,即:,设立原假设。,备择假设,下临界值:,上临界值:,根据样本信息,计算统计量Z的实际值:,检验判断:,拒绝H0,接受H1。,3、大样本总体方差已知,例,往年各届的统计学平均成绩为79分,今年从试卷中随机地抽取30份检查,结果如下:,57.562.567.572.577.582.587.592.5,-,57.5125.0202.5507.5620.0412.5262.5 92.5,2280.0,有关指标的计算:,=76(分),=7.97(分),1-,4、小样本 总体方差未知,建立假设,确定检验统计量,=-2.062,决策:,在=0.01的显著性水

9、平下,=2.462,t=-2.062,所以,接受原假设H0,即本年统计学成绩在80分左右。,1、,建立假设,H0:,H1:,2、,决定检验的显著性水平(一般取0.01或0.05),3、,确定检验统计量,4、,进行比较,做出接受或拒绝原假设的决策,H0:,H1:,H0:,H1:,(双侧检验),(右侧检验),(左侧检验),其中:,为2的检验量,当原假设为真时,检验统计量服从自由度n-1的2分布,若,接受H0,拒绝H1。,5、总体方差检验,例,某种产品的重量服从标准差=20 克的正态分布,现从生产线上随机的抽取16包产品实测,样本标准差 S=24克,请以0.02的显著性水平,检查产品的重量是否有显著

10、的差异。,设立假设,H0:,H1:,给定显著性水平=0.02,自由度=16-1=15,查2分布表得:,=5.229,=30.578,根据样本信息,计算2统计量的实际值:,=21.6,检验判断:,=5.229,2=21.6,=30.578,接受H0,拒绝H1。,组织形式,纯随机抽样,等距抽样,类型抽样,整群抽样,阶段抽样,限制:,编号困难,调查困难,无法利用已知的信息,特点:,调查精度高,所需样本单位少,信息全面,特点:,组织工作简单,调查精度低,设购买某种零部件,要求合格率90%,现抽查200件,第一阶段,6,78,8,合格率,92.5%,不确定,90%,不合格品,120,80,第二阶段,购买

11、,决策,拒购,影响因素,调查精度,把握程度,总体的差异程度,抽样调查的方法,抽样调查的组织形式,注意,无,类似的,历史的,试验性抽样,多个,重复抽样,不重复抽样,x,max,P,0.5,max,经济现象之间的关系,确定型关系,确定型关系,相关关系,回归关系,Y=f(X),S=PX,(互为因果关系),(因果关系),S=f(I、C),C=g(I、S),C=f(I),相关与回归分析的程序:,1、定性分析两个经济变量的相互关系。,2、从一组观察数据出发,确定这些变量之间的回归关系,即确定回归方程的数学模型。,3、判断影响因变量的自变量的显著性。,4、运用回归方程对客观过程进行分析、预测和模拟控制。,当

12、两个变量有统计相关关系时,对应自变量X的每一个值x,因变量Y有许多可能的取值。,(x0,y01),(x0,y02),(x0,y03),(x1,y11),(x1,y12),(x1,y13),为找出X和Y之间的定量关系,一个自然的想法是取X=x0时的所有Y值的平均值(记作)作为对应X=x0时Y的代表值,即取:,其中 表示在X=x0条件下,Y的条件期望。同理,对应于X=x1,有=E(Y|X=x1),。当x变化时,是x的函数:,人们的消费行为主要取绝与他的收入水平。根据经济学中消费理论,对人们的收入与消费有三种假设:,1、,绝对收入假设,2、,相对收入假设,3、,恒常收入假设,条件,=0,=min,=

13、0,=0,经整理可得:,最小二乘法,若记:,则b的计算公式为:,参数b称为样本回归系数,它的符号取决于lxy。显然,当b0时,y随x增大而增大,表明y与x的变化方向相同:当b0时,则y随x增大而变小,表明y与x的变化方向相反。,一般求回归方程是通过列表进行,根据上表统计数据,计算列表如下:,n=31,1、估计标准误差,人们通常用估计标准误差来说明 与 的差异程度,在大样本时,其公式为:,若 较大,则说明 与 的离差较大,回归直线 的代表性低,若 较小,则说明 与 的离差较小,回归直线 的代表性高,若=0,则说明 与 的没有离差,完全落在回归直线上,人们常用相关系数来反映两个变量间线性相关的密切

14、程度,公式为:,2、相关系数,若=,则有|=1,,若,则有|1,,表明两个变量完全相关,表明两个变量完全不相关,表明两个变量不完全相关,若=0,则有|=1,,变量之间相关程度的判断:,弱相关,低度相关,中度相关,高度相关,Syx=0.247,=1.422,n=31,显然,相关系数和回归系数的符号是一致的。,有,,表明两个变量呈正相关关系,有,,表明两个变量呈负相关关系,要说明两个变量是否具有线性相关,一般还需要作假设检验,设:,H0:,总体相关系数为0,H1:,总体相关系数不为0,检验统计量为:,可以证明,当H0成立时统计量是服从具有自由度为(1,n-2)的F分布,因而给出显著性水平(通常=0

15、.01 或0.05),当FF(1,n-2)时,则拒绝H0,说明两变量之间线性关系是显著的。,当FF(1,n-2)时,则接受H0,说明两变量之间线性关系不显著。,查表得:,FF,所以,拒绝H0,接受H1。说明两个变量之间的线性关系是显著的。,3、假设检验,4、方差分析,总偏差平方和:,误差平方和:,回归平方和:,可以证明 SST=SSR+SSE 即有:,4、方差分析,SSR与SST的比值有以下结果:,方差自由度,方差,自由度,n-1,n-2,1,所以:,显著性检验统计量,可决系数,以68.27%的概率保证 的预测区间为,以95.45%的概率保证 的预测区间为,以99.73%的概率保证 的预测区间

16、为,一般若 为正态分布,当n较大,并且 不远离 时,可以证明:,X,Y,x0,当n较小,通常n30时,则若给定置信概率(即可靠程度)1-,可以证明y0的预测区间为:,X,x0,Y,当我国城镇居民人均可支配收入为6千元时,则:,=4.7212(千元),上限为:,5.2152千元,按95.45%的可靠程度,下限为:,4.2272千元,当我国城镇居民人均可支配收入为15千元时,则:,按95%的可靠程度,查t分布表t0.025=2.05,=11.1625(千元),则城镇居民的消费性支出的预测区间为:,10.631411.6936(千元),多元线性回归模型的总体回归函数的一般形式如下:,式中:,Y变量Y

17、的第t次观察值,Xjt变量X的第t次观察值,0,1,2,k总体回归系数,j偏回归系数。,Ut随机误差项,假设:次观察值,同时,为总体回归系数的估计,则多元线性回归模型的样本回归函数如下:,式中:etY与其估计值 之间的离差,1、一般模型,多元线性回归模型最小二乘法:,对0,1,2,k求Q的偏导数,并使之等于零,则有以下的正规方程组:,用矩阵表示:,总体回归函数:,样本回归函数:,某种商品的销量与该商品的价格和居民收入有关,历年统计资料如下:,2、例,3、多元线性回归方程的计算机求解,矩阵相乘:,*选择存放计算结果的区域,*输入矩阵相乘函数 mmult(),*按组合键 ctrl-shift-enter,矩阵求逆:,*选择存放计算结果的区域,*输入矩阵相乘函数 minverse(),*按组合键 ctrl-shift-enter,本章已经结束,谢谢大家,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号