《计量经济学的统计学基础知识.ppt》由会员分享,可在线阅读,更多相关《计量经济学的统计学基础知识.ppt(50页珍藏版)》请在三一办公上搜索。
1、第二章 统计学基础知识,第一节 常用的统计量平均数、方差第二节 常用的概率分布,复习:,什么是计量经济学?计量经济学与其他学科有什么关系?计量经济学研究现实问题的程序是什么?,第一节 常用的统计量平均数、方差,一、算术平均 算术平均(arithmetic mean)就是我们日常生活中使用的普通的平均数,其定义如下式:,二、加权算术平均,加权平均(weighted arithmetic mean)是将各数据先乘以反映其重要性的权数(w),再求平均的方法。其定义如下式:,三、变化率,变化率的定义如下式:,四、几何平均 几何平均(geometric mean)是n个数据连乘积的n次方根,其定义如下式
2、:,五、移动平均,所谓移动平均(movingaverage),就是对时间序列数据的前后数据求平均,将不必要的变动(循环变动、季节变动和不规则变动)平滑(smoothing),也即剔除这些变动,从而发现长期变化方向的一种方法。,通常,移动平均大多用简单的奇数项来计算,下面是3项移动平均和5项移动平均的定义。3项移动平均:,5项移动平均:,EXCEL演示,三项移动平均五项移动平均,六、方差与标准差,为了了解数据的结构,有必要考察数据的集中趋势和分散的程度。对于集中的趋势,我们从前面学习过的算术平均中已经大体有所了解,而对于分散的程度,通过对方差(variance)与标准差(standard dev
3、iation),以及下一节将要介绍的变动系数的计算,能够得到很多信息。,方差的计算方法是,先将每个数据与算术平均数之差(即离差)的平方相加求和,再除于样本数减一。而标准差是方差的正的平方根。由于方差是通过平方计算的,它与原数据的次数有所不同,而标准差由于是方差的平方根,因而又与原数据的次数相同。因此,标准差与原数据的单位相同,而方差则不附加单位。,方差S2的定义分别如下式(样本):,标准差S的的定义分别如下式:,七、变动系数,变动系数(coefficient of variation)又称变异系数,它用标准差S除于算术平均数的商来表示。变动系数CV的定义如下式:,八、标准化变量,标准差变量(s
4、tandardized variable),又称基准化变量,它是用来测量某个数据的数值与算术平均数的偏离程度,是标准差s的多少倍。借此可以看出该数据在全体数据所处的位置。标准化变量z的定义如下式:,九、相关系数,所谓相关系数(correlation coefficient)是用来测量诸如收入与消费、气温和啤酒的消费量、汇率与牛肉的进口价格等两个变量X、Y之间的相互关系的大小和方向(正或负)的系数。通过计算相关系数,可以知道X与Y之间具有多大程度的线性(linear)关系。相关系数R的定义如下式:,相关系数的R的取值范围为,R的取值具有以下的不同含义:,(1)R=1完全正相关(perfect p
5、ositive correlation)(2)R0 正相关(positive correlation)(3)R=0 不相关(no correlation)(4)R0 负相关(negative correlation)(5)R=-1完全负相关(perfect negative correlation)为什么会有上述结果?请结合公式思考。,第二节 常用的概率分布,经济计量模型研究具有随机性特征的经济变量关系。本节将对数理统计中常用的随机变量分布及一些概念作一简单回顾。一、概率分布二、总体与样本三、正态分布四、抽样分布,一、概率分布,随机变量在各个可能值上出现的概率的大小的情况,叫概率分布。概率分布
6、可用概率函数描述。离散性随机变量X的可能取值为xi,P为概率,则概率函数为 P(X=xi)i=1,2,3,n概率函数满足P(X=xi)0;,一、概率分布,连续性的随机变量概率函数,二、总体与样本,数理统计中把所研究对象的全部单位所组成的集合,叫做总体。从总体中抽出的部分单位所组成的集合,叫做样本。,三、正态分布,当连续的随机变量的概率密度函数形式为时,称X的分布为正态分布,记为X,密度函数中 和 是X的数学期望和方差。,三、正态分布(总体分布),当 和 时,称X服从标准正态分布,记为X。对于非标准正态分布的X,总可以作如下变换,使Z服从标准正态分布。,四、抽样分布,1、分布 2、t 分布 3、
7、F 分布注:正态母体子样分布性质:,1、分布,统计量定义为,Xi符从正态分布。xi服从标准正态分布,服从自由度为n的卡方分布,卡方分布其实就是残差平方和。,分布的密度函数为:,其数学期望,其方差为,,,N=4,N=15,如果随机变量X服从标准正态分布N(0,1);随机变量 服从自由度为n、方差为2n的 分布。并且X和 相互独立,则统计量:,服从t分布(注:可以将分子理解为符合正态分布的参数,分母看作其标准差。,2、t分布,t分布的密度函数为,其数学期望E(t)=0,方差,t分布的特点是:左右对称;当n很大时,非常接近正态分布。,对于从标准正态分布中的总体中抽的容量为n的简单随机样本,其样本均值
8、 与样本标准差S构成如下统计量。,服从自由度为n-1的t分布,记为tt(n-1)。注意:这里的分母是子样标准差除以自由度,实际上是子样均值的标准差!只有这样才与分子保持一致性。分子被平均了,分母当然也要平均!,t分布在小样本(n30)统计推断中占有重要的地位。,T分布图形:正态分布相当于标准差为1的t分布。而t分布的标准差多小于1。因而出现这种尾部肥大的现象。,正态分布,T分布,如果随机变量Xi(i=1,2,3,n),Yi(i=1,2,3,n)是相互独立的,而且服从相同的正态分布。令,3、F分布,则统计量,服从第一自由度,、第二自由度,的F分布。记为FF(,),3、F分布,注:F分布在方差分析
9、中有着重要的作用。例如判断两个正态分布总体的方差是否有显著差异,需要利用F分布。其分子与分母其实是两个方差,在进行回归检验时正是利用F函数这个特点。,F分布图形,例1:正态分布检验,设甲、乙两台机床生产同类型产品,其产品重量分别服从方差为70克()与90克()的正态分布。从甲机床中随机地取出35件,其平均重量是137克,独立地从乙机床随机取出45件,其平均重量130克,问在显著性为0.01时,两台机床的产品就重量而言有无显著差异?,解:,理论:,例2:比较两种安眠药A、B的疗效,以10个患者为实验对象,数据如下:,问:在显著性水平为0.01时,两种药的疗效是否相同?(T分布),解:由于患者相同
10、,可以建立z变量,然后假设z的均值是0,对其进行t单侧检验,例3(卡方分布):设已知维尼纶纤度在正常生产条件下服从正态分布N(1.405,0.002304)。在生产某段时间,抽取了5根纤维,测得其纤度为1.32,1.55,1.36,1.4,1.44.问该段时间母体方差是否正常?(显著性水平是0.1),解:,9.49,13.5,例4(F):甲乙两台机床加工同一种轴。从这两台机床加工的轴中随机抽取若干根,没得直径(单位为毫米)为:,假定各台机床加工轴的直径分别服从正态分布,试比较甲乙两台机床加工的精度有无显著差异。显著性取0.05(拒绝原假设水平)。如果是单侧检验呢?,解:,F分布图形,作业:,例2:显著性改为0.02时,问两种药的疗效是否相同;例4:显著性取0.01时,两种机床的加工精度有无区别?重点理解什么是显著性?,显著性解释,数理统计中的显著性是划分原假设与备择假设界线,一般是原假设成立是1-;在软件中给出的显著性可以看作是原假设成立的概率。显著性越小,即原假设正确的错误的概率越小。,