《本科经济计量学附录B(第4版).ppt》由会员分享,可在线阅读,更多相关《本科经济计量学附录B(第4版).ppt(29页珍藏版)》请在三一办公上搜索。
1、附录B概率分布的特征,B.1 期望:集中趋势的度量,B.2 方差:离散程度的度量,B.3 协方差,B.4 相关系数,B.5 条件期望,B.6 偏度和峰度,B.7 从总体到样本,B.8 小结,B.1 期望值:集中趋势的度量,期望(expected value):集中趋势的度量,离散型随机变量的期望值用符号E(X)表示。定义为:,例3-1 掷一个骰子若干次。随机变量X表示正面朝上的数字,求X的期望值。(下表),表3-1 随机变量(正面朝上数字)的期望值,正面朝上的数字 概率 数字*概率 X f(x)xf(x),1 1/6 1/6 2 1/6 2/6 3 1/6 3/6 4 1/6 4/6 5 1/
2、6 5/6 6 1/6 6/6 E(X)=21/6=3.5,概率分布,1/6,图3-1 离散型随机变量(例3-1)的期望值,E(X),f(x),X,?在上例中,打印机销售量的期望值是多少?我们仍可从 表2-4中得到。,例3-2 在例2-17中,电脑销售量的期望值是多少?我们可从 中得到。把变量X的各可能值与其相对应的概率之积累加即得电脑销售量的期望值。0(0.08)+1(0.12)+2(0.24)+3(0.24)+4(0.32)=2.6 因此,电脑每天的平均销售量为2.6台。,表2-4,0(0.11)+1(0.16)+2(0.23)+3(0.27)+4(0.23)=2.35即每天打印机的平均销
3、售量为2.35台。,0 0.08 0 0.11 1 0.12 1 0.16 2 0.24 2 0.23 3 0.24 3 0.27 4 0.32 4 0.23总计 1.00 总计 1.00,X f(X)Y f(Y),表2-4 个人电脑售出数量X和打印机售出数量Y的边缘分布,1.若b为常数,则有:E(b)=b,2.给定随机变量X和Y,有 E(X+Y)=E(X)+E(Y),3.,4.,5.若a为常数,则有:,6.若a、b为常数,那么:,B.1.1 期望的性质,除非两个随机变量相互独立。,B.2 方差(variance):离散程度的度量,方差定义为:表明了随机变量X的各取值与其期望值的偏离程度。如图
4、3-2。,若X为离散型随机变量,通常用下列公式计算方差,标准差(standard deviation,s.d):方差的正的方根。,3-2,例3-4:接例3-1,求随机变量X(表示正面朝上的数字)的方差。,正面朝上的数字 概率 X f(x)(x-(EX)2*f(x),1 1/6(1-3.5)2(1/6)2 1/6(2-3.5)2(1/6)3 1/6(3-3.5)2(1/6)4 1/6(4-3.5)2(1/6)5 1/6(5-3.5)2(1/6)6 1/6(6-3.5)2(1/6)总计2.9167 VAR(X)=2.9167,1.常数的方差为零。2.若X与Y 是两个相互独立的随机变量,那么:var
5、(X+Y)=var(X)+var(Y)var(X-Y)=var(X)+var(Y)3.若b是常数,则 var(X+b)=var(X),4.如果a是常数,则,5.如果a,b是常数,则,6.如果X与Y相互独立,a,b是常数,则,B.2.1 方差的性质:,B.2.2 切比雪夫不等式,如果随机变量X的均值和方差分别为,那么对任意给的正数c,有:,例3-5:一个油炸圈饼店每天上午8点到9点平均卖出油炸圈饼100个,方差为25。那么,某天在8到9点间卖出90110个油炸圈饼的概率至少是多少?,B.2.3 变异系数,变异系数(coefficient of variation,V)度量相对变动,定义为:,例3
6、-6:某讲师讲授两个班的初级经济计量学课程,每班各15名学生。在期中考试中,A班平均83分,标准差为10,B班平均88分,标准差为16。哪个班的成绩更好?,由于A班的相对变动小,所以说A班成绩的总体情况好于B班。,B.3 协方差(covariance)令随机变量X和Y的期望分别为 其协方差为:,假定X和Y是离散型随机变量,协方差用下式计算,对于连续型随机变量可用积分符号代替求和符号。,1.若随机变量X,Y独立,协方差为零。2.其中,a,b,c,d为常数。,3.cov(X,X)=var(X),协方差的性质,例3-7:再次回到个人电脑/打印机销售一例,现利用协方差的计算公式计算电脑销售量X和打印机
7、销售量Y的协方差。,已知:,相关系数定义如下,B.4.1 相关系数的性质,B.4 相关系数(correlation),1.相关系数与协方差同号2.相关系数度量了两变量间的线性关系3.相关系数是一个纯数值,且满足:,4.如果两变量独立,则协方差、相关系数都为0,但如果两变量的相关系数为0,并不意味着这两个变量相互独立。5.相关并不一定意味着存在因果关系。,3-3,例3-8 继续个人电脑/打印机一例,现计算两变量的相关系数。已知两个变量的协方差为0.95,根据表2-4中的数据可以得到,即两变量存在一定的正相关关系,这也是很容易理解的。,3.4.2 相关变量的方差,特别地:,B.5 条件期望值(co
8、nditional expectation),例3-9:在个人电脑/打印机一例中,计算E(Y|X=2),即在每天售出2台个人电脑的条件下销售打印机的条件期望。,B.6 偏度(skewness)与峰度(kurtosis)偏度与峰度是用于描述概率密度函数形状的数字特征。偏度S是对称性的度量,峰度K是一个概率密度函数高低或胖瘦的度量。,偏度大于0,称其为正偏或右偏,偏度小于0为负偏或左偏。可以计算得到正态分布的S0,K3。,B.7 从总体到样本,如果我们想考察我国20岁女性的身高情况,我们知道,若设其为X,这是一个随机变量。描述该随机变量,可以用概率密度函数或用期望、方差等数字特征。但这些都是未知的
9、。现在,我们可以把我国所有20岁女性身高值构成的集合看成是一个总体,我们来考察这一总体的情况。考察方法之一是从总体中抽取一个样本,通过样本的特征来反映总体的情况。所以我们必须知道样本矩(sample moments)的计算方法。,1.样本均值,2.样本方差,3.样本协方差,4.样本相关系数,从总体中抽取的样本设为:,5.样本偏度与样本峰度对照下公式总体偏度S总体峰度K 样本三阶矩与样本四阶矩为:,例3-11:设有两变量X(股票价格)和Y(消费者价格 CPI)构成的二元总体。假设从该总体中得到一个随机样本(见Excel文件),在本例中,股票价格X用道琼斯指数均值来度量,消费者价格Y用消费者价格指数来度量。求该随机样本的各样本矩。,利用Excel文件具体计算。,作业:第3章书后习题:3.5、3.7、3.13,