《概率模型.ppt》由会员分享,可在线阅读,更多相关《概率模型.ppt(189页珍藏版)》请在三一办公上搜索。
1、2.随机事件及其概率,3.随机变量及其分布,第四讲 概率模型,4.随机变量的数字特征,5.统计方法的基本概念,6.参数估计法,1.概率论的诞生及应用,7 回归分析法,1654年,一个名叫梅累的骑士就“两个赌徒约定赌若干局,且谁先赢 c 局便算赢家,若在一赌徒胜 a 局(ac),另一赌徒胜b局(bc)时便终止赌博,问应如何分赌本”为题求教于Pascal(帕斯卡,法),帕斯卡与Fermat(费玛)通信讨论这一问题,并用组合的方法给出了正确的解答。,1657年Huygens(惠更斯,荷)发表的论赌博中的计算是最早的概率论著作,论著中第一批概率论概念(如数学期望)与定理(如概率加法、乘法定理)标志着概
2、率论的诞生。,起源 博弈,1 概率论的诞生及应用,18世纪初,Bernoulli(伯努利,法)、De.Moivre(棣莫费,法)、蒲丰、Laplace(拉普拉斯,法)、Gauss(高斯,德)和泊松等一批数学家对概率论作了的奠基性的贡献。,1812年,Laplace(拉普拉斯,法)概率的分析理论实现了实现了从组合技巧向分析方法的过渡,开辟了概率论发展的新时期。,19世纪(1866),Chebyhev(切比雪夫,俄)中心极限理论。是概率论理论的又一次飞跃,为后来数理统计的产生和应用奠定了基础。,20世纪(1933),kolmogorov(柯尔莫哥洛夫,俄)概率公理化定义得到了数学家们的普遍承认。由
3、于公理化,概率论成为一门严格的演绎科学,取得了与其他数学学科同等的地位,并通过集合论与其他数学分支密切的联系。,在公理化的基础上,现代概率论不仅在理论上取得了一系列突破,在应用上也取得了巨大的成就,其应用几乎遍及所有的科学领域,例如天气预报、地震预报、产品的抽样调查、经济研究等,在通讯工程中概率论可用以提高信号的抗干扰性、分辨率等等.,在一定条件下必然发生的现象称为确定性现象.,“太阳不会从西边升起”,(1)确定性现象(必然现象),“水从高处流向低处”,实例,自然界所观察到的现象:,确定性现象,随机现象,2.随机事件及其概率2.1 随机事件,在一定条件下可能出现也可能不出现的现象即在相同条件下
4、重复进行试验,每次结果未必相同,实例1 在相同条件下掷一枚均匀的硬币,观察正反两面出现的情况.,(2)随机现象(偶然现象),结果有可能出现正面也可能出现反面.,确定性现象的特征,条件完全决定结果,随机现象的特征,条件不能完全决定结果,(2)随机现象在一次观察中出现什么结果具有偶然性,但在大量试验或观察中,这种结果的出现具有一定的统计规律性,概率论就是研究随机现象规律性的一门数学学科.,随机现象是通过随机试验来研究的.,问题 什么是随机试验?,如何来研究随机现象?,说明,(1)随机现象揭示了条件和结果之间的非确定性联系,其数量关系无法用函数加以描述.,(1)可以在相同的条件下重复地进行;,(2)
5、每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;,(3)进行一次试验之前不能确定哪一个结果会出现.,在概率论中,把具有以下三个特征的试验称为随机试验.,2.1.1 随机试验定义,说明,(1)随机试验简称为试验,是一个广泛的术语.它包括各种各样的科学实验,也包括对客观事物进行的“调查”、“观察”或“测量”等.,实例“抛掷一枚硬币,观察字面,花面出现的情况”.,分析,(2)随机试验通常用 E 来表示.,(1)试验可以在相同的条件下重复地进行;,(1)抛掷一枚骰子,观察出现的点数.,(2)从一批产品中,依次任选三件,记 录出现正品与次品的件数.,同理可知下列试验都为随机试验.,(2)试
6、验的所有可能结果:,正面、反面;,(3)进行一次试验之前不能确定哪一个结果会出现.,故为随机试验.,定义 随机试验 E 的所有可能结果组成的集合称为 E 的样本空间,记为.,样本空间的元素,即试验E 的每一个结果,称为样本点,常用 表示.,实例1 抛掷一枚硬币,观察正面,反面出现的情况.,2.1.2 样本空间 样本点,实例2 抛掷一枚骰子,观察出现的点数.,实例3 从一批产品中,依次任选三件,记录出 现正品与次品的情况.,2.同一试验,若试验目的不同,则对应的样 本空 间也不同.,例如 对于同一试验:“将一枚硬币抛掷三次”.,若观察正面 H、反面 T 出现的情况,则样本空间为,若观察出现正面的
7、次数,则样本空间为,说明 1.试验不同,对应的样本空间也不同.,3.建立样本空间,事实上就是建立随机现 象的数学模型.因此,一个样本空间可以 概括许多内容大不相同的实际问题.,例如 只包含两个样本点的样本空间,它既可以作为抛掷硬币出现正面或出现反面的模型,也可以作为产品检验中合格与不合格的模型,又能用于排队现象中有人排队与无人排队的模型等.,在具体问题的研究中,描述随机现象的第一步就是建立样本空间.,通俗地讲随机事件是指随机试验中可能发生也可能不发生的事件,(1)基本概念,2.2 随机事件,它们分别可以对应了样本空间=1,2,3,4,5,6的子集1,2,3,4和2,4,6,根据这个说法不难发现
8、随机事件和样本空间的子集有一一对应关系!,“点数不大于4”,“点数为偶数”等都为随机事件.,反过来,的每个子集都对应了该试验的一个随机事件,随机事件的定义,当且仅当子集中某个样本点出现时,称事件发生,随机试验 E 的样本空间 的子集称为 E 的随机事件,简称事件.(即;某一可观察特征的随机试验的结果),实例 上述试验中“点数不大于6”就是必然事件.,必然事件 随机试验中必然发生的事件,不可能事件 随机试验中不可能发生的事件.,实例 上述试验中“点数大于6”就是不可能事件.,实例“出现1点”,“出现2点”,“出现6点”.,基本事件由一个样本点组成的单点集,特别地:,(2)几点说明,例如 抛掷一枚
9、骰子,观察出现的点数.,可设 A=“点数不大于4”,B=“点数为奇数”等等.,1)随机事件可简称为事件,并以大写英文字母 A,B,C,来表示事件,2)随机试验、样本空间与随机事件的关系,每一个随机试验相应地有一个样本空间,样本空间的子集就是随机事件.,样本空间 作为自身最大的子集包含所有的样本点(基本事件),表示必然事件,空集不含任何样本点表示不可能事件,2)随机试验、样本空间与随机事件的关系,每一个随机试验相应地有一个样本空间,样本空间的子集就是随机事件.,样本空间 作为自身最大的子集包含所有的样本点(基本事件),表示必然事件,空集不含任何样本点表示不可能事件,(1)子事件,若事件 A 出现
10、,必然导致 B 出现,则称事件 B 包含事件 A,也称A 是B的 子事件.,实例“长度不合格”必然导致“产品不合格”,所以“产品不合格”,包含“长度不合格”.,图示 B 包含 A.,B,2.2.1随机事件间的关系及运算,(2)A等于B 若 则称事件 A 与事件 B 相等,记作 A=B.,(3)事件 A 与 B 和事件,实例 某种产品的合格与否是由该产品的长度与直径是否合格所决定,因此“产品不合格”是“长度不合格”与“直径不合格”的并.,图示事件 A 与 B 的并.,A,(4)事件 A 与 B 积事件,和事件与积事件的运算性质,(5)事件 A 与 B 互不相容(互斥),若事件 A 的出现必然导致
11、事件 B 不出现,B出现也必然导致 A不出现,即A与B不能同时出现,则称事件 A与B互不相容或互斥,即,实例 抛掷一枚硬币,“出现花面”与“出现字面”是互不相容的两个事件.,“骰子出现1点”“骰子出现2点”,图示 A 与 B 互斥.,实例 抛掷一枚骰子,观察出现的点数.,注意 基本事件是两两互斥的.,(6)事件 A 与 B 的差,由事件 A 出现而事件 B 不出现所组成的事件称为事件 A 与 B 的差.记作 A-B.,图示 A 与 B 的差.,A,B,实例 设“长度合格但直径不合格”,“长度合格”,“直径合格”.,设 A 表示“事件 A 出现”,则“事件 A 不出现”称为事件 A 的对立事件或
12、逆事件.记作,实例“骰子出现1点”“骰子不出现1点”,图示 A 与 B 的对立.,B,若 A 与 B对立,则有,(7)事件 A 的对立事件,对立事件与互斥事件的区别,B,A、B 对立(互逆),A、B 互斥(互不相容),互斥,对立,(2)概率论与集合论之间的对应关系,概率的可列可加性,.3 事件的概率(概率的公理化定义),证明,由概率的可列可加性得,概率的性质,证明,证明,证明,由图可得,又由性质 3 得,因此得,解,(1)定义,2.4 古典概率模型(等可能概型),设试验 E 的样本空间由n 个样本点(基本事件)构成,A为 E 的任意一个事件,且包含 k个样本点(基本事件),则事件 A 出现的概
13、率记为:,(2)古典概型中事件概率的计算公式,称此为概率的古典定义.,解,(3)古典概型的基本模型:摸球模型,摸球模型是指从n个可辨认的球中按照不同的要求(是否放回,是否计序),一个一个地从中任取m个,从而得到不同的样本空间,然后在各自的样本空间中计算某事件的概率.,摸球模型一般可分为四种情况,各种情况的基本事件数如下表:,在解决许多概率问题时,往往需要在有某些附加信息(条件)下求事件的概率.,如在事件发生的条件下求事件发生的概率,将此概率记作P(|).,一般 P(|)P(),,那么 P(|)?,2.5 条件概率,同理可得,为事件 B 发生的条件下事件 A 发生的条件概率.,(2)定义,(3)
14、性质,2.5.1 乘法公式,(1)样本空间的划分,2.5.2 全概率公式与贝叶斯公式,有三个罐子,1号装有 2 红 1 黑球,2号装有 3 红 1 黑球,3号装有 2 红 2 黑球.某人从中随机取一罐,在从中任意取出一球,求取得红球的概率.,引例:,如何求取得红球的概率?,(2)全概率公式,全概率公式,某一事件A的发生有各种可能的原因Bi(i=1,2,n),如果A是由原因Bi所引起,则A发生的概率是,每一原因Bi都可能导致A发生,故A发生的概率是各原因引起A发生概率的总和,即全概率公式.,我们还可以从另一个角度去理解全概率公式:,引例:,某人从任一罐中任意摸出一球,发现是红球,求该球是取自 1
15、号罐的概率.,这是“已知结果求原因”的问题是求一个条件概率.,下面就介绍为解决这类问题而引出的 Bayes(贝叶斯)公式,称此为贝叶斯公式.,(3)贝叶斯公式,贝叶斯资料,(1)条件概率,全概率公式,贝叶斯公式,小结,乘法定理,事件 A 与 事件 B 相互独立,是指事件 A 的发生与事件 B 发生的概率无关.,说明,(2)定义,两事件相互独立,两事件互斥,例如,由此可见两事件相互独立,但两事件不互斥.,两事件相互独立与两事件互斥的关系.,请同学们思考,由此可见两事件互斥但不独立.,3.1 随机变量概念,在实际问题中,随机试验的结果可以用数量来表示,也可以用非数量表示,随机变量是随试验结果变化的
16、量!,在研究随机试验的结果时,可能关心的不是样本空间的各个样本点本身,而是对于与样本点联系着的某个数感兴趣。,3 随机变量及其分布,随机变量的定义,随机变量随着试验的结果不同而取不同的值,由于试验的各个结果的出现具有一定的概率,因此随机变量的取值也有一定的概率规律.,(2)随机变量的取值具有一定的概率规律,随机变量是一个函数,但它与普通的函数有着本质的差别,普通函数是定义在实数轴上的,而随机变量是定义在样本空间上的(样本空间的元素不一定是实数).,说明,(1)随机变量与普通的函数不同,实例 设某射手每次射击打中目标的概率是0.8,现该射手不断向目标射击,直到击中目标为止,则,是一个随机变量.,
17、且 X(e)的所有可能取值为:,实例 设盒中有5个球(2白3黑),从中任抽3个,则,是一个随机变量.,且 X(e)的所有可能取值为:,而表示随机变量所取的值时,一般采用小写字母x,y,z等.,随机变量通常用大写字母X,Y,Z或希腊字母,等表示,有了随机变量,随机试验中的各种事件,就可以通过随机变量的关系式表达出来.,3.2 引入随机变量的意义,例如:单位时间内某电话交换台收到的呼叫次数用X表示,它是一个随机变量.,事件收到不少于1次呼叫 X 1,没有收到呼叫 X=0,随机变量概念的产生是概率论发展史上的重大事件.引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变
18、量及其取值规律的研究.,事件及事件概率,随机变量及其取值规律,3.3 随机变量的分类,离散型,(1)离散型 随机变量所取的可能值是有限多个或无限可列个,叫做离散型随机变量.,观察掷一个骰子出现的点数.,随机变量 X 的可能值是:,随机变量,连续型,实例1,1,2,3,4,5,6.,非离散型,其它,实例2 随机变量 X 为“测量某零件尺寸时的测量误差”.,则 X 的取值范围为(a,b).,实例1 随机变量 X 为“灯泡的寿命”.,(2)连续型 随机变量所取的可能值可以连续地充满某个区间,叫做连续型随机变量.,则 X 的取值范围为,3.4 离散型随机变量的分布律,定义,1.,2.,则称,为随机变量
19、X的,概率分布律,简称分布律.,X的分布律也可用如下的表格形式来表示:,3.5 三种重要的离散型随机变量的概率分布,(1)两点分布,设随机变量 X 只可能取a与b两个值,它的分布律为,则称 X 服从 两点分布,(其中 0p1),当a=0,b=1时两点分布称为(01)分布,即:设随机变量 X 只可能取0与1两个值,它的分布律为,则称 X 服从(01)分布或伯努利分布.,(其中 0p1),两点分布是最简单的一种分布,任何一个只有两种可能结果的随机现象,比如新生婴儿是男还是女、明天是否下雨、种籽是否发芽等,都属于两点分布.,说明,(2)二项分布,1)重复独立试验,将试验 E 重复进行 n 次,若各次
20、试验的结果互不影响,即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这 n 次试验是相互独立的,或称为 n 次重复独立试验.,2)n 重伯努利试验,伯努利资料,实例1 抛一枚硬币观察得到正面或反面.若将硬币抛 n 次,就是n重伯努利试验.,实例2 抛一颗骰子n次,观察是否“出现 1 点”,就是 n重伯努利试验.,3)二项概率公式,且两两互不相容.,称这样的分布为二项分布.记为,注意:贝努里概型对试验结果没有等可能的要求,但有下述要求:,(1)每次试验条件相同;,二项分布描述的是n重贝努里试验中出现“成功”次数X的概率分布.,(2)每次试验只考虑两个互逆结果A或,,且P(A)=p,;,
21、(3)各次试验相互独立.,(3)泊松分布,泊松资料,泊松分布的背景及应用,二十世纪初卢瑟福和盖克两位科学家在观察与分析放射性物质放出的 粒子个数的情况时,他们做了2608次观察(每次时间为7.5秒)发现放射性物质在规定的一段时间内,其放射的粒子数X服从泊松分布.,电话呼唤次数,交通事故次数,商场接待的顾客数,地震,火山爆发,特大洪水,在生物学、医学、工业统计、保险科学及公用事业的排队等问题中,泊松分布是常见的.例如地震、火山爆发、特大洪水、交换台的电话呼唤次数等,都服从泊松分布.即:实际问题中的许多现象都服从或近似服从泊松分布.,(4)泊松定理 设随机变量X服从二项分布,其分布律为,k=0,1
22、,2,n.又设np=,(是常数),则有,二项分布与泊松分布有以下的关系.,该定理于1837年由法国数学家泊松引入!,单击图形播放/暂停ESC键退出,可见,当n充分大,p又很小时,可用泊松分布来近似二项分布!,由泊松定理,n重贝努里试验中稀有事件出现的次数近似地服从泊松分布.,我们把在每次试验中出现概率很小的事件称作稀有事件.如地震、火山爆发、特大洪水、意外事故等等,设X是随机变量,如果存在定义在整个实数轴上的函数f(x),满足条件,1.,2.,对于任意的,3.,则称X是连续型随机变量,称为X的概率密度函数,简称概率密度.,(2)连续型随机变量的定义,概率密度函数的性质,1),2),这两条性质是
23、判定一个函数 f(x)是否为某个随机变量X的概率密度函数的充要条件.,3)X落入区间a,b内的概率,注意 对于任意可能值 a,连续型随机变量取 a 的概率等于零.即,连续型随机变量取值落在某一区间的概率与区间的开闭无关,由此可得,这是因为,故 X的密度 f(x)在 x 这一点的值,恰好是X落在区间 上的概率与区间长度 之比的极限.这里,如果把概率理解为质量,f(x)相当于线密度.,()对 f(x)的进一步理解,3.6 三种重要的连续型随机变量,()均匀分布,均匀分布的意义,事实上,若X U(a,b),则对于满足,的c,d,总有,(2)指数分布,指数分布的重要性质:“无记忆性”.,证明,而,于是
24、,指数分布的无记忆性是使其具有广泛应用的重要原因!,指数分布在可靠性理论中描绘设备工作的可靠时间.有些系统的寿命分布也可用指数分布来近似,当电子产品的失效是偶然失效时,其寿命服从指数分布.在排队论中它被广泛地用于描绘等待时间,如电话通话时间、各种随机服务系统的服务时间、等待时间等.在更新和维修问题中描绘设备的寿命和维修时间.指数分布是伽玛分布和威布尔分布的特殊情况.一般地,当随机质点流中在长 t 的时间内出现的质点数服从参数为t 的泊松分布时,其相继出现两个质点的事件间就服从参数为 的指数分布.,(3)正态分布(或高斯分布),高斯资料,正态概率密度函数的几何特征,标准正态分布的概率密度表示为,
25、3.标准正态分布,标准正态分布的分布函数表示为,标准正态分布的图形,由标准正态分布概率密度图形的对称性易知:,即,正态分布是最常见最重要的一种分布,例如测量误差,人的生理特征尺寸如身高、体重等;正常情况下生产的产品尺寸:直径、长度、重量高度等都近似服从正态分布.一般来说,一个随机变量如果受许多随机因素影响,而其中的每一个因素都不起主导作用,则他服从正态分布.这是正态分布在实践中得以广泛应用 的原因.,正态分布的应用与背景,前面的课程中,我们讨论了随机变量及其分布,如果知道了随机变量X 的概率分布,那么X 的全部概率特征也就知道了.,但在实际问题中,概率分布一般是较难确定的.而且在一些实际应用中
26、,人们并不需要知道随机变量的一切概率性质,只要知道它的某些数字特征就够了.,4 随机变量的数字特征,主要应看这批灯泡的平均寿命和灯泡寿命相对于平均寿命的偏差平均寿命越长,灯泡的质量就越好,灯泡寿命相对于平均寿命的偏差越小,灯泡的质量就越稳定,因此,在对随机变量的研究中,确定某些数字特征是重要的.,下面我们来学习随机变量的数字特征,例如,评定一批灯泡的质量,随机变量的数学期望是概率论中最重要的概念之一.它的定义来自习惯上的平均值概念.,引例 将一枚骰子掷100次,各点数出现的次数与频率如下,求每次投掷的平均点数,4.1 数学期望的概念,(1)离散型变量数学期望的定义,几点说明:,(2)数学期望E
27、(X)是一个常数,而非变量它既不是随机变量所有可能取值的算术平均值,也不是随机变量的有限次观测值的算术平均值它是一种以概率为权的加权平均值,它从本质上体现了随机变量 X 取可能值的真正的平均值,具有重要的统计意义,请看下面的例子和实验_,随机变量 X 的算术平均值为,假设,X 的期望为,试问哪个射手技术较好?,实例1 谁的技术比较好?,解,故甲射手的技术比较好.,实例 如何确定投资决策方向?,某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元,失败的机会为70%,将损失 2 万元若存入银行,同期间的利率为5%,问是否作此项投资?,解,设 X 为投资利润,则,存入银行的
28、利息:,故应选择投资.,定义,4.2 连续型随机变量数学期望的定义,设已知随机变量X 的分布,一种方法是:g(X)也是随机变量,它的分布可以由已知的X 的分布求出来.一旦知道了g(X)的分布,就可以按照期望定义把 Eg(X)计算出来.,下面的定理指出答案是肯定的.,是否可以不先求g(X)的分布而只根据X 的分布求得Eg(X)呢?,如何计算 X 的某个函数g(X)的期望?,43随机变量函数的数学期望,设X是一个随机变量,Y=g(X)(g为连续函数),定理,(1)设C是常数,则E(C)=C;,(4)设X、Y独立,则 E(XY)=E(X)E(Y);,(2)若C是常数,则E(C X)=C E(X);,
29、(3)E(X1+X2)=E(X1)+E(X2);,(诸Xi独立时),注意:由E(XY)=E(X)E(Y)不一定能推出X,Y独立,4.4 数学期望的性质,.常用分布的数学期望,(1)概念的引入,4.5 随机变量方差的概念,前面我们介绍了随机变量的数学期望,它体现了随机变量取值的平均水平,是随机变量的一个重要的数字特征.,但是在一些场合,仅仅知道平均值是不够的.,为此需要引进另一个数字特征,用它来度量随机变量取值在其中心附近的离散程度.,这个数字特征就是我们接下来要介绍的,方差,(2)方差的定义,(2)由于标准差与X具有相同的度量单位,在实际问题中经常使用.,说明(1)方差刻划了随机变量的取值对于
30、其数学期望的离散程度,方差越小,X的取值集中在均值的附近;方差越大,X的取值越分散,离散型随机变量的方差,连续型随机变量的方差,(3)方差的计算,1)利用定义计算,证明,2)利用公式计算,证明,3 方差的性质(设D(X),D(Y)存在),(1)设 C 是常数,则有,(2)设 X 是一个随机变量,C 是常数,则有,证明,(3)设 X,Y 是两个随机变量,则有,证明,推广,其中i为常数,i=1,2,n.,即D(X)=0 P(X=C)=1,这里C=E(X),分 布,参数,数学期望,方差,两点分布,二项分布,泊松分布,均匀分布,指数分布,正态分布,(3)重要概率分布的期望和方差,现在转入课程的第二部分
31、,数理统计,数理统计的特点是应用面广,分支较多,社会的发展不断向统计提出新的问题。,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作。,但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断。,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科.,数理统计学,数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测,直至为采取一定的决策和行动提供依据和建议.,计算机的诞生与发展,为数据处理提供
32、了强有力的技术支持,数理统计与计算机的结合是必然的发展趋势.,学习统计无须把过多时间花在计算上,可以更有效地把时间用在基本概念、方法原理的正确理解上.国内外著名的统计软件包:SAS,SPSS,STAT等,都可以让你快速、简便地进行数据处理和分析.,概率论与数理统计是两个有密切联系的学科,它们都以随机现象的统计规律为研究对象.,但在研究问题的方法上有很大区别:,概率论 已知随机变量服从某分布,寻求分布的性质、数字特征、及其应用;,数理统计 通过对试验数据的统计分析,寻找所服从的分布和数字特征,从而推断总体的规律性.,数理统计的核心问题由样本推断总体,总体容量有限的称为有限总体,总体,一个统计问题
33、总有它明确的研究对象.,(1)总体,研究对象的全体称为总体(母体),,总体中每个对象称为个体.,总体、个体和样本的概念,研究某批灯泡的质量,总体,考察国产 轿车的质量,在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.,该批灯泡寿命的全体就是总体,灯泡的寿命,每公里的耗油量,所有国产轿车每公里耗油量的全体就是总体,这时,每个个体具有的数量指标的全体就是总体.,称总体中所含个体的数目为总体容量,总体容量无限的称为无限总体.,并常用随机变量的记号或用其分布函数表示总体.比如说 总体 X 或 总体 F(x).,很自然地,我们就用随机变量 X 来表示
34、所考察的总体.,设该大学一年级学生的年龄分布如下,若从该大学一年级学生中任意抽查学生的年龄,,X 的概率分布是:,可见,X 的概率分布反映了总体中各个值的分布情况.,考察某大学一年级 学生的年龄,某大学一年级全体学生 的年龄构成问题的总体,也就是说,总体可以用一个随机变量 X 或其分布来描述.,所得结果为一随机变量,记作 X.,X,概率,X 的分布函数和数字特征就是总体的分布函数和数字特征.,今后不必区分总体和其相应的随机变量.,那么,此总体就可用描述其寿命的随机变量 X 或用其分布函数 F(x)表示.,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数 F
35、(x,y)来表示.,总体概念的要旨:总体就是一个随机变量或一个概率分布!,再如,若研究某地区中学生的营养状况时,关心的数量指标是身高和体重,,如研究某批灯泡的寿命时,关心的数量指标就是寿命,它要求抽取的样本X1,X2,Xn 满足下面两点:,它可以用与总体同分布的 n 个相互独立的随机变量 X1,X2,Xn 表示.,2.代表性:Xi(i=1,2,n)与所考察的总体 X 同分布.,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.,最常用的一种抽样方法叫作简单随机抽样,1.独立性:X1,X2,Xn 是相互独立的随机变量;,抽样的目的是为了对总体进行统计推断,,由简单随机抽样得到的样本称为简
36、单随机样本,,今后,说到“X1,Xn 是来自某总体的样本”时,若不特别说明,就指简单随机样本.,则其简单随机样本的联合分布函数为,F(x1,x2,xn)=,简单随机样本是应用中最常见的情形,若总体 X 的分布函数为F(x),若总体 X 的概率密度为 f(x),则其简单随机样本的联合概率密度为,F(x1)F(x2)F(xn),1.统计量的定义,5.3 统计量,样本是总体的代表,但抽取样本后,并不直接利用样本的观察值进行推断,而是把样本中所包含的有关信息集中起来进行研究,这便是针对所研究的问题构造样本点某种函数,称之为样本函数,这种函数也称之为统计量。,2.几个常用统计量的定义,(1)样本均值,(
37、2)样本方差,其观察值,其观察值,其观察值,(3)样本标准差,其观察值,极 差:样本中最大值与最小值之差,即:,(4)样本 k 阶(原点)矩,其观察值,(5)样本 k 阶中心矩,其观察值,6.参数估计6.1 定义:所谓的参数估计就是对总体X的分布函数由样本()构造一些统计量()来估计X中参数(或数字特征),这样的统计量称为估计量,这种方法称为参数估计法。参数估计法可以分为点估计法和区间估计法两类。,6.2 点估计问题的提法,设总体 X 的分布函数形式已知,但它的一个或多个参数为未知,借助于总体 X 的一个样本来估计总体未知参数的值的问题称为点估计问题.,例1,解,用样本均值来估计总体的均值 E
38、(X).,点估计问题的一般提法,6.2.1 估计量的求法,由于估计量是样本的函数,是随机变量,故对不同的样本值,得到的参数值往往不同,如何求估计量是关键问题.,常用构造估计量的方法:(两种),矩估计法和最大似然估计法.,(1).矩估计法,复习,2.样本 k 阶(原点)矩,(X为连续型),(X为离散型),矩估计法的定义,用样本矩来估计总体矩,用样本矩的连续函数来估计总体矩的连续函数,这种估计法称为矩估计法.,(2).最大似然估计法,似然函数的定义,最大似然估计法,求最大似然估计量的步骤:,费舍尔,最大似然估计法是由费舍尔引进的.,最大似然估计法也适用于分布中含有多个未知参数的情况.此时只需令,对
39、数似然方程组,对数似然方程,估计量的评价:,一致性是对估计量的一个基本要求,不具备一致性的估计量是不予以考虑的.,1.一致性,2.有效性,由于方差是随机变量取值与其数学期望的偏离程度,所以无偏估计以方差小者为好.,3.无偏性,无偏估计的实际意义:无系统误差.,1.区间估计的基本概念,(1)置信区间的定义,关于定义的说明,若反复抽样多次(各次得到的样本容量相等,都是n),按伯努利大数定理,在这样多的区间中,(2)求置信区间的一般步骤(共3步),1.,2.,3、小结(正态总体),一元线性回归模型,主要内容,一元线性回归模型模型参数估计(最小二乘法)样本判定系数与拟合优度检验回归参数估计值的显著性检
40、验模型整体的显著性检验一元线性回归模型预测,参数估计,假设检验,2.线性回归模型,模型的基本形式:Y=0+1X1+2X2+3X3+iXi+i基本假设解释变量 Xi 是确定性变量,不是随机变量;解释变量之间互不相关,即解释变量之间是相互独立的;随机误差项具有0均值和同方差;随机误差项不存在序列相关关系;随机误差项与解释变量之间不相关;随机误差项服从0均值、同方差的正态分布。,3.一元线形回归模型,只含有一个解释变量的线形回归模型满足基本假设:1 E(i)=0 2 Var(i)=2 3 Cov(i,J)=0 4 Cov(Xi,i)=0 i=1,2,3,,n;j=1,2,3,,n ij,同方差,无序
41、列自相关,高斯-马尔柯夫假定,二.一元线性回归模型的参数估计,样本回归线(函数),总体回归模型,样本回归模型,1.基本概念,(3)估计量(Estimator),一个估计量又称统计量,是指一个规则、公式或方法,是用已知的样本所提供的信息去估计总体参数。统计量是样本的函数,因为抽样是随机的,估计量具有随机性对一次已经实现的抽样,估计量又是确定的。在应用中,由具体样本算出的估计量的数值称为估计值。,2.最小二乘法的思路(1),为了精确地描述Y与X之间的关系,必须使用这两个变量的每一对观察值(n组观察值),才不至于以点概面(做到全面)。Y与X之间是否是直线关系(用协方差或相关系数判断)?若是,可用一条
42、直线描述它们之间的关系。在Y与X的散点图上画出直线的方法很多。找出一条能够最好地描述Y与X(代表所有点)之间的直线。问题是:怎样算“最好”?最好指的是找一条直线使得所有这些点到该直线的纵向距离的和(平方和)最小。,最小二乘法的思路(2),最小二乘法的思路(3),纵向距离是度量实际值与拟合值是否相符的有效手段点到直线的距离点到直线的垂直线的长度。横向距离点沿(平行)X轴方向到直线的距离。纵向距离点沿(平行)Y轴方向到直线的距离。也就是实际观察点的Y坐标减去根据直线方程计算出来的Y的拟合值。实际值-拟合值=残差(剩余),最小二乘法的思路(4),纵向距离是Y的实际值与拟合值之差,差异大拟合不好,差异
43、小拟合好,所以称为残差、拟合误差或剩余。将所有纵向距离平方后相加,即得误差平方和,“最好”直线就是使误差平方和最小的直线。拟合直线在总体上最接近实际观测点。于是可以运用求极值的原理,将求最好拟合直线问题转换为求误差平方和最小的问题。,最小二乘法的数学原理,纵向距离是Y的实际值与拟合值之差,差异大拟合不好,差异小拟合好,所以又称为拟合误差或残差。将所有纵向距离平方后相加,即得误差平方和,“最好”直线就是使误差平方和最小的直线。于是可以运用求极值的原理,将求最好拟合直线问题转换为求误差平方和最小。,数学推证过程,最小二乘估计量,最小二乘估计量的简化形式,4.最小二乘估计量的统计性质,总离差平方和(TSS),回归平方和(ESS),残差平方和(RSS),总离差平方和的分解,总离差平方和的分解,平方和分解的意义,TSS=ESS+RSS被解释变量Y总的变动(差异)=解释变量X引起的变动(差异)+除X以外的因素引起的变动(差异)如果X引起的变动在Y的总变动中占很大比例,那么X很好地解释了Y;否则,X不能很好地解释Y。,