《统计推断准备.ppt》由会员分享,可在线阅读,更多相关《统计推断准备.ppt(42页珍藏版)》请在三一办公上搜索。
1、第一章 统计推断准备,0.预备知识0.1 大数定律与中心极限定理阐明大量随机现象平均结果的稳定性的一系列定理统称大数定律,而研究独立随机变量的和的极限分布在什么条件下为正态分布的一类定理叫中心极限定理。0.1.1车贝雪夫不等式设随机变量 有期望 和方差,则对任意,有,0.1.2大数定律定义:若 随机变量序列,如果存在常数列 使得对任意的 有 成立,则称随机变量序列 服从大数定律.定理1(贝努里大数定律)设 是n重贝努里试验中事件A出现的次数,又A在每次试验中出现的概率为p(0p1),则对任意的,有:,定理2(车贝雪夫大数定律)设 是一列两两不相关的随机变量,又设他们的方差有界,既存在常数C0,
2、使有 则对任意的,有例1.:设 为独立同分布的随机变量序列,均服从参数为 的泊松分布 则定理3(辛钦大数定律)设 是一列独立同分布的随机变量,且数学期望存在,则对任意的 有,0.1.3.中心极限定理定理1(林德贝格-勒维定理)若 是独立同分布的随机变量序列,且 则随机变量,其中 的分布函数 对一切x,有:即随机变量 渐近地服从标准正态分布。定理2(德莫佛-拉普拉斯定理)设 是n重贝努里试验中事件A出现的次数,而0p1是事件A在每次试验中出现的概率,则 渐近的服从正态分布,其中q=1-p或,例2:有一批建筑房屋用的木柱,其中80%的长度不小于3米,现从这批木柱中随机地取出100根,问其中至少有3
3、0根短于3米的概率是多少?例3:某车间有200台车床,独立工作,开工率为0.6,开工时耗电各为1000瓦,问供电部门至少要供给这个车间多少电力才能使99.9%的概率保证这个车间不会因为供电不足而影响生产。例4:一加法器,同时收到20个噪声电压 设他们是相互独立的,且在区间(0,10)上服从均匀分布的随机变量,记,求,1基本概念1.1总体与样本,总体:研究对象的全体,记为X或,是指一个随机变量。个体:组成总体的每个单元。样本:就是n个相互独立且与总体有相同概率分布的随机变量,i=1,2,n,所组成的n维随机变量样本值:每一次具体的抽样所得的数据就是n个随机变量的值(样本值)用小写字母 表示。注:
4、样本具有双重性,即它本身是随机变量,但一经抽取便是一组确定的具体值。定义:若随机变量 相互独立且每个,i=1,2,n,与总体 有相同的概率分布,则称随机变量 为来自总体 的容量为n的简单随机样本,称,i=1,2,n为样本的第i个分量。若 有分布密度(或分布函数)则 称 是来自总体(或)的样本.,1.2统计量定义:设 为总体 的一个样本,为一个实值函数,如果T中 不包含任何未知参数,则称 为一个统计量。统计量的分布称为抽样分布。例如:总体,a已知,未知,为 的一个样本,则 是统计量,但 不是统计量。1.3顺序统计量及经验分布 1.3.1顺序统计量 设 为总体,的一个样本,将其诸分量,i=1,2,
5、n,按由小到大的次序重新排列为,即,称 为总体的第k个顺序统计量(次序统计量),特别 称为最小项统计量,为最大项统计量。,例1.5:设有一个总体,它以等概率取0,1,2三个值,现从此总体中取容量为2的一个样本,列出样本 所有可能取值情况和相应的次序统计量 的情况。,1.3.2经验分布由给定的样本 定义一个函数,此函数的性质:(1)当样本固定时,作为x的函数是一个阶梯形的分布函数,恰为样本分量不大于x的频率。(2)当x固定时,它是一个统计量,其分布由总体的分布所确定。即(二项分布)称 为总体对应于样本 的经验分布函数。,1.4常用的一些统计量1.4.1样本的分位数 设 为总体,为样本,为顺序统计
6、量,定义 称 为样本的 分位数。当=1/2时,称 为样本的中位数。(也用 表示)例1.6:若(1.5,2.0,4.0,0,8,3.5,9),则?1.4.2.样本的极差 称为样本的极差,1.4.3样本分量的秩若,则称 的秩为j,记作,它表示样本第 个分量,处于顺序统计量中的位次。1.4.4.样本矩设 为总体 取出的容量为n的样本,统计量 叫样本均值;统计量 叫样本方差(而称 叫修正的样本方差);统计量,(r=1,2,)叫样本的r阶原点矩;统计量,(r=1,2,)叫作样本的r阶中心矩。,1.4.5二元总体的样本矩设 为二元随机变量,为其样本,称 为 的边际样本方差;为 的边际样本方差;为样本的协方
7、差;为样本的相关系数。,2.常用统计量的抽样分布2.1顺序统计量的分布(次序统计量)2.1.1定义 设()是来自总体 的一个样本,()是该样本的一组观察值,将它按由小到大的次序排列成,如果规定 的取值为,k=1,2,n,则称 为()的一组次序统计量,而称 为第k个次序统计量。(见 1.3.1)2.1.2连续型总体次序统计量的分布(仅给出结论)定理2.1设总体,为 的一个样本,则第k个次序统计量 的概率密度函数为:分布函数为:,特别:当k=1时,得样本极小值 的分布密度与分布函数为:当k=n时,得样本极大值 的分布密度与分布函数为:,定理2.2 设总体X的分布函数为,概率密度函数为,为X的一个样
8、本,则第k个次序统计量与 第r个次序统计量的联合概率密度函数为(kr)定理2.3设总体X的分布函数为,概率密度函数为,为X的一个样本,则S个次序统计量 的联合概率密度为,定理2.4(定理2.3的特殊情形)设总体X的分布函数为,概率密度函数为,为X的一个样本,则前r个次序统计量 的联合概率密度函数 为()特别:当r=n时,得n个次序统计量 的联合概率密度函数为 注:n个次序统计量不是相互独立的,即次序化破坏了简单随机样本的独立性。,定理2.5(极差的分布)令,则 的分布函数和密度函数分别为:,例2.1:设总体 有分布密度为,为从 取出的容量为4的样本的顺序统计量,求 的分布函数,例2.2:设总体
9、X服从区间(0,1)上的均匀分布,其分布函数与概率密度函数分别为:为X的一个样本,求第k个次序统计量的概率密度函数。,例2.3:设总体X服从参数 为的指数分布,其分布函数与概率密度函数分别为:为X的一个样本,求 的密度函数,的密度函数,极差=-的密度函数,的联合密度 函数。例2.4:设总体X服从指数分布,其概率密度函数为 是容量为n的样本 的前r个次序统计量,则 都服从参数为 的指数分布,且 相互独立。例2.5:在上述条件下,则,3 n个重要统计量的分布3.1正交矩阵与正态分布定理3.1设 相互独立,且都服从,而A=是n阶正交矩阵,则 必相互独立,且都服从 定理3.2设 相互独立,且,A=是n
10、阶正交矩阵,则 必相互独立,且,3.2 三个重要分布3.2.1 分布定义:称随机变量 有 分布,自由度为n,如果他有密度定理3.3设 相互独立,且都服从,则定义:的上侧 分位数,即,的性质:(1)(2)若,且X与Y独立,则X+Y注:1.如果 相互独立且,则 的上侧 分位数,即设X,则对 有即:当n很大时,或X,4.当n45时,本书附表 中查不到,但可以利用注3求其近似值,即 由于,则:例如:求,所以,3.2.2 t-分布定义:称随机变量 有t-分布,自由度为n,如果它有密度函数定理3.4 设X,Y,且X与Y相互独立,则T=.定义:的上侧 分位数,即 注:当自由度 时,的极限分布为标准正态分布
11、当n45时,,3.2.3 F-分布定义:称随机变量 有F-分布,自由度为,如果它有密度定理3.5 设X,Y 且X与Y相互独立,则注:若X,则1/X定义:的上侧 分位数,即,注:=1/,3.2.4 查表1.标准正态分布表:2.分布表:3.分布表:4.分布表:,3.3抽样分布定理定理4.6(Fisher定理)设总体 服从,为其子样,子样的平均值与方差,修正的样本方差分别记为 与 及,则(1),(2)(3)与(或)独立推论:设总体 服从,为其子样,则,定理3.7 设 与 分别为取自,的两个样本,且这两个样本独立,则1.2.若,则其中,,定理3.8(柯赫伦cochran定理)(变量分解定理)设总体,为
12、其子样,且 为秩为 的关于 的二次型,则,l=1,k相互独立,且,l=1,2,k例3.1:设总体,为其子样,试证:与 相互独立,且分别服从,,4.总体分布的近似描述 4.1格列汶科定理 对任意实数x,当 时,格里汶科定理表明:在几乎处处的意义下,当n 充分大时,对x一致地有 F(x)非常接近。由此可见当n较大时,用经验分布函数估计总体分布函数是合理有效的。,4.2 直方图 对于连续型随机变量,其分布函数或密度函数能完整地描述它的取值规律性,给出分布函数或密度函数是等价的。直方图能反映总体密度曲线的大致形状。,设X的分布函数和密度函数分别用F(X),f(x)表示:当 很小时,有 表明:密度函数在
13、x处的值f(x)近似等于随机变量X落入含有x的小区间的概率除以小区间的长度。概率可以用频率近似。,设来自X的样本观测值为,考察其中每个值是否属于 看作一次试验,则 即f(x)与单位长度的频率近似相等,称单位长度的频率为频率密度。,编制频数分布表的一般步骤:1.计算极差:2.计算组距:组距=组上限-组下限3.确定组限:选a(略小于或等于,,例4.1 某厂生产一种25瓦的白炽灯泡,其光通量(单位:流明)用X表示,从这批灯泡中抽取容量为60的样本,进行观察得光通量数据如下:216 203 197 208 206 209 206 208 202 221 206 213 218 207 203 202
14、194 203 202 193 203 213 211 198 213 208 204 206 204 206 208 209 213 203 206 207 196 201 208 207 213 208 210 208 211 214 220 211 203 216 224 211 209 218 214 219 211 221 211 218试编制频数分布表,并绘制频率密度直方图。,解.1.极差:R=224-193=31 2.计算组距:d=31/7=4.43 3.确定组范围:190,195),195,200),200,205),205,210),210,215),215,220),220
15、,225.,按光通量分组频数分布表,频率密度直方图(P.18)图1.6频率密度分布曲线图(P.19)图1.7,5.杂例例5.1:在总体 中随机抽一容量为36的样本,求样本均值 落在50.8到53.8之间的概率。例5.2:在总体 中取容量为5的样本,(1)求样本均值与总体均值之差的绝对值大于1 的概率(2)求(3)求例5.3:求总体 的容量分别为10,15的两个独立样本均值差的绝对值大于0.3的概率。,例5.4:设 为 的一个样本,求例5.5:设是来自的样本,求例5.6:已知,则例5.7:设为总体X的一个样本,求,例5.8:设在总体中抽取一容量为n的样本,未知,(1)求,;(2)当n=16时,求,例5.9:设为总体X的一个样本,为第n+1次的观察结果,试证:(1)例5.10:设是来自正态总体X的简单随机样本,则例5.11:设是取自正态总体X 的一个样本,求,例5.12.:设X服从,为来自总体X的简单随机样本,试求常数C,使CY 分布例5.13:设总体X在()()上服从均匀分布,为其子样,求及极差的数学期望。例 5.14:设总体服从 和 分别为样本均值和样本方差,又设 且与 独立。求统计量的抽样分布。,