《六数理统计的基本概念.ppt》由会员分享,可在线阅读,更多相关《六数理统计的基本概念.ppt(43页珍藏版)》请在三一办公上搜索。
1、第六章,数理统计的基本概念,数理统计和概率论一样都是研究随机现象的规律性.概率论是从给定分布出发来研究随机现象的规律,数理统计则是从实际观测的数据资料出发研究的.,数理统计处理问题基本思想:从被研究对象的全体中抽取一部分,根据这部分的情况对整体作出判断.,数理统计要解决两个问题:(1)抽取的对象要合理.即实验设计与抽样调查设计,目的是如何有效地收集数据;(2)数据处理要恰当,即对收集到的数据如何进行分析,并作出推断.,本课程只讨论数据处理,也叫统计推断.它包括参数统计、假设检验、方差分析、回归分析等内容.,第一节 概述,第二节 总体和样本,定义1 研究对象的全体称为总体(又叫母体),而组成总体
2、的每个对象称为个体。,由于总体就是一个随机变量(或向量)X,因此研究总体就是要研究X的概率分布或某些特征量.,在实际问题中,往往不需要研究总体的一切属性,而只要研究总体的某项数量指标,因此,可以把总体的某个数量指标的全体看成是总体,而把每个数值作为个体。若用一个随机变量X来描述总体的某个数量指标,则称随机变量X为总体.若X的分布函数为F(x),则也称F(x)为总体的分布函数。,定义2 设总体X的分布函数为F(x),对总体作n次抽样,第i次抽样所得的随机变量为Xi,i=1,2,n,若X1,X2,,Xn相互独立且和X同分布,则称(X1,X2,,Xn)为简单样本,简称为样本。,必须对抽取样本提出一些
3、要求,这些要求主要有两条,第一是代表性,即要求抽取的样本确实能代表总体;第二是独立性,即每次抽取的结果互不影响.,设X是具有分布函数F的随机变量,若X1X2Xn是具有同一分布函数F的、相互独立的随机变量,则称X1,X2,Xn 为来自总体X的样本容量为n的简单随机样本,它们的观察值x1,x2,xn称为样本值。,对于简单随机样本X1,X2,Xn,其联合概率分布可以由总体X的分布完全确定。若总体X的分布函数为F(x),则样本X1,X2,Xn的联合分布函数为,样本的联合分布,又若X具有概率密度 f(x),则 X1,X2,Xn的联合概率密度为,则X1,X2,Xn的联合分布律为,若X的分布律为,例1 设总
4、体XB(1,p),X1,X2,Xn为取自总体X的样本,求样本X1,X2,Xn的联合分布(称为样本分布)。,解:X的分布律为,所以样本X1,X2,Xn的联合分布律为,例2 设总体XN(,2).(X1,X2,Xn)是来自X的样本,求样本的联合密度.,解:,定义1 设X1,X2,Xn为来自总体X的样本,g(X1,X2,Xn)是X1,X2,Xn的函数,若g中不含任何未知参数,则称g(X1,X2,Xn)为统计量.,设x1,x2,xn是相应于样本X1,X2,Xn的样本值,则称g(x1,x2,xn)是g(X1,X2,Xn)的观察值.,第三节 统计量,统计量的概念,1.样本平均值,2.样本方差,3.样本标准差
5、,4.样本k阶(原点)矩,5.样本k阶中心矩,常用的统计量,它反映了总体k 阶矩的信息,它反映了总体k 阶中心矩的信息,6.样本协方差,(样本相关矩),7.样本相关系数,其中:X,Y为两个总体,(X1,X2,Xn)来自总体X的样本,(Y1,Y2,Yn)来自总体Y的样本.,它们的观察值分别为,例1某班主任老师抽查了5名学生的高考成绩X和大学一年级5科的平均成绩Y结果如下表,求X,Y之间的样本相关系数.,解:,例2设总体X的期望、方差分别为 X1,X2,Xn为来自总体X的样本,其样本均值和样本方差分别记为。求,由于,所以,顺序统计量(次序统计量),定义2:第k顺序统计X(k)是上述子样(X1,X2
6、,Xn)这样的一个函数,当样本(X1,X2,Xn)取值(x1,x2,xn)时,X(k)取值 x(k).,定义3 设(X1,X2,Xn)为取自总体 X 的样本.称Rn=maxX1,X2,Xn-minX1,X2,Xn 为样本极差,它反映了样本值的波动幅度.,第四节 抽样分布,定理1 设随机变量,则X的密度函数为,1、分布,设X1,X2,Xn相互独立,且XiN(0,1),i=1,2,n.,称X服从自由度为n的 分布.记作:.,的图像如下,分布具有以下性质:,其中ZN(0,1)。,标准正态分布的分位点也类似定义,标准正态分布的上 分位点记为,它满足,对不同的 分布的上 分位点的值已制成表格,可以查用。
7、,2、t分布,定理2 若随机变量tt(n).则t的密度函数为,t(n)分布的密度函数 关于t=0单峰对称,性质:从图形可以看出t分布和N(0,1)分布相当接近。f(t)是偶函数,f(-t)=f(t).当n30时,t 分布近似于N(0,1)分布,利用函数的性质可以证明.,当n较小时,t(n)分布与N(0,1)分布之间有较大差异。,(1)t(n)分布的上 分位点记为,即 满足,当,t分布的上 分位数可由附表查得.当n45时,有,(2)t(n)分布的下 分位点记为,即 满足,(3)t(n)分布的双侧 分位点记为,即 满足,例1总体XN(0,1),(X1,X2,X3)是来自X的样本,求,的概率分布.,
8、3、F分布,定理3 若随机变量FF(n1,n2),则F的密度函数为,f(x)的图形如下:,(1)若FF(n1,n2),则,F分布的性质:,(2)F分布的上 分位点有如下的性质:,的上 分位点记为,即它满足,的下 分位点记为,即它满足,若 表示为上分位点的值,则查表可得:,若FF(n1,n2),则,F分布性质(2)的证明,即要证明:,4、正态总体的抽样分布,定理4,性质2的应用,统计量的分布称为抽样分布,下面研究样本平均和样本方差的分布.注意:下述定理是在总体为正态分布这一假设下得到的.,推论1,推论2,证明,证明,推论3,证明,结束放映,推论1,返回,推论2的证明:,返回,推论3,返回,第五节 经验分布函数和直方图,例1,