《数理统计的基本概念.ppt》由会员分享,可在线阅读,更多相关《数理统计的基本概念.ppt(38页珍藏版)》请在三一办公上搜索。
1、,数理统计的任务就是研究怎样有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确而可靠的结论.,一个统计问题总有它明确的研究对象.,1.总体,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,总体,一、总体和样本,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性.从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布.,这样,总体就可以用一个随机变量及其分布来描述.
2、,而概率分布正是刻划这种集体性质的适当工具.因此在理论上可以把总体与概率分布等同起来.,从另一方面看,统计的任务,是根据从总体中抽取的样本,去推断总体的性质.,由于我们关心的是总体中的个体的某项指标(如人的身高、体重,灯泡的寿命,汽车的耗油量),所谓总体的性质,无非就是这些指标值的集体的性质.,例如:研究某批灯泡的寿命时,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,某批灯泡的寿命,总体,寿命X可用一概率分布来刻划,鉴于此,常用随机变量的记号或用其分布函数表示总体.如说总体X或总体F(x).,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是
3、身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.,统计中,总体这个概念 的要旨是:总体就是一个 概率分布.,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为“抽样”,所抽取的部分个体称为样本.样本中所包含的个体数目称为样本容量.,2.样本,但是,一旦取定一组样本,得到的是n个具体的数(X1,X2,Xn),称为样本的一次观察值,简称样本值.,样本是随机变量.,抽到哪5辆是随机的,容量为n的样本可以看作n维随机变量.,2.独立性:X1,X2,Xn是相互独立的随机变量.,
4、由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法.,最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:,1.代表性:X1,X2,Xn中每一个与所考察的总体有相同的分布.,由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,Xn表示.,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,若总体的分布函数为F(x),则其简单随机样本的联合分布函数为,F(x1)F(x2)F(xn),事实上我们抽样后得到的资料都是
5、具体的、确定的值.如我们从某班大学生中抽取10人测量身高,得到10个数,它们是样本取到的值而不是样本.我们只能观察到随机变量取的值而见不到随机变量.,3.总体、样本、样本值的关系,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,样本是联系二者的桥梁,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,二、统计量和抽样分布,1.统计量,这种不含任何未知参数的样本的函数称为统计量.它是完全由样本决定的量.,几个
6、常见统计量,样本均值,样本方差,它反映了总体均值的信息,它反映了总体方差的信息,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体k 阶矩的信息,它反映了总体k 阶中心矩的信息,2.抽样分布,统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布”.,抽样分布就是通常的随机变量函数的分布.只是强调这一分布是由一个统计量所产生的.研究统计量的性质和评价一个统计推断的优良性,完全取决于其抽样分布的性质.,抽样分布,精确抽样分布,渐近分布,(小样本问题中使用),(大样本问题中使用),三.统计三大分布,记为,定义:设 相互独立,都服
7、从正态分布N(0,1),则称随机变量:所服从的分布为自由度为 n 的 分布.,分布是由正态分布派生出来的一种分布.,分布的密度函数为,请看演示,分布,由 分布的定义,不难得到:,2.设 且X1,X2相互独立,则,这个性质叫 分布的可加性.,应用中心极限定理可得,若,的分布近似正态分布N(0,1).,则可以求得,E(X)=n,D(X)=2n,若,T的密度函数为:,记为Tt(n).,2、t 分布,具有自由度为n的t分布的随机变量T的数学期望和方差为:E(T)=0;D(T)=n/(n-2),对n 2,当n充分大时,其图形类似于标准正态分布密度函数的图形.,t分布的密度函数关于x=0对称,且,不难看到
8、,当n充分大时,t 分布近似N(0,1)分布.但对于较小的n,t分布与N(0,1)分布相差很大.,请看演示,t 分布,由定义可见,,3、F分布,F(n2,n1),即它的数学期望并不依赖于第一自由度n1.,X的数学期望为:,若n22,若XF(n1,n2),X的概率密度为,请看演示,F分布,统计三大分布的定义、基本性质在后面的学习中经常用到,要牢记!,教材180页给出了概率分布的上侧分位数(分位点)的定义.它在计算概率查表时经常使用.,这里请看演示.,分位数,当总体为正态分布时,教材上给出了几个重要的抽样分布定理.这里我们不加证明地叙述.除定理2外,其它几个定理的证明都可以在教材上找到.,四、几个重要的抽样分布定理,定理 1(样本均值的分布),n取不同值时样本均值 的分布,定理 2(样本方差的分布),n取不同值时 的分布,定理 3,定理 4(两总体样本均值差的分布),定理 5(两总体样本方差比的分布),上述5个抽样分布定理很重要,要牢固掌握.,