《医用数理统计方法课件第四章随机抽样与抽样分布.ppt》由会员分享,可在线阅读,更多相关《医用数理统计方法课件第四章随机抽样与抽样分布.ppt(76页珍藏版)》请在三一办公上搜索。
1、第 四 章,随机抽样 与 抽样分布,数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测.,由于大量随机现象必然呈现它规律性,只要对随机现象进行足够多次观察,被研究的规律性一定能清楚地呈现出来.,客观上,只允许我们对随机现象进行次数不多的观察试验,我们只能获得局部观察资料.,数理统计的任务就是研究有效地收集、整理、分析所获得的有限的资料,对所研究的问题,尽可能地作出精确而可靠的结论.,在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推
2、断.,数理统计方法具有“部分推断整体”的特征.,第4.1.节 基本概念,一、总体与个体,二、随机样本的定义,三、统计量,四、小结,一、总体与个体,一个统计问题总有它明确的研究对象.,研究对象的全体称为总体(母体),,总体中每个成员称为个体.,研究某批灯泡的质量,总体,总体,然而在统计研究中,人们往往关心每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.,由于每个个体的出现带有随机性,即相应的数量指标值的出现带有随机性。从而可把此种数量指标看作随机变量,我们用一个随机变量或其分布来描述总体。为此常用随机变量的符号或分布的符号来表示总体。通
3、常,我们用随机变量X,Y,Z,等表示总体。当我们说到总体,就是指一个具有确定概率分布的随机变量。,如:研究某批灯泡的寿命时,我们关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,总体,某批灯泡的寿命,寿命X可用一概率分布来刻划,因此,在统计学中,总体这个概念的要旨是:总体就是一个概率分布.,某工厂10月份生产的灯泡寿命所组成的总体中,个体的总数就是10月份生产的灯泡数,这是一个有限总体;而该工厂生产的所有灯泡寿命所组成的总体可近似地看成一个无限总体,它包括以往生产和今后生产的灯泡寿命.,有限总体和无限总体,实例,当有限总体包含的个体的总数很大时,可近似地
4、将它看成是无限总体.,二、简单随机样本,1.样本的定义,为推断总体的分布及各种特征,按一定的规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息.这一抽取过程称为“抽样”.,所抽取的部分个体称为样本.通常记为,样本中所包含的个体数目n称为样本容量.,容量为n的样本可以看作n维随机变量.但是,一旦取定一组样本,得到的是n个具体的数,称此为样本的一次观察值,简称样本值.,2.简单随机样本,抽取样本的目的是为了利用样本对总体进行统计推断,这就要求样本能很好的反映总体的特性且便于处理.为此,需对抽样提出一些要求,通常有两条:,满足上述两条性质的样本称为简单随机样本.,获得简单随机样本的抽样方法称
5、为简单随机抽样.,为了使大家对总体和样本有一个明确的概念,我们给出如下定义:,定义4.1,一个随机变量X或其相应的分布函数F(x)称为一个总体.,1.代表性:X1,X2,Xn中每一个与所考察的总体X有相同的分布.,2.独立性:X1,X2,Xn是相互独立的随机变量.,定义4.2,样本 所有可能取值的全体称为样本空间,记为。,定理5.1,3.样本的分布,解,例1,解,例2,三、统计量,1.统计量的定义4.3,由样本推断总体特征,需要对样本值进行“加工”,“提炼”.这就需要构造一些样本的函数,它把样本中所含的信息集中起来.,是,不是,例1,2.几个常用统计量(样本矩)的定义,(1)样本平均值,(2)
6、样本方差,其观察值,它反映了总体均值的信息,其观察值,(3)样本标准差,其观察值,(4)修正样本方差,(5)样本 k 阶(原点)矩,其观察值,(6)样本 k 阶中心矩,其观察值,其观察值,样本矩具有下列性质:,性质4.1,证明,证明,再根据第四章辛钦定理知,性质4.2,由第四章关于依概率收敛的序列的性质知,以上结论是下一章所要介绍的矩估计法的理论根据.,四、小结,个体 总体,有限总体,无限总体,基本概念:,说明1一个总体对应一个随机变量X,我们将不区分总体和相应的随机变量,统称为总体X.,说明2在实际中遇到的总体往往是有限总体,它对应一个离散型随机变量;当总体中包含的个体的个数很大时,在理论上
7、可认为它是一个无限总体.,随机样本,总体,样本,样本值的关系,总体(理论分布),样本,样本值,?,统计是从手中已有的资料-样本值,去推断总体的情况-总体的分布F(x)的性质.,样本是联系二者的桥梁.,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体.,两个最重要的统计量:,样本均值,样本方差,四。常用抽样方法,一、单纯随机抽样二、系统抽样三、分层抽样四、整体抽样五、多阶段抽样,第4.2节 样本分布图,一、样本直方图 p83样本累积频率函数图,第4.3节 常用统计分布,一、常见分布,二、概率分布的分位数,三、小结,一、常见分布,一、,定理4.1,定理4.2
8、,二.,随机数演示,分布函数与密度函数演示,定理4.3,证明,定理4.4,(此性质可以推广到多个随机变量的情形),定理4.5,证明,由于,再由定理4.4可的(1)的证明.(2)证略,同理,t 分布又称学生氏(Student)分布.,三,当n充分大时,其图形类似于标准正态变量概率密度的图形.,证明,且两者独立,由 t 分布的定义知,定理4.6,定理4.7,证明,四.,定理4.8,证明,由于,二、概率分布的分位数,根据正态分布的对称性知,由分布的对称性知,在Matlab中求解,在Matlab中求解,在Matlab中求解,证明,三、小结,1.三个来自正态分布的抽样分布:,的定义,性质.,2.分位数的概念.,二、例题,