统计学基础知识.ppt

上传人:牧羊曲112 文档编号:6015757 上传时间:2023-09-14 格式:PPT 页数:78 大小:1.16MB
返回 下载 相关 举报
统计学基础知识.ppt_第1页
第1页 / 共78页
统计学基础知识.ppt_第2页
第2页 / 共78页
统计学基础知识.ppt_第3页
第3页 / 共78页
统计学基础知识.ppt_第4页
第4页 / 共78页
统计学基础知识.ppt_第5页
第5页 / 共78页
点击查看更多>>
资源描述

《统计学基础知识.ppt》由会员分享,可在线阅读,更多相关《统计学基础知识.ppt(78页珍藏版)》请在三一办公上搜索。

1、第二章 统计学基础知识,2.1 基本概念2.2 概率基础2.3几种常见的概率分布2.4抽样分布,总体具有共同性质的个体所组成的集团,称为总体;特征:(1)同质性;(2)变异性;(3)大量性。总体中的一个成员称为个体;含有有限个个体的总体称为有限总体;包含有无限多个个体的总体叫无限总体;样本从总体中随机抽取一部分个体所组成的集合。,第二章 统计学基础知识 第一节 基本概念,一、总体与样本,为了能可靠地从样本来估计总体,要求样本必须能够代表总体,才能正确估计总体。只有从总体中随机抽取的样本才具有代表性。随机抽取的样本是指总体中的每一个个体都有同等的机会被抽取组成样本。(等可能性)总体中所包含的每个

2、总体单元都是相互独立、相互无依存关系,被抽取的每个个体必须具有偶然性,这是随机抽样应遵守的基本原理。,第二章 统计学基础知识 第一节 基本概念,样本中所包含的个体数目叫样本容量或大小(sample size),常记为n。小样本:n30的样本;大样本:n 30的样本。划分大样本和小样本是必要的,因为二者的统计方法不同。研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。,第二章 统计学基础知识 第一节 基本概念,二、随机变量,第二章 统计学基础知识 第一节 基本概念,按变量的性质不同,一般可以分为数量性状资料、质量性状资料和半定量(等级)资料(一)数量性状资料

3、(quantitative trait)数量性状是指测试、调查的对象具有可度量或计数的性质,观察测定数量性状而获得的数据就是数量状资料。连续型变量又称计量资料,能用量测手段直接测定。离散型变量(不连续性或间断性)若某变量各变量之间只能以整数断开而不能表现为小数的。它只能用计数的方法取得。,(二)质量性状资粮 质量性状是指能观察到而不能之间测量的性状。如叶片的颜色,麦芒的有无等;污染水体的颜色、污染物的气味等。赋值法统计分析。,第二章 统计学基础知识 第一节 基本概念,(三)半定量或等级资料 半定量或等级资料是指观察单位按所考察的性状或指标的等级顺序分组,然后清点各组观察单位的次数而得到的资料。

4、,三、参数与统计数,第二章 统计学基础知识 第一节 基本概念,在同质性的前提下,总体具有变异性和大量性的特性。用于反映总体内部个体间的变异程度或集中性趋势等特征的指标为总体参数,简称参数。常用希腊字母表示参数,例如用表示总体平均数,用2表示总体方差;参数是反映某类事物的总体规律的数值,科研上目的就在于求得对总体参数的了解,总体参数是常数,但不易获得。利用样本资料计算得到的用于描述样本内部个体间的变异程度或集中趋势等特征的一些指标,如样本的平均数x、样本的标准差S等成为样本统计数,简称统计数,它是总体参数的估计值。,四、误差与错误,(一)误差系统误差:由某种确定的原因所引起的误差。特点是在相同条

5、件下重复测定时,可重复出现。是可以测定并校正或消除的。来源:(1)方法误差;(2)仪器误差;(3)试剂误差;(4)操作误差;(5)环境条件的变化误差。,偶然误差:是由很多不可避免且无法控制的偶然因素引起的误差。产生的原因不确定,其误差大小无规律性,不具“单向性”和“重现性”。偶然误差虽不可避免,也不能校正,但若在同样条件下对同一试样进行多次测定,就会发现随机误差的出现是服从统计规律的。可以利用数理统计方法对试验数据进行分析处理,增加重复次数。,第二章 统计学基础知识 第一节 基本概念,四、误差与错误,(二)错误 由于工作人员的粗心大意或不负责任(如仪器使用不当,错读数据,记录不准,任意涂改,凭

6、空杜撰等)所产生的测定值与真值的偏差,称为错误。错误不是统计学的研究内容 在试验和调查中,错误应当、同时也可以加以消灭,第二章 统计学基础知识 第一节 基本概念,五、准确性与精确性,准确性是指观测对象的观察值与其真值的偏离程度,偏离越小则试验越准确。精确性是指同一观测对象的重复观察值之间的彼些相符程度,即试验误差的大小,误差越小则试验越精确。在统计工作中,常用样本的统计数来估计总体参数。因此,我们用统计数接近参数的程度来衡量统计数的准确性高低,而用统计数的变异程度来衡量统计数的精确性高低。可见,准确性与精确性是不同的概念。在一般试验中真值为未知数,所以试验的准确性难以确定。精确性一般是指试验误

7、差,是可以估计的。如何正确估计试验误差,并减小试验误差以提高试验精度是试验方法设计的主要内容。,第二章 统计学基础知识 第一节 基本概念,一、随机现象与随机事件,(一)确定性现象与随机现象根据客观现象的特征,一般将其分为两类:一类是在一定条件下必然出现(或不出现)某种结果的现象,称之为确定性现象。另一类现象是在一定条件下具有多种可能过结果,具体出现哪一种结果事先是不能确定的,这种在给定条件下不能确定哪一种结果会出现的现象,称之为随机现象。随机现象是概率论中的主要研究对象。,第二章 统计学基础知识 第二节 概率基础,对随机现象进行观测称作随机试验。随机试验应具下列有三个特性:可重复性:即可以在相

8、同的条件下重复进行试验;非唯一性:即每次试验的可能结果不止一个,并且事先能明确试验的所有可能结果;随机性:即进行一次试验之前,不能确定哪一个结果会出现。随机试验的每一种结果或随机现象的每一种表现称作随机事件,简称为事件。一般用字母A,B,C,(必要时加下标)表示事件。有时也可用表示事件,括号中写明事件的内容。,第二章 统计学基础知识 第二节 概率基础,(二)随机试验与随机事件,二、概率的概念及其计算,对于一个随机事件来说,它在一次试验中,可能发生,也可能不发生。既然是可能性,就有可能性的大小问题。,第二章 统计学基础知识 第二节 概率基础,(一)概率的概念,在相同条件下,重复进行统一随机试验,

9、A是这个试验的一个结果(事件)。设试验的次数为n,在n次重复试验中A出现的次数为m,则事件A的频率为:,二、概率的概念及其计算,(一)概率的概念,当试验次数n较小时,频率的数值有较大的波动;当n充分大时,频率数值的波动明显减小,并且随着n的增大会趋于稳定在某个常数P。通过大量观测可以发现,随机试验的频率具有随试验次数增加而趋向稳定的性质,而频率的稳定值可以用来反映事件发生的可能性的大小。因此,可以说频率的稳定值P是随机事件A的概率。即,第二章 统计学基础知识 第二节 概率基础,二、概率的概念及其计算,设事件A的概率为P(A),它则具有如下性质:非负性,即 0 P(A)1规范性,即 P()=1(

10、必然事件)P()=0(不可能事件)对于两两互不相容事件Ai(i=1,2,),则有,(二)概率的性质,第二章 统计学基础知识 第二节 概率基础,小概率事件:随机事件的概率很小。例如小于0.05、0.01、0.001,这样的时间被称为小概率事件。小概率原理:把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理,亦称为小概率原理。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。,(二)概率的性质,二、概率的概念及其计算,第二章 统计学基础知识 第二节 概率基础,例1:袋中盛有除颜色外其他完全相同的50个不同颜色的小球,其中有10个白球,充分混匀后

11、随意摸出一球。求所摸为白球的概率。,(三)概率的计算1、古典型概率 如果一项随机试验的全部基本事件总数有限,并且各基本事件出现的可能性都相同,事件A由若干基本事件所组成,则A的概率可用下式计算,第二章 统计学基础知识 第二节 概率基础,2、概率的加法公式(1)任意事件加法公式 任意两个事件和(并)的概率,等于两事件概率的和再减去两事件同时发生的概率。即P(A+B)=P(A)+P(B)-P(AB)(2)互斥事件的加法公式 两个互斥事件A与B之和的概率,等于这两个事件的概率之和。即P(A+B)=P(A)+P(B),(三)概率的计算,第二章 统计学基础知识 第二节 概率基础,3、条件概率和乘法公式

12、在实际问题中,除了要知道事件A发生概率外,有时还需要知道在“事件B已发生”的条件下,事件A发生的概率,这种概率成为条件概率,记作P(AB)。,(三)概率的计算,例2:在某厂一天两个班次生产的350件产品中,第一班生产200件,含次品9件;第二班生产150件,含次品4件。现随机抽出一件产品,发现它是次品。问这件产品出自第一班的概率是多少?,第二章 统计学基础知识 第二节 概率基础,把上式的分子、分母同时除以350,得这里AB=所抽产品是第一班生产的次品。,解:记A=所抽产品是第一班生产的,B=所抽产品是次品。显然有但在已知事件B发生的条件下,A发生的概率就不同了,可以直观的写出条件概率为:把,第

13、二章 统计学基础知识 第二节 概率基础,由这个定义,可得到概率的乘法公式:设A与B是任意两个事件,且P(A)0,P(B)0,则P(AB)=P(B)P(AB)P(AB)=P(A)P(BA),这就导出了条件概率下列一般定义:设A,B是任意两个事件,且P(B)0,则称为“在事件B发生的条件下,事件A发生的条件概率”,简称“A关于B的条件概率”。,第二章 统计学基础知识 第二节 概率基础,例3:设一批产品共N件,其中有M件次品,不放回地抽取2件,求事件第一件抽到的是正品,第二件抽到的是次品的概率。解:记A=第一件是正品,B=第二件是次品,所求事件为AB。根据乘法公式,有P(AB)=P(A)P(BA)=

14、,第二章 统计学基础知识 第二节 概率基础,4、全概率公式 当计算比较复杂事件的概率时,如果可以把它分解成互不相容的一些简单事件,就可以用全概率公式计算其概率。全概率公式表述如下:设B1,B2,Bn为n个互不相容事件,且P(Bi)0(i=1,2,,n)。则任一事件A的概率为:,第二章 统计学基础知识 第二节 概率基础,例4:有3个工人被指定制作一批产品。第一个人制作这批产品的40%,第二个人制作35%,第三个人制作25%。第一个人废品率为0.04,第二个人废品率为0.06,第三个人废品率为0.03。现随机抽取一件产品,问这件产品为废品的概率是多少?解:记A=抽出的一件产品是次品,Bi=抽出的产

15、品是第i个工人制作的,(i=1,2,3)。显然,B1+B2+B3=,且B1,B2,B3两两互不相容。所以可以用全概率公式算出所抽一件是废品的概率。,第二章 统计学基础知识 第二节 概率基础,5、贝叶斯公式 由全概率公式可导出另一个重要公式贝叶斯公式,它是由英国数学家贝叶斯(Bayes Thomas)在1763 年发表的,其陈述如下:设B1,B2,Bn为n个互不相容事件,且P(Bi)0(i=1,2,,n)。A是任一事件,且P(A)0。则对任一Bi(i=1,2,,n),有,第二章 统计学基础知识 第二节 概率基础,例5:在例4中,若随机抽出的一件产品为废品,那么,这件产品由第一个、第二个、第三个工

16、人所制作的概率各是多少?解:,第二章 统计学基础知识 第二节 概率基础,贝叶斯公式的意义在于:设事件A已发生,我们需要判断引起A发生的“原因”。如果已知A发生的可能“原因”共有n个:B1,B2,Bn且两两互不相容。那么我们希望知道其中某个“Bi”的概率,也就是条件概率P(Bi/A)。在实际应用中,我们往往要求出每一个P(Bi/A)(i=1,2,n),然后找出其中最大的一个P(Bi/A),则Bi就是引起事件A 发生的最可能的“原因”。,贝叶斯公式在“风险决策”、“模式识别”等中有着广泛的应用。,第二章 统计学基础知识 第二节 概率基础,6、事件的独立性 对于两个事件A和B,假若事件B的发生会对事

17、件A发生的概率产生影响,即P(AB)P(A),称事件A与B之间统计相依。假若事件B的发生并不影响事件A发生的概率,称事件A与B之间统计独立。在事件A与B独立时,显然有P(AB)=P(A),这时,乘法公式成为:P(AB)=P(B)P(AB)=P(A)P(B)通常把这个关系式作为事件独立性的定义。即 设A与B是任意两个事件,如果满足 P(AB)=P(A)P(B)则称事件A与B独立,否则称事件A与B相依。,第二章 统计学基础知识 第二节 概率基础,(一)随机变量的概率分布随机变量的概率随机变量的一切可能值的集合(值域)及其相应的概率。在随机试验中,随机变量的各种取值是由一定的概率规律的,这种规律就是

18、随机变量的概率分布。随机变量有离散型随机变量和连续型随机变量两类,因而,其概率分布也也分为离散型概率分布和连续型概率分布。,三、随机变量的概率分布,第二章 统计学基础知识 第二节 概率基础,离散型随机变量x的每一个可能取值xi和随机变量取该值的概率p(xi)之间所确立的对应关系称作这个离散型随机变量的概率分布。这里x通过点数取得,其取值是离散的。P(x=xi)=pi(i=1,2,3,)称作离散型随机变量x的概率分布或概率函数。,三、随机变量及其概率分布,(二)离散型随机变量的概率分布,概率分布的性质,第二章 统计学基础知识 第二节 概率基础,离散型随机变量的分布律也可表示为,第二章 统计学基础

19、知识 第二节 概率基础,连续型随机变量其概率用概率分布密度函数来确定。即经测度取得的数值分布于某一数值区间,无法一一列举,只能列出随机变量的取值区间及其相应概率,或列出随机变量取值小于某一值的累积概率;连续型随机变量的概率分布可以用对应于一定区间的函数曲线下的面积来表示概率。对应于一连续型随机变量的整个取值区间,函数曲线下的面积设为1,该区建制内的某段对应的函数曲线下的面积为大于0且小于1的一个数值。,(三)连续型随机变量的概率分布,第二章 统计学基础知识 第二节 概率基础,概率分布的性质,第二章 统计学基础知识 第二节 概率基础,(三)连续型随机变量的概率分布,1、正态分布的重要性,正态分布

20、可以作为许多分布的近似分布,正态分布是自然界及工程技术中最常见的分布之一,大量的随机现象都是服从或近似服从正态分布的。,可以证明,如果一个随机指标受到诸多因素的影响,但其中任何一个因素都不起决定性作用,则该随机指标一定服从或近似服从正态分布,正态分布有许多良好的性质,这些性质是其它许多分布所不具备的,一、正态分布,第二章 统计学基础知识 第三节 几种常见的概率分布,2、正态分布的定义 正态分布又称高斯(Gauss)分布,是一种连续型随机变量的概率分布,应用非常广泛。它的分布状态是多数变量都围绕在均值左右,由均值到分布的两侧,变量数减少。,一、正态分布,第二章 统计学基础知识 第三节 几种常见的

21、概率分布,正态分布的概率密度函数为:则称随机变量x服从参数,2的正态分布,记作x N(,2)。f(x)是一给定变量值x的概率密度。,第二章 统计学基础知识 第三节 几种常见的概率分布,3、正态分布的特征正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x。f(x)在x=处达到极大,极大值f(x)是非负函数,以x轴为渐近线,分布从-至+。曲线在x=处各有一个拐点,即曲线在(-,-)和(+,+)区间上是下凸的,在-,+区间内是上凸的;正态分布有两个参数,即平均数和标准差。是位置参数,确定它在x轴上的位置;是变异度参数,确定正态分布的变异度。分布密度曲线与横轴所夹的面积为1,即:,第二章 统计学基础

22、知识 第三节 几种常见的概率分布,值不同值相同的三条正态曲线 值相同值不同的三条正态曲线,第二章 统计学基础知识 第三节 几种常见的概率分布,4、标准正态分布,一个正态分布,确定了它的中心位置,确定了它的变异度。但不同的正态分布有不同的和,所以N(,2)不是一条曲线,而是一个曲线系统。为了便于一般化的应用,需将正态分布标准化。首先,将随机变量x标准化,令:u 称为标准正态变量或标准正态离差,它表示离开均值有几个标准差。,第二章 统计学基础知识 第三节 几种常见的概率分布,正态分布的概率密度函数即可标准化为:(u)为标准正态分布的概率密度函数,即纵坐标高度。根据u 的不同取值,就可绘出标准正态分

23、布的图形:标准正态分布曲线 通过标准化,使正态分布的均值=0,标准差=1。因此,标准正态分布可记作 N(0,1)。,第二章 统计学基础知识 第三节 几种常见的概率分布,4、标准正态分布,第二章 统计学基础知识 第三节 几种常见的概率分布,5、正态分布的概率计算,对任何一个服从正态分布N(,2)的随机变量x,通过标准变换后,如果u为任意实数,可按下式计算:,对标准正态分布的区间概率计算方法如下:,第二章 统计学基础知识 第三节 几种常见的概率分布,例:已知某河段的悬浮物浓度服从正态分布,其平均值为600mg/L,标准差为100mg/L,求该河段悬浮物浓度在小于800mg/L和大于400mg/L区

24、间的概率?并求大于800mg/L的发生概率?,第二章 统计学基础知识 第三节 几种常见的概率分布,在数理统计分析中,不仅注意随机变量x落在平均数加减不同倍数标准差区间(-k,+k)之内的概率,更关心的是x落在此区间之外的概率。把随机变量x落在平均数加减不同倍数标准差区间之外的概率称为双侧概率(两尾概率),记作。,第二章 统计学基础知识 第三节 几种常见的概率分布,对应于双侧概率,也可以求得随机变量x小于-k或大于+k的概率,称为单侧概率(一尾概率),记作2。,6、单侧概率与双侧概率,第二章 统计学基础知识 第三节 几种常见的概率分布,二、二项分布,1、贝努利试验及其概率公式 将某随机试验重复进

25、行n次,若各次试验结果互不影响,即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n次试验是独立的。在生物学研究中,我们经常碰到的一类离散型随机变量,如入孵n枚种蛋的出雏数、n头病畜治疗后的治愈数、n 尾鱼苗的成活数等,可用贝努利试验来概括。,在n重贝努利试验中,事件A可能发生0,1,2,n次,现在我们来求事件A 恰好发生k(0kn)次的概率Pn(k)。,第二章 统计学基础知识 第三节 几种常见的概率分布,二、二项分布,1、贝努利试验及其概率公式,先取n=4,k=2来讨论。在4次试验中,事件A发生2次的方式,第二章 统计学基础知识 第三节 几种常见的概率分布,二、二项分布,1、贝努利

26、试验及其概率公式,第二章 统计学基础知识 第三节 几种常见的概率分布,二、二项分布,2、二项分布的定义及性质,第二章 统计学基础知识 第三节 几种常见的概率分布,二、二项分布,2、二项分布的定义及性质,二项分布由n和p两个参数决定:(1)当p值较小且n不大时,分布是偏倚的。但随着n的增大,分布逐渐趋于对称;(2)当p值趋于0.5时,分布趋于对称;,第二章 统计学基础知识 第三节 几种常见的概率分布,二、二项分布,2、二项分布的定义及性质,(3)对于固定的n及p,当k增加时,Pn(k)先随之增加并达到其极大值,以后又下降。,(4)此外,在n较大,np、nq较接近时,二项分布接近于正态分布;当n时

27、,二项分布的极限分布是正态分布,2、二项分布的定义及性质,第二章 统计学基础知识 第三节 几种常见的概率分布,二、二项分布,3、二项分布的平均数和标准差,统计学证明,服从二项分布B(n,p)的随机变量x的平均数、标准差与参数n、p有如下关系。设x B(n,p),那么,二项分布的总体特征数为:,均值=np,标准差=,方差2=npq,例:在毒理学试验中,试验金鱼染毒后,死亡率为20,求5条金鱼染毒后死亡数各可能值相应的概率。,第二章 统计学基础知识 第三节 几种常见的概率分布,二、二项分布,4、二项分布的概率计算及应用条件,解:设5条金鱼染毒后死亡数为x,则x服从二项分布(5,0.2),其所有可能

28、取值为0,1,2,5,则计算概率用分布列表示如下:,二项分布的应用条件有三:(1)各观察单位只具有互相对立的一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料;(2)已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-p=q,实际中要求p 是从大量观察中获得的比较稳定的数值;(3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。,第二章 统计学基础知识 第三节 几种常见的概率分布,二、二项分布,4、二项分布的概率计算及应用条件,第二章 统计学基础知识 第三节 几种常见的概率分布,三、泊松分布,波松分布是一种可以用来描述和分析随机地发生在单

29、位空间或时间里的稀有事件的概率分布。要观察到这类事件,样本含量n必须很大。在生物、医学研究中,服从泊松分布的随机变量是常见的。如,一定畜群中某种患病率很低的非传染性疾病患病数或死亡数,畜群中遗传的畸形怪胎数,每升饮水中大肠杆菌数,计数器小方格中血球数,单位空间中某些野生动物或昆虫数,医院门诊单位时间内就诊患者数等,都是服从波松分布的。,泊松分布的背景及应用,二十世纪初卢瑟福和盖克两位科学家在观察与分析放射性物质放出的粒子个数的情况时,他们做了2608次观察(每次时间为7.5秒)发现放射性物质在规定的一段时间内,其放射的粒子数X 服从泊松分布.,第二章 统计学基础知识 第三节 几种常见的概率分布

30、,电话呼唤次数,交通事故次数,商场接待的顾客数,地震,火山爆发,特大洪水,第二章 统计学基础知识 第三节 几种常见的概率分布,第二章 统计学基础知识 第三节 几种常见的概率分布,三、泊松分布,1、定义,若随机变量x(x=k)只取零和正整数值0,1,2,且其概率分布为k=0,1,其中0;则称x服从参数为的波松分布,记为xP()。波松分布作为一种离散型随机变量的概率分布有一个重要的特征,这就是它的平均数和方差相等,都等于常数,即=2=。利用这一特征,可以初步判断一个离散型随机变量是否服从波松分布。,波松分布的意义 是波松分布所依赖的唯一参数。值愈小分布愈偏倚,随着的增大,分布趋于对称。当=20时分

31、布接近于正态分布;当=50时,可以认为波松分布呈正态分布。所以在实际工作中,当20时就可以用正态分布来近似地处理波松分布的问题。,不同的波松分布,第二章 统计学基础知识 第三节 几种常见的概率分布,三、泊松分布,波松分布的概率计算,依赖于参数的确定,只要参数确定了,把k=0,1,2,代入公式即可求得各项的概率。但是在大多数服从波松分布的实例中,分布参数往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为的估计值,将其代替式中的,计算出k=0,1,2,时的各项概率。,第二章 统计学基础知识 第三节 几种常见的概率分布,三、泊松分布,2、泊松分布的概率计算,第二章 统计学基础知识 第三

32、节 几种常见的概率分布,三、泊松分布,2、泊松分布的概率计算,例:为监测饮用水的污染情况,检验了某社区每毫升饮用水中细菌总数,共得400个记录,结果见下表。试分析饮用水中细菌数的分布是否服从泊松分布。若服从,按泊松分布计算每毫升水中细菌数的概率及理论次数并将次数分布与泊松分布作直观比较。,经计算得每毫升水中平均细菌数=0.5,方差S2=0.496,第二章 统计学基础知识 第三节 几种常见的概率分布,三、泊松分布,2、泊松分布的概率计算,第二章 统计学基础知识 第三节 几种常见的概率分布,三、泊松分布,2、泊松分布的概率计算,前面讨论的三个重要的概率分布中,前1个属连续型随机变量的概率分布,后2

33、个属离散型随机变量的概率分布。三者间的关系如下:对于二项分布,在n,p0,且n p=(较小常数)情况下,二项分布趋于波松布。在这种场合,波松分布中的参数用二项分布的n p代之;在n,p0.5时,二项分布趋于正态分布。在这种场合,正态分布中的、2用二项分布的n p、n p q代之。在实际计算中,当p0.1且n很大时,二项分布可由波松分布近似;当p0.1且n很大时,二项分布可由正态分布近似。对于波松分布,当时,波松分布以正态分布为极限。在实际计算中,当20(也有人认为6)时,用波松分布中的代替正态分布中的及2,即可由后者对前者进行近似计算。,第二章 统计学基础知识 第三节 几种常见的概率分布,第二

34、章 统计学基础知识 第四节 抽样分布,研究总体与所抽取的样本之间的关系是统计学的中心内容。对这种关系的研究从两方面着手:一是从总体到样本,这就是研究抽样分布(sampling distribution)的问题;二是从样本到总体,这就是统计推断(statistical inference)问题。,第二章 统计学基础知识 第四节 抽样分布,总体随机抽样(random sampling)的方法可分为有返置抽样和不返置抽样两种。前者指每次抽出一个个体后,这个个体应返置回原总体;后者指每次抽出的个体不返置回原总体。对于无限总体,返置与否都可保证各个体被抽到的机会相等。对于有限总体,就应该采取返置抽样,否

35、则各个体被抽到的机会就不相等。,第二章 统计学基础知识 第四节 抽样分布,由总体中随机地抽取若干个体组成样本,即使每次抽取的样本含量相等,其统计量(如,S)也将随着样本的不同而有所不同,因而样本统计量也是随机变量,也有其概率分布。我们把统计量的概率分布称为抽样分布。,第二章 统计学基础知识 第四节 抽样分布,样本平均数也是一个随机变量,其概率分布叫做样本平均数的抽样分布。由样本平均数构成的总体称为样本平均数的抽样总体。其平均数和标准差分别记为 和。是样本平均数抽样总体的标准差,简称标准误,它表示平均数抽样误差的大小。统计学上已证明:,=,,一、u分布,1、从单个正态总体中抽出的随机样本的平均数

36、分布,第二章 统计学基础知识 第四节 抽样分布,样本均数的概率密度:,标准正态变换,则 nN(0,1),一、u分布,第二章 统计学基础知识 第四节 抽样分布,一、u分布,2、从两个正态总体中抽出的随机样本的平均差数分布,设X1,X2,且X1与 X2相互独立,由这两个总体中抽样(无论样本容量n1、n2多大),则样本平均数之差()服从正态分布,即,且总体参数有如下关系:,第二章 统计学基础知识 第四节 抽样分布,一、u分布,3、从一个二项总体中抽出的随机样本的平均数分布,第二章 统计学基础知识 第四节 抽样分布,二、t 分布,样本均数标准误,以样本标准差S代替所得到的统计量 记为t。,第二章 统计

37、学基础知识 第四节 抽样分布,在计算 时,由于采用S来代替,使得t 变量不再服从标准正态分布,而是服从t 分布。它的概率分布密度函数如下:,式中,df=n-1为自由度,t的取值范围是(-,+),二、t 分布,伽玛函数,第二章 统计学基础知识 第四节 抽样分布,t分布的平均数和标准差为:,t0,(df2),(df1),第二章 统计学基础知识 第四节 抽样分布,(1)t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。(2)t分布密度曲线以纵轴为对称轴,左右对称,且在t0时,分布密度函数取得最大值。(3)与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df

38、越大,t分布越趋近于标准正态分布。当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n时,t 分布与标准正态分布完全一致。,t 分布的特点是:,第二章 统计学基础知识 第四节 抽样分布,三、分布,如果 是来自正态总体 的一个随机样本,则统计量值的计算公式如下:,分布密度曲线(卡方),(4),分布的形状取决于参数df,,df1时,曲线极端左偏,呈反J型;随着df的增大,曲线渐趋左右对称。当df30时,分布已趋向于正态分布。,第二章 统计学基础知识 第四节 抽样分布,四、F分布,在一个平均数为,方差为 的正态总体中,随机抽取自由度为df1和df2的两个独立样本,其样本方差分别为 和,则方差的比值定义为F,即:,第二章 统计学基础知识 第四节 抽样分布,F 分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称,如图所示。,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号