第5章抽样调查12课件.ppt

上传人:小飞机 文档编号:2109283 上传时间:2023-01-11 格式:PPT 页数:107 大小:571.34KB
返回 下载 相关 举报
第5章抽样调查12课件.ppt_第1页
第1页 / 共107页
第5章抽样调查12课件.ppt_第2页
第2页 / 共107页
第5章抽样调查12课件.ppt_第3页
第3页 / 共107页
第5章抽样调查12课件.ppt_第4页
第4页 / 共107页
第5章抽样调查12课件.ppt_第5页
第5页 / 共107页
点击查看更多>>
资源描述

《第5章抽样调查12课件.ppt》由会员分享,可在线阅读,更多相关《第5章抽样调查12课件.ppt(107页珍藏版)》请在三一办公上搜索。

1、第五章,9/24/2022,第五章9/24/2022,本 章 内 容,第一节 抽样调查概述,第二节 抽样调查的数理基础,第三节 抽样误差与参数估计,第四节 抽样调查的组织方式,9/24/2022,本 章 内 容第一节 抽样调查概述第二节 抽样调查的数理基,综合指标,总量指标,相对指标,平均指标,变异指标,反映总体数量特征,如何取得总体指标数据?一是通过全面调查方式,如普查、全面统计报表等。二是通过抽样调查(即抽样推断)方式。,9/24/2022,综合指标总量指标相对指标平均指标变异指标反映总体数量特征如何,.,第一节 抽样调查概述,一、抽样调查的概念、特点及作用 二、抽样调查中的基本概念 三、

2、抽样调查的一般步骤,9/24/2022,.第一节 抽样调查概述 一、抽样调查的概念、特,(一)抽样调查的概念(二)抽样调查的特点(三)抽样调查的应用场合(四)抽样调查推断总体的两种类型,一、抽样调查的概念、特点及作用,9/24/2022,(一)抽样调查的概念 一、抽样调查的概念、特点及作用9,抽样调查是以概率论和数理统计理论为基础,按照随机原则从调查总体中抽取一部分单位作为样本进行调查,再用样本数值,对总体数量特征作出具有一定可靠程度的推断。也称为抽样推断、抽样估计或统计推断,是一种非全面调查。,,,(一)抽样调查的概念,9/24/2022,抽样调查是以概率论和数理统计理论为基础,按照随机原则

3、从调,抽样,样本,n=100,总体,N=10000,推断,(总体指标),(样本指标),【例】要得到某厂生产10000只灯泡的平均耐用时间,就只能采用抽样调查的方法,从中随机抽取100只灯泡组成样本,对样本进行检验。,9/24/2022,抽样 样本n=100总体N=10000推断(总体指标),(二)抽样调查的特点,实施随机抽样的原因:能使样本分布与总体分布相同或相近,使样本代表性变强。能使样本统计量成为具有一定分布规律的随机变量,可以根据样本统计量的分布规律,运用概率理论对抽样调查结果的误差进行计算和评价。,2、调查目的是根据样本指标来推断总体;3、在调查之前可以计算出抽样误差和控制大小;4、运

4、用概率对总体进行估计和推断。,1、实施随机抽样,即按照随机原则从总体中抽取样本,使各个调查单位被抽中的概率相等。,9/24/2022,(二)抽样调查的特点实施随机抽样的原因:2、调查目的是根据,(三)抽样调查的应用用于不能用全面调查方式进行调查的现象。,用于通过全面调查后结果将失去意义的现象。,如调查某地区的矿藏、某城市的空气质量等。,如炮弹射程的测量,电视、灯泡等耐用时数的检验等属于破坏性调查。,用于经全面调查后成本过高或调查精度要求不高的现象。,如某市居民家计调查,某林区的木材储存量调查等。,9/24/2022,(三)抽样调查的应用用于通过全面调查后结果将失去意义的现象,用于调查时效性要求

5、较强的现象。,如为满足领导机关及时制订政策、安排工作需要而进行的民意测验,某农产品的产量调查等。,1994年,我国确立了以周期性普查为基础,以经常性抽样调查为主体,同时辅之以重点调查、科学核算等综合运用的统计调查方法体系,抽样调查的主体方法地位得以正式确立。,5.用于修正全面调查的结果。,如在人口普查结束后,运用抽样调查的方法对普查结果进行修正等。,9/24/2022,用于调查时效性要求较强的现象。如为满足领导机关及时制订政,(四)抽样调查推断总体的两种类型一类是参数估计:研究的是用样本指标(统计量)估计总体指标(参数)的方法。一类是假设检验:它是先对总体参数或特征提出一个假设,然后利用样本信

6、息去检验这个假设是否成立。如果成立,就接受这个假设;如果不成立,就放弃这个假设。例:,【例】对可口可乐公司生产的一种瓶装雪碧产品进行检查,包装上标明其净含量是500ml。在市场上随机抽取了50瓶,测得到其平均含量为499.5ml,标准差为2.63ml。根据这些数据可以进行:,一是参数估计:用95%的概率保证,该种包装的雪碧平均含量在498.77-500.23ml之间;,二是假设检验:根据样本数据结合统计分布规律,对“该种瓶装雪碧重量不符合所标明的重量”假设进行否定或肯定。,9/24/2022,(四)抽样调查推断总体的两种类型【例】对可口可乐公司生产的一,二、抽样调查中的基本概念,(一)抽样调查

7、中常用的指标(二)抽样方法(三)抽样框(四)样本的可能个数,9/24/2022,二、抽样调查中的基本概念(一)抽样调查中常用的指标9/2,总体:即根据研究目的确定的所要研究的同类事物的全体,也称为全集总体、母体。总体单位:组成总体的各个单位,也称为个体或子体。总体容量:总体单位的总数,一般用“N”表示。,1、总体与总体指标,9/24/2022,总体:即根据研究目的确定的所,总体参数的具体形式见后表:抽样调查中常用的指标,总体指标,或总体参数:它是用来反映总体数量特征的指标。,总体,是唯一确定的,注意:由于总体是唯一确定的,所以总体指标也是唯一确定的,但又是未知的,需要用样本指标来估计。,总体参

8、数,9/24/2022,总体参数的具体形式见后表:抽样调查中常用的指标总体指标,或总,总体,是唯一确定的,样本:也称为抽样总体,是从总体中按随机原则抽取出来的一部分单位的组成集合体,作为总体的代表。,样本容量:样本中包含的单位数,一般用n表示。n30为大样本,n30为小样本,样本k,由于抽样方法和样本容量的不同,从一个总体中可以抽出许多个不同的样本。在实际调查时,一般只从总体中抽取一个或几个样本进行调查,哪一个样本被抽到完全是随机的。,2、样本与样本指标,不是唯一确定的,9/24/2022,总体是唯一确定的 样本:也称为抽样总,样本指标是随机变量,它会随着样本的不同而有不同的取值。,样本指标,

9、也称为样本统计量、估计量:是根据样本中各个单位数据计算的反映样本特征的指标。,抽样调查中常用的指标:总量指标 平均数(均值)方差或标准差 成数或比例(是非标志比重)(计算公式见下表),注意:总体指标(参数)和样本指标(统计量)是一一对应的。,9/24/2022,样本指标是随机变量,它会随着样本的不同而有不同的取值。样本指,是唯一确定的,是随机变量,它会随着样本的不同而有不同的取值,总体平均 数,总体标准 差,样本平均 数,样本标准 差,总体平均 数,总体标准 差,样本平均 数,总体成数,样本标准 差,变量总体,属性总体,性质,变量样本,属性样本,性质,表5-1 抽样调查中常用指标及计算公式,9

10、/24/2022,参数(总体指标),(二)抽样方法,重复抽样 不重复抽样,9/24/2022,(二)抽样方法 重复抽样9/24/2022,1、重复抽样,即指要从总体的N个单位中随机抽取一个单位数为n的样本,每次抽出一个单位记录其特征后,再放回总体中参加下一次抽选。这样连续抽n次即得到所需样本。,(即每次抽取是独立的,条件相同),(重置抽样,有放回的抽样),9/24/2022,1、重复抽样 即指要从总体的N个单位中随机抽取一个单位数,2、不重复抽样(不重置抽样,无放回的抽样),即每次从总体N个单位中随机抽出一个单位后,就不再放回总体中,下一个样本单位再从余下的总体单位中抽取。这样连续抽n次即得到

11、一个单位数为n的样本。,(即每次抽取不是独立的,条件不同),9/24/2022,2、不重复抽样(不重置抽样,无放回的抽样)即每次从总体N,概率抽样(随机抽样):是指按照随机原则抽取样本单位。,非概率抽样(非随机抽样):是指调查单位的抽取是非随机的。重点调查、典型调查、方便抽样中单位的选取就属于非随机抽样形式。在抽样调查中有时也采用非概率抽样方式抽取样本。,此外,从抽取样本的随机性看,分为两类形式:,9/24/2022,概率抽样(随机抽样):是指按照随机原则抽取样本单位,抽样框是包括全部总体单位名单的框架。实施概率抽样必须具备抽样框。,抽样框的形式有:,名单抽样框:列出全部单位名单的一览表。,区

12、域抽样框:按地理位置将总体范围划分为若干小的 区域,以小区域为抽样单位。,时间表抽样框:将总体全部单位按时间顺序排列,把总 体的时间分为若干小段时间,以各个小 段的时间单位为抽样单位。,(三)抽样框,9/24/2022,抽样框是包括全部总体单位名单的框架。抽样框的形式有:名,(四)样本的可能个数它是指从总体N个单位中随机抽选n个单位构成样本,结果有排列组合,一种排列组合便构成一个可能的样本,排列组合的总数称为样本的可能个数。,【例】假设总体有A、B、C、D、E五个单位,现纯随机重复抽取2个单位组成样本,求全部可能样本个数。,(N=5 n=2),9/24/2022,(四)样本的可能个数【例】假设

13、总体有A、B、C、D、E五个,(1)在 n 次抽样中,总体每个单位在各次抽样中被抽取的概率都相同(即均为 1N);,重复抽样的特点:,(2)共可组成 个样本,每个样本在各次抽样中被抽取的概率都相同(即均为1k)。,(抽后放回),第二次抽取:,则所有可能的样本个数为:,AA AB AC AD AE BA BB BC BD BECA CB CC CD CEDA DB DC DD DE EA EB EC ED EE,即:,第一次抽取:,解:,9/24/2022,(1)在 n 次抽样中,总体每个单位在各次抽样中被抽取的概率,【例】假设总体有A、B、C、D、E五个单位,现纯随机不重复抽取2个单位组成样本

14、,求全部可能样本个数。,(N=5 n=2),第一次抽取:,第二次抽取:,则所有可能的样本个数为:,AB AC AD AE BA BC BD BECA CB CD CEDA DB DC DE EA EB EC ED,(抽后不放回),解:,9/24/2022,【例】假设总体有A、B、C、D、E五个单位,现纯随机不重复抽,(1)n次抽样中,总体每个单位在各次抽样中被抽取的概率不相同(第1次是1N,第2次是1N1,);,(2)可组成k=N(N1)(N 2)(N n+1)个样本,每个样本在各次抽样中被抽取的概率都相同(即均为1k)。,不重复抽样的特点:,9/24/2022,(1)n次抽样中,总体每个单位

15、在各次抽样中被抽取的概率不相同,可能的样本个数计算公式,9/24/2022,抽样方法重复抽样不重复抽样考虑顺序不考虑顺序可能的样本个数计,设计抽样方案,抽取样本单位,收集样本数据,计算样本统计量,推断总体,三、抽样调查的一般步骤,界定调查总体选择收集资料的方式选择抽样框确定抽样组织形式确定抽样方法确定样本单位数,抽取样本评估样本,9/24/2022,设计抽样方案抽取样本单位收集样本数据计算样本统计量推断总体三,.,.,随机原则,样本,n=100,总体,N=10000,推断,(抽样误差),(总体指标),(样本指标),M个样本,抽样实际误差,抽样平均误差,(可以计算),(无法计算),抽样极限误差,

16、概率度,置信度(概率),9/24/2022,.随机原则 样本n=100总体N=1000,.,第二节 抽样调查的数理基础,一、概率 二、随机变量及其分布 三、大数定律和中心极限定理 四、抽样分布,9/24/2022,.第二节 抽样调查的数理基础 一、概率9/24/,一、概率,(一)随机事件(二)事件的概率(三)概率的基本性质,9/24/2022,一、概率(一)随机事件9/24/2022,随机现象:在一定条件下可能发生也可能不发生的现象。如,“一分钟内从某十字路口通过30辆汽车”“抛一次硬币,正面朝上”。,随机试验:对随机现象进行观察的过程。,可在相同条件下重复进行;所有可能结果可知;事先不能肯定

17、哪一结果出现。,须满足三个条件:,与随机现象相对应的是确定性现象,是指在一定条件下,能够明确预见其结果的现象。,(一)随机事件,9/24/2022,随机现象:在一定条件下可能发生也可能不发生的现象。随机试,随机事件:随机试验的每一可能结果。,基本事件(样本点):不可能再分的事件;例如:掷一枚骰子出现的点数,有“1”、“2”“6”6个样本空间(基本空间):基本事件的全体()。一个试验中所有基本事件的集合,用表示例如:在掷枚骰子的试验中,1,2,3,4,5,6在投掷硬币的试验中,正面,反面,9/24/2022,随机事件:随机试验的每一可能结果。基本事件(样本点):不,复杂事件:由某些基本事件组合而

18、成的事件。必然事件:每次试验必然发生的事件()。,不可能事件:每次试验必然不会发生的事件()。,例如,在掷一枚骰子观察点数的试验中,“出现的点数不超过6”是必然事件;“出现8点”是不可能事件;“出现点数是奇数”是复杂事件,是由若干个基本事件组合而成的。,9/24/2022,复杂事件:由某些基本事件组合而成的事件。不可能事件:每,(二)事件的概率,概率(几率)是指随机事件发生的可能性。事件A的概率是对事件A在试验中出现的可能性大小的一种度量;表示事件A出现可能性大小的数值;事件A的概率表示为P(A);概率的定义有:古典定义、统计定义和主观概率定义,9/24/2022,(二)事件的概率概率(几率)

19、是指随机事件发生的可能性。事件A,古典定义:某一事件A发生的概率,是该事件所包含的基本事件数 m与基本空间中基本事件总数n 的比值。(客观存在),【例】投掷 2 枚骰子,求 2 枚骰子中至少有一枚出现 6 点,且点数之和为偶数的概率。,解:A有“(6,2),(6,4),(6,6),(2,6),(4,6)”5种;,9/24/2022,古典定义:【例】投掷 2 枚骰子,求 2 枚骰子中至少有一,【例】某钢铁公司所属三个工厂的职工人数如下表。从该公司中随机抽取1人,问:(1)该职工为男性的概率;(2)该职工为炼钢厂职工的概率。,9/24/2022,【例】某钢铁公司所属三个工厂的职工人数如下表。从该公

20、司中随机,解:(1)用A 表示“抽中的职工为男性”这一事件;A为全公司男职工的集合;基本空间为全公司职工的集合。则,(2)用B 表示“抽中的职工为炼钢厂职工”;B为炼钢厂 全体职工的集合;基本空间为全体职工的集合。则,9/24/2022,解:(2)用B 表示“抽中的职工为炼钢,统计定义:在相同条件下重复进行n次试验,事件A发生m次,随着试验次数n的增大,事件A发生的频率 m/n 围绕某一常数p上下波动的幅度愈来愈小,且逐步趋于稳定,则称p为事件A的概率。(多次试验),(5.2),如:,9/24/2022,统计定义:(5.2)如:9/24/2022,【例】投掷一枚硬币,出现正面和反面的频率,随着

21、投掷次数 n 的增大,出现正面和反面的频率稳定在1/2左右,9/24/2022,【例】投掷一枚硬币,出现正面和反面的频率,随着投掷次数 n,【例】某工厂为节约用电,规定每天的用电量指标为1000度。按照上个月的用电记录,30天中有12天的用电量超过规定指标,若第二个月仍没有具体的节电措施,试问该厂第一天用电量超过指标的概率。解:上个月30天的记录可以看作是重复进行了30次试验,试验A表示用电超过指标出现了12次。根据概率的统计定义有,9/24/2022,【例】某工厂为节约用电,规定每天的用电量指标为1000度。按,主观定义:人们根据经验和所掌握的有关信息,对事件发生的可能性大小给出的估计值。(

22、调查研究),例如,高考填志愿时,某考生估计自己被一本第一志愿录取的可能性为80%;如果一本落榜,被二本第一志愿录取的可能性为99%。,9/24/2022,主观定义:例如,高考填志愿时,某考生估计自己被一本第一志,(三)概率的基本性质,非负性对任意事件A,有 0 P 1规范性必然事件的概率为1;不可能事件的概率为0。即P()=1;P()=0可加性若A与B互斥,则P(AB)=P(A)+P(B)推广到多个两两互斥事件A1,A2,An,有 P(A1A2 An)=P(A1)+P(A2)+P(An),9/24/2022,(三)概率的基本性质非负性9/24/2022,(四)概率的加法法则(两个)法则1:两个

23、互斥事件之和的概率,等于两个事件概率之和。假设A和B是互斥事件,则:,法则2:对于任意两个随机事件,它们之和的概率等于两事件的概率之和减去两事件之交的概率。即:,9/24/2022,(四)概率的加法法则(两个)法则1:两个互斥事件之和的概,【例】设某地有甲、乙两种报纸,该地成年人中有20读甲报纸,16读乙报纸,8两种报纸都读,问成年人中有百分之几至少读一种报纸?解:设A读甲报纸,B读乙报纸,C至少读一种报纸,则:由题意知于是即有28的成年人至少读一种报纸。,9/24/2022,【例】设某地有甲、乙两种报纸,该地成年人中有20读甲报纸,,二、随机变量及其分布,(一)随机变量(二)离散型随机变量的

24、概率分布(三)连续型随机变量的概率分布(四)正态分布,9/24/2022,二、随机变量及其分布(一)随机变量9/24/2022,随机变量的概念:描述随机现象某一侧面的变量,是对一次试验的结果的数值性描述。一般用 X、Y、Z 来表示。,随机变量的特点:取值的随机性;取值的规律性。,3.随机变量的种类:根据取值情况的不同分 离散型随机变量 连续型随机变量,(一)随机变量,9/24/2022,随机变量的概念:描述随机现象某一侧面的变量,是对一次试验的,(1)离散型随机变量,概念:随机变量 X 取有限个值或所有取值都可以逐个列举出来 X1,X2,离散型随机变量的例子:,9/24/2022,(1)离散型

25、随机变量概念:随机变量 X 取有限个值或所有取值,(2)连续型随机变量,概念:随机变量 X 取无限个值。取数轴上某一区间内的任意点。所有可能取值不可以逐个列举出来。连续型随机变量的例子:,9/24/2022,(2)连续型随机变量概念:随机变量 X 取无限个值。试验随机,1、概念:先列出离散型随机变量X的所有可能取值;再列出随机变量取这些值的概率。用下面的表格来表示:,P(X=xi)=pi称为离散型随机变量的概率函数,(二)离散型随机变量的概率分布,pi0,9/24/2022,1、概念:先列出离散型随机变量X的所有可能取值;再列出随机变,2、离散型随机变量的概率分布举例:,【例】如规定打靶中域得

26、3分,中域得2分,中域得1分,中域外得0分。今某射手每100次射击,平均有30次中域,55次中域,10次中,5次中域外。则考察每次射击得分为0,1,2,3这一离散型随机变量,其概率分布为,9/24/2022,2、离散型随机变量的概率分布举例:【例】如规定打靶中域得3,3、离散型随机变量的概率分布的类型,9/24/2022,超几何分布离散型随机变量的概率分布泊松分布二项分布3、离散型,(1)二项分布(01分布),产生二项分布的过程称为贝努里试验。每一次试验只有两个结果的重复试验称为贝努里试验。,贝努里试验的特点:,第一,每次试验只有两种可能结果:成功或失败、是或否第二,不管进行多少次,任何一次试

27、验结果的概率是固定的第三,试验是相互独立的,9/24/2022,(1)二项分布(01分布)产生二项分布的过程称为贝努,一个离散型随机变量X只取两个可能的值;例如:男性用 1表示,女性用0表示;合格品用 1 表示,不合格品用0表示列出随机变量取这两个值的概率,就形成二项分布。,随机变量X服从参数n和p的二项分布,记为:,其期望值等于,其方差等于。,9/24/2022,一个离散型随机变量X只取两个可能的值;随机变量X服从参数n和,【例】已知一批产品的次品率为p0.05,合格率为q=1-p=1-0.5=0.95。并指定废品用1表示,合格品用0表示。则任取一件为废品或合格品这一离散型随机变量,其概率分

28、布为,二项分布的概率分布表达式:,9/24/2022,【例】已知一批产品的次品率为p0.05,合格率为q=1-p,(2)泊松分布,泊松分布是一种描述离散型随机变量的概率分布。若 代表离散型随机变量,值可以取,用小写的 表示变量 可能取的某个具体值,则事件恰好发生 次的泊松分布公式为:,式中:,是 的期望和方差,是自然对数的底,约等于2.71828,是 的阶乘,9/24/2022,(2)泊松分布泊松分布是一种描述离散型随机变量的概率分布。若,=2,=3,=5,=10,=15,泊松分布图一般是正偏斜的,值越小,偏斜度越大,随着 的值的增大,偏斜度逐渐缩小。如左图所示。,9/24/2022,=2=3

29、=5=10=,当要研究在指定时间或空间区间内随机现象发生的问题时,比如说,单位时间、单位长度或单位面积上观察到的次品数,或在某一固定时间区间内到达某加油站的顾客数,以及某企业每月发生的工伤事故次数等等,就产生了泊松分布的重要应用。泊松分布可以用于解决指定时间或空间区间内随机现象发生的问题。,当二项试验中样本容量 很大而成功的概率 很小时,那么,二项概率一般可以采用泊松分布所产生的相应概率来逼近。为了逼近二项概率分布,可以令。当 很大而 又很小(为最佳)时,泊松分布就成了二项概率的良好近似方法。,9/24/2022,当要研究在指定时间或空间区间内随机现象发生的问题时,比如说,,(3)超几何分布,

30、二项分布主要用于计算有限总体重复抽样的概率,而如果在有限总体中进行不重复抽样,就会破坏有关贝努里试验独立性的条件。而超几何分布就是研究不重复抽样的适当的模型。,若随机变量具有下述概率密度函数,则称为服从超几何分布,9/24/2022,(3)超几何分布 二项分布主要用于计算有限总体重复抽样,一个离散型随机变量取各个值的概率相同。列出随机变量取值及其取值的概率,就形成了均匀分布。,(4)均匀分布,9/24/2022,一个离散型随机变量取各个值的概率相同。(4)均匀分布9/2,【例】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为,9/24/2022,【例】投掷一枚骰子,出现的点数是个离散型

31、随机变量,其概率分布,期望值在描述具体的统计数据时,我们使用均值来描述数据的集中趋势。而期望值是均值的一种推广,它反映随机变量的平均水平。方差除了随机变量的平均水平之外,有时我们还要测定它的离散程度。前面我们曾用方差来描述数据的离散程度。同样,这里我们用随机变量的方差来反映随机变量取值的离散程度。,4、离散型随机变量的数学期望和方差,9/24/2022,期望值在描述具体的统计数据时,我们使用均值来描述数据的,离散型随机变量的数学期望,概念:在离散型随机变量X的一切可能取值的完备组中,各可能取值xi与其取相对应的概率pi乘积之和。作用:描述离散型随机变量取值的集中程度公式:,9/24/2022,

32、离散型随机变量的数学期望概念:在离散型随机变量X的一切可能取,概念:随机变量X的每一个取值与期望值的离差平方和的数学期望,记为D(X)。作用:描述离散型随机变量取值的分散程度公式:,离散型随机变量的方差,9/24/2022,概念:随机变量X的每一个取值与期望值的离差平方和的数学期望,,例:离散型随机变量的指标计算,【例】投掷一枚骰子,出现的点数是个离散型随机变量,其概率分布为如下。计算数学期望和方差,解:数学期望为:,方差为:,9/24/2022,例:离散型随机变量的指标计算【例】投掷一枚骰子,出现的点数是,(三)连续型随机变量的概率分布,由于连续型随机变量可以取某一区间或整个实数轴上的任意一

33、个值,它取任何一个特定的值的概率都等于0,所以不能列出每一个值及其相应的概率。通常研究它取某一区间值的概率。连续型随机变量的概率分布用数学函数的形式和分布函数的形式来描述。,9/24/2022,(三)连续型随机变量的概率分布由于连续型随机变量可以取某一区,1、概率密度函数的概念,设X为一连续型随机变量,x 为任意实数,X的概率密度函数记为f(x),它满足条件,注意:f(x)不是概率,是一种函数,9/24/2022,1、概率密度函数的概念设X为一连续型随机变量,x 为任意实数,密度函数 f(x)表示X 的所有取值 x 及其频数f(x),9/24/2022,密度函数 f(x)表示X 的所有取值 x

34、 及其频数f(x),在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1x2,P(x1Xx2)是该曲线下从x1 到 x2的面积,概率是曲线下的面积,9/24/2022,在平面直角坐标系中画出f(x)的图形,则对于任何实数 x1,2、分布函数,连续型随机变量的概率也可以用分布函数F(x)来表示分布函数定义为:,根据分布函数,P(aXb)可以写为:,9/24/2022,2、分布函数连续型随机变量的概率也可以用分布函数F(x)来表,3、分布函数与密度函数的图示,密度函数曲线下的面积等于1;分布函数是曲线下小于 x0 的面积。,9/24/2022,3、分布函数与密度函数的图示密度函数曲线下的面积

35、等于1;f(,4、连续型随机变量的期望和方差,数学期望为方差为,9/24/2022,4、连续型随机变量的期望和方差数学期望为9/24/2022,5、常见的连续型随机变量的概率分布,9/24/2022,5、常见的连续型随机变量的概率分布指数分布连续型随机变量的概,(四)正态分布,1.正态分布在统计学中的地位,正态分布是统计和抽样的基础,在统计中具有极其重要的理论意义和实践意义,主要表现在:,(1)客观世界中有许多随机现象都服从或近似服从正态分布;(2)正态分布具有很好的数学性质,根据中心极限定理,很多分布的极限是正态分布,在抽样时有些总体虽然不知道其确定的分布,但随着样本容量的增大,很多统计量可

36、以看作近似正态分布;可用于近似离散型随机变量的分布。(3)尽管经济管理活动中的有些变量是正偏斜的,但并不影响正态分布在抽样应用中的地位。,9/24/2022,(四)正态分布1.正态分布在统计学中的地位正态分布是统计,f(x)=随机变量 X 的频数=总体方差=3.14159;e=2.71828x=随机变量的取值(-x)=总体均值,2、正态分布的概率密度函数,9/24/2022,f(x)=随机变量 X 的频数 2、正态分布的概率密度函,3、正态分布函数的性质,概率密度函数在x 的上方,即f(x)0;正态曲线的最高点在均值,它也是分布的中位数和众数;正态分布是一个分布族,每一特定正态分布通过均值的标

37、准差来区分。决定曲线的高度,决定曲线的平缓程度,即宽度;曲线f(x)相对于均值对称,尾端向两个方向无限延伸,且理论上永远不会与横轴相交;正态曲线下的总面积等于1;随机变量的概率由曲线下的面积给出。,9/24/2022,3、正态分布函数的性质概率密度函数在x 的上方,即f(x),4、参数和对正态曲线的影响,平均数决定密度函数 f(x)的中心位置。如图:,9/24/2022,4、参数和对正态曲线的影响平均数决定密度函数 f(x),标准差决定 f(x)曲线的陡缓程度,越大曲线越平缓,越小曲线越陡峭。如图:,9/24/2022,标准差决定 f(x)曲线的陡缓程度,越大曲线越平缓,越,正态分布的概率,概

38、率是曲线下的面积。,9/24/2022,正态分布的概率概率是曲线下的面积。abxf(x)9/24/2,5、标准正态分布,一般的正态分布取决于均值和标准差,计算概率时,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的,若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表即可。,(1)标准正态分布的重要性,9/24/2022,5、标准正态分布一般的正态分布取决于均值和标准差,计算,(2)标准正态分布函数,标准正态分布的概率密度函数,任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布,标准正态分布的分布函数,9/24/2022,(2)标准正态分布函数标准正态分布

39、的概率密度函数任何一个一般,标准正态分布形式,9/24/2022,标准正态分布形式xms一般正态分布=1Z标准正态分布,(3)标准正态分布表的使用,将一个一般的转换为标准正态分布,在计算概率时,查标准正态概率分布表对于负的 x,可由(-x)x得到;对于标准正态分布,即X N(0,1),有P(a X b)b aP(|X|a)2 a 1对于一般正态分布,即X N(,),有,9/24/2022,(3)标准正态分布表的使用将一个一般的转换为标准正态分布,在,【例】设X N(5,10),计算 P(5 X 6.2),查表P=0.5478-0.5=0.0478,9/24/2022,【例】设X N(5,10)

40、,计算 P(5 X,【例】设X N(5,10),计算P(2.9 X 7.1),一般正态分布,9/24/2022,【例】设X N(5,10),计算P(2.9 X,【例】设X N(5,32),求以下概率(1)P(X 10);(2)P(2X 10)解:(1),(2),注意:(-x)x,9/24/2022,【例】设X N(5,32),求以下概率(2)注意:,三、大数定律与中心极限定理,(一)大数定律(二)中心极限定理,9/24/2022,三、大数定律与中心极限定理(一)大数定律9/24/202,(一)大数定律,大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定律的总称。本节只介绍两个最常用的大数

41、定律。,独立同分布大数定律:独立随机变量x1,x2,具有相同分布,且存在有限的数学期望和方差2,则对于任意小的正数,有,9/24/2022,(一)大数定律大数定律是阐述大量随机变量的平均结果具有稳定性,该定律表明,当n足够大时,独立同分布的一系列随机变量的均值接近(依概率收敛于)数学期望,即平均数具有稳定性。,9/24/2022,该定律表明,当n足够大时,独立同分布的一系列随机变量的均值接,例如,调查成年男性的平均身高,可能会有如下结果:,9/24/2022,例如,调查成年男性的平均身高,可能会有如下结果:9/24/2,该定律表明,当n足够大时,事件A发生的频率接近于事件A发生的概率,即频率具

42、有稳定性。,贝努力大数定律:设m是n次独立随机试验中事件A发生(“成功”)的次数,p是事件A在每次试验中发生的概率,则对于任意小的正数,有,9/24/2022,该定律表明,当n足够大时,事件A发生的频率接近于事件A发生的,(二)中心极限定理,中心极限定理是阐述大量随机变量之和的极限分布是正态分布的一系列定理的总称。,独立同分布中心极限定理:设x1,x2,是独立同分布的随机变量序列,且存在有限的数学期望和方差2,那么当n时,,9/24/2022,(二)中心极限定理中心极限定理是阐述大量随机变量之和的极限分,该定理表明,不论总体服从什么分布,只要其数学期望和方差存在,对这一总体进行重复抽样,当样本

43、容量n充分大时,其标志总量或均值就趋于正态分布。,例如,调查成年男性的平均身高,可能会有如右图。,9/24/2022,该定理表明,不论总体服从什么分布,只要其数学期望和方差存在,,四、抽样分布,样本统计量的概率分布(理论分布),构造抽样分布的步骤:,样本统计量全部可能的数值对应的频数分布,即抽样分布。,9/24/2022,四、抽样分布样本统计量的概率分布(理论分布)构造抽样分布的,样本平均数的抽样分布(例题分析),【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4。总体的均值、方差及分布如下:,均值和方差,9/24/2022,样本

44、平均数的抽样分布(例题分析)【例】设一个总体,含有4个,现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为:,3,4,3,3,3,2,3,1,3,2,4,2,3,2,2,2,1,2,4,4,4,3,4,2,4,1,4,1,4,4,1,3,3,2,1,1,2,1,1,1,第二个观察值,第一个观察值,所有可能的n=2 的样本(共16个),9/24/2022,现从总体中抽取n2的简单随机样本,在重复抽样条件下,共,计算出各样本的均值,如下表。并给出样本均值的 抽样分布。,3.5,3.0,2.5,2.0,3,3.0,2.5,2.0,1.5,2,4.0,3.5,3

45、.0,2.5,4,2.5,4,2.0,3,2,1,1.5,1.0,1,第二个观察值,第一个观察值,16个样本的均值(x),x,样本均值的抽样分布,1.0,0,0.1,0.2,0.3,P(x),1.5,3.0,4.0,3.5,2.0,2.5,9/24/2022,计算出各样本的均值,如下表。并给出样本均值的3.53.02.,样本均值的分布与总体分布的比较(例题分析),=2.5 2=1.25,总体分布,抽样分布,P(x),1.0,0,.1,.2,.3,1.5,3.0,4.0,3.5,2.0,2.5,x,9/24/2022,样本均值的分布与总体分布的比较(例题分析)=2,样本平均数的抽样分布 数字特征

46、 抽样分布,数学期望,方 差,1 当总体服从正态分布时,从该总体中取样所得到的样本均值仍然服从正态分布。,2 从非正态总中抽取的样本,只要容量足够大,根据中心极限定理可知,样本均值的分布也趋向正态分布。,一般认为样本容量足够大的标准为:n 大于等于30,9/24/2022,样本平均数的抽样分布数学期望方 差1 当总体服从正态分布,几种常用的样本指标分布律 t 分布、分布和 F 分布,t 分布,t 分布是小样本分布,小样本指 n 30。t 分布适用于当总体标准差未知时用样本标准差代替总体标准差,由样本平均数推断总体平均数以及两个小样本之间差异的显著性检验等。,t 分布的性质:,1.t 分布是对称

47、分布,均值为0。2.样本容量大于或等于30时,t 分布接近于标准正态分布,这时可用标准正态分布来代替t 分布。3.t 分布是一个分布族,不同的样本容量对应不同的 t 分布。4.与标准正态分布相比,t 分布的中心部分较低,两个尾部较高。5.变量t 的取值范围在 与 之间。,9/24/2022,几种常用的样本指标分布律 t 分布、分布和 F 分,t 分布表的使用:,t/2(n-1),-t/2(n-1),/2,/2,t(n-1),-t(n-1),9/24/2022,t 分布表的使用:t/2(n-1)-t/2(n-1),分布,分布是一种抽样分布,自由度为n。适用于对拟合优度检验和独立性检验,以及对总体

48、方差的估计和检验等。,分布的性质:,1.分布是一个以自由度n为参数的分布族,不同的n对应不同的 分布。2.分布是一种非对称分布,为正偏分布。自由度n达到相当大时,分布接近于正态分布。3.分布的变量值始终为正。,9/24/2022,分布 分布是一种抽样分布,自由度为n。适,n=2,n=3,n=5,n=10,n=15,9/24/2022,分布图n=2n=3n=5n=10n,分布表的使用:,9/24/2022,分布表的使用:9/24/2022,F 分布,F分布定义为两个独立的 分布被各自的自由度除以后的比率,这一统计量的分布,可用于方差分析、协方差分析和回归分析等。,F分布的性质:,1.F 分布是非对称分布。2.F 分布有两个自由度,相应的分布为F(n1-1,n2-1)。3.,9/24/2022,F 分布 F分布定义为两个独立的,F 分布图,F(10,15),F(10,10),F(10,4),9/24/2022,F 分布图F(10,15)F(10,10)F(10,4,F分布表的使用:,F(n,m),9/24/2022,F分布表的使用:F(n,m)9/24/2022,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号