《统计学第一章统计学的基础理论.ppt》由会员分享,可在线阅读,更多相关《统计学第一章统计学的基础理论.ppt(37页珍藏版)》请在三一办公上搜索。
1、统计分析与应用,STATISTICS,2023/7/1,1,第一章 统计学基础理论第二章 列联分析第三章 回归分析第四章 方差分析第五章 非参数检验第六章 主成分分析与因子分析第七章 聚类分析第八章 模糊综合评判与模糊聚类分析,2023/7/1,2,课程内容,统计学,贾俊平等,中国人民大学出版社,2009年 11月第4版统计学,贾俊平等,中国人民大学出版社,2008年 11月第3版统计学从数据到结论,吴喜之著,中国统计出版社,2006年例解商务统计学,Terry F.Triola著,陈鹤琴等译,清华大学出版社,2001年,2023/7/1,3,主要参考书目,2023/7/1,4,第一章 统计学
2、的基础理论,第一节 统计学及其应用领域第二节 统计数据第三节 统计学的基本概念,2023/7/1,4,一、统计学的定义 二、统计学的分科 三、统计学的应用,2023/7/1,5,第一节 统计学及其应用领域,2023/7/1,6,2023/7/1,6,一、统计学的定义,统计学是一门关于搜集、处理、分析、解释数据并从数据中得出结论的科学。,2023/7/1,7,二、统计学的分科,研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征。主要内容:统计数据的搜集方法;数据的加工处理方法;数据的显示方法;数据分布特征的概括
3、与分析方法等。,描述统计学(Descriptive Statistics),2023/7/1,8,是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。主要内容:参数估计:利用样本信息推断总体特征假设检验:利用样本信息检验对总体的某个假 设是否成立,推断统计学(Inferential Statistics),2023/7/1,9,是指统计学的数学原理,它主要研究统计学 的一般理论和统计方法的数学理论。从事统计理论和方法研究的人员需要有坚实 的数学基础。由于概率论是统计推断的数学和理论基础,因而广义地讲统计学也应该包括
4、概率论在内。,理论统计学(Theoretical Statistics),2023/7/1,10,是研究如何应用统计方法去解决实际问题。由于在自然科学及社会科学研究领域中,都需要 通过数据分析来解决实际问题,因而,统计方法 的应用几乎扩展到了所有的科学研究领域。应用统计学的不同分支所应用的基本统计方法都 是一样的,即都是描述统计和推断统计的主要方 法。但由于各应用领域都有其特殊性,统计方法 在应用中又形成了一些不同的特点。,应用统计学(Applied Statistics),2023/7/1,11,说出哪些领域运用统计,哪些领域不运用统计,都很困难几乎找不到一个不用统计的领域统计是适用于所有科
5、学领域的通用数据分析方法只要有数据的地方,都会用到统计,三、统计学的应用,2023/7/1,12,统计的应用,一切社会科学领域,一切人类生活领域,一切自然科学领域,一切生产活动领域,一、数据的计量尺度 二、数据的类型 三、数据的来源 四、数据的调查方式 五、数据的调查方法 六、数据的质量要求,第二节 统计数据,2023/7/1,13,一、数据的计量尺度,2023/7/1,14,根据调查对象的性质进行分类,各类之间是并 列关系。,定类尺度,与等距量表是一个等级,但该尺度存在绝对“0”点,“0”在此处表示不存在,故可计算比率。,测度多类别之间不同程度的顺序关系,存在类 别差和顺序差。,测度顺序和各
6、顺序位置之间的距离。这种尺度不存 存在绝对“0”点,“0”在此处是有意义的数字。,定序尺度,定距尺度,定比尺度,2023/7/1,15,二、数据的类型,分类数据 是只能归于某一类别的非数字型数据。如,人口的性别:男和女;产品类别:食品、衣着、家电等;顺序数据 是只能归于某一顺序类别的非数字型数据。如产品的质量等级:一等品、二等品等;数值型数据 是按数量尺度测量的数据。一般可直接进行加减乘除运算,且使用自然、物理、货币等单位计量。分类数据和顺序数据说明是事物的品质特征-品质数据或定性数 据;数值型数据是说明事物的数量特征-定量数据,不同计量尺度的数据,2023/7/1,16,观测数据:通过调查或
7、观察而搜集到的统计数据。如有关社会经济数据均 为观测数据。试验数据:在试验中,利用监控手段,通过控制试验对象而搜集到的统计 数据。如对医药疗效试验数据;生物成长的试验数据等。观测数据一般不能再生,只能通过观察得到;大多数试验数据来源于科学实验,一般可以重复取得。,不同搜集方法的数据,2023/7/1,17,截面数据 在相同或近似相同的时间点上搜集的数据;描述多个现象在 某一时刻的变化情况;比如,2010年我国各地区的国内生产 总值数据。时序数据 在不同时间上搜集到的数据;描述一个现象随时间变化的情 况;比如,1990年至2010年国内生产总值数据。混合数据 在数据集中含有时间序列和截面数据成分
8、的数据;描述多个 现象随时间变化的情况;比如,1990年到2010年我国各地区 的国内生产总值数据。,不同时空属性的数据,2023/7/1,18,三、数据的来源,2023/7/1,19,四、数据的调查方式,2023/7/1,20,五、数据的调查方法,2023/7/1,21,六、数据的质量要求,2023/7/1,22,一、总体和样本 二、参数和统计量 三、变量 四、概率分布,第三节 统计学的基本概念,2023/7/1,23,总体就是根据一定目的确定的所要研究事物的全体。它是由客观存在的、具有某种共同性质的许多个别事物构成的整体,简称为总体。构成统计总体的个别事物则称为总体单位。样本从总体中抽取出
9、来,作为代表这一总体的部分单位组成的集合体称为样本。,一、总体和样本,2023/7/1,24,参数用来描述总体特征的概括性数字度量参数一般是未知常数统计量用来描述样本特征的概括性数字度量统计量是随机变量可以由样本数据计算出来,二、参数和统计量,2023/7/1,25,说明现象某种特质的概念变量的取值称为变量值变量按取值特征不同,可分为离散变量与连续变量变量按计量尺度不同,可分为分类变量、顺序变量、数值型变量,三、变量,2023/7/1,26,概率分布的理论十分丰富按涉及的对象不同,可分为总体分布、样本分布、抽样分布概率分布按精确程度不同,可分为精确分布与渐进分布按属性不同,可分为理论分布与经验
10、分布按涉及的随机变量的性质不同,可分为离散变量的概率分布与连续变量的概率分布,2023/7/1,27,四、概率分布,总体分布总体中各元素的观察值所形成的相对频数(频率)分布。分布通常是未知的(因为几乎得不到总体所有观察值),可以(根据理论分析)假定它服从某种分布 样本分布一个样本中各观察值形成的相对频数(频率)分布,也称经验分布。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布 抽样分布样本统计量的概率分布,是一种理论分布在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布,总体分布、样本分布、抽样分布,2023/7/1,28,理论分布根据数学原理,所推导出来的随机变量的分
11、布模型。对于离散随机变量,常用的理论分布模型有 两点分布、二项分布、泊松分布、超几何分布;对于连续随机变量,常用的理论分布模型有正态分布、指数分布、均匀分布,以及由正态分布导出的 分布、分布、分布(统计三大分布)。经验分布一个样本中各观察值形成的相对频数(频率)分布。这种分布是可知的,是一种实际发生的分布。,理论分布与经验分布,2023/7/1,29,精确分布在总体X的分布类型已知时,若对任意自然数,都能导出统计量 的分布的数学表达式,这种分布称为精确的抽样分布。它对样本量较小的统计推断非常有用。精确分布大多数是在正态分布情况下得到的。渐进分布在统计学的抽样分布理论中,至今已求出的精确分布并不
12、多。抽样分布很难求,即便求出来精确的抽样分布,也因为过于复杂而难于应用。因此,人们往往寻求在样本量无限增大时统计量的极限分布,这种极限分布常称为渐进分布。,精确分布与渐进分布,2023/7/1,30,正态分布 分布 分布 分布,常用概率分布,2023/7/1,31,如果连续随机变量X的密度函数为:则随机变量服从均值为,方差为 的正态分布,记为标准正态分布:准则,正态分布,2023/7/1,32,设随机变量 相互独立,且 服从标准正态分布,则它们的平方和 服从自由度为 的 分布。记为 分布的期望与方差分别为:分布的上侧分位值定义为:,分布,2023/7/1,33,设随机变量,且X与Y独立,则随机变量:服从自由度为 的 分布,记为随着自由度 的增加,分布 的密度函数越来越接近标准正态分布的密度函数。实际应用中,一般当n 30时,分布与标准正态分布就非常接近。分布的数学期望与方差分别为,分布,2023/7/1,34,设随机变量Y与Z相互独立,且Y和Z分别服从自由度为m和n的 分布,则随机变量X:服从第一自由度为m,第二自由度为n的 分布 分布与 分布存在如下关系:如果随机变量 X服从 分布,则X2服从 的 分布。分布的期望与方差分别为:,分布,2023/7/1,35,2023/7/1,36,2023/7/1,37,