数据模型与决策2统计模型课件.ppt

上传人:牧羊曲112 文档编号:3051781 上传时间:2023-03-10 格式:PPT 页数:79 大小:867.51KB
返回 下载 相关 举报
数据模型与决策2统计模型课件.ppt_第1页
第1页 / 共79页
数据模型与决策2统计模型课件.ppt_第2页
第2页 / 共79页
数据模型与决策2统计模型课件.ppt_第3页
第3页 / 共79页
数据模型与决策2统计模型课件.ppt_第4页
第4页 / 共79页
数据模型与决策2统计模型课件.ppt_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《数据模型与决策2统计模型课件.ppt》由会员分享,可在线阅读,更多相关《数据模型与决策2统计模型课件.ppt(79页珍藏版)》请在三一办公上搜索。

1、第二章 统计模型,针对的主要问题,(1)参数估计(包括点估计和区间估计)(2)假设检验(3)类别判断(4)群体特征识别,(1)一个很熟悉的问题,某种产品的合格率为p,检测了100 件产品,合格88件,试用统计的方法估计该产品的合格率。,合格率:88%,是否可信?,(2)常见的买卖纠纷,有消费者投诉某企业的某种产品有欺诈行为(缺斤短两、内质成分结构与标准不符),工商质检部门如何处理?,(3)复杂事物的分类,以人的血液中各种指标值为基础,可以把人群分成多种类型。材料也是如此。组织是否也可如此?,(4)内隐特征识别,70后、80后、90后行为特征清华、北大、东北大学大学毕业生的知识与行为特征。,中性

2、特征;优势特征;劣势特征,概率论的有关概念和知识复习,2.1 参数估计模型,(1)点估计的矩法 1)原理 2)估计质量(2)区间估计,(1)点估计的矩法,矩估计依据:大数定律 结论:对于简单随机子样,样本数量趋向于无穷时,均值以概率1保证趋近于数学期望。,随机变量的k阶原点矩,含参数的表达式,例如:在 上均匀分布随机变量,由大数定律,有,依此,矩法直接令,右侧是含待定参数的表达式,左侧是实测数据的表达式,据此,可以得到矩估计的一般过程,0)选择适合具体问题的随机变量1)确定具体问题所包含的待估计参数的数量2)依据问题的特点及大数定律构造含待估参数的等式方程组3)求解方程组的估计器4)分析估计器

3、的可信程度5)采样、测试并计算,现有一批某种产品,如何依据相关的质量标准。估计其合格率为p。,前面熟悉的问题应该是,统计方法分析:用表示群体产品中单件产品的合格与不合格的状态,则是随机的,可表述为,实际上,0-1是人为规定的,也可另行规定,合格产品的数量,用容量为n的子样估计产品合格率,即估计p。由于随机变量的数学期望为p,因此,估计产品的合格率p就是估计随机变量的参数数学期望。,由于单个随机变量的方差,其最大值为0.25,而均值的方差为,构造估计器,因此,有,对于容量为100样本,最保守的考虑,估计器的误差方差也不会超过,如果比照正态分布的情形,就是以99.9999%的把握保证,实际的合格率

4、在,即:,另行规定的尝试:用表示群体产品中单件产品的合格与不合格的状态,则是随机的,可表述为,依照相应的处理过程,有,因此,有矩估计方程,解方程,得,即,因此,选a=0,b=1是最简练,也是最直接的。,再如:,正态分布母体的均值与方差的估计,由正态分布的一阶矩和二阶矩,求解方程组,得,以后记,称为样本方差。,可应用的背景很多,例:,若从自动车床加工的一批零件中随机抽取10件,测得尺寸与规定尺寸的偏差分别为2,1,-2,3,2,4,-2,5,3,4。设偏差应服从正态分布N(,2),试估计,2。,解:,由,有,关于a,b均匀分布随机变量的参数估计,由分布函数,可得,令,解方程组,可得,还有其它方法

5、构造估计器,比如最大似然估计,而且所得估计器的结构不尽相同。,(2)可信程度估计的质量,1)无偏估计2)一致估计,均值的估计质量,定理:设母体服从分布F(x),(x1,x2,xn)是来自母体的容量为n的简单子样,如果F(x)存在二阶矩,则有,证明,定理:如果F(x)存在四阶矩,则有,其中,因此,用,估计方差是不合适的!,但可依此得到方差的无偏估计:,有时直接记,须留意规定!,由此,前面例子,若从自动车床加工的一批零件中随机抽取10件,测得尺寸与规定尺寸的偏差分别为2,1,-2,3,2,4,-2,5,3,4。设偏差应服从正态分布N(,2),试估计,2。,(2)参数的区间估计,例1 某制造厂质量管

6、理部门的负责人确信包装后的原材料总体标准差为15千克。希望以95的把握(置信度)估计移交给接受部门的5500包原材料的平均重量的区间。,准备知识:,正态母体的重要抽样(统计量)分布设母体的分布为N(,2),则,1)2)3)两者是独立随机变量,参数的区间估计,显著水平、置信度1)方差已知的正态母体均值估计,例1 某制造厂质量管理部门的负责人确信包装后的原材料总体服从标准差为15千克的正态分布。希望以95的把握(置信度)估计移交给接受部门的5500包原材料的平均重量的区间。,模型的设计,如果有容量为n的简单随机子样,由均值的无偏估计,应该考虑下面统计量的分布,由正态分布的抽样分布结论,由于标准状态

7、分布的有关结果可查表得到,故转变成标准正态分布,几何解释,针对正态分布随机变量,选择怎样的区间?,几何解释,针对正态分布随机变量,选择怎样的区间?,因此,应选与纵轴对称区间,查数学用表,临界值为1.96。即,至此,模型构建完毕。,模型的使用:,1)确定随机子样的容量n;(由要求的精度决定)2)实现随机子样值的获取;3)计算统计量(均值)的值;4)带入数学模型,即有结论:以95%的把握说,选择简单子样的容量为250。通过随机检测250包原材料,得到一个样本,其平均值为65千克。,续前例,由估计准则,有,参数区间估计模型的构造过程,1)针对关心的参数,并依据所拥有的条件构建统计量;2)分析统计量的

8、概率分布规律;3)依据概率分布及置信水平,确定区间模型;4)确定子样容量;5)获得简单随机子样;6)统计判断,2)方差未知的正态母体均值估计,对于前一个问题,如果负责人并不知道母体的方差,如何进行参数的区间估计?,即:某制造厂质量管理部门的负责人希望以95的把握(置信度)估计移交给接受部门的5500包原材料的重量的区间。,参照前面,首先考虑子样均值,但是,由于未知,原区间估计的表述中含有未知参量!,改进,标准正态分布,自由度为n-1的分布,由t-分布的定义,由此,可以建立对应背景的区间估计数学模型,即:,例:某制造厂质量管理部门的负责人希望以95的把握(置信度)估计移交给接受部门的5500包原

9、材料的重量的区间。,选择简单子样的容量为45。通过随机检测45包原材料,得到一个子样,其平均值为65千克,标准差为14千克。,由,有,3)两个总体平均数之差的区间估计,教育部某部门想了解两所学校在某专业的教育质量的差距。置信度为95%。,两种考虑,A 经询问两校教务处,可知各自学生成绩的方差。B 经询问两校教务处,未知各自学生成绩的方差。,A.方差已知,即,经询问两校教务处,未知各自学生成绩的方差。,B 正态母体,方差未知但相同,t-分布,因此,当 时,,4)方差的区间估计,借助抽样分布的结论:,4)方差的区间估计,某企业技术质量部门想掌握产品加工中的质量波动情况。,借助抽样分布的结论:,如加

10、工贸易中的贴牌生产 我国某知名企业想通过OEM的方式扩大市场占有率,在美国寻找伙伴。如何了解美国企业的加工水平与该企业的异同情况。,两母体方差比的区间估计,已知该企业25个随机样本的方差为64;经检测,美国某企业30个样本的方差为81。两企业的加工精度的差异如何?,2.2 假设检验模型,重要的抽样分布结论复习,假设检验所依据的公设,2.3 聚类分析模型,2.4 主成分分析模型,重要的结论,正态分布的随机变量的代数和还是正态分布随机变量。,几个重要的分布,分布设有n个独立的标准正态分布的随机变量的平方和为自由度为n的 分布。,几个重要的分布,t-分布标准正态分布与自由度为n的 分布独立,它们的特殊比的形式,为自由度为n的t-分布。,几个重要的分布,F-分布两个自由度为分别为n和m的 独立分布的随机变量的某种比的形式,为自由度为(m,n)的F-分布。,子样容量,即:随机样本个数。,简单随机子样,独立、同分布的随机子样。,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号