《第八章输入数据分析课件.ppt》由会员分享,可在线阅读,更多相关《第八章输入数据分析课件.ppt(44页珍藏版)》请在三一办公上搜索。
1、一、输入数据的收集,第八章 输入数据分析,二、分布的识别,三、参数估计,四、拟合度检验,五、相关性分析,?模型的输入数据哪里来?,输入数据分析,生产仿真结果的准确性,生产模型的准确建立,仿真数据的准确性,输入数据是仿真模型的动力,GIGO(garbage in garbage out),系统的仿真依靠这些原型系统的运行数据,缺乏这些数据的实验和实验值的提取,仿真也就毫无意义。,收集原始数据,基本统计分布的辨识,参 数 估 计,拟合度检验,否,是,是输入数据分析的基础,需要分析的经验,对收集的方法、数据需要做预先的设计和估算。因此这是一个关键的、细致的工作。,通过统计的数学手段(计数统计、频率分
2、析、直方图制作等),得出统计分布的假设函数(如:正态分布、负指数分布、Erlang分布等),根据统计特征,计算确定系统的假设分布参数。,运用统计分布的检验方法,对假设的分布函数进行可信度检验。通常采用的是2检验。,正确输入数据,一、输入数据的收集,做好仿真计划,详细规划仿真所需要收集的数据在收集数据过程中要注意分析数据数据的均匀组合收集的数据要满足独立性的要求数据自相关性的检验,根据问题的特征,进行仿真的前期研究。分析影响系统的关键因素。从相关事物的观察入手,尽量收集相关的数据。为此可以事先设计好调研表格,并注意不断完善和修改调研方式,使收集的数据更符合仿真对象的数据需要。,数据的收集与仿真的
3、试运行是密切相关的,应当是边收集数据、边进行仿真的试运行。然而系统仿真是一项专业性很强的工作,要正确认识“仿真”的含义,抓住仿真研究的关键,避免求全、求精。确信所收集的数据足以确定仿真中的输入分量,而对仿真无用或影响不显著的数据就没有必要去多加收集。,针对仿真所收集的各个数据需要进行相关性检验。为了确定在两个变量之间是否存在相关。要建立两个变量的散布图。通过统计方法确定相关的显著性。,尽量把均匀数据组合在一组里。校核在相继的时间周期里以及在相继日子内的一时间周期里的数据的均匀性。当校核均匀性时,初步的检验是看一下分布的均值是相同。,考察一个似乎是独立的观察序列数据存在自相关的可能性。自相关可能
4、存在于相继的时间周期或相继的顾客中。例如,第i个顾客的服务时间与(i+n)个顾客的服务时间相关。,数据收集过程中的注意事项,二、分布的识别,直方图的构造方法如下:,分组区间的组数依赖于观察次数以及数据的分散或散布的程度。一般分组区间组数近似等于样本量的平方根。即:,如果区间太宽(m太小),则直方图太粗或呈短粗状,这样,它的形状不能良好地显示出来。,如果区间太窄,则直方图显得凹凸不平不好平滑,合适的区间选择(m值)是直方图制作,分布函数分析的基础。,二、分布的识别,二、分布的识别,离散数据汽车数量(p215),连续数据电子元器件寿命(p217),三、参数估计,设某一个随机过程X,其n个抽样样本为
5、x1,x2,xn,该样本的均值为该样本的方差为如果离散数据已按频数分组,则,k是X中不相同数值的个数即分组数,fi是X中数值Xj的观察频数,仿真中常用的一些分布参数建议值,三、参数估计,?理论分布和实际分布的差异程度?,拟合度检验,四、拟合度检验,Ei 是在该分组区间的期望频数。每一分组区间的期望频数是 Ei=n pi,这里pi是理论值,是对应第i个分组区间的假设概率。,2拟合度检验,式中,Oi是在第i个分组区间的观察频数。Oi=ni/n,可以证明:02近似服从具有自由度 f=k-s-1的2分布。这里 s 表示由采样统计量所估计的假设分布的参数个数。假设检验:H0:随机变量X服从参数是由参数估
6、计给出的分布假设。H1:随机变量X不确认若2太大则拒绝H0,若拟合是好的,则期望值2很小。,拟合程度的判定,四、拟合度检验,指定拟合度的检验,我们可以根据拟合度检验的要求,设定一个拟合度的显著性指数,根据设定的显著性指数以及2分布的自由度数f=k-s-1,可以查2表得到,f2。如果 则检验未通过,H0不成立。如果 则检验通过,H0成立。,在应用这个检验时,如果期望的频数太小,将对检验的有效性有所影响。一般情况下区间的个数k宜在3040以下,并能使最小期望频数Ei5。如果Ei值太小,可以把它和相邻分组区间的期望频数相合并,对应的Oi值也应该合并起来,同时每当合并一个单元,k值应该减去1。,四、拟
7、合度检验,四、拟合度检验,注意:,(1)被检验的分布离散,除非必须合并相邻分组区间以满足最小期望频数的需要,否则随机变量的每个值应该是一个分组区间,(2)被检验的分布连续,五、输入数据分析例题1p215,五、输入数据分析例题1,五、输入数据分析例题1,五、输入数据分析例题1,五、输入数据分析例题1,假设:,泊松分布的概率质量函数:,五、输入数据分析例题1,对于=3.64,不同x值的概率从概率质量函数得到:,22,12.2,17,7.6,五、输入数据分析例题1,计算出:,在显著性水平=0.05下,查表得出(p409):,五、输入数据分析例题1,五、输入数据分析例题2 p216,假设:,令k=8,
8、则每个区间p=0.125,具有相等概率2的检验,五、输入数据分析例题2,五、输入数据分析例题2,五、输入数据分析例题2,计算出:,在显著性水平=0.05下,查表得出:,五、输入数据分析例题2,六、相关性分析,系统运行过程中,随机变量有多个,如激励存在多种因素的影响;系统参数的变化等。这些随机变量之间可能是独立的,也有可能是相互有牵连的,牵连程度的强弱有所不同。需要进行相关性分析。相关性分析的目的:更好地了解系统以及系统随机变量的关联性,更正确地把握问题的关键。,六、相关性分析,协方差和相关系数是X1和X2之间线性相关程度的度量,设X1和X2是两个随机变量,令,分别是Xi的均值和方差。,X1和X
9、2的协方差的定义为,六、相关性分析,相关系数,越接近于-1或1,X1和X2之间的线性关系就越强,六、相关性分析,样本协方差,相关系数,六、相关性分析,例题9.20:令X1表示工业机器人交货的平均提前期,X2表示年需求量。下面的数据是过去10年的需求量和提前期:,计算得到:,六、相关性分析,因此,提前期和需求量有很强的依赖性,假设要估计在自变量x与一个因变量y之间的相关性。设在y与x之间真实相关是线性关系,这里观察值y是随机变量。而x是数学变量。那么在给定x的值之下,y的期望值假设是式中:0为一未知常数,是x取零时y的值;1为斜率,即x变化一个单位所引起的y的变化,也是一个待定的未知常数。,六、
10、相关性分析,假设 y 的每一个观察值可用下式表示y=0+1 x+式中 是均值为0,方差为2的随机误差。假设存在n对观察值(xi,yi),i=1,2,n,通常采用最小二乘法来估计上式中的yi。设 yi=0+1 xi+i i=1,2,n,则 i=yi-0-1 xi 假设是不相关的随机变量。,六、相关性分析,随机变量偏差 的平方和为(最小二乘法函数形式)为了使L(偏差)极小,可求出 和,并置它们为0,从而可以得到0、1的线性代数方程,既有:,六、相关性分析,检验统计量的构造方法1的均方误差:在xi处观测值yi与回归值yi之间的误差为均方误差值为也称为回归的剩余方差,它是误差方差的无偏估计量。,六、相关性分析,构造检验统计量 服从自由度为n-2的t分布。设定一个显著性水平,当 时,x、y是显著相关。,六、相关性分析,六、相关性分析,计算出:,六、相关性分析,