《环境研究设计.ppt》由会员分享,可在线阅读,更多相关《环境研究设计.ppt(79页珍藏版)》请在三一办公上搜索。
1、第七章 环境研究设计,7 环境研究的设计,7.1 调查设计7.2 实验设计7.3 环境研究中的系统误差,7 环境研究的设计,环境研究可简单概括为环境管理研究、环境监测研究和环境工程研究。研究工作通常包括调查和实验两个方面。调查(survey)是指不加任何干预措施对事实进行的描述分析性研究,实验(experiment)是指加上干预性措施对对象进行的试验分析性研究。在同一研究项目中,前者为后者提供线索,后者对前者加以验证,即调查和实验常常是互相补充、结合进行的。,7.1 调查设计,7.1.1 调查的类型考虑调查空间,调查科分为全面调查和抽样调查;考虑调查时间,调查可分为回顾性调查、前瞻性调查与断面
2、调查;考虑调查指标,调查可分为单项指标抽样、多项指标抽样与全指标抽样。,7.1.1.1 全面调查,全面调查(complete survey)又称普查,是对总体的全部观察单位进行的调查。在没有遗漏也没有重复的前提下,普查结果可以准确反应总体情况。由于全面调查面广、量大,因此,必须统一调查方法、统一调查技术要求,并据此统一培训调查人员。,7.1.1.2 抽样调查,定义抽样调查(sampling survey)是对总体的部分观察单位进行的调查。在抽样具有代表性的前提下,抽样调查样本的统计指标可以精确估计总体情况。分类抽样调查分为非随机抽样调查和随机抽样调查,随机抽样调查因能使每个观察单位有同等机会被
3、抽到而保证样本有较高的代表性,因此在研究中广泛应用。随机抽样方法常用的随机抽样方法有单纯随机抽样、系统随机抽样、分层随机抽样(比例分层、最优分层)、整群随机抽样(单纯整群抽样、二阶段整群抽样、整群比例概率抽样)。,7.1.1.3 回顾性调查,回顾性调查(retrospective study)又称对照调查,是寻找某种结果的原因的调查。通过调查过去较长时期内某种结果阳性样本与对照样本中具有与不具有某种原因的观察单位数量,经统计处理,可提示原因与结果的关联线索,但不能直接估计因果关系或关联程度。,7.1.1.4 前瞻性调查,前瞻性调查(prospective study)又称队列调查或定群调查,是
4、认定某种原因的结果的调查。通过调查未来较长时期内暴露于原因样本与不暴露于原因样本中发生与不发生某种结果的观察单位数量,经统计处理,可直接估计原因与结果的关联程度。,7.1.1.5 现况调查,现况调查(field survey)又称断面调查,是对已知明确原因和结果的状况调查。通过对设定短期内的原因和结果调查,为进一步的动态分析等工作积累信息。,7.1.2 调查的样本含量估计,“环境数据统计与分析”显示,观察单位的多少直接影响对样本和总体特征的准确阐述和推断,因此,必须科学地确定观察单位的数量即样本含量。这是抽样调查的第一步工作。,7.1.2.1 推估总体均数时的抽样样本含量,(1)推估无限总体均
5、数的抽样样本含量式中n 样本含量u 总体均数在检验水准的临界值 总体标准差 总体容许误差 r u式中r 估计平均数变化的幅度,取0.050.1均数于是当计算出n30时,需用样本均数在检验水准的临界值t(v)依次代替u继续计算,直到计算出稳定的样本含量,于是由于(变异系数)所以有 或,7.1.2.1 推估总体均数时的抽样样本含量,(2)推估有限总体均数时的抽样样本含量当有限总体的观察单位数(N)很大,且将其按无限总体对待所计算的抽样样本含量(n)也很大时,用校正样本含量公式计算:式中 nc 有限总体校正样本含量n 假定为无限总体的样本含量 有限总体校正数N 有限总体的观察单位数,7.1.2.2
6、推估总体率时的抽样样板含量估计,(1)推估无限总体率的抽样样本含量当总体率接近50时,有当总体率接近100或0%时,用反正弦的平方根转换的率式中n 样本含量 总体率 u 总体率在检验水准的临界值 总体率标准差 总体率容许误差 式中r 估计率变化的幅度,取0.050.1p 样本率,(2)推估有限总体率的抽样样本含量式中 nc 有限总体校正样本含量n 假定为无限总体的样本含量 有限总体校正数 N 有限总体的观察单位数,7.1.2.3 样本均数与总体均数比较时的样本含量估计,“均数比较”问题,比估算总体均数进一步,涉及到显著性检验,因此不仅只考虑均数第一类错误的概率,还要考虑第二类错误的概率。通常使
7、用的估计公式为n=式中n估计样本含量 t第一型错误概率的t值,据单侧或双侧检验要求查附表2(t值表)得到;t 第二型错误概率的t值,据单侧检验要求查附表2(t值表)得到;标准差容许误差先用自由度的t和t值求n1,再用n1的自由度的t和t值求n2,经过多次计算,得一基本稳定的ni值,即为求解的样本含量。,7.1.2.4 配对资料比较的样本含量估计,计算样本含量n式中sd 样本差数的标准差样本差数的平均值,7.1.2.5 两样本均数比较的样本含量估计,计算样本含量n1n22式中 sc 两样本均数合并标准差 两样本均数之差,7.1.2.6 两样本率比较的样本含量估计,(1)(实验或处理的)样本率在5
8、0左右时,计算样本含量:n1n22(2)(实验或处理的)样本率远离50时,计算样本含量:n1n21641.6式中1、2 样本率 c 平均率(3)用相对危险度估计样本含量n1n2式中 平均率1 对照组的暴露比例2 病例组的暴露比例 R 相对危险度,7.1.2.7 单因素多组资料比较调查的样本含量估计,在假定方差齐同的前提下,计算容许误差后,查附表17(单因素多组均数的样本量表),得出相应的样本含量。式中 容许误差 最大均数 最小均数,7.1.2.8 相关分析的样本含量估计,作相关系数比较时的样本含量估计时,需先查附表18(r与z值转换表),将r值转换成z值后,再计算样本含量。(1)回答xi与yi
9、是否相关时的样本含量(2)样本相关系数与总体相关系数比较时的样本含量(3)样本相关系数差异显著性检验时的样本含量n1n2式中 z0总体相关系数的转换值z1、z2 样本相关系数的转换值,7.1.3 调查的样本抽取,样本含量确定后,抽样调查的第二步工作,就是确定“哪个观察单位将成为调查对象”。有以下几种代表性的抽样技术方法。单纯随机抽样系统随机抽样分层随机抽样整群抽样整群按比例的概率抽样法,7.1.3.1 单纯随机抽样,定义指对全部的观察单位不加任何分组,完全随机地抽取观察单位组成样本的抽样技术。常用随机数字表法进行单纯随机抽样。其操作过程如下:(1)给全部观察单位顺序编号;(2)从随机数字表的任
10、意行列开始,向任意方向依次抄录随机数字(3)舍去重复出现的数字和大于观察单位总数值的数字(4)当保留的随机数字个数等于样本含量值时停止抄录;(5)将编号与每个随机数字相同的观察单位抽出组成样本。,7.1.3.2 系统随机抽样,定义又称机械抽样,指按照一定顺序,机械地每隔若干观察单位抽取一个观察单位的抽样技术。其操作过程如下:(1)给全部观察单位顺序编号;(2)确定抽样间隔()(3)随机确定一个观察单位为抽样起点,依次抽取抽样间隔末的观察单位组成样本。当观察单位按顺序有周期性或单调增减时,用此法抽得的样本带有偏性,故该法适用于观察单位分布均匀的总体。,7.1.3.3 分层随机抽样,定义又称类型抽
11、样,指将全部观察单位按某些标志分成若干类型、区域或层次,然后对各类型、区域或层次的观察单位进行随机抽样的抽样技术。其操作过程如下:(1)计算对全部观察单位N抽样的样本含量n(见7.1.2);(2)对全部观察单位分层;(3)计算各层的样本含量ni;(4)对各层进行随机抽样。,根据各层样本含量的计算方法不同,分层抽样分为比例分层抽样法和最优分层抽样法。比例分层抽样法指按同样比例()在各层观察单位(Ni)中抽取样本含量为的样本的抽样方法。最优分层抽样法指根据各层观察单位实有数(Ni)和标准差(Si)决定抽取样本含量的抽样方法。式中第i层全部观察单位标准差,可用Si作为无偏估计值第i层总体率,可用Pi
12、作为无偏估计值,7.1.3.4 整群抽样,定义整群抽样指抽取包含若干个观察单位的群体的抽样方法。整群抽样适用于大规模研究。分类如果对被抽取群体中的全部观察单位进行研究,则称为单纯整群抽样。如果对被抽群体中的观察单位再进行抽样研究,则称为二阶段整群抽样。性质群间差异越小,整群抽样的精密度越好;在抽取的群中抽取的观察单位越多,整群抽样的精密度越好。单纯整群抽样的精密度好于二阶段整群抽样。,7.1.3.4 整群抽样-单纯整群抽样,群内观察单位数相等的单纯整群抽 样本均数为样本标准误为样本率为样本率标准误为,群内观察单位不相等的单纯整群抽样样本均数为群的平均观察单位数为样本标准误为样本率为样本率标准误
13、为,7.1.3.4 整群抽样-二阶段抽样,样本均数为各群的平均观察单位数为样本标准误为样本率为样本率标准误为,7.1.3.5 整群按比例的概率抽样法,整群按比例的概率抽样法(probability proportiona1 to size),简记PPS法。该法是把人数不等的实际初级单位转化为人数相等的假设初级单位,用系统抽样法确定假设初级单位所在的实际初级单位,再从被抽取的初级单位中随机抽取若干观察单位,这样使人数不相等的初级单位内每个观察单位被抽的机会均等,便于计算抽样误差。,7.2 实验设计,定义实验(或试验)研究是观察实验因素的实验效应的研究。实验研究的基本要素包括实验因素、受试对象和实
14、验效应。实验因素可分为物理因素、化学因素、生物因素。受试对象要符合明确的规定而具有一定的同质性。实验效应即实验中所选用的指标。指标有计数和计量两种,选用的指标应具有客观性、精确性、特异性和灵敏性。,实验研究及设计的原则实验研究及相应的实验设计必须遵循“对照、随机、重复、均衡”原则。(1)对照。对照指实验中有可以相互比较效应水平的接受不同的处理的生物分组或个体。(2)随机。落实随机原则的目的在于减少误差,减少人为因素对实验结果的影响。(3)重复。在实验研究中对样本含量的要求是,既要保证实验结果可靠,又要避免不必要的浪费。(4)均衡。要求非实验因素的条件均衡一致,以准确揭示实验因素的效应规律。重点
15、注意两个方面,一是要求受试对象具有较好的同质性,二是实验的环境条件要控制在规定的状态。,实验设计的方法完全随机设计配对设计配伍组设计平衡不完全配伍组设计交叉设计析因设计拉丁方设计不完全拉丁方设计分割设计系统分组设计正交设计,7.2.1 完全随机设计,定义指将受试对象随机地分配到单因素的各个处理组中进行实验观察,或者分别从不同总体中随机抽样进行对比观察的设计方法。优点是设计和统计分析比较简单,缺点是只能分析一个因素而效率较低。基本思路先将选定的受试对象编号,再用附表19(随机数字表或随机排列表)把它们随机分成两组或多组(各组受试对象数可以相等,也可以不相等),分别给各组受试对象施加预定的各种处理
16、,观察实验效应。两处理组的效应比较常用t检验或秩和检验,多个处理组的效应比较常用方差分析或秩和检验。,7.2.2 配对设计,定义配对设计指将条件一致或相同的受试对象配成对子,将每对中的对象随机分入单因素的两个不同处理组。配对的注意事项一般不要以实验因素作为配对条件,而应以主要的非实验因素作为配对条件。配对时要防止偏性,尽可能保持每对受试对象的均衡和齐同。应把每对中的两个受试对象随机分配到两个不同处理组。记录试验数据应保持每对的一一对应关系,不能错乱或缺失。配对设计的优点是同对的试验对象间均衡性增大,因而可提高试验的效率。,7.2.3 配伍组设计,定义配伍组试验亦称随机区组试验,是配对试验的扩大
17、。配伍组设计指,将条件一致或相同的三个或三个以上的受试对象组成对象组(配伍组),并将每组中的对象随机分配到单因素的三个或三个以上的处理组。适用范围配伍组设计可同时分析出处理组及配伍组两个因素的影响,试验效率较高。配伍组设计还可用于实验缺项估计。,7.2.3.1 配伍组设计与结果分析,校正数总变异的离均差平方和及自由度SS总X2C,vN1;处理组间的离均差平方和及自由度,vt1;配伍组的离均差平方和及自由度,vb1;误差离均差平方和及自由度SS误差=SS总SS处理SS配伍,v(t1)(b1),7.2.3.2 缺项估计,配伍组试验的特点是各处理组的受试对象数相等,各配伍组的受试对象数也相等。如在试
18、验过程中因故漏失原始数据时须补进漏失数据后才能作方差分析。如漏失数据只有一个,缺项Xe可按下式估计:式中:T有缺项的处理组中现有观察值之和,B有缺项的配伍组中现有观察值之和,S现有观察值之总和。补进缺项后作方差分析时,须从处理的平方和中减去偏大值K加以校正,并将总变异及误差的自由度各减1。,7.2.4 平衡不完全配伍组设计,定义 平衡不完全配伍组设计指,在每一配伍组中包含的受试对象数小于要求的处理数时,有计划地安排每个配伍组中受试对象接受的处理,使全部试验中每种处理的重复数相等,一个配伍组中的受试对象接受的某两种处理的次数相等。设计 平衡不完全配伍组设计中,以k表示每个配伍组中受试对象数,以表
19、示处理数,以b表示要求的配伍组数,以 r表示要求的每种处理的重复次数,则 r或bk为实验单位的总数;以表示某两种处理同时出现的配伍组数。必须是整数,可由下式求得:设计时,根据试验给定的k和,从表7.14中查得所需b、r、以及解法,再按“解法”确定每个配伍组的处理安排。确定处理安排的方法有三种,即所有结合法、正交方法和解法号法。,7.2.4.1 所有结合法,所有结合法指,利用组合技术列出给定条件下的所有配伍组的处理组合。如给定条件k3、4时,要求全部的实验组合满足b4、r3。即当每个配伍组只有3只动物,要接受4个处理时,则要求有4个配伍组,每个处理要给予3个配伍组中的受试对象,且某两种处理同时出
20、现的配伍组数为2。令4个处理为a、b、c、d,4个配伍组安排的处理分别为abc、abd、bcd、acd。,7.2.4.2 正交方法,定义正交方法指,利用正交方的排列技术列出给定条件下的各配伍组的处理组合。类型(1)类型1指k2的实验类型,此时,要求bk(k+1)。(2)类型2 指k(k1)+1的实验类型,此时,要求b。,7.2.4.3 解法号法,定义解法号法指,查表7.16(平衡不完全配伍组的联合解法),确定给定条件下的解法号,按解法号规定的技术列出给定条件下的各配伍组的处理组合。分类(1)直接列出消解法(2)循环消解法 一系循环消解法 二系循环消解法 三系循环消解法 一系二循环消解法 二系二
21、循环消解法 三系三循环法,7.2.4.4 平衡不完全配伍组设计的分析,表7.18 平衡不完全配伍组方差分析计算表,(1)求离均差平方和先按配伍组试验资料分析方法,求以下SS:总变异的SS=配伍组间(不分处理)的SS=处理间(不分配伍组)的SS=,为将配伍组与处理间的相互影响分开,再求以下SS:配伍组间(不分处理)项内的处理部分的SS=余数的SS=-配伍组间(消除处理影响)项的SS=-+,(2)计算各处理的最有效估计值 及其误差均方各处理的最有效估计值式中 M配伍组内误差均方;配伍组间均方。误差均方(3)多个样本均数间两两比较必要时可按多个样本均数间两两比较的方法比较各 值间的两两相差,或按资料
22、情况作其他分析。,7.2.4.5 平衡不完全配伍组设计与分析实例,【例7.26】,7.2.5 交叉设计,定义交叉设计指,将A、B两种处理先后随机地施于属于同一批而随机分成两部分的受试对象的设计,即随机地使一部分对象先接受A处理,后接受B处理,另一部分对象先接受B处理,后接受A处理。由于A处理和B处理处于先后两个试验阶段的机会是相等的,因此平衡了试验顺序的影响,而且能把处理方法之间的差别与时间先后之间的差别分开来分析。某种生物先后受到两种污染物攻击的效应比较、先后在污染处理装置中施加两种因素对装置运行效果的影响比较等可用此法进行设计。,7.2.5.1 设计,(1)确定需作比较的A、B两种处理。(
23、2)确定偶数个受试对象,尽量使相邻的第1、2号条件近似,第3、4号条件近似,余类推。(3)随机确定各单号受试对象接受两种处理的顺序,并规定各双号受试对象接受两种处理的顺序与其紧邻其前的单号受试对象接受两种处理的顺序相反。因此,按先A后B顺序接受处理与按先B后A顺序接受处理的受试对象数必然相等。,7.2.5.2 分析,一般可用秩和检验,对符合方差分析条件者,用方差分析效率更高。(1)方差分析检验假设同一般方差分析。从总变异中分出处理间变异、先后顺序间变异和受试对象间变异,剩余为误差。然后以误差均方分别除三个组间变异均方,即得各F值,查附表5(F界值表)得P值,按所取检验水准作出推断结论。,(2)
24、秩和检验 处理间的比较基本思想:假设A、B两种处理的效果相同,则同一受试者按先A后B顺序接受处理的两次测定值之差的秩和与按先B后A顺序接受处理的两次测定值之差的秩和相等;若A处理效应低于B处理效应,则同一受试者按先A后B接受处理的两次测定值之差的秩和小于按先B后A顺序接受处理的两次测定值之差的秩和。方法:.将每一受试者接受两种处理所得效应数据依先后顺序相减,并保留正、负号,以差的代数值编秩;.分别求按先A后B顺序与按先B后A处理的秩和,做两样本秩和检验。,顺序间的比较基本思想:假设两种处理皆对下一阶段无影响或影响相同,则两秩和应相等;若A处理的效果影响到下一阶段的B处理,而B处理的效果并不影响
25、到下一阶段的A处理,或A处理对下阶段B处理的影响大于B处理对下阶段A处理的影响,则按先A后B顺序的秩和与按先B后A顺序的秩和不相等。方法:.将同一受试者接受两种处理所得数据相加,以和编秩;.分别求按两种顺序处理的秩和,进行两样本秩和检验。,7.2.5.3 交叉设计的实验与分析实例,【例7.27】,7.2.6 析因设计,析因设计是指一种既研究每个因素各水平间的差异,又研究各因素间的交互作用的多因素的交叉分组设计。本节仅讨论最简单的两因素析因设计(以“22”为例)和较复杂的四因素析因设计(以“2232”为例)的设计方法及分析方法。,7.2.6.1 22析因设计及分析,(1)设计当有两个因素A、B,
26、每个因素各有两个水平A1、A2、B1、B2时,两因素同时存在的实验组合共有4个,其实验设计模型如下表。,(2)分析方差齐性检验对4个组合的试验结果作方差齐性检验,如巳满足齐性要求,即可进行方差分析。,方差分析.假设A因素或B因素各水平间比较的H0:A因素或B因素两水平的总体均数相等,即1 2。A、B两因素交互作用分析的H0:两因素间无交互作用,即彼此独立。.基本计算分别计算“A因素”、“B因素”、“交互作用AB”及“误差”四部分的离均差平方和SSA、SSB、SSAB、SS误差SS及相应自由度v。,总变异v总例数1,某因素v该因素的水平数1,交互作用v有关因素的自由度之积,22析因分析中v均为1
27、。SSA、SSB的计算公式见条目“单因素多个样本均数比较”。SSAB的计算步骤如下:SSAB=SST(AB)SSASSB式中 SST(AB)A、B两因素副表总变异的离均差平方和;XA1B1A因素1水平与B因素1水平组合的样本观察值,余类推;n分子中每个合计所包含的例数;C校正数(区别于因素C)。,.方差分析表计算 分别计算各因素及交互作用的均方MS,并与误差的均方相比得F值。.结论推断 查附表5(F界值表),得P值,按所取检验水准作出推断结论。7.2.6.2 22析因设计及分析实例【例7.28】,7.2.6.3 2232析因设计与分析,(1)设计当有四个因素,各因素分别有2、2、3、2个水平时
28、,四个因素同时存在的实验组合共有223224个,其实验设计模型如下表。,(2)实验按此模型安排24个组合的试验,每个试验可根据试验条件和具体要求规定重复次数,一般所取次数较少。(3)分析对试验结果先作方差齐性检验,然后再作以下方差分析:单因素组间比较:A,B,C,D;一级交互作用间比较:AB,AC,AD,BC,BD,CD;二级交互作用间比较:ABC,ABD,ACD,BCD;三级交互作用:ABCD。总共15次检验,大致可获得各因素的最佳水平及最佳组合。,7.2.6.4 2232析因设计与分析实例,【例7.29】,7.2.7 拉丁方设计,用r个拉丁字母排成r行r列的方阵,使每行、每列中每个字母都只
29、出现一次,这样的方阵叫r阶拉丁方或rr拉丁方。按拉丁方的字母、行和列安排处理及影响因素的设计称为拉丁方设计。拉丁方设计可作缺项估计。,7.2.7.1 拉丁方设计与分析,(1)设计 要求实验包含三个因素,且三个因素的水平数相等;行间、列间、处理间均无交互作用;各行、列、处理的方差齐。方法.根据处理数选定拉丁方。.将拉丁方随机化。.规定行、列、字母所代表的因素和水平。行、列、字母各代表一个因素,每行、每列、每个字母代表一个因素水平。(2)分析.列出试验结果。.进行初步计算,即计算各处理的合计及均数。.进行方差分析计算,即计算离均差平方和SS、自由度v、均方MS与F值,列出方差分析表。.推断结论,即
30、查附表5(F界值表),得P值,按所取检验水准作出推断结论。.若检验结果均数间有差别,需要时作均数的两两比较。,7.2.7.3 拉丁方设计缺项估计与分析,拉丁方设计的特点是各行、各列、各处理的观察值个数相等。当实验中遇到意外情况致数据漏失时,可以对所缺数据进行估计。缺项估计的目的只是为了资料分析能顺利进行,所估数据不是实验客观信息。通常只考虑漏失一个数据的缺项估计与分析。,补进估计缺项Xe后,按无缺项的拉丁方作方差分析。进行补项后的方差分析时要从SS处理中减去偏大值K,并将总变异和误差的自由度各减1。式中r拉丁方的阶;R有缺项行内各观察值之和;C有缺项列内各观察值之和(不是方差分析中的校正数);
31、T有缺项处理内各观察值之和;G观察值总和(不包括估计值)。若需将有漏失数据的处理均数和其他处理的均数进行比较时,两均数之差的标准误按下式计算。,7.2.8 不完全拉丁方设计,定义 不完全拉丁方又称Youden方。当客观条件限制不能用拉丁方试验时,可用拉丁方的一部分来安排试验,称为不完全拉丁方设计。不完全拉丁方资料处理步骤(1)计算现有数据各行、列、处理的合计。(2)按配伍组设计分析要求,计算校正数C及SS行、SS列、SS总。(3)以列(或行)均数估计列(或行)所缺数据,并计算各处理合计的估计值Ti。Ti(n-1)式中 n处理的安排次数(4)计算SS处理、SS误差SS误差=SS总SS行SS列SS
32、处理(5)列出方差分析表,查附表5(F界值表),得P值,按所取检验水准作出推断。,7.2.9 分割设计,定义 分割设计又称裂区设计,是把一个或多个完全随机设计、配伍组(随机区组)设计、拉丁方设计结合起来的设计方法。,7.2.9.1 分割设计与分析,(1)设计 先选定受试对象作一级单位分成几组,分别用一级因素的不同水平作完全随机,或配伍组,或拉丁方设计(一级处理);每个一级单位再分成几个二级单位,分别用二级因素的不同水平作完全随机,或配伍组,或拉丁方设计(二级处理)。设计时,宜用最感兴趣的或较主要的因素,差异较小或要求精确度较高的因素作为二级因素。(2)分析用方差分析。检验假设一级因素(或二级因
33、素)各水平间比较的H0:总体均数相等;一级因素与二级因素交互作用的H0:两种因素间无交互作用,彼此独立。计算离均差平方和及自由度。计算均方MS。计算F值,查P值,结论推断。,7.2.10 系统分组设计,定义 系统分组设计指将受试对象按自身特征逐级分组的设计,即将受试对象按甲特征分为若干大组,每个大组内按乙特征分为若干小组,每个小组内再按丙特征分为若干小小组,如此反复地分组、再分组后再接受因素处理的设计。又称多层分组设计、成套分组设计。,7.2.10.1 系统分析设计与分析,(1)设计 要求每一受试对象都要具备分组、再分组所需的各种分组特征。通常,以具有本质意义的特征作为分大组的特征,以其他特征
34、作为下级分组特征。设计时,尽可能保证各大组内的小组数相等,各小组的例数相等,以利于条件分析计算。(2)分析 检验假设大组间比较的H0:各大组的总体均数相等;同大组内各小组间比较的H0:同大组内各小组的总体均数相等。,统计分析计算常用方差分析。a.计算离均差平方和及自由度总变异的离均差平方和及自由度按变异来源分为大组、小组和误差三部分。计算中,令大组组号为i1,2,p,小组组号为j1,2,q,各小组受试者号为k=1,2,r,总例数为N,则有,vp1,vp(q1),vp q(r1)SS总X2CSS大组+SS小组+SS误差,vN1式中 C校正系数;X观察值;Ai大组内观察值之和;Bij小组内观察值之
35、和;,b.计算均方MS c.计算F大组F小组F 统计推断,7.2.11 正交设计,定义 正交设计指利用一套规格化的正交表,安排每次试验的因素及水平的设计。正交设计是一种高效、快速的多因素设计方法。通过对正交设计的试验结果的分析,可以说明各因素对受试对象的影响,并判断主要因素和次要因素、独立作用和交互作用,并筛选最佳的因素水平组合。,7.2.11.1 正交设计与分析,(1)设计正交设计通过正交表实现。已开发使用的正交表有L4(23)、L9(34)、L12(211)、L16(45)等等。符号中,L代表正交表,L的下标代表试验次数(4、9、12、16次),括号内的幂式的指数代表最多允许安排试验因素的
36、个数(3、4、11、5个),幂式的底代表因素的水平数(2、3、2、4个)。,(2)正交表的选用选用正交表的思路:确定试验的因素。根据研究目的,选出实验因素。确定每个因素的水平。各因素的水平数可以相等,也可不等,在水平数不等时,主要因素的水平数可以多些,次要的可以少些。决定试验次数。根据主客观条件,决定试验次数。要求精确度高时,可选试验次数多的正交表;要求精确度不高或试验条件有困难时,可选试验次数少的正交表。,具体选用时,一般遵循以下规范:根据水平数,选择正交表。水平数相等时,如全是二水平,选用Ln(2m)表,全是三水平,选用Ln(3m)表,全是四水平,选用Ln(4m)表,全是五水平,选用Ln(
37、5m)表,五水平以上可选用正交拉丁方。有m1个因素是a个水平、m2个因素是b水平时,选用Ln(am1bm2)表。根据交互作用,选择正交表。交互作用多的,选列多的正交表;已知交互作用小,选列少的正交表。根据分析方法,选择正交表。如果用方差分析,至少要空一列以估计误差,如用直观分析粗略估计,可不空列。,(3)正交设计的实验结果分析正交试验的分析有直观分析与方差分析两种。直观分析将按正交表设计实施的试验结果直接计算出每一因素各水平观察指标的平均值,找出各因素中最佳水平。此法可粗略地说明各因素诸水平间的差别,简单直观,但不能确切地判断各因素间的交互作用。方差分析比直观分析精确,可以补其不足。a.检验假
38、设每一因素各水平间比较的H0:某因素各水平的总体均数相等,交互作用的H0:两因素间无交互作用。,b.计算离均差平方和SS及自由度v总变异的离均差平方和及其自由度分为各因素的各水平间、两因素的交互作用及误差等部分,分别计算。,vN1,v水平数1SS误差SS总-SS因素(交互作用),vN1(水平数1)c.计算均方MS及F值d.结论推断,7.3 环境研究中的系统误差,事实上,系统误差是难以完全消除的,实际工作中,只能针对来源,尽可能减少系统误差。(1)来自受试对象的系统误差(2)来自观察者的系统误差(3)来自仪器的系统误差(4)来自非实验因素的系统误差(5)来自研究或计算方法的系统误差由一定原因产生的系统误差,有的是恒向、恒量的,称定值误差或恒差,有的按一定规律变化,如周期性变化,称变值系统误差。总体上看,系统误差可通过正确的实验设计、严格的技术措施消除或减少,而不能靠“统计方法”来解决。系统误差常以绝对误差、相对误差和回收率等指标来表示。,