《药学统计学.ppt》由会员分享,可在线阅读,更多相关《药学统计学.ppt(175页珍藏版)》请在三一办公上搜索。
1、药学统计学,Pharmaceutical Statistics(Pharmacometrics),沈阳药科大学药学院 药物分析教研室 2016年9月,Pharmaceutical Statistics(Pharmacometrics),主讲教师:李伟 药学院药物分析系 药物分析教研室药学院楼432 email:讲课24学时,学分1.5/讲课16学时,学分1.0 指定选修课:药学专业 自由选修课:全校各专业 考试形式,教材和主要参考书,教材:罗旭 毕开顺 医药统计学 高等教育出版社 2010年 主要参考书:罗旭 化学统计学科学出版社 2001年参考书:1 方积乾 卫生统计学 人民卫生出版社 20
2、03年2 孙振球 医学统计学 人民卫生出版社 2010年3 杨德 试验设计与分析 中国农业出版社出版 2002年4 徐叔云 药理实验方法学 人民卫生出版社 2009年5 张均用 现代药理实验方法 北京医科大学/协和医科大学出版社 2002年,教材和主要参考书,参考书:6 郭祖超 医用数理统计方法第三版 人民卫生出版社 1988年7 相秉仁 计算药学 中国医药科技出版社 1990年 8 许禄 化学计量学方法 科学出版社 1995年9 蔡元龙 模式识别 西北电讯工程学按出版社 1990年10 王玺 化学统计学基础习题 沈阳药科大学 1995年11 Sanford Bolton,Pharmaceut
3、ical Statistics 1998年12 PHARMACOMETRICS THE SCIENCE OF QUANTITATIVE PHARMACOLOGY,A JOHN WILEY&SONS,INC.,PUBLICATION,2007,其他推荐参考资料,药学科学前沿与发展方向 吴镭,北京:中国医药科技出版社,2000 新药设计原理与方法 徐文方,北京:中国医药科技出版社,1997 分子生物学与中医药研究 王明艳等,上海中医药大学出版社,2000 计算机辅助药物设计-原理、方法及应用陈凯先等,上海科学技术出版社,2000 分子结构、性质与活性王连生等,北京:化学工业出版社,1997 蛋白质
4、的结构预测与分子设计来鲁华等,北京:北京大学出版社,1995 药物化学总论郭宗儒,北京:中国医药科技出版社,1994 组合化学(英)Nicholas K.Terrett,北京:北京大学出版社,1999 遗传算法原理及应用周明等,北京:国防工业出版社,2000 化学因子分析潘忠孝等,合肥:中国科技大学出版社,1992 化学计量学导论俞汝勤,长沙:湖南教育出版社,1991 现代分析化学中的信息理论基础俞汝勤,长沙:湖南大学出版社,1987 计算化学 陈念贻等,上海:上海科技出版社,1985 神经网络导论胡守仁等,长沙:国防科技大学出版社,1993,前言,统计学的意义All knowledge is
5、,in final analysis,history.All sciences are,in the abstract,mathematics.All judgments are,in their rationale,statistics.在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。C.R.Rao 统计与真理:怎样运用偶然性,前言,统计学的产生人类对数据研究的需要matters of state(国事)-Statistics 词源概率论(probability theory)博弈论(Game Theory)关于竞争、合作和游戏规则的
6、数学理论 win-win/lose-lose/zero-sum(win-or-lose),前言,统计学的发展古典统计学的萌芽时期(17世纪中叶18世纪末)近代统计学的形成时期(19世纪初19世纪末)现代统计学的发展时期(20世纪初),亚伯拉罕棣莫弗(Abraham De Moivre)166717541697年,英国皇家学会会员1735年,柏林科学院院士1754年,法国巴黎科学院会员主要成就:概率论、中心极限定理,卡尔弗里德里希高斯(Johann Carl Friedrich Gauss)17771855数学家、物理学家和天文学家“数学王子”、“数学家之王”“最伟大的数学家之一”相关成就:误差
7、正态分布的最小二乘理论 三次观测法确定谷神星的位置,Stiglers law of eponymy Stigler名字由来法则No scientific discovery is named after its original discoverer.“(没有科学发现是以它最初的发现者命名的)Named the sociologist Robert K.Merton as the discoverer of Stiglers law,so as to avoid this law about laws disobeying its very own decree.Robert K.Merton
8、(1910.7.4 2003.2.23)Matthew effect(or accumulated advantage)(the rich get richer and the poor get poorer“)马太效应(积累优势、两极分化现象),威廉戈塞 William Sealy Gosset,18761937现代统计方法小样本理论研究的先驱化学家、数学家与统计学家相关成就:1908年,以笔名“Student”在生物计量学杂志发表论文平均数的规律误差 1907-1937年间发表的22篇统计学论文于 1942年以“学生”论文集为书名重新发行,统计学的分类 描述统计学 与 推断统计学描述统计学
9、(descriptive statistics)是研究如何取得反映客观现象的数据,并通过图表形式对所搜集的数据进行加工处理和显示,进而通过综合概括与分析得出反映客观现象的规律性数量特征的一门学科。推断统计学(inferential statistics)是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对统计总体的未知数量特征做出以概率形式表述的推断。,描述统计学和推断统计学区别:描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。推断统计是研究如何利用样本数据来推断总体特征的方法。联系:现代统计学的两个组成部分,相辅相成、缺一不可。描述统计学
10、现代统计学的基础和前提推断统计学现代统计学的核心和关键,前言,统计学的发展正态分布(normal distribution/Gaussiandistribution)观测误差理论(Theory of errors of observation)如果影响一个量的独立随机因素众多而且每个因素的影响小,则这个量呈现为概率密度两头小、中间大的分布,p(x),前言,近代和现代统计学的发展 t分布 显著性检验方法 方差分析未来统计学的发展趋势依赖数学、结合计算机技术与实质性学科、统计软件、现代信息相结合从描述现状、反映规律,向抽样推断、预测未来变化发展,前言,统计学的一般定义和解释是以概率论和数理统计为基
11、础,对研究对象的数据进行搜集、整理和分析,揭示事物总体特征和规律的方法论科学。研究数据的搜集或产生、描述、分析、综合和解释,以获得新知识或新信息,或做出新推断的学科。,前言,统计学的学科分支经济计量学 econometrics技术计量学 technometrics 生物计量学 biometrics,biometry化学计量学 chemometrics医学统计学 medical statistics卫生统计学 health statistics生物统计学 biostatistics学科分级:化学 分析化学 化学统计学,前言,药学统计学的产生和发展学科的继承性和交叉学科的形成统计学方法在药学研究中
12、的应用新技术和新方法在药学研究中的应用 PR(Pattern Recognition)ANN(Artificial Neural Network)DM(Data Mining)KDD(Knowledge Discovery in Databases),统计学和数学软件,SAS Statistical Analysis SystemSPSS Statistical Product and Service Solutions(2010后称为 IBM SPSS)BMDP Bio Medical Data Processing曾与SAS、SPSS并称为三大统计软件包Statistica、Stata、S
13、-PLUS、Graphpad Prism数学软件:Mathematica、MATLAB、Maple,前言,药学统计学的定义(pharmaceutical statistics,pharmacometrics)研究数据的搜集或产生、描述、分析、综合和解释,以获得新的药学知识或信息,或做出新的药学推断的学科学科分级:药学 药学统计学药学统计学的应用片剂含量均匀度计量型检验方案的研究中药质量化学模式识别的研究中药方剂处方的筛选和优化,SGI图形工作站 SGI O2WorkstationRISC架构的MIPS并行处理器64位UNIX操作系统:IRIX分子模拟及分子建模软件 TriposSybyl&MS
14、IInsight II数据库系统 Oracle 数据库管理台MDL药物数据报告三维数据库(MDDR/3D)Chapman&Hall天然产物数据库(CHDNP)CambridgeSoft NCI 2D/3D&INDEXNET数据库,第一章 数据误差的叠加,1.1 误差及其种类误差:测量值(给出值)与客观真值之差,分析结果误差,实验误差,数据处理误差,系统误差随机误差抽样误差过失误差,舍入误差算法误差人为误差,相对误差,1.1 误差及其种类系统误差,系统误差(systematic error)可定误差 确定原因引起的误差性质:重复性 多次测定重复出现 单向性 正误差或者负误差 确定性 误差基本恒定
15、不变 无抵偿性 无法通过多次测定取平均值减免 分布多样性 未知分布可按均匀分布处理 改变实验条件才能发现它,1.1 误差及其种类系统误差,系统误差(systematic error)影响测定结果的准确性无法应用概率统计方法减弱或消除重复测定不能发现或减少,1.1 误差及其种类系统误差,系统误差(systematic error)误差分类恒差 绝对误差(absolute error)保持不变,与称样量无关,相对误差(relative error)随被测组份含量的增大而减小比例误差 相对误差不变,绝对误差随样品量增大而增大,1.1 误差及其种类系统误差,系统误差(systematic error)
16、误差来源 方法误差 仪器和试剂 个人误差检查和减免方法试验设计对照试验空白试验回收试验标准加入法,A:加入标准后测得量B:未加入标准前测得量C:加入标准量,1.1 误差及其种类随机误差,随机误差(random error)偶然误差、不可定误差 不确定原因引起的误差性质:随机性 单次测定误差大小和符号无法估计 多次观测服从概率统计规律正态性 分布为正态分布抵偿性 多次重复测定取平均值可减免,1.1 误差及其种类,随机误差影响测定结果的精密度系统误差和随机误差的关系抽样误差样品个体差异对取样的影响样本均值之间、样本均值与总体均值都可能不相等过失误差因操作失误产生的误差,1.2 准确度与精密度,准确
17、度(accuracy)观测值的正确性精密度(precision)观测值彼此符合的程度,极差,偏差,平均(绝对)偏差,方差(variance),标准差(Standard Deviation,SD),变异系数,(Coefficient of Variation,CV),1.2 准确度与精密度,精密度的层次连续测定的精密度相同条件下,同一时间内对同一样品进行n次重复测定重复性精密度(Repeatability precision)相同条件下,不同时间内对同一样品进行m回n次重复测定 m回 m个样本 n次 相互独立进行中间精密度(intermediate precision)变动因素:不同时间,不同人
18、员,不同仪器设备,1.2 准确度与精密度,第 i 回的连续精密度,重复性精密度,1.2 准确度与精密度,精密度的层次再现性精密度(Reproducibility precision)不同条件下,对同一样品进行m回n次重复测定 药典用语重现性耐用性(robustness)通用性 测试条件有微小改变时测试结果不受影响的承受能力研究分析方法时,通过系统适用性试验考察,1.2 准确度与精密度,分析方法的精密度影响因素:样品、样品的均匀性、被测量值大小、所用仪器、试剂、分析者、实验条件、测定次数仅在测定次数无限多,条件固定,对特定样品而言,标准差是一个常数。在相对条件下,针对具体样品来研究方法的精密度。
19、,准确度表示测量的正确性,精密度表示测量的重现性精密度是保证准确度的先决条件,只有在消除了系统误差后,才可用精密度同时表达准确度一组测量值精密度高,其平均值的准确度不一定就高可能包含一种恒定的系统误差,结果总是偏高或偏低精密度低,准确度也常常较低平均值与真实值很接近也是出于偶然,并不可取精密度和准确度都高的测量结果才准确,准确度与精密度的关系不精密则不准确,精密不一定准确,准确必需精密,1.3 误差的叠加,系统误差的叠加 和差的绝对误差等于各观测值误差的和差 积商的相对误差等于各观测值的相对误差的和差,1.3 误差的叠加,随机误差的叠加极值误差法标准差法极值误差法,1.3 误差的叠加 极值误差
20、法,极值误差法 例 容量分析法,K 换算因数(一般为相对分子量)C 标准溶液的物质的量浓度V 滴定体积W 称样量,1.3 误差的叠加 极值误差法,极值误差法 例 吸收光度分析法,被测组分含量,被测组分百分含量,1.3 误差的叠加 极值误差法,例 间接分析法 同时测定两组分含量的吸收光度分析:,对A1,A2进行偏微分,并令A1=A2,组分含量小的相对误差大组分含量大的相对误差小组分含量相近的相对误差大约相等,1:xcx+ycy=A1 2:xcx+ycy=A2,cx=,cy=,1.3 误差的叠加 标准差法,标准差法 根据概率分布规律处理随机误差的叠加使用条件:观测值足够多 各个观测值彼此独立 观测
21、次数有限时,用样本方差S2来估计2,和差标准差的平方等于各步观测值标准差的平方和积商的相对标准差的平方等于各步观测值相对标准差的平方和,1.3 误差的叠加,例:某药物的规定剂量为200mg,制成200mg/片,S=10mg,每次服用1片。也可制成50mg/片,S=3mg,每次服用4片。从保证用药的安全和有效方面考虑,服用哪一种标示量的片剂更有利?提示:服用4片药物时:S2=S12+S22+S32+S42=432 S=6mg,1.3 误差的叠加,例:容量分析法,SV=0.02ml V=20mlSW=0.2mg W=200mg,1.4 有效数字与计算规则,有效数字(significant figu
22、re)组成:可靠数字和最后一位不确定数字(欠准数字)常数、无理数、系数、H2SO4含量测定项下“每1ml的xxx滴定液(0.1mol/L)”规格项下:0.3mg,1ml:25mg,etcpH值,1.4 有效数字与计算规则,数值修约(rounding off for numerical values)通过省略原数值的最后若干位数字,调整所保留的末位数字,使最后所得到的值最接近原数值的过程数值修约规则新标准(GB/T 8170-2008)中,增加了术语“数值修约”和“极限数值”,删除了术语“有效位数”、“0.5单位修约”、“0.2单位修约”,数值修约规则,新标准:GB/T 8170-2008 数值
23、修约规则与极限数值的表示和判定(Rules of rounding off for numerical values&express and judgement of limiting values 国家质量监督检验检疫总局、国家标准化管理委员会2008-07-16 发布,2009-01-01实施)原标准:GB/T 8170-1987 数值修约规则(Rules for rounding off of numberical values)(国家标准局 1987-08-19 批准),数值修约规则,修约间隔(rounding interval)修约值的最小数值单位确定修约保留数位的一种形式,数字的进
24、舍规则,4舍6入5留双连续修约错误:15.454615.455 15.46 15.5 16,数字的进舍规则,药典的补充规定准标准和域标准(例:异戊巴比妥钠的干燥失重)药典用语:称定、精密称定;量取,精密量取“精确度可根据数值的有效数位来确定”,数字的进舍规则,“精确度可根据数值的有效数位来确定”,确定数学运算有效数字位数的普适规则结果的相对误差与运算中最大的相对误差相当例如:99.7%和 100.3%,第二章 显著性检验,前言统计推断从样本到总体 1)统计估计:样本统计量的计算,总体参数的估计 2)假设检验:接受还是放弃H0?数据组间差异存在的原因偶然还是必然?显著性检验的任务参数检验和非参数
25、检验方法,第二章 显著性检验,2.1 显著性检验2.2 2检验2的齐性2.3 拟合优度的2检验2.4 独立性检验2.5 非参数检验2.6 逸出值检验2.7 显著性检验中注意的几个问题,2.1 显著性检验,显著性检验的步骤:1)提出检验统计量并进行试验2)提出零假设H0和备择假设Ha3)规定显著性水平4)计算检验统计量5)界定P值和作出结论 几种参数检验方法:Z检验,t 检验,比率差检验,F检验、2检验,2.1 显著性检验,Z检验:1)样本均值与总体均值比较2)两样本均值的比较,标准正态分布常用的临界值(双侧检验):,2.1 显著性检验,t检验:1)样本均值与总体均值比较2)两样本均值的比较3)
26、成对t检验,1),2),2.1 显著性检验,t检验:2)两样本均值的比较 方差齐性检验,方差齐性,方差非齐性,2.1 显著性检验,例 24只豚鼠离体肺脏作支气管灌流试验,记录如下:,试验结果能否说明该药对支气管有扩张作用?,n1=12 n2=12,S1=9.815 S2=6.952,2.1 显著性检验,t检验:3)成对t检验,例 为判断大翅猪毛菜对降低血压是否有效,随机测得10例患者在治疗前、后的平均血压的数值如下:,2.1 显著性检验,3)成对t检验,2.1 显著性检验,比率差检验1)关于【2015】届毕业生http:/有1592名被授予学士学位。未被授予学位71人;比率:4.27%2)关于
27、【2014】届毕业生http:/,2.1 显著性检验,比率差检验1)样本比率与总体比率比较2)两样本比率的比较,2.1 显著性检验,1)样本比率与总体比率比较【例】:某产品要求次品率不超过2%,现在对某批次产品随机抽取30件样品,其中1件是次品,问是否应该拒绝这批样品?,2.1 显著性检验,2)两样本比率的比较,【例】观察流感活疫苗的接种效果,得如下数据:,2.1 显著性检验,疫苗分类,第一类疫苗免费提供,公民依照政府的规定受种的疫苗,包括国家免疫规划确定的疫苗,省、自治区、直辖市人民政府在执行国家免疫规划时增加的疫苗,以及县级以上人民政府或者其卫生主管部门组织的应急接种或者群体性预防接种所使
28、用的疫苗。第二类疫苗由公民自费并且自愿受种的其他疫苗。,2.1 显著性检验,疫苗分类,第一类疫苗计划免疫类疫苗国家支付费用保障不受传染病威胁的第一道防线主要包括卡介苗、乙肝疫苗、脊灰疫苗、百白破疫苗、白破疫苗、麻疹疫苗、麻风疫苗、麻腮疫苗、麻腮风疫苗、乙脑减毒活疫苗、甲肝减毒活疫苗、A群流脑疫苗、A+C群流脑疫苗,等等总共13种,22针次,2.1 显著性检验,疫苗分类,第二类疫苗计划免疫外疫苗公民自费:儿童注射由父母承担接种费用包括水痘疫苗、HIB疫苗、轮状病毒疫苗和流感疫苗等辉瑞(Pfizer)七价肺炎球菌疫苗“Prevenar”商品名:沛儿 接种方案:肌肉注射 参考价格:单价860元赛诺菲
29、安万特(Sanofi-Aventis)B型流感嗜血杆菌偶联疫苗“ActHIB”商品名:安尔宝 接种方案:皮下/肌肉注射 参考价格:单价160元部分计划内免疫疫苗根据疫苗的性质产地等也有部分收费灭活乙脑疫苗不收费,乙脑活苗需要收费,咨询医生选择,第二类疫苗计划免疫外疫苗公民自费:儿童注射由父母承担接种费用包括水痘疫苗、HIB疫苗、轮状病毒疫苗和流感疫苗等辉瑞(Pfizer)七价肺炎球菌疫苗“商品:沛儿 接种方案:肌肉注射 参考价格:单价860元赛诺菲安万特(Sanofi-Aventis)B型流感嗜血杆菌偶联疫苗“商品名:安尔宝 接种方案:皮下/肌肉注射 参考价格:单价160元部分计划内免疫疫苗根
30、据疫苗的性质产地等也有部分收费灭活乙脑疫苗不收费,乙脑活苗需要收费,咨询医生选择,偶合症 指受种者在接种时正处于某种疾病的潜伏期或者前驱期,接种后偶合发病,它与预防接种无因果关系,纯属巧合,即不论接种与否,这种疾病都必将发生。截至2009年11月30日,中国H1N1甲流疫苗接种后报告疑似异常反应发生率为11.44/10万,偶合症约占7%;异常反应报告发生率未超过国内外临床试验结果。2013年12月乙肝疫苗接种致死事件 湖南3名婴儿接种乙肝疫苗后出现严重不良反应,其中2人死亡。涉事两个批号产品已暂停使用。疫苗生产企业康泰公司发出澄清公报称,致死原因缘于偶合症,与疫苗无关。,2.1 显著性检验,F
31、检验样本方差与总体方差比较分析方法重复性差异比较方差齐性检验,例 混合罐中混合两种物质A和B,检查混合效率,运行10min和15min时分别在7处取样测定物质A的百分数(%):,2.1 显著性检验,F检验,例 混合罐中混合两种物质A和B,检查混合效率,运行10min和15min时分别在7处取样测定物质A的百分数(%):,2.1 显著性检验,2检验2分布:Z变量平方和的分布2分布特性:非负性;加和性;只有自由度一个参数可用于关于样本方差或样本标准差概率的陈述,2.1 显著性检验,2用于关于样本方差或样本标准差概率的陈述例:从总体标准差为0.020的正态分布总体中取出容量为10的样本,其样本标准差
32、大于0.030的概率是多少?,概率:1.0%2.5%,大约2%,2.2 2检验2的齐性,2检验2的齐性多组数据方差是否有显著差异巴特莱特方法(Bartletts method):,2.2 2检验2的齐性 巴特莱特方法,例 来自三个实验室的数据,2.3 拟合优度的2检验,观测频数与期望频数差异的显著性检验,2.4 独立性检验,分类标准差异的显著性检验列联表(contingency table)按两个或更多不同标准、原则、属性分类所编制列出的频数表 22 列联表 mk 列联表 配对计算资料的2检验,2.4 独立性检验 22 列联表,22 列联表 例 某医院收得乙型脑炎重症患者206人,随机分为两组
33、,分别用同样的中药方剂治疗,但其中一组加一定量的人工牛黄,治疗效果如下表。问人工牛黄能否增强乙脑中药方剂的疗效?,2.4 独立性检验 22 列联表,例,H0:用药和疗效是独立的,没有联系。人工牛黄没有增强疗效作用。两组治疗率相同。Ha:用药和疗效有联系,两组治疗率 不同。,根据H0,将两组的总治疗率作为理论治疗率:110/206 100%=53.4%,2.4 独立性检验 22 列联表,例,=(m-1)(k-1)=(2-1)(2-1)=12=7.72 2(0.01,1)=6.63,2.4 独立性检验 22 列联表,耶梯斯连续性校正(Yates correction),2 无需校正:(满足任一条件
34、)自由度 2|Oi-Ei|602 相加,2.4 独立性检验 22 列联表,2的加和性 2的加和也是2分布实验结果趋势相同时,2直接加和进行2检验实验结果趋势不同时,先计算2开平方后的数值,根据实验结果的趋势不同,加上正负号,之后计算代数和,按下列公式计算Z值,k 四格表数目,2.4 独立性检验 22 列联表,例 用止血粉做狗股动脉截断止血试验,共进行6批试验,结果如下表:,问加药后3min和5min的止血成功率有无显著差别?,2.4 独立性检验 22 列联表,例,第一次试验结果数据,2.4 独立性检验 22 列联表,第一次试验结果数据,22=0.5032=4.5042=2.1352=3.146
35、2=3.84 总 2=14.80 2(0.05,6)=12.59,2.4 独立性检验 22 列联表,如果直接用总结果计算:,2=0.00527 2(0.05,1)=3.84,2.4 独立性检验 22 列联表,例 用甲乙两种止血粉做狗股动脉截断止血试验,加药后压迫3min,共做了6批试验,结果如下表:,问甲乙两种止血粉的止血成功率有无显著差别?,2.4 独立性检验 22 列联表,例,第一批试验结果数据,2.4 独立性检验 22 列联表,计算其它各批数据,总 Z=1.92 Z(0.05)=1.96,2.4 独立性检验 mk 列联表,mk 列联表,2.4 独立性检验 mk 列联表,问给药方法不同与抗
36、电休克的效果有无关联?,例 用小白鼠惊厥法测定羚羊角制剂的抗电休克效果,试用口服、皮下、腹腔三种给药方法,结果如下表:,2.4 独立性检验 mk 列联表,不同给药方法与抗电休克的效果确实有统计学意义的关联,例,H0:无关联(无效假设)Ha:有关联,2=14.14 2(0.01,4)=13.28,2.4 独立性检验 配对计算资料的2检验,配对计算资料的2检验,问两药的抗休克效果有无区别?,例 比较东莨菪碱和氯丙嗪的临床抗休克效果,将病人按其休克程度配对,在每对休克程度相近的病人中除常规处理外,甲用东莨菪碱治疗,乙用氯丙嗪治疗,共观察了30对病人,其疗效结果如下表:,2.4 独立性检验 配对计算资
37、料的2检验,问两药的抗休克效果有无区别?,2(0.05,1)=3.84 2(0.01,1)=6.63,2.5 非参数检验,非参数检验 Nonparametric tests(分布自由方法 Distribution-free methods)不考虑研究对象总体分布具体形式检验中不涉及有关总体分布的参数(如:均值、方差)通过检验样本所在总体分布形式的一致性得出统计结论符号检验(Sign test)秩和检验(Ranks test)游程检验(Runs test),2.5 非参数检验,非参数检验方法适用范围未知分布、分布不明、分布不稳定样本数太少(n6)而使得分布状况尚未显示出来半定量数据 只能以严重程
38、度、优劣等级、效果大小、名次 先后以及综合判断等方式记录其符号或等级偏态分布组内个别随机变量偏离过大多组数据离散程度相差悬殊,2.5 非参数检验,非参数检验优点对总体假定较少适用范围广,无需考虑总体分布形式计算简便,在急需初步统计结果时可采用易于理解和掌握可用于不便精确测量的资料或等级资料,2.5 非参数检验,非参数检验缺点信息利用不充分检验效率低,出错可能性比参数检验大虽计算简便,但有些问题的计算仍显繁冗获取临界值表不易,2.5 非参数检验,符号检验(Sign test),适用于配对的实验设计。利用各对数据之差的符号来检验两个总体分布的显著性差异。如果两总体服从相同分布,则每对数据之差的符号
39、为正和负的概率应该相等。考虑到实验误差的存在,正号和负号出现的次数相差应该不大,如果太大,超过一定的临界值,就不能认定两个总体服从相同的分布,即差异显著。,2.5 非参数检验,符号检验(Sign test),例 某种新药治疗高血压患者18例,治疗前后的收缩压见表,问治疗前后的收缩压有无显著性差异?,2.5 非参数检验,符号检验(Sign test),当n超出符号检验表范围时,可采用正态近似法求Z值来确定P值:,2.5 非参数检验,秩和检验(Ranks test,rank sum test),建立检验假设,确定显著性水平 混合编秩 求秩和并确定检验统计量 确定P值和作出推断结论,2.5 非参数检
40、验,秩和检验(Ranks test,rank sum test),常用于配对、两样本和多样本比较。将两组试验数据混起来按照大小次序编号,每个数据的对应号码(名次)称为它的秩,对于大小相等的两个数,则以对应号的平均数赋秩。计算容量较少的那些值所对应的秩的和用T表示。若两组数据无显著差异时,两组的秩和不会过分悬殊,即T值应处于一定的上下限之间。根据n1,n2,查秩和检验表得到T1下限和T2上限,若TT1 或TT2,接受Ha,认为存在显著性差异;若 T1TT2,则不存在显著性差异。,2.5 非参数检验,秩和检验(Ranks test,rank sum test),例 两个品种的家兔,分别测定其停食1
41、8小时后的血糖如表所示。试问两品种家兔的血糖有无显著性差异?,2.5 非参数检验,秩和检验(Ranks test,rank sum test),当n120或(n2-n1)10时,可采用正态近似法求Z值来确定P值:,显著性检验方法比较,数据类型 参数检验 非参数检验 两独立样本 t检验 Wilcoxon秩和检验两配对样本 配对t检验 符号秩和检验多样本 方差分析 Kruskal-Wallis秩和检验,2.5 非参数检验,游程检验(Runs test)从两个总体中独立抽取的两个样本的观察值混合排列,观察游程个数,进行比较。用游程的个数来检验样本的随机性,或总体的分布特征。,两组数据混合排列 相邻数
42、据属于同组者即构成一个游程 连接若干同组的数据也构成一个游程 游程所含的数据个数成为游程的长度,游程总数记为R,2.5 非参数检验,游程检验(Runs test),例 比较两种不同的饲料(甲:高蛋白;乙:低蛋白)喂养大白鼠对体重增加的影响。试问两种饲料的影响是否显著?,2.6 逸出值检验,逸出值(离群值、野值,异常数据)逸出值检验的一般步骤1)用给定的公式计算统计量2)根据需要选定显著性水平3)按观测次数n和选定的显著水平从相应的统计 数据表中查找统计量的临界值4)计算值 临界值,数据异常,应舍弃 计算值 临界值,数据应保留,2.6 逸出值检验,逸出值检验的标准对不同的总体分别考虑:1)正态分
43、布总体异常值的判断和处理GB48832)指数分布总体异常值的判断和处理GB80563)I型极值分布总体异常值的判断和处理GB6380逸出值检验方法简介格拉布斯检验法(Grubbs)狄克逊检验法(Dixon),格拉布斯检验法(Grubbs)1)x1或xn 可疑2)x1,xn 均可疑 G(,n),2.6 逸出值检验,2.6 逸出值检验,狄克逊检验法(Dixon),2.6 逸出值检验,例 某醋酸泼尼松制剂的标示百分含量(%)六次重复测定结果分别为:98.5,98.4,98.7,99.5,98.2,98.4,其中是否有可疑数据需要剔除?,显著性检验中注意的几个问题,单侧与双侧检验第一类错误与第二类错误
44、关于显著性水平的选择“差别无显著意义”和“差别有显著意义”显著性检验的结论,单侧与双侧检验,显著性检验中注意的几个问题,p(x),0,0,/2,/2,p(x),0,p(x),显著性检验中注意的几个问题,单侧与双侧检验,0,p(x),【例】:参加本课程期末考试要求上课考勤的出勤率要高于40%,则12次课中抽查出勤率点名6次,至少要出勤几次?(Z(0.05)=1.96,=0.025,男生计算),显著性检验中注意的几个问题,单侧与双侧检验,0,p(x),【例】:参加本课程考试要求上课考勤的缺勤率要低于60%,则12次课中抽查出勤率6次,最多可以有几次考勤未到?(Z(0.05)=1.96,=0.025
45、,女生计算),第一类错误和第二类错误I have no need of that hypothesis.LaplaceThere are only two tragedies in life:One is not getting what you want,the other is getting it.第一类错误(错误):事实上不存在真正的差异,但作出了差异显著的结论。犯了以真为假的错误:舍弃了正确的零假设。第二类错误(错误):事实上存在真正的差异,但作出了差异不显著的结论。犯了以假为真的错误:接受了错误的零假设。,显著性检验中注意的几个问题,第一类错误和第二类错误,显著性检验中注意的几个问
46、题,p(x),0,0,p(x),显著性检验中注意的几个问题,关于显著性水平的选择“差别无显著意义”和“差别有显著意义”差别有无意义均指概率水平而言差别有显著意义具此差别的不同样本在同一总体中出现的概率很小,已达到了可以确认他们有差别的概率水平。差别无显著意义具此差别的不同样本在同一总体中出现的概率(可能性)并不小于统计上公认的概率水平。,显著性检验中注意的几个问题,显著性检验的结论小概率原理:一个事件如果发生的概率很小,那么可认为它在一次实验中是不会发生的 具有概率性质的反证法Logic from absurd premises.-HegelI think,therefore I am.-De
47、scartesThe Man From Earth&Phone Booth-THINKING MANS MOVIES!VERY DEEP AND VERY PHILOSOPHIC THOUGHTFUL.-HIGHLY RECOMMENDED!,第三章 方差分析,变差:生产和试验过程受到诸多因素的影响,结果因此有差异方差分析:确定引起结果有差异的诸因素中各自单独作用和交互作用的方法,第三章 方差分析,方差分析(analysis of variance,ANOVA)由数据的总变差中分出试验误差和条件变差,并赋予它们数量表示优点:不受对比组数限制可同时分析多种因素的作用可分析因素间的交互作用,3.1
48、 单因素方差分析,方差分析的假定:样本观测值的随机性样本间的相互独立性样本分别服从N(i,i),即正态性样本方差具有齐性,即方差齐性试验数据是各因素(包括随机误差)综合作用结果,各因素的效应是可以迭加的,即可加性,3.1 单因素方差分析,因素:影响试验结果的条件水平:因素在试验时分的等级处理:同一个试验条件下的试验根据试验影响因素的数目,方差分析可分为单因素方差分析和多因素方差分析,3.1 单因素方差分析,观测得到的试验数据:X11 X12 X1nX21 X22 X2nXa1 Xa2 Xani=1,2,a 水平数(分组数)j=1,2,n 重复次数(等重复试验)总试验次数 N=an,3.1 单因
49、素方差分析,符号定义和说明:,第i组观测值之和,任一观测值,第i组观测值的均值,所有观测值的总和,总均值,3.1 单因素方差分析,方差分析的数据可用数据结构式表示:,总均值,总变差,条件变差,误差变差,总均值,误差效应,水平效应,3.1 单因素方差分析,变差平方和 SS(sum of squares):,总平方和,因素平方和,误差平方和,3.1 单因素方差分析,自由度和方差:,3.1 单因素方差分析,水平效应(组间效应),固定(效应)模型,随机(效应)模型,水平人为选定因素的水平可控i 效应值为确定数值结论只适用于特定水平,众多水平中随机选出a个水平因素的水平不完全可控ai 效应值是一个随机变
50、量结论可推广到总体的所有水平,【I型 ANOVA】,【II型 ANOVA】,3.1 单因素方差分析,符号说明:,MSA 观测的组间方差MSe 观测的组内方差E(MSA)组间的期望方差E(MSe)组内的期望方差 因素A的方差成分 因素A的方差成分的估计值 误差的方差成分 误差的方差成分的估计值MS()单一测定的观测方差,3.1 单因素方差分析,随机模型,固定模型,以观测方差替代期望方差,单次测定的观测方差,3.1 单因素方差分析,例 从数百名学生中随机选出4名学生,每人做4份试验测定水中铁含量(ppm)(仪器经过校准,使用相同试剂),试确定学生测定值是否有显著差异。,3.1 单因素方差分析,方差