《生物统计学教学课件》第一章绪论.ppt

上传人:牧羊曲112 文档编号:5902944 上传时间:2023-09-01 格式:PPT 页数:52 大小:960KB
返回 下载 相关 举报
《生物统计学教学课件》第一章绪论.ppt_第1页
第1页 / 共52页
《生物统计学教学课件》第一章绪论.ppt_第2页
第2页 / 共52页
《生物统计学教学课件》第一章绪论.ppt_第3页
第3页 / 共52页
《生物统计学教学课件》第一章绪论.ppt_第4页
第4页 / 共52页
《生物统计学教学课件》第一章绪论.ppt_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《《生物统计学教学课件》第一章绪论.ppt》由会员分享,可在线阅读,更多相关《《生物统计学教学课件》第一章绪论.ppt(52页珍藏版)》请在三一办公上搜索。

1、,同学们好!,生物统计学Biostatistics,范小勇办公:31115316手机:,生 物 统 计 学,目的意义:学习生物统计学基本原理、基本统计分析方法和试验设计,为教学和科学研究服务。教 材:李春喜等 编著,2013,生物统计学(第五版),科学出版社。,五、主要参考书,1.明道绪主编,2002,生物统计附试验设计,中国农业出版社 2.盖钧镒主编,2000,试验统计方法,中国农业出版社 3.生物统计学杜荣骞,2000年7月 4.生物统计的数学原理,林德光,辽宁人民出版社,1982。,第 一 章 概论第 二 章 试验资料的整理与特征数的计算第 三 章 概率与概率分布第 四 章 统计推断第

2、五 章 2检验第 六 章 方差分析基础第 七 章 试验设计与统计分析第 八 章 直线回归与相关分析SAS/SPSS 软件在生物统计学中的应用*复习迎考,六、教学计划,平时 30%(作业、出勤、回答问题等)考试 70%,七、成绩评定,第一章 概 论,世界上有三种谎言:谎言、该死的谎言和统计There are three kinds of lies:lies,damned lies and statistics 马克吐温自传引述十九世纪英国首相狄斯 雷利的名句,第一节 生物统计学的概念,平均气温海南岛气候属于海洋性热带季风气候,年平均温度在22一26之间,平均数反映全年气候特征,表 几种动物性食品

3、的营养成分,数据资料的直观图示,第一节 生物统计学的概念,截至2005年底,全国已有343个单位可以授予博士学位,其中普通高校238所;777个单位可以授予硕士学位,其中普通高校461所。目前已有100多万名博、硕士生毕业,在校博士生、硕士生人数超过100万。这一现状表明,我国高素质人才培养已经进入一个相对稳定的发展时期,我国已成为名副其实的研究生教育大国。,数据,结果,第一节 生物统计学的概念,2006年全国硕士生报考人数127.5万,比05年增长9%。08年硕士研究生的考试形势会比往年更加严峻。报名参加2008年研考的恰好是本科扩招高峰2004年入学的本科生,而这批学生的人数全国范围内比0

4、3年增长了60万,达到了350万之多,这从一个方面导致了2008年研究生报考人数的基数相当大。推测2008年的全国硕士研究生的计划招生人数约为45万50万人,报名人数将达到150万170万人。在报名人数增长远多于计划录取人数的增长的同时,各院校又更加重视学生从事未来研究工作的科研能力和专业素质,加大了专业课成绩和复试成绩的权重,2008年考研的形势会更加严峻。,数据,结果,统计学(Statistics)是把数学的语言引入具体的科学领域,将所研究的问题抽象为数学问题的过程,是收集、分析、列示和解释数据的一门科学。统计学被广泛地应用于解决自然科学和社会科学各个领域中具体的随机现象的规律性,形成了应

5、用于各个学科领域的统计学,即应用统计学。,生物统计学概念,生物统计学(Biostatistics)是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科。属于应用统计学的一个分支。是一门应用数学。,复杂生物体,随机因素,数据变异,现象掩盖了本质,杂乱无章,X2检验,?,?,添加剂好,始重不同,进食前后,磅秤不准,在对事物的研究过程中,人们往往是通过某事物的一部分(样本),来估计事物全部(总体)的特征,目的是为了以样本的特征对未知总体进行推断,从特殊推导一般,对所研究的总体作出合乎逻辑的推论,得到对客观事物的本质和规律性的认识。在生物学研究

6、中,我们所期望的是总体,而不是样本。但是在具体的试验过程中,我们所得到的却是样本而不是总体。因此,从某种意义上讲,生物统计学是研究生命过程中以样本来推断总体的一门学科。,生物统计学是研究生命过程中以样本推断总体的一门学科。,生 的物 基统 本计 内学 容,试 验 设 计,统 计 分 析,基本原则方案制定常用试验设计,资料的搜集和整理数据特征数的计算统计推断方差分析回归和相关分析协方差分析主成分分析聚类分析,对比设计随机区组设计平衡不完全区组设计裂区设计拉丁方设计正交设计,第二节生物统计学的内容与作用,如何合理地进行调查或试验设计,如何科学地整理、分析所收集来的具有变异的资料,揭示出隐藏其内部的

7、规律性。,生物统计学的任务,问题:最适使用剂量分别是多少?新药物比旧药物治愈率高吗?1.试验如何设计?2.数据如何整理、分析呢?3.结果是什么?可靠性有多高?4.结论如何?新药是否可生产?,生物统计学的基本作用:,提供整理和描述数据资料的科学方法,确定某些性状和特性的数量特征。,运用显著检验,判断试验结果的可靠性或可行性。,提供由样本推断总体的方法。,提供试验设计的的一些重要原则。,课外活动:生物统计方法在生物学学术刊物中的应用情况,学习生物统计的方法和要求,掌握生物统计的基本概念、基本原理、基本公式和应用条件。能因地制宜灵活应用常用的试验设计方法及相应的统计分析方法。2.懂得抽样技术,抽样调

8、查的基本方法。学会研究事物间关系统计法,进行预测预报研究。3.懂判断别人的试验及调查结论的可靠程度。4.做好例题、习题、作业。,不过多讨论数学原理,偏重于统计原理的介绍和具体分析方法的应用,J.Bernoulli(贝努里,瑞士,16541705)系统论证了“大数定律”,即样本容量越大,样本统计数与总体参数之差越小。,P.S.Laplace(拉普拉斯,法国,17491827)最早系统的把概率论方法运用到统计学研究中去,一、古典记录统计学(17世纪中叶至19世纪中叶),第三节生物统计学发展概况,Gauss(高斯,德国,17771855)正态分布理论最早由De Moiver于1733年发现,后来Ga

9、uss在进行天文观察和研究土地测量误差理论时又一次独立发现了正态分布(又称常态分布)的理论方程,提出“误差分布曲线”,后人为了纪念他,将正态分布也称为Gauss分布。另外,他还完成了最小二乘法的研究,正式发表于1809年。,F.Galton(高尔登,英国,18221911)19世纪末统计学开始用于生物学的研究。1882年Galton开设“人体测量实验室”,测量9337人的资料,探索能把大量数据加以描述与比较的方法和途径,引入了中位数以及分布、相关、回归等重要的统计学概念与方法。1889年发表第一篇生物统计论文自然界的遗传。1901年Galton和他的学生Pearson创办了“Biometrik

10、a(生物统计学报)”杂志,首次明确“Biometry(生物统计)”一词。所以后人推崇Galton为生物统计学的创始人。,二、近代描述统计学(19世纪中叶至20世纪上半叶),K.Pearson(卡.皮尔逊,英国,18571936)Pearson的一生是统计研究的一生。他首创频数分布表与频数分布图,如今已成为最基本的统计方法之一;观察到许多生物的度量并不呈现正态分布,利用相对斜率得到矩形分布、J型分布、U型分布或铃型分布等;1900年独立发现了X2分布,提出了有名的卡方检验法,后经Fisher补充,成为小样本推断统计的早期方法之一;Pearson对“回归与相关”进一步作了发展,在18971905年

11、,Pearson还提出复相关、总相关、相关比等概念,不仅发展了Galton的相关理论,还为之建立了数学基础。,(歌赛特,英国,18761937)在生产实践中对样本标准差进行了大量研究。于1908年以“Student(学生)”为笔名在该年的Biometrika上发表了论文平均数的概率误差,创立了小样本检验代替大样本检验的理论,即t分布和t检验法,也称为学生式分布。t检验已成为当代生物统计工作的基本工具之一,为多元分析理论的形成和应用奠定了基础,为此,许多统计学家把1908年看作是统计推断理论发展史上的里程碑。,三、现代推断统计学(始于20世纪初),(费歇尔,英国,18901962)Fisher一

12、生论著颇多,共写了329篇。他跨进统计学界是从研究概率分布开始的,1923年发展了显著性检验及估计理论,提出了F分布和F检验,1918年在孟德尔遗传试验设计间的相对关系一文中首创“方差”和“方差分析”两个概念,1925年提出随机区组和拉丁方试验设计,并在卢桑姆斯坦德农业试验站得到检验与应用,他还在试验设计中提出“随机化”原则,1938年和Yates合编了Fisher Yates随机数字表。,另外,Neyman(18941981)和E.Pearson进行了统计理论研究,分别于1936和1938年提出一种统计假说检验学说。假设检验和区间估计作为数学上的最优化问题,对促进统计理论研究和对试验作出正确

13、结论具有非常实用的价值。,描述性,推断性,统计学在中国的传播,我国在解放前,社会经济发展缓慢,统计的应用和发展受到了很大的限制。1913年,顾澄教授(1882?)翻译了英国统计学家尤尔的著作统计学之理论(1911),即为英美数理统计学传入中国之始。之后又有一些英美统计著作被翻译成中文,Fisher的理论和方法也很快传入中国。在20世纪30年代,生物统计与田间试验就作为农学系的必修课,1935年王绶(18761972)编著出版的实用生物统计法是我国出版最早的生物统计专著之一。随后1942年范福仁出版了田间试验技术等,这些对推动我国农业生物统计和田间试验方法的应用都产生了很大影响。,新中国成立后,

14、许多学者翻译、编著了统计学论著,有力的推动了数理统计方法在中国的普及和应用。许多生物学研究工作者积极从事统计学理论和实践的应用研究,使生物统计学在农业科学、医学科学、生物学、遗传学、生态学等学科领域发挥了重要作用。在农作物品种产量比较试验、病虫害的预测预报、动物饲养试验、饲料配方、毒理试验、动植物资源调查与分析、动植物育种中遗传资源和亲、子代遗传的分析等都取得了较好的效果。,统计遗传学(群体遗传学),生态统计学,生物分类统计学,毒理统计学,生物统计学,生物数学,随着计算机的普及、网络技术的发展,统计电算程序:SAS(Statistical Analysis System)SPSS(Statis

15、tical Package for Social Science)Excel DPS(试验设计design of experiment数据处理processing of data模型建立simulation analysis)等的引进,统计学在中国的应用与研究出现了崭新的局面,越来越广泛、深入。,第四节 常用统计学术语,一、总体与样本,具有相同性质的个体所组成的集合称为总体(population),它是指研究对象的全体;组成总体的基本单元称为个体(individual);(总体中的一个研究单位)总体又分为有限总体和无限总体:含有有限个个体的总体称为有限总体(finitude populatio

16、n);包含有极多或无限多个体的总体称为无限总体(infinitude population).,从总体中抽出若干个体所构成的集合称为样本(sample);(总体中的一部分)构成样本的每个个体称为样本单位;样本中所包含的个体数目叫样本容量或样本大小(sample size),样本容量常记为n。一般在物学研究中,通常n30的样本叫小样本,n 30的样本叫大样本。对于小样本和大样本,在一些统计数的计算和分析检验上是不一样的。,统计推断,总 体,样本,随机抽样,总体,研究的目的是要了解总体,观测到的是样本,通过样本来推断总体是统计分析的基本特点。,为了表示总体和样本的数量特征,需要计算出几个特征数,包

17、括平均数和变异数(极差、方差、标准差等)。描述总体特征的数量称为参数(parameter),也称参量。常用希腊字母表示参数,例如用表示总体平均数,用表示总体标准差;描述样本特征的数量称为统计数(staistic),也称统计量。常用英文字母表示统计数,例如用 表 示样本平均数,用S表示样本标准差。,二、参数与统计数,由于总体一般都很大,或者不能得到,所以总体参数常常无法计算,但可以通过从总体中随机抽样,取得样本,用容易计算得到的样本的统计数来估计总体参数。用样本平均数 估计总体平均数,用样本标准差S估计总体标准差等。,“样本的作用在于估计总体”,三、变量与常数,变量,或变数,指相同性质的事物间表

18、现差异性或差异特征的数据。常数,表示能代表事物特征和性质的数值,通常由变量计算而来,在一定过程中是不变的。,变量,定性变量,定量变量,连续变量,非连续变量,只有整数出现,可以有任何小数出现,四、效应与互作,通过施加试验处理,引起试验差异的作用称为效应(effect)。效应是一个相对量,而非绝对量,表现为施加处理前后的差异。效应有正效应与负效应之分。,小麦亩产原来400kg 新品种亩产450kg 效应值为50kg亩;高血压病人原来180 吃降压药后为130 效应值为50mm汞柱;某人体重原来60kg 经减肥后为55kg 效应值为5kg.,例:,互作(interaction),又叫连应,是指两个或

19、两个以上处理因素间相互作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。,例:,田间施肥,亩施1kg氮肥 粮食增产3kg;亩施1kg磷肥 粮食增产2kg;亩施1kg氮肥1kg磷肥 粮食增产6kg;,氮肥和磷肥相互作用引起的正效应:氮肥(3)+磷肥(2)+氮肥磷肥(1)6(kg),五、误差与错误,变异,效应,误差,随机误差抽样误差偶然误差(Random error),系统误差片面误差(Systematic error),随机误差,也叫 抽样误差(sampling error),是由于试验中无法控制的内在和外在的偶然因素所造成的试验结果与真实结果之间的差异。如试验动物的初始条件、

20、饲养条件、管理措施等尽管在试验中力求一致,但也不可能达到绝对一致,所以随机误差带有偶然性质,在试验中,即使十分小心也是不可避免的。如果通过良好的试验设计、正确的试验操作,增加抽样或试验次数,随机误差可能减小,但不可能完全消灭。统计上的试验误差一般都指随机误差。随机误差越小,试验精确性越高。,系统误差,也叫片面误差(lopsided error),是由于试验处理以外的其他条件控制不一致所产生的带有倾向性的或定向性的偏差。系统误差主要由一些相对固定的因素引起的,如仪器调校的差异、各批药品间的差异、不同操作者操作习惯的差异等。系统误差影响试验的准确性。只要试验工作做得精细,系统误差是可以克服的。,错

21、误(mistake),是指在试验过程中,由于人为作用引起的差错。如测量仪器不准、试剂配制不当、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为因素而引起的,只要以认真负责的态度和细心的工作作风,在试验中是完全可以避免的。原则上,试验中是不允许出现错误的。,20年前,德国化学家劳尔赫在研究化肥对蔬菜的危害时,无意中发现,菠菜的实际含铁量并不像所宣传的那样高,只有食品营养化学和各种有关手册所载数据的十分之一,劳尔赫很是诧异,怀疑试验是否有偶然性。于是,他找来各种各样的菠菜叶子,一一加以分析化验,但从未发现哪一种菠菜叶子的含铁量比别的蔬菜特别高的情况。他进而探索所谓菠菜含铁量高的“神话

22、”,是从哪里来的。追踪结果发现,原来是100年前,印刷厂在排版时,不小心把菠菜含铁量的小数点向右错移了一位,从而使它的含铁量扩大了十倍,缪误相传,以至今日。(3.5mg/100g)菠菜中仅有1%的铁在肠道中吸收,90%与草酸结合,不仅难以吸收,而且也会影响人体对铁的吸收利用。,六、准确性与精确性,准确性(accuracy),也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。设某一试验指标或性状的真值为,观测值为 x,若 x与相差的绝对值|x|越小,则观测值x的准确性越高;反之则低。精确性(precision),也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此

23、接近的程度。若观测值彼此接近,即任意二个观测值xi、xj 相差的绝对值|xi xj|越小,则观测值精确性越高;反之则低。,准确性不等于精确性。准确性是说明测定值对真值符合的程度大小,而精确性是说明多次测定值的变异程度大小。调查或试验的准确性、精确性合称为正确性。,统计推断,总体,样本,随机抽样,现象,本质,平均数,变异数,畅所欲言,为什么要学习生物统计学?如何学好生物统计学?指出下列术语间的差别:总体与样本 变数与常数 参数与统计数 机误和错误 效应与互作 准确性与精确性,章节小测验,1.变量按其性质可以分为_变量和_变量。2.样本统计数是总体_的估计值。3.生物统计学是研究生命过程中以_来推断_的一门学科。4.生物统计学的内容包括_、_。5.生物学研究中,一般将样本容量_称为大样本。6.试验误差可以分为_、_两类。,章节小测验,1.对于有限总体不必用统计推断方法。()2.资料的精确性高,其准确性也一定高。()3.在试验设计中,随机误差只能减小,而不可能完全消除。()4.统计学的试验误差,通常指随机误差。(),

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号