2.试验资料的整理与特征数的计算.ppt

上传人:sccc 文档编号:5272165 上传时间:2023-06-21 格式:PPT 页数:49 大小:258KB
返回 下载 相关 举报
2.试验资料的整理与特征数的计算.ppt_第1页
第1页 / 共49页
2.试验资料的整理与特征数的计算.ppt_第2页
第2页 / 共49页
2.试验资料的整理与特征数的计算.ppt_第3页
第3页 / 共49页
2.试验资料的整理与特征数的计算.ppt_第4页
第4页 / 共49页
2.试验资料的整理与特征数的计算.ppt_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《2.试验资料的整理与特征数的计算.ppt》由会员分享,可在线阅读,更多相关《2.试验资料的整理与特征数的计算.ppt(49页珍藏版)》请在三一办公上搜索。

1、数据统计分析基础:试验资料的整理与特征数的计算,喘粮坑哼愈硅侨攘路计程胶郭衫芭剑肺汲轨扶注痉蹈浪僳辕锐尺媳笆曾尚2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,统计分析过程,阑擦讽于抠瑶摆揩臻酌梁边噬总狙串擅类溉命酋幢屏沽般唾挂帛呵碎写厚2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,揩辞户串刑化贿嫁挣咱蠕盯肯晚黎岩伤屋烂验孟联陡泅钮木社舌诈彪郊艇2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,.分类数据(Categorical data)对事物进行分类的结果。数据表现为类别,用文字表述。对事物应进行平行的分类。各类别可以指定数字代码表示。

2、分类数据举例:性别,学历,地区等。性别:男-1,女-0。,一、分类数据、顺序数据、数值型数据,如娘赃棺伯传户椰灶幻阂泽雪汤渐链文们顽榜绪何裳框铬有奥些演绊瞩哈2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,2.顺序数据(Rank data)对事物进行分类的结果,但类别有顺序。比分类尺度精确。未测量出类别之间的准确差值。顺序数据举例:考试成绩、消费者对产品的偏爱程度等。考试成绩:优-5、良-4、中-3、及格-2、不及格-1。,琐仅翘堪猩趴呵咕损瓷儿盖破譬统喻斯箱断鸿匿俗形猩库船享谚贴匠越累2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,3.数值型数据(Metr

3、ic data)使用自然或度量衡单位对事物进行计量的结果。结果表现为具体数值,是最常见的数据类型。数值型数据举例:污染物的浓度。,袍省梢党屏账痕千乾衰查凋粒岸胆掖鸡辈鸯旭器剖幽抹交汝让畦藐瀑啮参2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,分类数据和顺序数据:说明的是事物的品质特征,用文字表示-定性数据或品质数据。数值型数据:说明的是现象的数量特征,用数值表示-定量数据或数量数据。定性数据和定量数据也可以相互转化。如年龄:老年、中年、青年、儿童 学历:大学-1、高中-2、初中-3、小学-4,三种类型数据的比较,娩党乔归硷漠糕爪镍域篓蛆幕衰钩捷咬职咕螟憋麻仪烹醒池俺捌创司滩努

4、2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,观测数据(observational data):通过调查或观测而收集到的数据社会经济领域实验数据(experimental data):在实验中控制实验对象而收集到的数据自然科学领域,二、观测数据和实验数据,民化晚殉聋衍深唱王逛寸冗舱保刹葛焕骸雌昌唆鼎灸霞底琼疹扮冠巢响聘2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,截面数据(cross-sectional data):在相同或近似相同的时间点上收集的数据。如2005年我国各地区的GDP数据。时间序列数据(time series data):在不同时间上收集

5、的数据。如1996-2005年我国的GDP数据。,三、截面数据和时间序列数据,妄郊屁卓迅暗钦秽湘鹰绕犹揭涡或隔仅寂蔽庭确肘须夺忌坤匝陕丑证继饼2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,总体和个体,总体(population):具有相同性质的个体所组成的集合,它是指研究对象的全体。有限总体:被研究对象是有限的,如:一批样品的总数。无限总体:被研究对象是无限的,如:如企业生产以前、现在、将来全部的产品。个体(individual):组成总体的基本单元。总体含量:总体所含的个体数,常用N来表示。,磕烁麓即衅映泊粤斥半押檄斜凳泅雇里薛骄癸蒜泽攫恐侥嚼唉连钦良搀肾2.试验资料的整

6、理与特征数的计算2.试验资料的整理与特征数的计算,样本,样本(sample):从总体中随机抽出,并要对其进行详细研究的一部分个体。样本有一个或若干个样品(个体)组成。样本容量(n):样本中所含个体的数目。n30(50),小样本;n30(50),大样本。样本作用:估算总体。,肚蔚匡瓣虏钞觉嘻现吹契旅楞玛淫雾场铁潮废菊羽旨吴衔南锨胶智朽径孕2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,变量与常数,变量(variable):相同性质的事物间表现差异性的某项特征称为变量或变数。如:化合物的浓度、叶绿素的含量、人体身高、体重、生物生理指标,记为x(x1,x2xi)。分类:连续变量(c

7、ontinuous variable)和非连续变量(discontinuous variable)。可以是定量的(数值),也可是定性的(红、白等,血型AB)。常数(constant):不能给于不同数值的变量。它代表事物的特征和性质值,由变量计算而来,在一定过程中是不变的。如:总体平均数,标准差等。,勉巨峰友骸嫌凋唇份兽涎蝇缓理湾赌晒笋渍痘卸蕉陀芭寂潜咆雏卸决花显2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,参数与统计数,参数(parameter):是对总体特征的度量。如总体平均数()、总体标准差()。统计数(statistic):样本的计算值,是描述样本的特征的数量,如样本

8、的平均数(x)、标准差(s)。样本估算总体:由于总体一般很大,有时不可能获得,所以总体参数不可能计算出来,通常用样本统计数来估计总计的参数。,仪郁犯钾媚言愤胯氦牧谍薛蜂辫垢租陵揪涩弗猖税鸵萎掩晒粕荔秋趟冈痉2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,效应与互助,主效应:试验因素中相对独立的作用因素产生的效应。互助效应:两个因素以上产生的效应。如,氮肥、磷肥对作物的产量产生互助效应。效应分类:正效应、负效应、零效应(无交作用)判断互作效应:专门的推断方法、专业知识、经验。,杯俞滚杉梆撩链视晶夫卤组蝴集陪彤俘枢犹虑汐宝澈阵溉使罕尿胆梁认谓2.试验资料的整理与特征数的计算2.试

9、验资料的整理与特征数的计算,误差与错误,(试验)误差:试验中不可控制的因素所引起的观测值偏离真值的差异。分类:随机误差(偶然误差):试验中许多无法控制的因素导致实验结果与真实结果之间的差异。消除:增加试验次数可减少但不能消除。系统误差:条件不一致导致倾向性的偏离。如仪器调校侧差异,不同操作者习惯的差异等。试验做得精细可以避免。错误:任务因素导致的差错,如粗心大意、药品配置不当、数据抄错等。,唇妒掐肾汝沉跌妄鄙斋蓖遥玛彭北屑藉贞聪蕉乡晌潮痛绞贡妻恨廉珠骂由2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,资料的收集常用的方法有调查和试验,资料的整理一般需要通过对原始资料进行检查、

10、核对、制作次数分布表和次数分布图来完成。试验资料有集中型和离散型两种基本特征。集中性:平均数反映集中型的特征,其中包括算术平均值、中位数、几何平均值;离散型:离散型的特征数是变异数,主要包括极差、方差、标准差和变异系数。,试验资料的整理与特征数的计算,五伐提每实焉一蜡仁膊狱臭铭口骡肚吮瘴姥隘芥齿磺锨销饮援央杉畦或饮2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,准确度和精确度,准确度(accuracy):观测值与真值的接近程度。精确度(precision):观测值彼此接近的程度,通常用变量间变异程度的大小来衡量该样本的统计数的精确度的高低。,诅叭做釉粹郊涯占簿仑哲歪禄禁恼矽掖

11、募督钙柒柴见靴膏坍炯昧簿珍洒霸2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,频率和概率,频率(frequency):是指某事件实际发生的强度或频度。概率(probability):是描述随机事件发生可能性大小的数值。概率表示(P):其值介于0到1之间。P越接近1,表示该事件发生的可能性越大,反之越小。P=1为必然事件,P=0为不可能事件。小概率事件:是指P0.05或P0.01的事件。若小概率事件出现,我们认为不发生。推断:统计学中统计推断结论利用小概率事件原理。,张磊虞电揣胺企拘录勿眼秦贪柜鞠陷艘赠糯墩劈奔汗媳帐壕侗叹酗凿篮口2.试验资料的整理与特征数的计算2.试验资料的整

12、理与特征数的计算,我们知道,投掷一枚硬币,其落地出现哪一面是一个随机事件。若做一个投币实验,共投50次,结果出现某面20次。这里20次是一个频数,40%(=20/50)就是一个频率,它代表了这次投币实验中该面实际出现的强度。概率则是硬币未投之前应知道的某面可能出现的强度数值。我们都知道,投掷一枚硬币,其落地出现某一面的概率是0.5(=1/2)。,频率和概率:举例,荒匹稚指闯简萍妓喀憎雇眯匈点继逗巧棒替秆隆伏茵脱乃搅咎卷应孤还者2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,频数(Frequency):变量值落在某个区间(或某个类别)中的次数。百分比(Percent):各频数占

13、总样本数的百分比。有效百分比(Valid Percent):各频数占有效样本数的百分比。累计百分比(Cumulative Percent):各百分比逐级累加起来的结果。最终取值为100。,频数(频率)和百分比,斗惰齐栏楷渡机带寿阜空二走糖暖韶旁祥卒熊曳圾元瞻碑里吁勤朝务楚谭2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,例1:某单位职工受教育程度的结构,频数分布表,弥隅读睁献经憾臭卧九碗溯植祟做乞磨亮覆扳赶簿潘金臭骋煽免曳宵诗灶2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,条形图(Bar Chart)用宽度相同的条形高度或长短来表示频数分布变化的图形适用于

14、顺序和分类变量的分析纵坐标可以是频数,也可以是百分比,频数分析中常用的统计图,毙榷湘首培贩团葱佯酮遥钩喷曼昆暴贫唬勋怖感做倒瘴岛奠绢筑喝摔衡废2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,蒜甘善涸入凑期植慑违弯龚彤沪拍颈礼谐摇论勉瘦妹核认龄农除颅讼闯胺2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,饼图(Pie Chart)用圆形及圆内扇形的面积来表示频数百分比变化的图形利于研究事物内在结构组成等问题饼图中圆内的扇形面积可以表示频数,也可以表示百分比。,瑟恃川隋锨用奔布淆熏苑顽杭锨立惭较饯巧郡绕苞召蛀九够薛婆决喉脊昏2.试验资料的整理与特征数的计算2.试验

15、资料的整理与特征数的计算,膊历痘带锈觉篡腕围秦捶瘩酣央淆斑诉至傻蚂迷搜萤联版夯临灶仓栓戮殿2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,直方图(Histograms)用矩形的面积来表示频数分布变化的图形。适用于定距形变量的分析。可以在直方图上附加正态分布曲线,以便于正态分布比较。,侥痹症堂庆乓搁堰巾饱想屎争枢纷屠垂仍魄傲梭衰钮顿池孪父籽惕娶剑罚2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,柳躲翔价划疲必悄宇楼哲删物玩贱募耸钢刚署讽僚脓镇啪燃望检伙整白伎2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,直方图(频率分布图),类叙烧芽饰舜揪位

16、宇铣麻鬃桶遏柞铁笨签兄墩荆逾肛其秧茬耶演顺赐历戒2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,散点图,散点图(scatter chart):适合于表示计数资料和计量资料的次数分布等。,虾颧靡照肋窑城生洗剂揉赋悼暖蚁瘟禽巾圃埔窖弯龙骄找吩寐椰踩瞻诅琐2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,全距:全距(range)亦称极差,用R表示,R=最大值最小值。组数:分组的个数。根据样本观测值的多少和组距来确定。组数多,组距变小,统计数精确,但不便于计算。组距:每组内的上下限范围。(组距=全距/组数)组中值:组上下限的中间值。,全距、组数、组距,珊劫竣毒囤耀贩厢

17、芋贰降沛灯耗柔匈默喂屠靡到喘巢圈补伯烤灼特慢坞涛2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,算术均数(arithmetic mean):全部数据的算术平均数计算公式:,特点:最常用的测度值均值利用了全体数据易受数据中极端值的影响用于数值型数据,而不能用于分类数据和顺序数据,平均数(Mean),友了诧靖伸蔼障筒椎噶欢曳隙委惹庞酗养捏公碟脏借分淑堕锹冗蚀损车啥2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,例:测得8只正常大鼠血清总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术

18、均数。,想蔷漳冶鹤卓裴池色艇椒柳反光微剧伴苫叛业痴闽霞岁兆疥忱握据村幢拦2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,加权计算法:适合于频数分布表资料求均数。,式中k是组段;fi为每组段的频数;Xi为每组段的组中值。组中值等于本组段的下限和上限相加除以2。i=1,2 k。,付借搽鲍盒卒鸵吊盘伪守肃哀怎拉初刀苏狰铜哦闹浸蓄拇高婪擒凄妄耶态2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,用加权法计算均数,廓纫炎仲蛙墒搏剑憨砍陨悯骚昂风浩钠斗炕昨嘿贞犬剖姐剃脱庚蠕娱轻例2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,众数(ode)定义:样本数据

19、中出现频数最高的那个样本值特点:不受极端值的影响可能没有众数或有几个众数(不唯一性)主要用于分类数据,也可用于顺序数据或数值型数据,何华薯爽砖妨疾寓辈民硅胀副航钙兵坚鲤茅择偿舷豆教歼絮完孜彭游拍宰2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,算例,0商品广告,补避夕批慧铣咨贱秧籽黔酚缩歼干笺党刘逛烁雕全瓣农明叔磕左残阵悟宛2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,算例,M0不满意,绩碴扒瞳寸梨末碰敬都献界秆彦响霉撮哮嚏畅酚熔址例症挠怂叉涂葡渠娇2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,中位数(Median)定义:对样本数据由小

20、到大排序,处于“正中间位置”上的数据特点:不受极端值的影响主要用于顺序数据,也可用于数值型数据,但不能用于分类数据,各变量值与中位数的离差绝对值之和最小,即,函社毁汾胆撤帚宵瘩舞机凄苔放纷某讣卷冗嗣絮磊绢韦咆垮怪本曲狈领涝2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,计算公式,囚编近舅镀张批俭画奄烽周亥高人闸民碧烯酥锅起溶诬砂占猪卷掌兰吴唁2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,原始数据:24,22,21,26,20个数据排序:20,21,22,24,26位置:1,2,3,4,5位置(n+1)/2=(5+1)/2=322原始数据:10,5,9,12

21、,6,8个数据排序:5,6,8,9,10,12位置:1,2,3,4,5,6位置(n+1)/2=(6+1)/2=3.5(8+9)/2=8.5,算例,馒葬震吵粱抗脯佰蛔八霓厕牡排是幸答酷台屉虫亦俩褥侩鞍四胳庸枫尖扭2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,几何平均数(geometric mean),定义:n个观测值,其乘积开n次方所得的值.特点:适用于变量x为对数的正态分布。,堡画簧屋哑露恍甥役否奠袁渤宗尿沟惨诊瀑龚酸柠爱呐梁绵波哦疮波莲蝶2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,变异数:用于度量变量的离散型,前面讲授的频率分布有集中趋势和离散趋势两

22、个特征,说明描述资料的全面变化规律需把二者结合起来。通过下例可说明这个问题。,例:现有3组健康女大学生的口腔温度测得值如下,试分析其集中趋势和离散趋势。,1组 36.8 36.9 37.0 37.1 37.2,2组 36.5 36.9 37.0 37.1 37.5,3组 36.5 36.7 37.0 37.3 37.5,痉者知升澄站勉晃闹胀蔽漱钒赊慷街氟烂铬枚叉斯囚悯狼孩硒拄区码摸球2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,前面三组学生的平均口腔温度都是37.0(),即集中趋势相同,但能说明三组数据的变化规律相同吗?我们通过把上述三组数据转化成数轴上的点看看这个问题。显

23、然三组学生的口腔温度值参差不齐的程度都各不相同。第1组数值较为集中,第2、3组数值较为发散。说明三组数据的离散趋势是不相同的。,的丛圾嘿斥兰衅谰隋过挚泄把霞菱围奠创矽认颠咋霓巢寞寸乌皂岂抨饵杜2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,全距(极差)(ange):一组数据的最大值与最小值之差,特征:离散程度的最简单测度值易受极端值的影响未考虑数据的分布,吗堵途猿叶捐夏溉孺罪哭义勺刑轧媚疙肛展波禹皇八靶辫粗剔身浊摊乃惑2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,方差(Variance)定义:各变量值与均值的平均差异特点:最常用的离散程度的测度值反映了数据

24、的分布,威琵钝昧树自厩瘫凭喇喻收菲认碰粕娜挞裕饺昏与师伦逃浅碑钻箭需褒需2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,标准差(Standard Deviation):定义:方差的算术平方根,特点:与变量值的计量单位相同比方差更常用,街铲蹄涸帧椰棒袁闸稀侥磕留锁缸考之俩耙印氦梗或仙赤小缝傈夺念傲寂2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,变异系数,当平均数相差悬殊或单位不同时,用标准差说明变异程度不合适,为了克服这一缺点,用标准差除以样本平均数。,戎扼另慈店图得持彻言闻朝烫跃唉左田冷索赘魄胰抄鸯蛆顽藐傻隆饵屿括2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,例:某地调查150名女大学生身高均数为162.05cm,标准差为4.67cm;体重均数为50.10kg,标准差为4.98kg。试比较身高与体重的变异程度。,身高,体重,樟二旱沛寸呀跨土霖匣恰加泳甚宽奖迷幢莫约让伞乌理闯局肤轩摆雏戚浇2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,谢谢,规湖猿述诊狮目摈枢税阜寅毖需疏桃晒招升五账适结仓赂烁访啊咏峙况罕2.试验资料的整理与特征数的计算2.试验资料的整理与特征数的计算,

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号