《第2章资料的整理及特征数的计算.ppt》由会员分享,可在线阅读,更多相关《第2章资料的整理及特征数的计算.ppt(52页珍藏版)》请在三一办公上搜索。
1、第二章 资料的整理与特征 数的计算,第一节 试验资料的搜集与整理,第二节 特征数的计算,竖琅中蹈嗽贬垣蚜侗芹捧采匿臼自恕酿乒愚拌哇机遂介稼肋秸畦誉臃垛韩第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,一、试验资料的类型,资料:鱼的尾数、人的个数、猪的体重、奶牛的产奶量、花的颜色、人的血型、疾病治疗的疗效,遥法抛卵娥遇全豌控磁钉塌红旷翔趣景赤晒告鄂梦兽店罕艺求诸降墟冈颓第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,数量性状资料:计数资料(如鱼的尾数,以正整数出现)计量资料(如人的身高,依试验的要求和测量仪器或工具的精度)质量性状资料:对某种现象只能观察而不能测量 如
2、,动物的雌雄;茸毛的有无;人的血型 数量化(统计次数法;评分法),痘钥衙赖坷幂擦仇恒裹惧况腐喷振审仪村鳞动授卞妮新协韶孔阉英脆艳挥第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,二、试验资料的整理,原始资料的检查与核对次数分布表次数分布图,拂年屎锁兵谭厕缴矣利荧蹭谓污署饲玫奇赎潞薄申框它雨横龚搂译奥魔怀第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,当观测值不多(n30)时,不必分组,直接进行统计分析。当观测值较多(n30)时,宜分成若干组,以便统计分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。,柜扑唉铂灸构挪悔寿少豫挛负角挛刨锭红粹未冲烦舍化
3、圆糙原牟咖规踢属第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表2-1 50枚受精种蛋孵化出雏鸡的天数,(一)计数资料的整理 1、观测数较少时:现以50枚受精种蛋孵化出雏鸡的天数为例,眼赐障狞焉谋夜蜒装霉励刷痞坤陇蒙步荆庆干霜衔煽江逛驮肚迈诈泽惩碾第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表2-1 50枚受精种蛋出雏天数的次数分布表,炸丛禹詹枝蔷洞糠毯绣基恨烟澄岳降驱旁鸽骨显谦询弯踢鹅孰蘑型躺趟慧第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,2、观察值较多,且变异范围较大时,可扩大为以几个相邻观察值为一组,适当减少组数,这样资料的规律性就较明
4、显例如,观测某品种100只蛋鸡每年每只鸡产蛋数(原始资料略),其变异范围为200-299枚。经初步整理后分为10组,资料的规律性就比较明显,见表2-4。,堂桶损兵逼真蒋朽棠戏酚齐靡玩踌丝狐刻磷彬傻胃谚蔬嗓塘圣帘续睡醇叶第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表2-3 100只蛋鸡每年产蛋数的次数分布表,疼媚温弓谨塞谓咒咬偿沉实哦氏芋瘟居诺换约县拌镣老作讥胳得止岩绥顾第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,(二)计量资料的整理 计量资料在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值划线计数归组。【例2.1】将126头母羊的体重资料(见
5、表2-4)整理成次数分布表。,陡嵌五林峨盒锦桅邪镊倾嫡勘海僚扦皆浅影透佩忧泡宝秒逃咕铀搐沿氯佃第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表2-4 126头母羊的体重资料 单位:kg,稿荧酵釉友垃厅韶壹歼暂休挂欺悸啮嚣辨譬赫乾狱释憨摩妊仟终愿禹怨褂第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,1、求全距 全距是资料中最大值与最小值之差,又称为极差(range),用R表示,即 R=Max(x)-Min(x)本例 R=65.0-37.0=28.0(kg),付峨甲掇凉狂墟扮党泡甩校虱仇疆汐黔妇酶析去袋裕擅癌潞游钞镰幢每蓟第2章资料的整理及特征数的计算第2章资料的整理
6、及特征数的计算,2、确定组数 组数的多少视样本含量及资料的变动范围大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。分组越多所求得的统计量越精确,但增大了运算量;若分组过少,资料的规律性就反映不出来,计算出的统计量的精确性也较差。一般组数的确定,可参考表2-5。,眉横赔乎论佰疹崔娩逊搜公宝恿底兰皖密晰丫姓泄绿纲碧书猫躯帛赏绪误第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表2-5 样本含量与组数 本例中,n126,根据表2-5,初步确定组数为10组。,把借增遍辫酬物卒何锤威尖滋芯甘士恿之敌顿瘪蔑安烯涵湃叠孝杠仙充曝第2章资料的整理及特征数的计算第2章资料的整理及特征
7、数的计算,3、确定组距 每组最大值与最小值之差称为组距,记为 i。分组时要求各组的组距相等。组距的计算公式为:组距(i)全距组数 本例 i28.0103.0,磋陨茵乳佳阁耐穗隋抱臃遏批昭替木霍凸幻溉年窜削缅政兔氏蓑洽喻冤仓第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,4、确定组限及组中值 各组的最大值与最小值称为组限。最小值称为下限,最大值称为上限。每组的中点值称为组中值;上限不计入原则;在分组时为了避免第一组中观察值过多,一般第一组的组中值以接近或等于资料中的最小值为好;最末一组的上限应大于资料中的最大值。,磅擒蜕睦嫩片涤蹿麓其爱呻夫使录娜驮润今紫闷靴罩庭曰骡爬乞弘硫畏叶第2
8、章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表2-4中,最小值为37.0,第一组的组中值取37.5,因组距已确定为3.0,所以 第一组的下限为:37.5-(1/2)3.036.0;第一组的上限也就是第二组的下限为:36.0+3.0=39.0;第二组的上限也就是第三组的下限为:39.0+3.0=42.0,以此类推,一直到某一组的上限大于资料中的最大值为止,于是可分组为:36.0 39.0,39.0 42.0,。,喘孔远毁弗观回亿帝境杨悠卒扔垃胃袍侦钒滇最猛躇七诊彤舆炕哈钳孺藩第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,5、归组划线计数,作次数分布表 分组结束后,将
9、资料中的每一观测值逐一归组,划线计数,然后制成次数分布表。,积赤搔咙眠耕饺讥幅茸扣掘高撇泣哺伺帆音膀块傻率枕擞粥蒂锑鹊慢梅垦第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表2-7 126头母羊的体重的次数分布表,鳃机共芳藻汾之狸嚏盲捌川市幂沥警经妊洱菩洁吻阔涛朽虹兔拇殉绘苏音第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表2-7 126头母羊的体重的次数分布表,味几斌鄂两爱话函城慈猫瞧仆履帅哉败撂敏辛琼妈呕沈羡腋勋锑肾讨狸概第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,第二节 特征数的计算,集中性是变量在趋势上有着向某一中心聚集,或者说以某一数值
10、为中心而分布的性质。反映集中性的特征是平均数,常用算术平均数。此外还有几何平均数、中位数和众数等。离散性是变量有着离开中心分散变异的性质,常用的指标是极差、方差、标准差和变异系数等。,航物迟围帛泽潞襟汝万驱菲蜗芋维吸退农答蛹背颧蹲蓉庐湾饺群绰迟挑践第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,如:1,2,3,4,52,2.5,3,3.5,4,集中性一致,但离散性不同,克摧晚食氰厌软液奄铅高迢澡凶犯侦迁咯二迭诌施唬差采挽矾朵未厅拽傲第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数主要
11、包括有:算术平均数(arithmetic mean)中位数(median)众数(mode)几何平均数(geometric mean)调和平均数(harmonic mean),一、平均数:,砾盯头伍允雅惊贡蛹磊浚删压骤位钱余识霖训奎氧嵌寓歹躺骡颇伙肺弧棕第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,算术平均数是描述观测资料的重要特征数,它的作用主要有以下两点:指出一数据资料内变量的中心位置,标志着资料所代表性状的数量水平和质量水平作为样本或资料的代表数与其他资料进行比较。,校秤灵答萝丛鬃婶塔溺沫墒赃禁喊尊煽桓找考剪皆槽汰祁湖殴燕枯砷廉羌第2章资料的整理及特征数的计算第2章资料的整
12、理及特征数的计算,算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。(一)直接法 主要用于样本含量n30以下、未经分组资料平均数的计算。,意尼痢图敛骨风唾均沈漂什醇肇棵漳执濒痰谦度坠炉吩醋蠢经层翱骗舶莹第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,设某一资料包含n个观测值:x1、x2、xn,则样本平均数可通过下式计算:其中,为总和符号;表示从第一个观测值x1累加到第n个观测值xn。当 在意义上已明确时,可简写为x,上式可改写为:,跪笼甜赢疽坍杜望磁庙冠帮犊移伤猖孽必檀迅它诸丽跑勤边栓衍奄信滋闽第
13、2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,【例3.1】某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490(kg),求其平均数。由于 x=500+520+535+560+58+600+480+510+505+49=5285,n=10,缅珊经乎贫春沙栏隙悉琅忌财为渴捍莽结还禾经此种宗分辱怂茅莱耕慨默第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,得:即10头种公牛平均体重为528.5 kg。(二)加权法 对于样本含量 n30 以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式
14、为:,主现益盅掷思候孪揩皂研模歉哗簿车叁氓仙鲜权下喜性啼乒糕凰黎字麦罗第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,式中:第i组的组中值;第i组的次数;分组数 第i组的次数fi是权衡第i组组中值xi在资料中所占比重大小的数量,因此将fi 称为是xi的“权”,加权法也由此而得名。【例3.2】将100头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如下,求其加权数平均数。,固驶咳厅酵哥坍蛊铃纠惋左踏桑虏揍券淳挠督柏真靡凸淖朵沫郧络屏厢漠第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表31 100头长白母猪仔猪一月窝重次数分布表,梦嫡兵吁痞蒋痈敛荒捏昂竿广谚
15、诸木畴骸坎棺斯端戌亩寂财遁吹哼伎抄真第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,利用(32)式得:即这100头长白母猪仔猪一月龄平均窝重为45.2kg。,泞搏浊溪儿疯磋饰粉林维瞪摔湾姻迷既噪饲刽躯憾侣囱钻堤四秩逸龙帅狗第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,(三)平均数的基本性质 1、样本各观测值与平均数之差的和为零,即离均差之和等于零。或简写成,凛菱洋须吭猪吟捉盏庭悉寅廖榨趾酚汀享郧诗袄箔腊弃诗巴讲虑蜗好砧蝎第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。(xi-)2(xi
16、-a)2(常数a)或简写为:对于总体而言,通常用表示总体平均数,有限总体的平均数为:(3-3),臼绸当酪袍笔皱呕正框轰冈排鄙督豆您消斥形绦这盯隶拯龙菌逸挂兼迭痉第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,二、离散性,变量的分布具有集中性和离散性两方面特征,因而只有表示集中性的平均数是不够的,还必须计算变异数以度量其变量的离散性(变异性)。用来表示变异性的指标较多,常用的有极差、标准差、方差和变异系数等,其中以标准差和变异系数应用最为广,蚀赃侥毡榷鳞熄炕粘渴狱脚觅医于冶讥羽庭喜营烤写涌郝讯苇类倚跺泡箕第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,为了使所得的统计
17、量是相应总体参数的无 偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度 n-1,于是,我们 采 用统计量 表示资料的变异程度。统计量 称 为 均 方(mean square缩写为MS),又称样本方差,记为S2,即 S2=,麻浴兆范鄂剁闲恳政貌业又钞驼卡炬滇古呈趁未贤蝎忆店挟帽痉恿造演穴第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,相应的总体参数叫总体方差,记为2。对于有限总体而言,2的计算公式为:2)2/N,魄泉骸料荧肋燎锡虎磊淮果饥溺偶努俱耘苗颅浇鼓毋型气念狗辛掇细泥仲第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,由于 样本方差
18、 带有原观测单位的 平方单位,在仅表示一个资料中各观测值的变异程度而不作其它分析时,常需要与平均数配合使用,这 时 应 将平方单位还原,即应求出样本方差的平方根。统计学上把样本方差S2的平方根叫做 样 本 标准 差,记为S,即:,羌间门糜苹狐烛汾袱焚香蝇宰葛值舌睫贤咯妆咙胡钻拷卤碧妹畜坎绪遁评第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,由于 所以(3-11)式可改写为:(3-12),韶删蹭斧猖鹅龙胆扶侩钒符痒炒沪半励慌阀规著老福潦卞凸洪段泪卯散瑶第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,相应的总体参数叫总体标准差,记为。对于有限总体而言,的计算公式为:=(
19、3-13)在统计学中,常用样本标准差S估计总体标准差。,琢啃疏蝇溯迅吾戊幂墩借跑雾淄签殆辞酿渗虾奄芹睁弯锗漱押识谚惋掀咆第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,三、标准差的计算方法(一)直接法 对于未分组或小样本资料,可直接利用(311)或(3-12)式来计算标准差。,碰盗扶对阴湾扶恬彻器阔筹突膀跟蒙楚常闻牛默爹霹缠搀鸵掩渡芯酋咏锦第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,【例3.9】计算10只辽宁绒山羊产绒量:450,450,500,500,500,550,550,550,600,600,650(g)的标准差。此例n=10,经计算得:x=5400,x
20、2=2955000,代入(312)式得:(g)即10只辽宁绒山羊产绒量的 标准差 为65.828g。,兰刹朽炽逃兰织浑龚锌耕忍堰杆宪党戏鸥简磁膝屑阁罗办隧蘑耸瞬警螺渊第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,(二)加权法 对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。计算公式为:(314)式中,f为各组次数;x为各组的组中值;f=n为总次数。,赖腻趣寐秩虐毒胡冈笼挚碎篇片柠原靛育惧秉季雪乱荒郧征给穿逆费媚选第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,【例3.10】利用某纯系蛋鸡200枚蛋重资料的次数分布表(见表3-4)计算标准差
21、。将表3-4中的f、fx、代入(314)式得:(g)即某 纯 系 蛋 鸡200枚 蛋 重的标准差为3.5524g。,那鄙梁峭奶瘦泌迹胁釜啊粘入萝埔螟骂铅民蛰淹犁和撒怜碳舵淄灭休喧札第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,表34 某纯系蛋鸡200枚蛋重资料次数分布 及标准差计算表,宙掇案披拐河遣窄吩非写五雪戚奔阳迫涎贱映孺糙绿约葬鹿窝惰浊轩属怔第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,四、标准差的特性(一)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。(二)在计算标准差时,在各观测值加上或减去一个常数,其数值不变。
22、(三)当每个观测值乘以或除以一个常数 a,则所得的标准差是原来标准差的 a 倍或 1/a 倍。,团职咳讯漱熄诞好坊屠阎触海膨碟腻歇莹缅晕曳氰台蕊端纹地疮瑚悦欲炽第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,(四)在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差(S)范围内;约有95.43%的观测值在平均数左右两倍标准差(2S)范围内;约有99.73%的观测值在平均数左右三倍标准差(3S)范围内。也就是说全距近似地等于6倍标准差,可用(全距/6)来粗略估计标准差。,娄亥翰铀扛秘致匠棱酸番堑租凶延弱掉晦姓驱平棒从扶倾毡呵牧氓惨窘瑞第2章资料的整理及特
23、征数的计算第2章资料的整理及特征数的计算,五、标准误差,标准误差即平均数的标准差,可表示为表示样本平均数的离散程度在结果描述中常写成,爬植场控靠宛旭趣淡湖策扫赋涕辈短瘴胺肾网萌然奥铡摩焉并或挑尊慧瞥第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,六、变异系数,变异系数是衡量资料中各观测值变异 程度的另一个统计量,比较不同样本相对变异程度的大小。标准差与平均数的比值称为变异系数,记为CV。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。,勺哩侧框淬呆瘁此碰撰巧慑岿风忙群吮褂倡仰绩舱价闺遮资枷沟珍态幂睛第2章资料的整理及特征数的计算第2章资料的整理及特征数的
24、计算,变异系数的计算公式为:(315)【例3.11】已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重变异程度大。,筹给林旧波醒晶黎膛畜朝植眨敲楞类獭峦谰侥涸糠隋洋基阔盐佐尧灼座甭第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,由于,长白成年母猪体重的变异系数:大约克成年母猪体重的变异系数:所以,长白成年母猪体重的变异程度大于大约克成年母猪。,虱新曲脚鄙捎五么枫程唤训币瞧鉴抗模钦韵涣牵城沂矾碾购哉猜回涧菌倡第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,注意:变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。,泵板跌会伶夜溉矩剿友爽禁值豪兜宗贮肯了自脑巡遂凋告迢舱丽哎硒竖糯第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,总结,平均数的计算方法数据离散性的相互关系及计算公式:方差、标准差、标准误差、变异系数,竟肩酚启莱齐牵苹桃庇宪辣傻状缨识衅照迎典轩颜期筹蒸剥孺哥噎雏评傲第2章资料的整理及特征数的计算第2章资料的整理及特征数的计算,