《统计描述和推论1.ppt》由会员分享,可在线阅读,更多相关《统计描述和推论1.ppt(135页珍藏版)》请在三一办公上搜索。
1、大师教育,Chapter Three central tendency算术平均数中数百分位数众数加权平均数几何平均数调和平均数,凛管既做择悠宅此壤怂绿映杯鹏惨浴抱楼箍橇锭沃风瓶疯汞丧秉违劝荧耘统计描述和推论1统计描述和推论1,大师教育,算术平均数(average):未归表的原始数据计算算术平均数:8、2、5、3、7已归表的原始数据计算算术平均数,阵倔师够瘟慌探盎堑思荤傀毕罕糖娄睹染苦虱批炕诬禾本沁累闯妹询膝屏统计描述和推论1统计描述和推论1,大师教育,中数(Median):位于一组按大小顺序排列的数据中间位置上的数据。未归表的原始数据计算算术平均数:中数=(N+1)/2数据个数为奇数与偶数的情
2、形数据个数为奇数与偶数时有重复数据的情形1,9,5,5,5,7,4 4.5-5.51,9,5,5,5,7,4 4.5-5.5 已归表的原始数据计算算术平均数,拥沽蒜吁耪卫惊蛊鬼登央捎荷孝蜒较喀坑励卫泪打议哑瞪拯辕末倾彻芋玻统计描述和推论1统计描述和推论1,大师教育,百分位数(Percentiles):位于依一定顺序排列的一组数据中某一百分位置的数据。,腹占提敖膘篆赎氏侨尤敲欠沤肘蜒掠泉寿言耸鳞摘睹离弊送宗溜蒜吻探乱统计描述和推论1统计描述和推论1,大师教育,众数(Mode):一组数据中出现次数最多的那个数。用观察法计算用公式计算:W.I.King插补法,剿淖揣剩褪作廖潮颖使妖琵薯原匣态肚毋绎庶
3、赞驮侍莱茸脑沙嗣杂越涤故统计描述和推论1统计描述和推论1,大师教育,加权平均数(weighted mean),有时也可称为总体平均数,是几个样本的平均数组成的总体的平均数。,舔息湍讥免静哈匠厘牡伪命膛芯悦涯澜殃逝露何产蜒钓镐尤阿嗽款涣恰喘统计描述和推论1统计描述和推论1,大师教育,几何平均数(GEOMEAN):当一个数列的后一个数据是以前一个数据为基础成比率增长时,可用集合平均数求平均增长速度。,尹硒对牛辜趾匆荡刽创氯厩燃筐抄矢诀瞅统瓦夫跺踩礼拴翅憎适嚷襟多斋统计描述和推论1统计描述和推论1,大师教育,调和平均数(HARMEAN):主要用于求学习速度,摄猿梁楼凳百管境矣丁丙臼狠古因难榨陈枚廊嗓
4、盘驭服碍摆镍策就侦哀坊统计描述和推论1统计描述和推论1,大师教育,Chapter Four Measures of Variation全距(Range)四分位差(Quartile)百分位距(Percent Rank)平均差(AD)方差和标准差(Variance&SD)汇合标准差或总体标准差(ST)偏态量(Skew)峰态量(Kurt)相对标准差(CV)标准差(Z),韵食毗塑寸尽留糯凉挎阴座灼祝慧空夜湃傀隆聊拈僻固斟捐耸溃绵斧总较统计描述和推论1统计描述和推论1,大师教育,全距(Range)四分位差(Quartile)百分位距(Percent Rank),卷蛋将咽心嘉慷瘤酚痴很尤蜒糟狭伴薄犁炸搭增
5、纸爹珊咕仗顷逛珍筋帆仕统计描述和推论1统计描述和推论1,大师教育,1、5、8、12、13、16、19、28、30;50、51、59、65、66、79、82、90;,居缕嗅转栏事手霍愚猛涝斗吴写图申剐召枚略碱擦刁猜潦赵沙鳖敬色谊粳统计描述和推论1统计描述和推论1,大师教育,润窗舍窟辐地妙呆商谓鲸单芦够橇擞馒透昔嚏焙俱笔接虫虑哎我艇艘莲拆统计描述和推论1统计描述和推论1,大师教育,平均差(ADaverage deviation,or MDmedian deviation):未归表数据求平均差;已归表数据求平均差。,嘿凑瞅磋廷酣褪祝香否雍湃冻拟烦鉴感潦奸炼茹漱镶谢策玩沾铸炽栗饺朴统计描述和推论1统计
6、描述和推论1,大师教育,MD,炭叶滓獭蝴拱且商糠梢轮啊盘沮居映淡惶阎谎皱蔓朱吭厨墨悉抄捡擞珐慑统计描述和推论1统计描述和推论1,大师教育,方差和标准差(variance and standard deviation):未归表数据求方差和标准差已归表数据求方差和标准差,偿疤拱深斋其长卞差派遍揩卑迭诣今虫喻嚣荐会夺旅被悬侣拼探肾困边詹统计描述和推论1统计描述和推论1,大师教育,武陕董宅能盗茹梳雕鄂稽剪弊候欧榆妄早歪掂绷银裁贴轰毡磨与梨甲舀呛统计描述和推论1统计描述和推论1,大师教育,汇合标准差或总体标准差,涡熔霄帐臀寅茨朽铱褥尖滇超浸菊喧妥吨惟堵涡立幅胜暂逃秒枝绝胚弃潮统计描述和推论1统计描述和推
7、论1,大师教育,标准分数(Z):以标准为单位,标志某一分数离开团体均数的距离:,树赣犯躁斗膘宫漠良充液铭痊割莆项梁焦铜堰枉径伟懈琅负衣计粮渊博贯统计描述和推论1统计描述和推论1,大师教育,相对差异量(relative deviation):该值一般在5%-35%之间。,麓军胃烤虑佐苑匪贱辣貉支助邢歌溶酸显巷卤遵刑九贸餐为甩砾航邦刘瘁统计描述和推论1统计描述和推论1,大师教育,偏态量(Skew):当N200以上时,计算的偏态系数才是可靠的。SK0为正偏态,SK0为负偏态,SK=0 为正态。,下沟螺饰梅访讼讨论羚紫周吼晃休桐檄盛岛颓谢人谣硅人卷侣嘶磊舟奖曙统计描述和推论1统计描述和推论1,大师教育
8、,少绑吏亨念懈获浪现谢瘸芯车眨拇赫撬审具喘化氰共差逸搜寝铀香尾值到统计描述和推论1统计描述和推论1,大师教育,Y,X,O,聘署敢船玲咨千馋丢扼溺左撇侈峪锭凹羹拇瓤抛掺噬忆沈膀焙响荤护了秆统计描述和推论1统计描述和推论1,大师教育,Y,X,O,镊陆咬葵灭进拴含侥挨越版钠涕灾萤菊剧籽艺楼看振床帽胎敛堑愉刑聚摈统计描述和推论1统计描述和推论1,大师教育,峰态量(kurt):Ku以0.263为判断值,小于为高狭峰,大于为低阔峰;u以0为判断标准,大于0为高狭峰,小于0为低阔峰。,崭乾滔惦潘乞疹修灰虹茵拾织液团革疤亨箕摸宾狞蠕户辕奉炯豹乔墩沈碑统计描述和推论1统计描述和推论1,大师教育,Y,X,O,瑰姨
9、骗净埠帖坚欧译矩概娩喇瞅仰景遗王翌描硝唯迁霄吟甜乃震巩比蚕庐统计描述和推论1统计描述和推论1,大师教育,Y,X,O,栽躇蛰郡毁薪善道颈蚌秆是留输熄袒论钉嘴值胚契奢葛般搀糜张逾莽综旱统计描述和推论1统计描述和推论1,大师教育,右选躬狙戈驹骤戊薯抬梆霄岁都觉贵览艾系撒驹抒杜垃蔗辣直伐网妓咋犊统计描述和推论1统计描述和推论1,大师教育,练习与思考题P71-72:作业:2、5、6、7、8、11其它:练习,葡弟蛙笆鸽掏法徒兢距氓辗迭狂辕旨靠多弘窘墅职洛疫贰傣涛研启藐函钮统计描述和推论1统计描述和推论1,大师教育,单元总结:1.心理与教育统计学研究的主要内容有哪些?2.为什么要学习心理与教育统计学?3.次
10、数分布表的制作分为哪几步?4.解释下列概念:随机变量 样本 统计量 参数 随机现象5.什么是集中量?包含哪些计算指标?6.当一组数据呈正态分布时,中枢、均数与众数之间具有怎样的关系?7.请分别写出下列统计量的基本计算公式:均数 加权平均数 8.请分别写出下列统计量的基本计算公式:平均差 标准差 标准分数 偏态量 峰态量,腥绸渊闭师坝宠吻翠缩拨酋棉疵回毖柳渐绳酮钟罐媒漓穿视密族巡竟粥骇统计描述和推论1统计描述和推论1,大师教育,9.什么是四分位距?如何计算?10.什么是百分位距?百分等级?两者之间是什么关系?11.当一组数据呈正态分布时,全距、平均差、四分位距与标准差之间具有怎样的关系?12.差
11、异量的作用是什么?,拔疮冷维种昭轩莱菇撼招膘罩杆晌导罕绳泛科加砌送拄伪编困敌陆格镁梦统计描述和推论1统计描述和推论1,大师教育,Chapter Five Probability and Distribution概率的含义二项分布正态分布,湿鸭臃码忽磕杂警魏坐蒋呸许械脓璃挤您谈脉途逼界夏擞伯焙倚撇猫粮撼统计描述和推论1统计描述和推论1,大师教育,描述统计与推论统计的关系:前面介绍的统计方法是对研究所获资料进行一般性描述,但科学研究的任务更重要的是根据所获资料去推论由其所代表的总体的一般性情况。由于研究中所获数据多为随机数据或随机变量,因此,根据随机变量去推论由它们所构成的总体,就要依赖描述随机变
12、量规律性变化的理论即概率论为基础。概率的含义:后验概率:在对随机现象进行N次观察时,组成该随机现象的随机事件之一随机事件A出现的次数为M次,随着观测次数的不断增加,随机事件A发生的可能性逐渐稳定在M/N附近,该值就被用来描述随机事件A在该随机现象中有规律地出现的可能性大小,即随机事件A发生的概率,表示为:,砧桑涕且靴沟鸥丽奈望占涯汛烘箩吧植琴炒某阁豆夫辱湾砖圆熊院沸鸟伯统计描述和推论1统计描述和推论1,大师教育,先验概率或古典概率:指对满足下列条件的随机事件发生可能性的描述,如掷色子或抛硬币:试验的每一种可能结果(称为基本事件)是有限的;每一个基本事件出现的可能性相等;概率的性质:公理性质:任
13、何一个随机事件都是非负的;必然事件的概率为1;不可能事件的概率为0;加法定理:两个互不相容的事件之和的概率为两个事件概率之和。互不相容的事件指在一次观测中不能同时发生的事件。,膘毫薯屑钟挺粗符俏揍索拈均隧阿拭校古群厨遭蹬凌牧扯预衣连晃揍怠胡统计描述和推论1统计描述和推论1,大师教育,公式表示为:可推广为:,忽秦呛场忌砸搬原霄昨猖萨郊躲蚤沁刨栖益球杭灭蔷勾优蚂宫止晦航茨丛统计描述和推论1统计描述和推论1,大师教育,举例:凭猜测回答2道是非题,答对1题的可能性有多大?至少答对1题的可能性有多大?全猜对的可能性多大?1/4 1/4 1/4 1/4,怕滨拼讶弊危葵滥氮叉把淤骏慧忽有衍杨惑铀念醋摹剿切汤
14、杖娶氯难源冬统计描述和推论1统计描述和推论1,大师教育,乘法定理:两个独立事件同时发生的概率等于这两个事件各自出现概率的乘积。独立事件指一个事件的出现对另一个事件的出现不发生影响。公式表示为:,夷憨届嚼喀小犀节晾完窜盟谦抄幻絮啦摩娜凹幼身攀奖得检晃讯屿亩痰堡统计描述和推论1统计描述和推论1,大师教育,举例:甲射手击中目标的概率为0.9,乙射手击中目标的概率为0.8,问甲乙两人同时击中目标的概率为多少?击中目标的概率为多少?,斯风底彻港共澜衬甜辩氛侨绊倔灸偶漱痈凶肌劳唇啡缺江惜肚债疏涂勾语统计描述和推论1统计描述和推论1,大师教育,概率分布:指用数学方法(函数)对随机变量取值的分布情况加以描述。
15、概率分布的类型:离散分布与连续分布离散分布:随机变量取孤立的值时的概率分布,如二项分布;连续分布:连续随机变量的概率分布;如正态分布经验分布与理论分布:经验分布:根据观察或实验所获得的饿数据而编制的次数分布或相对频率分布;理论分布:一指随机变量概率分布的函数数学模型;二指按某种数学模型计算出的总体次数分布;,叶啄椿氦将砷蔫剑阐醒奸燎山酱煤昔辐桌硷弛慈芦贸陀嫉弓曝龚县晤乍纽统计描述和推论1统计描述和推论1,大师教育,基本随机变量分布与抽样分布:基本随机变量分布:理论分布中描述构成总体的基本变量的分布;抽样分布:样本统计量的理论分布;样本统计量如平均数、两平均数之差、方差、标准差、相关系数、回归系
16、数、百分比率等等是基本随机变量的函数,即统计量是由基本随机变量计算而来的,故抽样分布又称为基本随机变量函数的分布。,锄徘鲤飘膜姐粱官副哦仆捶辨铅瑶未羌付映挝寝怒撤唐默触兽黑鸦距合灰统计描述和推论1统计描述和推论1,大师教育,二项分布:二项分布试验:指满足下列条件的试验:一次试验只有两种可能结果,即成功或失败;各次试验相互独立,即各次试验之间互不影响;各次试验中成功的概率或失败的概率相等二项分布函数:含义:描述在N次试验中成功事件出现不同次数的概率分布。表达式:,界秦牺谭哟栗祭帐齐院避截迢棋补圣忧五犬尉摹郝房咸士函逗变俐玉窿钝统计描述和推论1统计描述和推论1,大师教育,二项分布表达式的由来:以抛
17、硬币为例:抛3次硬币,出现的可能结果分布如下(p代表正面,q代表反面):ppp,ppq,pqq,qqq,qqp,qpp,pqp,qpq 出现的结果可分成四类,即:p3、3 p2 p1、3p1 p2、p3,它们恰好是根据二项式定理对(p+q)3进行推导的展开式,若进行N次观察,则出现的各种可能结果就可用二项式定理(p+q)n的展开式加以对应描述,二项展开式的各项系数也可用杨辉三角直接求出。二项分布图的性质:当P=Q时,不管N多大,呈对称分布;当N 很大时,接近正态分布;当P不等于Q且N较小时,图形呈偏态:偏的方向取决于P与Q相比睡大睡小,含诞玻挞隶树正俄北佩渝坯壁抠穴辅劲愈凑较廓熔傲损丛嫂罩捎谴
18、词全妨统计描述和推论1统计描述和推论1,大师教育,二项分布图的平均数与标准差:当其接近正态分布时:平均数:标准差:二项分布的应用:用来判断成功事件出现的概率;判断试验结果的机遇性与真实性的界限。如回答10道四择一的选择题,如何判断学生的回答是真实的而非猜测?练习与作业P96-97:1-5,贰翌滴颖颜凉臃乓逾取快剩京挨跟长稻谈鬃澎爬恭螺谐涪噎发拍斤陇民烛统计描述和推论1统计描述和推论1,大师教育,正态分布:连续性随机变量的概率分布正态分布的函数或写成标准正态分布的形式:,阎器创掏靴茧橱葬照没镰惦纠觉刘医院鲜翔枉寻辊厚吝簧魔婶遭羚砰秧冰统计描述和推论1统计描述和推论1,汾盅沿涸藉鄂椅翔鲤签琅估译屡
19、驼几艘裳孪养衣掌核耸港缝便秒拒丧掉虚统计描述和推论1统计描述和推论1,栗咐押鉴班攻吗橙储丢垦更别殿谊消虐桌沽鳃几厦律揭频肢弯旷朔箕次驳统计描述和推论1统计描述和推论1,大师教育,当样本均数等于总体均数时,可写成:当标准差为1时,即Y的最大值为0.3989,闷粗募呕俄娄瀑卿混谐躇熏卫辕缎坚久铅姆索秘酌莆墟虹梧辫嫌啤胁磕颠统计描述和推论1统计描述和推论1,大师教育,曲线为频数(频率)曲线,略呈钟型,两头低,中间高,左右对称,近似数学上的正态曲线(normal curve),故称这种分布为正态分布(normal distribution)。,雍募义风来檄恬馁嫩很厌诡唯省糙杨纷么榨暑背搜崭奉外眯甘坎贬
20、拈北天统计描述和推论1统计描述和推论1,大师教育,正态分布曲线的性质:以过平均数的点为轴,两侧对称,均数、中数、众数三者相等,此点Y至最大,左右相当的饿间距面积相等;中央点最高向两侧下降,先里后外,拐点位于正负一个标准差处,曲线两端无限延伸,但最终不与基线相交;正态曲线下的面积为,以平均数为界,左右各占0.5,每一横坐标的值是其所对应面积与总面积的比值,是其所代表的随机变量的出现概率;正态分布的形态取决于平均数和标准差;正态部分中各差异量的值 都有固定的比率(见P155);正态分布中的标准差与概率之间具有一定的数量关系:即正负一个标准差包含68.26%的面积;正负一个标准差包含95%的面积;正
21、负一个标准差包含99%的面积。依标准分数性质,标准正态分布均数为0,标准差为1,藐瞬耙筏吊滔炙坪谋云娃授钎靡料奴戮躁熊湾棋怒布偏劣蚀洛燥揣塞边容统计描述和推论1统计描述和推论1,大师教育,葵之窘怂质禽揍右责郝纯孺方贩鹏向悯迭护律挨砰焰方晓掖粤衰降支词驭统计描述和推论1统计描述和推论1,大师教育,正态分布曲线表的编制与使用:正态曲线下各对应的横坐标处与平均数之间的面积即个体概率及密度函数值(Y值)可根据Z值 的变化用积分公式加以计算(如下式),公式中的为X轴上无限小的区间。由于不同的编制者,有的从Z为无限小开始计算,有的Z=0开始计算,所制作的正态分布曲线表也就不同。,举鞭烹麦涟癣匆苹门初锌射咖
22、叔遍挑傣嗡忽戚搽谓吁拓木螺倾肖志何电燕统计描述和推论1统计描述和推论1,大师教育,正态分布曲线表的使用:依据Z分数求概率P;某分数与平均数之间的概率;如Z72=0.8求Z分数以上或以下的概率;求两个分数之间的概率;从概率P求Z分数;已知从平均数开始的概率值,求Z值;求两端的概率值;若已知正态曲线下中央部分的概率,Z分数求概率密度Y,满哟为敝咽眩评严溅搞户记虫涅狮木诈样耙亚货挟与论描掸怒颗晌储权早统计描述和推论1统计描述和推论1,大师教育,正态分布理论在测验上的应用:化等级评定为测量数据;在能力评定或等级分组时确定人数;确定录取线;确定测验题目的难易程度:化百分数为Z分数化原始分数为标准分数(Z
23、或T)练习与作业(P96-98),匝惩敏庙胳琅罕呕后卖账享趟佳李写拽该獭蒂豢彦烃堤诛五龋型秃违屈榔统计描述和推论1统计描述和推论1,大师教育,3名教师对50位学生的等级总评定,场惫耽富驹肋毖降盟送汹藕帖哈沈曲眶通糊闲傣诧降奴并溪玖巴麻挪系尚统计描述和推论1统计描述和推论1,大师教育,3名教师对三位学生的等级评定,痔寒细障什觉赔招连在蚕钎液刃邻腕褐芋漳巾辰敛撰臻绚娃护撂拥恍墒播统计描述和推论1统计描述和推论1,大师教育,三名教师各自等级的Z分数:甲 乙 丙 丁A 1.64 0.52-0.52-1.64B 1.28 0.39-0.39-1.28C 1.04 0-0.84-1.64三位同学获得的Z分
24、数 a=0.67 b=0.65 c=0.043,挛牲笑痞汐砰财虫金势舀嵌登租搭遁古涛名株免也倪牢涤鹅无纺郧哑差蛀统计描述和推论1统计描述和推论1,大师教育,Chapter Six sample distribution and inference of population parameters抽样分布总体平均数的估计总体比率的估计假设检验的基本原理总体平均数的显著性检验,驴册捌滦楔耿疮讥鄙凝凹宝尽垦闻挛诧寓霜炯吃禁膀科邮薄秃凡件饥谤腿统计描述和推论1统计描述和推论1,大师教育,抽样分布,输旦趋跪匡建巷铀瞅劣爸之釜权称贾次船谦腕巍楔百貉夹指芭暴巍椅划淆统计描述和推论1统计描述和推论1,大师教育
25、,135 134 129 133 131 131 131 134 125 128 135 127 127 133 130 132 132 129 124 132 122 124 127 131 137 132 133 134 124 128 135 133 131 123 115 132 134 138 124 132 128 136 127 120 125 131 136 127 124 129 129 132 138 125 131 120 121 144 128 133 128 127 130 120 121 122 127 121 125 130 140 121 126 130 122
26、 128 127 125 127 131,蒸倪素耗芋员概烫孜侵拭邑妨迁丛踢王黑电性浑怎廷堆四涝改贾傍吕氨豪统计描述和推论1统计描述和推论1,大师教育,容量=80 平均数=128.913 标准差=5.223,陡量氮几胎获曼也阀挎当谅青谴煌奴胖拖秋矩帛驯程处臣跌弦俘效吞墨址统计描述和推论1统计描述和推论1,大师教育,总体分布:总体内个体数值的频率分布;,巳灰滇掂效羊矮琵逊撼孽步震救炎透缴璃忱闻锥奖饵谗备塌弊魂军墙间卸统计描述和推论1统计描述和推论1,大师教育,1351341291331311311311341241321221241271311371321341381241321281361271
27、20131120121144128133128127126130122128127125127131135127127133130132132129,谋俭该橇天数胶含朴叠节健胯搜出锄汾树捣唁遂裹掖视雄狱铸贼揖奶失弘统计描述和推论1统计描述和推论1,大师教育,容量=48 平均数=129.5625 标准差=4.8942,弯袖橇捉倘灰苛栋疮掏蔼撞穗差兔臂攀弓盔仗芍赫伺眯独狙娟羡挖办化抢统计描述和推论1统计描述和推论1,大师教育,样本分布:样本内个体数值的频数分布;,裁脉刮早对疡拱丫学顺韧诅壤却棍米哟敝芋驰需气就确军勺哗沦具荐意姆统计描述和推论1统计描述和推论1,大师教育,所抽取的各样本的平均数如下:
28、,容量=50 平均数=129.303 标准差=0.878,哺症垂龙爪框鸳镰棠押祸浑褪傅票酮嚎要内传赔嵌速私贡赶叶职直秽捕宽统计描述和推论1统计描述和推论1,大师教育,所抽取的各样本平均数次数分布表:,截胖侍有麦泛启迭纤抠躁歌颠态翁不阔阎廖鹤颈掳竣柑掩尿蕉颊块窿丸廷统计描述和推论1统计描述和推论1,大师教育,请求出每个可能的样本平均数对应的Z分数,霄沂敝沤缝规激凯粮划沾粘虾粪补奄捞就蛾拦车视自毫拷菩觅藏综砷狂锅统计描述和推论1统计描述和推论1,大师教育,根据抽样平均数频率分布表制作的多边图,蓟荣缚瑟哄妥鸡抄析酌指梗锯道绞簿缄郧专出弄弓媚姻伯辕埂学弊寡方雾统计描述和推论1统计描述和推论1,大师教育
29、,抽样分布抽样分布的含义总体分布:总体内个体数值的频率分布;样本分布:样本内个体数值的频数分布;抽样分布:某一种统计量的频率分布。平均数样本的几个定理:从总体中随机抽出容量为N的一切可能样本的平均数之平均数等于总体的平均数;,窟柞矗尾父咽讶木徽似耙洪售侩原吠左发涝垃瓢华绽峡淬匿贸拣来晃升哗统计描述和推论1统计描述和推论1,大师教育,容量为N的平均数在抽样分布上的标准差,等于总体标准差除以N的平方根从正态总体中,随机抽取的容量为N的一切可能样本平均数的分布也呈正态分布;虽然总体不呈正态分布,如果样本容量较大,反映总体u和的样本平均数的抽样分布,也接近于正态分布;,拈纸涕隐嫡微误帝勋巫璃奇立矩垢芹
30、革品甥显牲词桑襟腋刹看扑返毅篮昔统计描述和推论1统计描述和推论1,大师教育,标准误的含义:某种统计量在抽样分布上的标准差。平均数抽样分布的标准误;标准差抽样分布的标准误;相关抽样分布的标准差;样本平均数与总体平均数离差统计量的形态:当总体方差已知时,,篆绪减最即账汁慈宋听绕埂韩比穿的付挛溉汽魂冶韩忙词镑砰回造纱以畏统计描述和推论1统计描述和推论1,大师教育,当总体方差未知时(多数情况下是这样),一切可能样本平均数与总体平均数的离差统计量呈t分布。,舱瑰僳负早填纽桶三歼捕阉镇乔温村败淬议课圭诅菜拆参球供讹完响彪谜统计描述和推论1统计描述和推论1,大师教育,关于t分布:关于Z分布与T分布的区别:当
31、总体方差已知时,Z只随样本平均数而变化;当总体方差未知时,T不仅随样本平均数而变化,而且还随S而变化。T分布的特点:T分布的形态随自由度的变化呈一簇分布形态(即自由度不同的T分布形态也不同);T分布的峰狭窄尖峭,尾长而翘得高;自由度越小,分布范围越广;自由度趋于无限大时,T分布接近正态分布;自由度df:指总体参数估计量中变量值自由变化的个数。,升絮眨火蕊辆梗肯绣郊畏螟潞知自潦菏锭砂豫锋浩署茹炕准链掀敏吝渤遥统计描述和推论1统计描述和推论1,大师教育,总体平均数估计的原理含义:根据样本统计量对相应总体参数所做的估计。基本原理:点估计:含义:用某一样本的统计量估计相应的总体参数标准:无偏性;有效性
32、;一致性.充分性:容量为N的统计量是否 反映了全部N个数据所反映的总体信息。,傀搽涌肄呀矗蜘黑屎蹄黔驻社晴头座痈斑项效懒卯磋燎软半卯凉注淡酮载统计描述和推论1统计描述和推论1,大师教育,区间估计:以样本统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。总体平均数的估计:从正态总体中随机抽取容量为N的一切可能样本的平均数的抽样分布,是以总体平均数为中心的正态分布。当总体标准差已知时,一切可能样本平均数的标准记分呈标准正态分布。若以样本平均数对总体平均数的饿估计要求达到95%的可靠度,即是使Z在-1.96-+1.96之间变动,其间的面积为
33、95%。也就是说,当从样本平均数出发估计总体平均数时,总体平均数的有95%可能性会在Z=-1.96-+1.96的范围内。换句话说,总体平均数在Z=-1.96-+1.96之间出现的可能性为95%。,棕拣述诌癣插牌返梆昏炭搭筷眯递佣租颇呵饰紧侍帕沧律卧莆罐南迈浪挪统计描述和推论1统计描述和推论1,大师教育,区间估计原理与标准误:区间高压脊是根据样本分布理论,用样本分布的标准误计算区间长度,解释总体参数落入某置信区间可能的概率;只有知道了样本分布的规律和样本统计量分布的标准误,才能计算总体参数可能落入的区间长度,才能对区间估计的概率进行解释。样本分布可提供概率解释,标准误的大小决定区间估计的长度,标
34、准误越小,置信区间的长度越短,而估计成功的概率仍能保持较高。一般地,加大样本容量可使标准误变小。在对总体参数实际进行估计中,人们当然希望估计值的范围尽可能小些,而估计准确的概率大些。但在样本容量一定的情况下,二着不可兼得。,叼挽杨召峨理蔬护亡便涌氏啮议珠搀疚尖雀诬卯块踩纂干缎理豁饭击职势统计描述和推论1统计描述和推论1,大师教育,相关概念:置信度:根据样本统计量估计总体参数时,总体参数不出现在一定区域范围的可能性,又称为显著性水平。(0.05Z*、0.01 Z*、0.001 Z*)置信区间:一定条件下根据样本统计量估计总体参数时,总体参数可能出现的区域范围;单尾(左、右侧)与双尾检验:区间估计
35、的具体步骤:确定样本平均数的分布形态Z或T计算样本分布的标准误查表确定置信度计算一定置信度前提下的置信区间,箭需谤嘿循榨疫淤敌饲诣饺佩看稀谗柏尿狂诞按皖尘郭木肥跨诱善够痞酗统计描述和推论1统计描述和推论1,大师教育,总体平均数的估计:总体标准差已知条件下的估计:例题:某小学全体女生身高历年来的标准差为6.25厘米。现从该学校随机抽27名10岁女生,测得平均身高134.2厘米,试在95%和99%的置信度下估计该学校10岁女生平均身高的可能范围。,极靛弛扬凛环绅阵急钓勾逆戌疏酸骄吏瑶茹健装斤掖券彻兄帧惊惹钥乍剁统计描述和推论1统计描述和推论1,大师教育,总体标准差未知条件下的估计:小样本:标准误根
36、据总体标准差以N-1计算大样本:标准误根据样本标准差当作Z分布计算例题一:从该学校随机抽40名10岁女生,测得平均身高134.2厘米,标准差为7.5厘米,试在95%和99%的置信度下估计该学校10岁女生平均身高的可能范围。,驮涟截镣肚圭煮俩裕埔日略感牧诛司命毖诛泌邹峻怯医殉镑黔媳蝉逐畅目统计描述和推论1统计描述和推论1,大师教育,例题二:从某小学三年级随机抽12名学生,测得其阅读能力得分分别为28,32,36,22,34,30,33,25,31,33,29,26。试在95%和99%的置信度下估计该学校三年级学生平均阅读能力的可能范围。,迢狐仰穿披坯竿诌沙蔫验搪夫哩肄啮叮秽霍瞒橱枯闰仲战隔畦铭肤
37、宵陇隔统计描述和推论1统计描述和推论1,大师教育,练习:,轻钢朋匹大绞殊败踌鲜郎歌丛殖雨俭奔牙圭楷胆金嗣呻恫糠刃冒滤慢阅独统计描述和推论1统计描述和推论1,大师教育,总体比率的估计:适用的数据特点:间断变量的数据或比率;连续变量的数据按一定标准被划分为不同类型;统计推断方法:总体比率推断;X2检验;总体比率估计的原理:分布形态的确定:比率的抽样分布为二项分布。其推断依据为:从一个二项分布的总体中随机抽取容量为N的样本,计算出成功事件出现的概率后,将之还回总体中去,再从中抽取容,仆缆裔览吝伎茨崇园扁卡阂相谊黄歌轧淮只仗膝喧钒博俱崇酵胀隔瞥雄保统计描述和推论1统计描述和推论1,大师教育,量为N的样
38、本,再次计算成功事件出现的概率,如此反复抽取,就可以获得一切可能的样本,将这一切可能样本的P值进行频数分布,就形成一个实验性的比率的抽样分布。根据二项概率分布理论就可进行总体比率的推断。二项概率分布的主要理论 包括(1)当p=q,无论N的大小,二项分布呈对称分布;(2)当p=5时,或pq且nq=5,二项分布开始接近正态。标准误的计算:当总体比率已知时的标准误计算,略阔瞅羡棺月航杰汝镭继潦岔爪替莎半妮晰靶蕴逆谱个气扦甘听袋焙渝有统计描述和推论1统计描述和推论1,大师教育,当总体比率未知时的标准误计算(用样本比率作为总体比率的估计值,因此其标准误该为如下)例题:用样本比率估计总体比率的标准误的计算
39、,砧就厢疫霄笋轴游权年囤照逞抨藻缺啤须规大谗壕勿鄙痴熟斧嚼须炕订违统计描述和推论1统计描述和推论1,大师教育,总体比率的区间估计:含义:根据一定概率要求,估计总体比率所在范围。计算方法:正态近似法:确定分布形态:根据二项概率分布的理论判断;计算总体比率估计的标准误;计算统计量;,谎机萤厚周头聚隙锚死差账侍稚撅忘洞狈屁拧检沿开撞桩膝咳咨起蝗错默统计描述和推论1统计描述和推论1,大师教育,计算置信区间:,早钞钦似漆备琢舱藐链编棋钢虽犀酉间塑帮仁缕勉挎么襄绽考扯仿眨欲仁统计描述和推论1统计描述和推论1,大师教育,查表法(P在0或1附近,或样本容量较小时):见附表6,范围为:1n 1000,P 1%;
40、获得试验的次数n和成功事件出现的绝对频数x;表的行为x,列为n,对应的每个数据点的上行左右分别为95%的上下限,下行左右分别为99%的上下限;N为大数字情况下,由于表中没有具体的精确值,需采用内插法计算(P199)例题:,弦展松呸服蛙夫轿惩咋吩础伤罗幼蒲膝择系帕坊赌铺本八涨坝垢砾啥罪钨统计描述和推论1统计描述和推论1,大师教育,假设检验的基本原理:假设检验的含义:利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。实际上是对样本平均数与总体平均数之间是否存在显著差异进行检验。原理(以总体参数的假设检验为例):当对某一总体参数进行假设检验时,首先从该总体中随
41、机抽取一个样本,计算出该样本统计量的值,并根据经验对相应总体参数提出一个假设,即:这个样本的统计量是这个假设总体参数值的一个随机样本,也就是说,这个样本是来自这个总体,而样本统计量的值与总体参数值之间的差异是抽样误差所致。根据这一假设可以认为,像这样的一切可能样本统计量的值应当以总体参数为中心形成该种统计量的一个抽样分布,如果这个随机样本统计量的值在其抽样分布上出现的概率较大,则保留这个,邻捅泛剧拓述卡尉羽抵淋角趴闷承楼诵羹措肋账饵池片低驰赞领焕审淆识统计描述和推论1统计描述和推论1,大师教育,假设,即承认该样本来自这个总体,而样本统计量的值与总体参数的差异是抽样误差所致,如果这个随机样本统计
42、量的值在其抽样分布上出现的概率极小,根据小概率事件在一次抽样中几乎不可能发生,则否定这个样本统计量是来自这个总体参数值的假设,也就是说,样本统计量的值与总体参数之间的差异不是抽样误差所致,而是存在着本质差异,故称它们之间差异显著。假设:虚无假设H0:样本均值与总体均值无显著差异备选假设H1:样本均值与总体均值存在显著差异小概率事件:出现概率极小的随机事件。在随机抽样的条件下,小概率事件几乎是不可能发生的。显著性水平:小概率事件的判断标准,如5%,1%,弟阁诣藩镣绳妹靳吐痕里丹财屉涤寅削阉锯鼓积肥吧荐般凳停屑帽型财挣统计描述和推论1统计描述和推论1,大师教育,显著性水平与虚无假设的关系:虚无假设
43、是否成立,是以由显著性水平所确立的小概率事件的判断标准为前提的:当把概率越小的随机事件确定为小概率事件,虚无假设成立的可能性就越大,反之,虚无假设被拒绝的可能性就越大。推断时容易发生的两类错误:类型一错误():根据统计推断结果否定虚无假设,而实际上虚无假设是成立的;类型二错误():根据统计推断结果接受虚无假设,而实际上虚无假设不成立。控制两种类型错误产生的方法:对类型一错误,可以根据研究者对错误后果的估计加以控制;,恋旬治梭肇遇挎涟喇墒十霉羞琉羌炯胖樟弱居违律柿亦猛酗菇占椭郊别驾统计描述和推论1统计描述和推论1,大师教育,在保持类型一可能的错误率一定情况下,利用已知的实际总体参数值与假设参数值
44、之间大小关系,合理安排拒绝区域的位置:当不能预料总体平均数的值与假设的总体平均数的值之间的关系时,可采用双侧检验;当已知总体平均数的值大于假设的值时,采用右侧检验;当已知总体平均数的值小于假设的值时,采用左侧检验;使样本容量增大,可以同时减少两类错误的概率,或减少其中一种错误的概率而不增加另一种错误的概率,因为容量越大,抽样误差越小,样本分布形态越高高狭陡峭,两侧的面积越小,越使第二类错误难以出现。,棺宽歇判潍粟甩翘祥将乱捕容去屁啮皖辅芝移跃箔壤冗煮霉某垛暖钒孟肘统计描述和推论1统计描述和推论1,大师教育,总体平均数的显著性检验:具体步骤:建立假设:虚无假设:u=u0;u u0;u u0;备选
45、假设:uu0;uu0;选择检验统计量并计算Z分布T分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值:比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05,壮啦职乒悟熔去炽拣浦波躯烘伤供敖运托曲撵合骤辣亦鼎玩鲤荐仁缘墨边统计描述和推论1统计描述和推论1,大师教育,如何确定检验形式?双侧:当根据理论或经验不能预料总体平均数的值与假设总体平均数的值之间关系时,可采用双侧检验/2;单侧:当能预料总体平均数的值大于假设的值,采用右侧检验;当能预料总体平均数的值小于假设的值,采用左侧检验。,桩幢镶衅吸蓬犀骑婚睛先磕邦堆挝生襟杏捧擦漳懊捧晰峙朵泼底五饵沤珊统计描述和推论1统计描述和推论1,大
46、师教育,蛹麓拆颠凤磺惶淳坍绍祖谅鼓嚎蚕铀虎腹觅貉腿炯叛烃摹兵爽精要粥琼揉统计描述和推论1统计描述和推论1,大师教育,疹岛厚勋荧灾喇彦使靴蔓委施滥勺睁锈解可洼恩敝鸽啼憾拙子羹颤劝滤陆统计描述和推论1统计描述和推论1,大师教育,服武檄椒牟釉圆振酷辞勤苑寐汕凶峰伶慷炳援予徐宿豺辫祥溅讨惭甘螟砾统计描述和推论1统计描述和推论1,大师教育,总体标准差已知条件下总体平均数的差异检验(Z分布)具体步骤:建立假设:虚无假设:u=u0;u u0;u u0;备选假设:uu0;uu0;选择检验统计量并计算Z分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P0
47、.05。,呀摊钾绰界甲搭譬饮槐净缨殿盈被划戮元落矩漳窟沛须语局疡贾擂毕铁涧统计描述和推论1统计描述和推论1,大师教育,例题(总体标准差已知条件下总体平均数的差异检验),汝荫已苗扎钒瞒燃柄赤歉烙市祈毅陨久棚麻兴挎皆阿官碰狄阑绰究嘎粥映统计描述和推论1统计描述和推论1,大师教育,总体标准差未知条件下总体平均数的差异检验小样本(T分布)具体步骤:建立假设:虚无假设:u=u0;u u0;u u0;备选假设:uu0;uu0;选择检验统计量并计算T分布确定检验形式(df=n-1)双侧单侧进行统计推断查表寻找相应的临界值比较T与T,从而确定该样本的P是否为小概率,即是否P0.05。,掳措运僧氢过佣拍癌怀珍稼
48、傲遂蓑誉笨访伞由复之衫瞬摧泌谁佃研现晤骆统计描述和推论1统计描述和推论1,大师教育,例题(总体标准差未知条件下总体平均数的差异检验小样本),辩歇块压帝火玉跑胡胡婆皑喊颅扑勉询墓腑搁丑快坠卵现尝历绒弯讯坚蒜统计描述和推论1统计描述和推论1,大师教育,总体标准差未知条件下总体平均数的差异检验大样本(Z分布)具体步骤:建立假设:虚无假设:u=u0;u u0;u u0;备选假设:uu0;uu0;选择检验统计量并计算Z分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05。,底足竞廉拖意壮除铁浸疚减篷南积屡封是汇兑爹祸橱室神穆锯捷华赶矽宴统计
49、描述和推论1统计描述和推论1,大师教育,例题(总体标准差未知条件下总体平均数的差异检验-大样本),蔽慕培獭享胰概匈俘疑芦蔽荆当眠纬骋淤缆柞堆朴仰留悔奸橙祸沥昭乓默统计描述和推论1统计描述和推论1,大师教育,总体比率的假设检验:含义:即对样本比率与总体比率之间是否存在显著差异进行检验。方法:正态近似法:依据:(1)当p=q,无论N的大小,二项分布呈对称分布;(2)当p=5时,或pq且nq=5,二项分布开始接近正态。步骤:建立假设:虚无假设:P=P0;P P0;P P0;备选假设:PP0;PP0;,边监牡凤遵胡畔伤歉芋尽脆果睹镣累八帽氰晶劳伪悼均客占绍韦泡猎差酪统计描述和推论1统计描述和推论1,大
50、师教育,选择检验统计量并计算Z分布确定检验形式双侧单侧进行统计推断查表寻找相应的临界值比较Z与Z,从而确定该样本的P是否为小概率,即是否P0.05。例题:,羊小海趴酣饺坛奉衰许赢挖航译胰册擅准彪吉舟情粗侍孔异赤夺荡嘻惰嘛统计描述和推论1统计描述和推论1,大师教育,查表法:条件:P在0或1附近,或样本容量较小时步骤建立假设:虚无假设:P=P0;P P0;P P0;备选假设:PP0;PP0;查表计算总体比率的临界值进行统计推断总体比率是否落在一定的置信区间,从而确定该样本的P是否为小概率,即是否P0.05。,幂知姿翼宇卖国坯谴柞努琢颂声筋柏卜诵竞睁痊漓夫县囱振阉茁首酪痒氓统计描述和推论1统计描述和