《创新设计》高考数学人教A版(理)一轮复习:统计与概率.doc

上传人:文库蛋蛋多 文档编号:4233537 上传时间:2023-04-10 格式:DOC 页数:161 大小:3.58MB
返回 下载 相关 举报
《创新设计》高考数学人教A版(理)一轮复习:统计与概率.doc_第1页
第1页 / 共161页
《创新设计》高考数学人教A版(理)一轮复习:统计与概率.doc_第2页
第2页 / 共161页
《创新设计》高考数学人教A版(理)一轮复习:统计与概率.doc_第3页
第3页 / 共161页
《创新设计》高考数学人教A版(理)一轮复习:统计与概率.doc_第4页
第4页 / 共161页
《创新设计》高考数学人教A版(理)一轮复习:统计与概率.doc_第5页
第5页 / 共161页
点击查看更多>>
资源描述

《《创新设计》高考数学人教A版(理)一轮复习:统计与概率.doc》由会员分享,可在线阅读,更多相关《《创新设计》高考数学人教A版(理)一轮复习:统计与概率.doc(161页珍藏版)》请在三一办公上搜索。

1、第十一篇统计与概率第1讲抽样方法与总体分布的估计【2014年高考会这样考】1考查三种抽样方法及其应用2考查频率分布直方图中的相关计算(求解频率、频数等)3考查用样本估计总体中的样本数据的数字特征(平均数、方差、标准差等)考点梳理1 三种抽样方法的比较类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等,均属于不放回抽样从总体中逐个抽取总体中的个体数较少系统抽样将总体均分成几部分,按事先确定的规则在各部分中抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多分层抽样将总体分成几层,分层进行抽样各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成2.频率分布

2、直方图与茎叶图(1)当总体很大或不便获得时,可以用样本的频率分布去估计总体的频率分布,我们把反映样本频率分布的表格称为频率分布表绘制频率分布表的步骤为:求极差;决定组距和组数;将数据分组;列频率分布表(2)利用直方图反映样本的频率分布,这样的直方图称为频率分布直方图画频率分布直方图的一般步骤是:绘制频率分布表;作直角坐标系,把横轴分成若干段,每一段对应一个组的组距;在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的.此时,每个矩形的面积恰好就是该组的频率,显然所有矩形的面积之和为1.3样本的数字特征(1)众数在样本数据中,出现次数最多的那个数据(2)中位数样本数据中,将

3、数据按大小排列,位于最中间的数据如果数据的个数为偶数,就取中间两个数据的平均数作为中位数(3)平均数样本数据的算术平均数,即(x1x2xn)(4)方差与标准差方差:s2(x1)2(x2)2(xn)2标准差:s .一条规律三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每个个体被抽到的概率都是.两个特性(1)在频率分布表中,频数的和等于样本容量,每一小组的频率等于这一组的频数除以样本容量,各小组频率的和等于1;(2)在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形

4、的面积等于该组的频率,所有小矩形的面积之和为1.考点自测1(2012山东)采用系统抽样方法从960人中抽取32人做问卷调查为此将他们随机编号为1,2,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为()A7 B9 C10 D15解析从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an930(n1)30n21,由45130n21750,得n,所以n16,17,25,共

5、有2516110人,选C.答案C2(2013临沂模拟)甲校有3 600名学生,乙校有5 400名学生,丙校有1 800名学生为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90的样本,应该在这三校分别抽取的学生人数是()A30,30,30 B30,45,15C20,30,10 D30,50,10解析抽取比例是,故三校分别抽取的学生人数为3 60030,5 40045,1 80015.答案B310名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是()A14 B16 C15 D17解析将这组数据从

6、小到大排列得10,12,14,14,15,15,16,17,17,19.故中位数为15.答案C4(2013西北工大附中测试)如图是容量为150的样本的频率分布直方图,则样本数据落在6,10)内的频数为()A12 B48 C60 D80解析落在6,10)内的频率为0.0840.32,故频数为0.3215048.答案B5(2013长沙模拟)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为_(注:方差s2(x1)2(x2)2(xn)2,其中为x1,x2,xn的平均数)解析(89101315)11,s2(941416)6.8.答案6.8考向一抽样方法【例1】

7、从某厂生产的802辆轿车中抽取80辆测试某项性能请合理选择抽样方法进行抽样,并写出抽样过程审题视点 因为802不能整除80,为了保证“等距”分段,应先剔除2个个体解由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:第一步:先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);第二步:将余下的800辆轿车编号为1,2,800,并均匀分成80段,每段含k10个个体;第三步:从第1段即1,2,10这10个编号中,用简单随机抽样的方法抽取一个编号(如5)作为起始编号;第四步:从5开始,再将编号为15,25,795的个体抽出,得到一个容量为80的样本 解决系统抽样问题的两个

8、关键步骤为:(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了【训练1】 (2012天津)某地区有小学150所,中学75所,大学25所现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取_所学校,中学中抽取_所学校解析根据分层抽样的特点求解从小学中抽取3018所学校;从中学中抽取309所学校答案189考向二频率分布直方图的绘制及应用【例2】某班同学利用国庆节进行社会实践,对25,55岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,

9、称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:组数分组低碳族的人数占本组的频率第一组25,30)1200.6第二组30,35)195p第三组35,40)1000.5第四组40,45)a0.4第五组45,50)300.3第六组50,55150.3续表(1)补全频率分布直方图;(2)求n,a,p的值审题视点 (1)要补全频率分布直方图,关键是计算出第二组的频率;(2)灵活运用关系式:组距频率,频率求解解(1)第二组的频率为1(0.040.040.030.020.01)50.3,所以小长方形的高为0.06.频率分布直方图如图所示(2)第一组的人数为200,频率为0

10、.0450.2,所以n1 000.由(1)知,第二组的频率为0.3,所以第二组的人数为1 0000.3300,所以p0.65.第四组的频率为0.0350.15,所以第四组的人数为1 0000.15150,所以a1500.460. (1)绘制频率分布直方图时需注意:制作好频率分布表后可以利用各组的频率之和是否为1来检验该表是否正确;频率分布直方图的纵坐标是,而不是频率(2)由频率分布直方图进行相关计算时,需掌握下列关系式:组距频率【训练2】 (2013烟台四校联考)据悉2012年山东省高考要将体育成绩作为参考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅球

11、测试,成绩在8.0 m(精确到0.1 m)以上的为合格把所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示已知从左到右前5个小组对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.(1)求这次铅球测试成绩合格的人数;(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由解(1)由题易知,第6小组的频率为1(0.040.100.140.280.30)10.14,此次测试的总人数为50.这次铅球测试成绩合格的人数为(0.2810.3010.141)5036.(2)直方图中中位数两侧的矩形面积和相等,即频率和相等,前三组的频率

12、和为0.28,前四组的频率和为0.56,中位数位于第4组内考向三用样本的数字特征估计总体的数字特征【例3】甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价审题视点 (1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价解(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分. 甲13,乙13,s(1013)2(1313)2(1213)2(1413)2(1613)24,s(1

13、313)2(1413)2(1213)2(1213)2(1413)20.8.(2)由ss可知乙的成绩较稳定从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高 (1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似实际应用中,当所得数据平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小【训练3】 (2012陕西)从

14、甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示)设甲乙两组数据的平均数分别为甲,乙,中位数分别为m甲,m乙,则()A.甲m乙 B.甲乙,m甲乙,m甲m乙 D.甲乙,m甲m乙解析甲(41433030382225271010141818568),乙(42434831323434382022232327101218).甲乙又m甲20,m乙29,m甲m乙答案B方法优化15快速掌握抽样方法的技巧【命题研究】 通过近三年的高考试题分析,考查分层抽样方法的题目较多,其次是系统抽样题型多为选择题、填空题,有的与统计的其它知识或概率综合考查,常以解答题的形式出现,难

15、度较低【真题探究】 (2012江苏)某学校高一、高二、高三年级的学生人数之比为334,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取_名学生教你审题 一审 等比例性质;二审 抽取的样本容量优美解法 高二年级学生人数占总数的.样本容量为50,则高二年级抽取:5015(名)学生答案 15反思 用分层抽样抽样时,分成的各层标准要一致,互不重叠,各层抽取的比例都等于样本容量在总体中的比例,即.【试一试】 (2013徐州模拟)从某小学随机抽取100名同学,这些同学身高都不低于100厘米,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)现用分层抽样的方法从身

16、高在120,130),130,140),140,150三组学生中,选取18人参加一项活动,则从身高在140,150内的学生中选取的人数应为_解析由(0.0050.0100.0200.035a)101,得a0.030,因此120,130),130,140),140,150三组学生人数分别为:0.310030,0.2010020,0.1010010,所以,从身高在140,150内的学生中选取的人数应为183.答案3A级基础演练(时间:30分钟满分:55分)一、选择题(每小题5分,共20分)1.(2013西安质检)对某商店一个月内每天的顾客人数进行了统计, 得到样本的茎叶图(如图所示),则该样本的中

17、位数、众数、极差分别是()A46,45,56 B46,45,53C47,45,56 D45,47,53解析样本共30个,中位数为46;显然样本数据出现次数最多的为45,故众数为45;极差为681256,故选A.答案A2(2013南昌模拟)小波一星期的总开支分布如图(a)所示,一星期的食品开支如图(b)所示,则小波一星期的鸡蛋开支占总开支的百分比为()A30% B10% C3% D不能确定解析由题图(b)可知小波一星期的食品开支共计300元,其中鸡蛋开支30元又由题图(a)知,一周的食品开支占总开支的30%,则可知一周总开支为1 000元,所以鸡蛋开支占总开支的百分比为100%3%.答案C3(2

18、013成都模拟)交通管理部门为了解机动车驾驶员(简称驾驶员)对某新法规的知晓情况,对甲、乙、丙、丁四个社区做分层抽样调查假设四个社区驾驶员的总人数为N,其中甲社区有驾驶员96人若在甲、乙、丙、丁四个社区抽取驾驶员的人数分别为12,21,25,43,则这四个社区驾驶员的总人数N为()A101 B808 C1 212 D2 012解析甲社区驾驶员的抽样比例为,四个社区驾驶员总人数的抽样比例为,由,得N808.答案B4(2012安徽)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A甲的成绩的平均数小于乙的成绩的平均数B甲的成绩的中位数等于乙的成绩的中位数C甲的成绩的方差小

19、于乙的成绩的方差D甲的成绩的极差小于乙的成绩的极差解析由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B错;甲、乙的成绩的方差分别为(46)2(56)2(66)2(76)2(86)22,(56)2(56)2(56)2(66)2(96)2,C对;甲、乙的成绩的极差均为4,D错答案C二、填空题(每小题5分,共10分)5(2013武夷模拟)用系统抽样法要从160名学生中抽取容量为20的样本,将160名学生随机地从1160编号,按编号顺序平均分成20组(18号,916号,153160号),若第16组抽出的号

20、码为126,则第1组中用抽签的方法确定的号码是_解析设第1组抽取的号码为b,则第n组抽取的号码为8(n1)b,8(161)b126,b6,故第1组抽取的号码为6.答案66(2013苏州一中月考)某学校为了解学生数学课程的学习情况,在1 000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如图)根据频率分布直方图可估计这1 000名学生在该次数学考试中成绩不低于60分的学生人数是_解析低于60分学生所占频率为(0.0020.0060.012)100.2,故低于60分的学生人数为1 0000.2200,所以不低于60分的学生人数为1 00020080

21、0.答案800三、解答题(共25分)7(12分)某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取解用分层抽样方法抽取具体实施抽取如下:(1)2010015,2,14,4,从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人(2)因副处级以上干部与工人的人数较少,他们分别按110编号与120编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,69编号,然后用随机数表法抽取14人(3)将2人,4人,14人的编号汇合在一起就

22、取得了容量为20的样本8(13分)(2012揭阳调研)某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:(1)求分数在50,60的频率及全班人数;(2)求分数在80,90之间的频数,并计算频率分布直方图中80,90间的矩形的高解(1)分数在50,60的频率为0.008100.08.由茎叶图知,分数在50,60之间的频数为2,所以全班人数为25.(2)分数在80,90之间的频数为25271024,频率分布直方图中80,90间的矩形的高为100.016.B级能力突破(时间:30分钟满分:45分)一、选择题(每小题5分,共

23、10分)1(2013哈尔滨模拟)一个样本容量为10的样本数据,它们组成一个公差不为0的等差数列an,若a38,且a1,a3,a7成等比数列,则此样本的平均数和中位数分别是()A13,12 B13,13 C12,13 D13,14解析设等差数列an的公差为d(d0),a38,a1a7(a3)264,(82d)(84d)64,(4d)(2d)8,2dd20,又d0,故d2,故样本数据为4,6,8,10,12,14,16,18,20,22,样本的平均数为13,中位数为13,故选B.答案B2(2012江西)样本(x1,x2,xn)的平均数为,样本(y1,y2,ym)的平均数为()若样本(x1,x2,x

24、n,y1,y2,ym)的平均数(1),其中0,则n,m的大小关系为()Anm Cnm D不能确定解析依题意得x1x2xnn,y1y2ymm,x1x2xny1y2ym(mn)(mn)(mn)(1),nm(mn)(mn)(1),于是有nm(mn)(1)(mn)(21),0,210,nmn.答案A二、填空题(每小题5分,共10分)3(2013沈阳质检)沈阳市某高中有高一学生600人,高二学生500人,高三学生550人,现对学生关于消防安全知识了解情况进行分层抽样调查,若抽取了一个容量为n的样本,其中高三学生有11人,则n的值等于_解析由,得n33(人)答案334(2013北京西城一模)某年级120名

25、学生在一次百米测试中,成绩全部介于13秒与18秒之间将测试结果分成5组:13,14),14,15),15,16),16,17),17,18,得到如图所示的频率分布直方图如果从左到右的5个小矩形的面积之比为13763,那么成绩在16,18的学生人数是_解析成绩在16,18的学生的人数所占比例为,所以成绩在16,18的学生人数为12054.答案54三、解答题(共25分)5(12分)汽车行业是碳排放量比较大的行业之一,欧盟规定,从2012年开始,对CO2排放量超过130 g/km的MI型新车进行惩罚(视为排放量超标),某检测单位对甲、乙两类MI型品牌的新车各抽取了5辆进行CO2排放量检测,记录如下(

26、单位:g/km):甲80110120140150乙100120xY160经测算发现,乙类品牌车CO2排放量的均值为乙120 g/km.(1)求甲类品牌汽车的排放量的平均值及方差;(2)若乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,求x的取值范围解(1)甲类品牌汽车的CO2排放量的平均值甲120(g/km),甲类品牌汽车的CO2排放量的方差s600.(2)由题意知乙类品牌汽车的CO2排放量的平均值乙120(g/km),得xy220,故y220x,所以乙类品牌汽车的CO2排放量的方差s,因为乙类品牌汽车比甲类品牌汽车CO2的排放量稳定性好,所以ss,解得90x0时,两变量正相关,当r0时,两

27、变量负相关,当|r|1且|r|越接近于1,相关程度越高,当|r|1且|r|越接近于0,相关程度越低2最小二乘法求回归直线方程(1)设线性回归方程为x,其中,是回归方程的斜率,是截距(2)回归直线一定经过样本的中心点(,),据此性质可以解决有关的计算问题3独立性检验(1)独立性检验的有关概念分类变量可用变量的不同“值”表示个体所属的不同类别的变量称为分类变量22列联表假设有两个分类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:y1y2总计x1ababx2cdcd总计acbdabcd(2)独立性检验利用随机变量K2(其中nabcd为样本容量)来判断“两个

28、变量有关系”的方法称为独立性检验步骤如下:计算随机变量K2的观测值k,查下表确定临界值k0:P(K2k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2k0);否则,就认为在犯错误的概率不超过P(K2k0)的前提下不能推断“X与Y有关系”一个区别函数关系是一种确定的关系,相关关系是一种非确定的关系事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随

29、机变量的关系三个特征(1)回归方程x中的表示x增加一个单位时,的变化量约为.(2)R2越大,残差平方和越小,即模型的拟合效果越好;R2越小,残差平方和越大,即模型的拟合效果越差(3)当K23.841时,则有95%的把握说事件A与B有关;当K26.635时,则有99%的把握说事件A与B有关;当K22.706时,则认为事件A与B无关考点自测1下列两个变量之间的关系是相关关系的是()A正方体的棱长与体积B单位面积的产量为常数时,土地面积与总产量C日照时间与水稻的亩产量D电压一定时,电流与电阻解析A,B,D中两个变量间的关系都是确定的,所以是函数关系;C中的两个变量间是相关关系,对于日照时间一定的水稻

30、,仍可以有不同的亩产量,故选C.答案C2对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u,v有观测数据(ui,vi)(i1,2,10),得散点图(2)由这两个散点图可以判断()A变量x与y正相关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关解析由图(1)可知,各点整体呈递减趋势,x与y负相关;由图(2)可知,各点整体呈递增趋势,u与v正相关答案C3(2012湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立

31、的回归方程为0.85x85.71,则下列结论中不正确的是()Ay与x具有正的线性相关关系B回归直线过样本点的中心(,)C若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg解析根据线性回归方程中各系数的意义求解由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,故A正确又线性回归方程必过样本中心点(,),因此B正确由线性回归方程中系数的意义知,x每增加1 cm,其体重约增加0.85 kg,故C正确当某女生的身高为170 cm时,其体重估计值是58.79 kg,而不是具体值,因此D不正确答案D4为了评

32、价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K20.99,根据这一数据分析,下列说法正确的是()A有99%的人认为该栏目优秀B有99%的人认为该栏目是否优秀与改革有关系C有99%的把握认为电视栏目是否优秀与改革有关系D没有理由认为电视栏目是否优秀与改革有关系解析只有K26.635才能有99%的把握认为电视栏目是否优秀与改革有关系,而即使K26.635也只是对“电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关故D正确答案D5(2011辽宁)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显

33、示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的线性回归方程:0.254x0.321.由线性回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加_万元解析由题意,知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元答案0.254考向一线性相关关系的判断【例1】下表是某小卖部6天卖出的热茶的杯数与当天气温的对比表.气温/2618131041杯数y202434385064(1)将表中的数据画成散点图;(2)你能依据散点图指出气温与热茶杯数的关系吗?(3)如果气温与卖出热茶杯数近似成线性相关关系的话,请画出一条直线来近似地表示这种线性相关关系审题

34、视点 (1)用x轴表示气温,y轴表示杯数,逐一画点;(2)根据散点图分析两个变量是否存在相关关系解(1)画出的散点图如图(2)从图中可以发现气温和热茶杯数具有相关关系,气温和热茶杯数成负相关,图中的各点大致分布在一条直线的附近,因此气温和杯数近似成线性相关关系(3)根据不同的标准,可以画出不同的直线来近似表示这种线性相关关系,如让画出的直线上方的点和下方的点数目相等如图 利用散点图判断两个变量是否有相关关系是比较简便的方法在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系即变量之间具有函数关系如果所有的样本点落在某一函数的曲线附近,变量之间就有相关关系;如果所有的

35、样本点都落在某一直线附近,变量之间就有线性相关关系【训练1】 5个学生的数学和物理成绩如下表:学生学科ABCDE数学8075706560物理7066686462画出散点图,并判断它们是否有相关关系解把数学成绩作为横坐标,把相应的物理成绩作为纵坐标,在直角坐标系中描点(xi,yi)(i1,2,5),作出散点图如图从图中可以直观地看出数学成绩和物理成绩具有相关关系,且当数学成绩增大时,物理成绩也在由小变大,即它们正相关考向二线性回归方程及其应用【例2】(2012福建)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元88.28.48.68.89销量

36、y/件908483807568(1)求回归直线方程x,其中20, ;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润销售收入成本)审题视点 (1)分别计算,利用线性回归方程过点(,),代入方程可得解;(2)将已知条件代入可得关于单价x的二次函数,配方可得最大值解(1)由于(88.28.48.68.89)8.5,(908483807568)80,又20,所以 80208.5250,从而回归直线方程为20x250.(2)设工厂获得的利润为L元,依题意得Lx(20x250)4(20x250)20x2330x1

37、 000202361.25.当且仅当x8.25时,L取得最大值故当单价定为8.25元时,工厂可获得最大利润 求回归直线方程的步骤:(1)依据样本数据画出散点图,确定两个变量具有线性相关关系;(2)计算出,iyi的值;(3)计算回归系数,;(4)写出回归直线方程x.【训练2】 (2013南昌模拟)以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据.房屋面积x/m211511080135105销售价格y/万元24.821.618.429.222(1)求线性回归方程;(2)据(1)的结果估计当房屋面积为150 m2时的销售价格解(1)(11511080135105)109,(24.821.61

38、8.429.222)23.2.设所求回归直线方程为x,则0.196 2, 23.21091.816 6.所求回归直线方程为0.196 2x1.816 6.(2)由第(1)问可知,当x150 m2时,销售价格的估计值为0.196 21501.816 631.246 6(万元)考向三独立性检验的基本思想及应用【例3】在调查男女乘客是否晕机的事件中,已知男乘客晕机为28人,不晕机的也是28人,而女乘客晕机为28人,不晕机的为56人(1)根据以上数据建立一个22的列联表;(2)能否在犯错误的概率不超过0.05的前提下认为晕机与性别有关系?(可能用到的公式:K2,可能用到的数据:P(K23.841)0.

39、05,P(K25.024)0.025)审题视点 (1)列22列联表;(2)假设是否晕机与性别无关,代入公式求K2的观测值解(1)22列联表如下:晕机不晕机合计男乘客282856女乘客285684合计5684140(2)假设是否晕机与性别无关,则K2的观测值k3.889,P(K23.841)0.05.所以可以在犯错误的概率不超过0.05的前提下认为晕机与性别有关系 解决独立性检验的应用问题,首先要根据题目条件列出两个变量的22列联表,通过计算随机变量K2的观测值k,依据临界值与犯错误的概率得出结论注意观测值的临界值与概率间的对应关系【训练3】 (2013东北三校联考)某学生对其亲属30人的饮食习惯进行了一次调查,并用下图所示的茎叶图表示30人的饮食指数(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主)(1)根据以上数据完成下列22列联表:主

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 办公文档 > 其他范文


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号