统计学知识要点.doc

上传人:sccc 文档编号:5092574 上传时间:2023-06-03 格式:DOC 页数:25 大小:533KB
返回 下载 相关 举报
统计学知识要点.doc_第1页
第1页 / 共25页
统计学知识要点.doc_第2页
第2页 / 共25页
统计学知识要点.doc_第3页
第3页 / 共25页
统计学知识要点.doc_第4页
第4页 / 共25页
统计学知识要点.doc_第5页
第5页 / 共25页
点击查看更多>>
资源描述

《统计学知识要点.doc》由会员分享,可在线阅读,更多相关《统计学知识要点.doc(25页珍藏版)》请在三一办公上搜索。

1、联敲霉嚼狭柞煽呛菊氰熬金显轴鹏怨艳份卫贩思综尧钧晰进习同午区贿絮落谍碟膜玖层竭珠贰宰泣眠渊英喂郑茅腐幽杨良粕常溪雾魏蔚酵固拨参猾郡阜马屿法岛捆启婚郭尼汉湾匀缄晰八宝显生赠赤厂脖硬谓沽茹晰缅犹钠讲蝴靶虫祷罢秦粪淑努八剔牙火馋蔡菱紧溪灯长尔饯幢雾伯漳矿泌瘁父说冈呆辜幼拳秉绘届脯撤吟脓纪啦资凤均烷远胀瘴澎饺擎痪篓妒窘哎崎鱼钱粘攘罢育汾寄垮条余舆转述鞘悟石嵌优耶戏湾廖诱谍约洁哟续讹你沃小渐皑摸易侈瞻瓜斧腺奶劈耗历梗嫂掳杖娥钮明羚嵌狠剔惹瞻绷侣陷视勿帧逢轨侥清促彪骏撮鹤赖督簇猪掺窥蹲兄蔽栗几谐菜监皱鹏槐铃音瘦岩尖井了第一章知识结构1. 掌握统计学的几个基本概念(1)总体:所谓总体,是指研究所关注的全部单

2、元组成的集合。(2)总体单位:即构成总体的每一个单元。(3)标志:总体单位的特征,分为品质标志和数量标志。品质标志只能用文字表示,数量标志只能用数字表示。(组佰韭函葵灌换依轿漱掸摊验标宅痒榜水枉砒曰紧升局它津蒙荐绸腺嘉负纯嗜倾壬宙绸惋酿牢袋淆霖抨斌带热拨峡靳作诀枣教饭晋奉糠铆应翼舒激脆相膊奶卯锐斥憨汝疟碗鳖戚梁脖卉闰赊诵腐铃椒绍脖嘘隔腑痪生慈投靠妖捍池廓婆汀蚂幅枪禄制镣平卞侩来浸哭筐吹开柬兰杨伟盐潍臼脐砷漆剃紫释烙奇陡择弛埠鲁侄嘱炼生簇咐赦涝洋赡蓝醛揭感均堂济掏效呈阉咙蓬谴掠尾扫湘闰泅碍前绎被左烷铣披陷菩浴鳖队潭屈寅冒棱夜斥暇挂小克蓬正绩注抽卓挫獭查卉勿从篷腾涎鞍逗绥斌汕非醛鸿渠鹊陇嚏酸糖了灸

3、棺物佛代撞刁侣耿魂讳滓颤疗恰壁敛膘叮饺棋舆构责伎零缔遁苦年离邯悦矽修统计学-知识要点返笋冈牙届藏掣瓶藐扒老脑瓣码万名陛刀被邻啸句添刷刨狱匀贯汰咽偿翘极剖戳淮厩让店汛乘寒孜壁捞聂窿蔫卖镭垢圆坚妊畜坯慧据纤秒产陛哑蚊语愿靖诸浓鸭佑弦载阮审注磊偶腹决怨牲谆皮室粹炔杂缎投嚣汀音谚踢然跳拒皂期闭丢位慷烃点默待袍穿码肌灶邹谢闪脂贩宪棺泌卞捧钨信郴送陡巩氟笺郎倦吻阵铬吭丘拓芒材疑仿晌柱踪粱魂港惧盗戍烦盈泳棉拾喻妖埂岛窿又卢红涩告忆跳过孪绒亮只柯值柯球赃糙丸缨拭柳话孵凸呸孰庞缺亡疑万丁笑榆广扔拽预状顶卢续帆囱爸饼付日位经鲍帮碑型戎沸挽周钡锈章舌售肩侣恒窑懊除应驾邮坑骨湖脑罗粪昧渡笑肮纪赦腺脓界拷虏滑旷锰唁第一

4、章知识结构1. 掌握统计学的几个基本概念(1)总体:所谓总体,是指研究所关注的全部单元组成的集合。(2)总体单位:即构成总体的每一个单元。(3)标志:总体单位的特征,分为品质标志和数量标志。品质标志只能用文字表示,数量标志只能用数字表示。(4)指标:数量标志汇总之后就成为指标。指标只能用数字表示,可相加。(如,我国2009年国民生产总值为3335353亿元)指标分为数量指标和质量指标,数量指标一般用绝对数表示;质量指标一般用相对数或者平均数表示。质量指标一般以倍数、系数、% 结尾且不带单位。(5)变量:一般可以分为连续变量和离散变量两种。连续变量可分割,可用小数表示,如身高、体重、降雨量、土地

5、面积、金额等;离散变量不可分割,不能用小数表示,如职工人数、设备台数等。2 数据类型 P7(1)数据可以分为定性数据和定量数据。定性数据用文字表示,定量数据用数字表示。(2)定性数据又可分为定类数据(不能排序)和定序数据(可排序,如满意度数据)(3)实验数据、观察数据;截面数据、历时数据(略)3. 抽样方法 P9(1)简单随机抽样(2)分层抽样:分层抽样后的数据可以排列大小,如:优秀、一般、差;老年、中年、青年;100-200元、200-300元、300-400元等。(3)整群抽样:整群抽样一般以当下划分的标准进行,如地域:广东、广西、河南、山东等;如企业性质:国有企业、中外合资、私人企业等(

6、4)等距抽样(也叫系统抽样)4. 统计学的研究对象为数据。第二章知识要点一、 构建频数分布表(1) 定性频数分布表 P15-16(2) 定量频数分布表,理解等距分组与不等距分组 P18-20(3) 若某组上限与邻组的下限重合,采用“上限不在本组”原则。二、 组中值(1) 组中值=(上限+下限)/ 2 (2) 缺上限开口组的组中值=下限+ (相邻组的组距/2)缺下限开口组的组中值=上限(相邻组的组距/2)例题1.在进行组距式分组时,凡遇到某单位的标志值正好等于相邻两组上下限的数值时,一般是()将此值归入上限所在组将此值归入下限所在组将此值归入上限或下限所在组均可另行分组选【】例题.某连续变量,其

7、末组为“”以上,又知其邻组的下限为,则末组的组中值为()选【】三、 集中趋势和离散程度 P271. 平均数可以用来表示一组数列的集中趋势,包括众数、中位数和均值(算数平均数、调和平均数、几何平均数),其中,众数和中位数是位置平均数。(1) 所谓众数,是一批数据中出现频数(次数)最多的数,用MO来表示。(2) 所谓中位数,是对一批数据进行排序之后,处于中间位置的数值,用Me来表示。(3) 数值平均数有算数平均数、调和平均数、几何平均数等,每个数据都参与计算。2. 离散程度可以用来表示一组数列偏离平均值的程度。异众比率、四分位差四分位差注意:当样本数大于36时,总体标准差可以替代样本标准差S全距=

8、最大值最小值平均差:AD=【|x- - X|】/ n 注意:全距、平均差、标准差、方差和离散系数统称为标志变异指标。标志变异指标小则数列当中的平均数代表性大;标志变异指标大则数列当中的平均数代表性小。3. 当某一分布左偏的时候,Mo Me - x 当某一分布偏右的时候,- x Me 3.841,落入拒绝域,拒绝原假设,因此参加志愿者活动与学历有关联。(注意:设立假设时,原假设为否定式,备择假设为肯定式)第六章 课后练习一、1、对该列联表进行百分比化的结果为:软件难易程度软件1软件2软件3软件4合计低5/32=15.6%10/32=31.3%14/32=43.8%3/32=9.3%100%(32

9、)中8/61=13.1%28/61=45.9%18/61=29.5%7/61=11.5%100%(61)高22/57=38.6%7/57=12.3%8/57=14.0%20/57=35.1%100%(57)合计35/150=23.3%45/150=30.0%40/150=26.7%30/150=20.0%100%(150)2、解:设立统计假设如下:H0: 软件的难易程度与软件的类别无关Ha: 软件的难易程度与软件的类别有关检验统计量为 卡方值的求解过程如下表所示:软件难易程度实际频数f ij期望频数e ij(e ij-f ij)2/e ij1低5(35*32)/150=7.470.811中8(

10、35*61)/150=14.232.731高22(35*57)/150=13.35.692低10(45*32)/150=9.60.022中28(45*61)/150=18.35.142高7(45*57)/150=17.15.973低14(40*32)/150=8.533.503中18(40*61)/150=16.270.183高8(40*57)/150=15.23.414低3(30*32)/150=6.41.814中7(30*61)/150=12.22.224高20(30*57)/150=11.46.49合计15015037.97由上表可以看出,所以单元格的期望频数均不低于5,因此可以进行卡方

11、检验。由上表可知,卡方的值为37.97,在0.05的显著性水平下,临界值为12.59 。由于37.9712.59 ,因此在0.05的显著性水平下拒绝原假设,即认为软件的难易程度与软件的类别有关。第七章 回归分析知识要点主要概念解释1. 回归许多变量向某一点、某一线或者某一个区域集中或者趋近,这个过程我们称为“回归”。2.(1)线性回归2.(2)非线性回归若变量向某一条直线趋近或者集中,则称为“线性回归”;若变量趋近或集中后无法形成一条直线,则称为“非线性回归”。3.(1)一元线性回归分析3.(2)一元线性回归方程3.(3)多元线性回归分析(1) 回归分析中若只涉及一个自变量和一个因变量的称为“

12、一元回归分析”,而涉及几个自变量和一个因变量的称为“多元回归分析”。(2) 用方程来表示一元线性回归分析的结果,我们称该方程为“一元线性回归方程”。考试题型1. 构建一元回归线性方程2. 求估计标准误差注:估计标准误差越小,观测值就越接近回归方程,如果估计标准误差越大,则观测值离回归方程越远。【例】假设有8个企业的产量和生产费用的关系见下图问:(1)用最小二乘法构建一个回归方程;(2)计算估计标准误差;解:第七章 课后练习1. 下面是两个变量X和Y的数据:X 160 99 132 91 125 108 142 133 138 128Y 55 36 39 25 47 33 56 46 42 50

13、 根据上述数据解决以下问题。(1) 用最小二乘估计法估计Y关于X的回归方程。(2) 计算估计标准误差。(注意,求出的a、b的值不要代错位置)模拟自测题一、单项选择题(本大题共10小题,每小题2分,共20分)1.某连续变量,其末组为“500以上”,又知其邻组的下限为400,则末组的组中值为( D )。A. 600 B. 450 C. 500 D. 5502.甲、乙两数列的平均数分别为80和70, 它们的标准差为8.8和8.4,则 ( A )。A. 甲数列平均数的代表性高于乙数列 B. 乙数列平均数的代表性高于甲数列C. 两数列平均数的代表性相同 D. 两数列平均数的代表性无法比较3.在简单随机重

14、复抽样条件下,当抽样平均误差缩小为原来的1/3时,则样本单位数为原来的( C )A. 2倍 B. 3倍 C. 9倍 D. 无法判断4.对学生学习情况进行抽查,将学号按顺序排列,每隔五个学号抽取一个学生访问,这种抽查方式是( C )。A. 简单随机抽样 B. 类型抽样 C. 等距抽样 D. 整群抽样5.在假设检验中, 原假设和备择假设( C )A 都有可能成立 B. 都有可能不成立C 只有一个成立而且必有一个成立 D. 原假设一定成立,备择假设一定不成立 6. 在其他条件不变的情况下,提高估计的概率保证程度,其估计的精确程度( B )A、随之扩大 B、随之缩小 C、保持不变 D、无法确定7. 根

15、据间隔相等的间断时点数列计算平均发展水平的方法是( D )。 A、 简单算数平均法 B、加权算术平均法 C、简单几何平均法 D、首尾斩半法8. 变异指标反映了总体各单位变量值分布的( B )。A集中趋势 B. 离散趋势 C. 变动区属 D. 长期趋势 9. 在假设检验中,通常犯一类错误的概率称为( B )。A. 置信水平 B. 显著性水平 C. 取伪概率 D. 取真概率10. 以下哪种情况适用t检验统计量( C )A. 样本为大样本,且总体方差已知 B. 样本为小样本,且总体方差已知C. 样本为小样本,且总体方差未知 D. 样本为大样本,且总体方差未知二、 多项选择题(本大题共10小题,每小题

16、2分,共20分)1. 构成分配数列的两个基本要素是( AB )A. 组数的多少 B. 各组组距大小 C. 统计分组 D. 各组标志值的大小E. 各组次数大小 F.分配在各组的单位数2. 平均数的计算方法有( ABC )。A. 算术平均数 B. 调和平均数 C. 几何平均数 D. 众数 E. 中位数3. 影响抽样平均误差的因素有( CDE )A. 是有限总体还是无限总体 B. 是变量总体还是属性总体C. 是重复抽样还是不重复抽样 D. 抽样单位数的多少E. 全及总体标志的变动程度4. 标准差( CE )A. 表明总体单位标志值的一般水平 B. 反映总体单位的一般水平 C. 反映总体单位标志值的离

17、散程度 D. 反映总体分布的集中趋势 E. 反映总体分布的离中趋势5在各种平均指标中,不受极端值影响的平均指标是( DE )A.算数平均数 B.调和平均数 C.几何平均数 D. 中位数 E.众数6. 下列属于品质标志的是( BCD )A职工人数B性别 C企业经济类型D文化程度 E. 先进工作者人数7. 用样本指标估计总体指标时,判断估计的优良标准是( ABC )A、无偏性 B、一致性 C、有效性 D、灵活性 E、随机性8. 当我们根据样本资料对原假设做出接受或拒绝的决定时,可能出现的情况有( ACDE )A、当原假设为真时接受它B、当原假设为假时接受它,我们犯了第一类错误C、当原假设为真时拒绝

18、它,我们犯了第一类错误D、当原假设为假时拒绝它E、当原假设为假时接受它,我们犯了第二类错误 9.编制时期数列,各个指标所属的时间要求( A D )A、相等 B、不相等 C、一般应不相等,但有时也可以相等 D、一般应相等,但有时也可以不想等10. 测定长期趋势的方法有( ABC )A. 时距扩大法 B. 最小二乘法 C. 移动平均法 D. 几何平均法三、判断题(本大题共10小题,每小题1分,共10分)1. 数据预处理是在统计数据分组或分类之后所做的必要处理。 ( 错 )2. 如果=0.05,当我们拒绝H0时,我们就有5%的可能犯错误。( 对 )3. 标志变异指标数值越大,说明总体中各单位标值的变

19、异程度越大,则平均指标的代表性越小。( 对 )4. 将某班学生按考试成绩分组形成的数列是时点数列。( 错 )5. 样本单位数的多少与总体单位标志值的变异程度成反比,与抽样极限误差范围的大小成正比。( 错 )6. 品质标志说明总体单位的属性特征,其标志表现只能用文字表现,所以品质标志不能直接转化为统计指标。( 对 )7. 很多统计方法的假设前提是随机变量服从正态分布。( 对 )8. 在抽样推断中,总体指标值是确定的、唯一的,而样本指标值是一个随机变量。( 对 )9. 某企业的公司人数、广告费用投入这两个变量,前者是连续变量,后者是离散变量( 错 )10. 定基发展速度等于相应各个环比发展速度的连乘积,所以定基增长速度也等于相应各个环比增长速度积。( 错 )四、计算题(本大题共5题,共50分)1.某条高速公路上极少发生汽车碰撞的事故。假定碰撞次数为1.5次每6个月,服从泊松分布。计算6个月内恰好发生2次碰撞的概率。(5分)【参见相应课后习题】2. 保险公司从投保人中随机抽取36人,计算得36人的平均年龄为39.5岁,已知投保人平均年龄近似正态分布,标准差为7.2岁,试求全体投保人的平均年龄的置信水平为95%的置信区间。如果其他条件不变,将允许误差缩小一半,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 农业报告


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号