数据分析方法01-绪论.ppt

上传人:小飞机 文档编号:6296281 上传时间:2023-10-14 格式:PPT 页数:37 大小:1.84MB
返回 下载 相关 举报
数据分析方法01-绪论.ppt_第1页
第1页 / 共37页
数据分析方法01-绪论.ppt_第2页
第2页 / 共37页
数据分析方法01-绪论.ppt_第3页
第3页 / 共37页
数据分析方法01-绪论.ppt_第4页
第4页 / 共37页
数据分析方法01-绪论.ppt_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《数据分析方法01-绪论.ppt》由会员分享,可在线阅读,更多相关《数据分析方法01-绪论.ppt(37页珍藏版)》请在三一办公上搜索。

1、数据分析方法及软件应用,授课教师:杨小宝 副教授北京交通大学2015.09,第一章 绪论,1.1 课程安排与要求(重点)1.2 数据相关的实际问题举例1.3 常用统计软件简介1.4 统计数据及其类型(重点),1.1 课程安排与要求,课程名:数据分析方法及软件应用授课老师:杨小宝地 点:8号教学楼8610室,本人的教学课程:本科-本科-硕士-硕士-硕士-,参考书目,1、薛薇.SPSS统计分析方法及应用,电子工业出版社,第3版2、杜强、贾丽艳.SPSS统计分析从入门到精通,人民邮电出版社,20113、朱星宇、陈勇强.SPSS多元统计分析方法及应用,清华大学出版社,20114、陈胜可,SPSS统计分

2、析从入门到精通,清华大学出版社,2010年,课堂的特点,人多-安静基础不同(概率论、统计学)要求不同课堂信息量大听着容易,学好学精难课堂抛砖引玉,重在课后多学多练,学习方法,1课堂认真听讲;2理论方法-课后多自学教材;3软件应用-结合PPT多练习;4结合自己的研究方向或项目解决实际问题。课件公共邮箱:密码:bjtu102,绪论SPSS软件的入门基本统计分析及其SPSS实现回归分析及其SPSS实现方差分析及其SPSS实现聚类与因子分析及其SPSS实现时间序列分析及其SPSS实现,课程安排:,成绩考核:由三部分组成:大作业:40分 期末考试(闭卷):60分平时出勤和回答问题:扣分和奖分制,第1-2

3、次缺勤,每次扣2分,回答问题准确的加分,缺勤3次后果 很严重。,考试说明,12,1.2 数据相关的实际问题举例,1.北京市机动车保有量,优讯-中国网 随着城市的发展,北京机动车数量也不断增多。记者从交管部门获悉,截至2010年12月19日,全市机动车保有量已达476万余辆。交管部门表示,北京机动车增长太快了,保有量从2300辆到100万辆,用了48年(1997年114.5万辆);2003年8月突破200万辆,用时6年6个月;2007年5月突破300万辆,用时3年9个月;2009年12月突破400万辆,仅仅用时两年零7个月。2012年2月突破500万辆;2014年9月550万辆.北京市机动车牌照

4、申请网2011年1月1日开通每月8号前申请26号摇号。,对一些企业而言,市场信息数据是企业生存所必需的,绝不是可有可无的。调查其产品及竞争者在市场中的状况、各种类型消费者对其产品的态度、收集各地方的经济交通等信息等等。某方便面企业每年至少花三四千万元来收集和分析数据洗发水交通事故数据,2.数据对企业的重要性,选举人票-赢者通吃,3.总统选举,一次失败的统计调查,在1936年的美国总统选举前,一份名为 Literary Digest 杂志进行了一次民意调查。调查的焦点是谁将成为下一届总统Landon or Roosevelt。为了解选民意向,民意调查专家们根据电话簿和车辆登记簿上的名单给一大批人

5、发了简单的调查表(电话和汽车在1936年并不像现在那样普及,但是这些名单比较容易得到)。尽管发出的调查表大约有一千万张,但收回的比例并不高。在收回的调查表中,Alf Landon非常受欢迎。于是该杂志预测 Landon 将赢得选举。但事实上是Franklin Roosevelt赢得了这次选举,盖洛普成功预测1936年总统大选,1936年盖洛普利用配额抽样成功地预测了罗斯福当选总统。样本中男性、女性的比例;黑人、白人的比例;穷人、富人的比例是与美国人口的分布一致。,计算机的诞生与发展,为数据处理提供了强有力的技术支持,统计学与计算机的结合是必然的发展趋势.20 世纪末至今,开发出了一些非常实用的

6、统计软件包:SAS,SPSS,Eviews,Matlab等,这些软件都可以让你快速、简便地进行数据处理和分析.,18,1.3 常用统计软件简介,Excel:它严格说来并不是统计软件,但作为数据表格软件,必然有一定统计计算功能。而且凡是有Microsoft Office的计算机,基本上都装有Excel。但要注意,有时在装Office时没有装数据分析的功能,那就必须装了才行。当然,画图功能是都具备的。对于简单分析,Excel还算方便,但随着问题的深入,Excel就不那么“傻瓜”,需要使用函数,甚至根本没有相应的方法了。多数专门一些的统计推断问题还需要其他专门的统计软件来处理。,20,上一页图形制作

7、方法提示:先把两个图形都 做好,再点中其中一个鼠标右键设置数据系列格式次坐标轴,Minitab:这个软件是很方便的功能强大而又齐全的软件,也已经“傻瓜化”,在我国用的不如SPSS与SAS那么普遍。MATLAB:这也是应用于各个领域的以编程为主的软件,在工程上应用广泛。编程类似于S和R。但是统计方法不多。,统计软件的种类很多。只要学会使用一种“傻瓜式”软件或编程软件,使用其他类似的软件也不会困难,最多看看帮助和说明即可.学习软件的最好方式是多练多用.用统计软件容易得到漂亮的数据结果,但其中充满了危险的陷阱.,计算机无法识别你的统计方面的错误.错误的方法、错误的数据形式都必然输出错误的结果.结果虽

8、然看上去很漂亮,但有时得到的却是大量垃圾.因此,使用统计软件时,要了解相关的统计理论方法,及其使用的前提条件和适用性,根据实际研究问题选用准确的方法.,1.4 统计数据及其类型,一、分类数据、顺序数据、数值型数据 二、观测数据和实验数据三、截面数据和时间序列数据,什么是统计数据?(data),1.对现象进行计量的结果,是统计工作的成果 2.不是指单个的数字,而是由多个数据构成的数据集 3.不仅仅是指数字,它可以是数字的,也可以是文字的,统计数据的分类,统计数据的分类,统计数据的分类(按计量尺度分),1.分类数据(categorical data)-也叫定类数据对事物进行分类的结果数据表现为类别

9、,用文字来表述,对事物应进行平行的分类例如,人口按性别分为男、女两类;企业分国有、集体、私营、外资等等,统计数据的分类(按计量尺度分),2.顺序数据(rank data)-也叫定序数据对事物类别顺序的测度数据表现为类别,用文字来表述,但类别有顺序比分类尺度精确,未测量出类别之间的准确差值例如,产品分为一等品、二等品、三等品、次品等;成绩分优、良、中、差3.数值型数据(metric data)对事物的精确测度结果表现为具体的数值,是最常见的数据类型例如:身高为175cm、168cm、183cm;还有体重、收入等等,三种类型数据的比较,分类数据和顺序数据:说明的是事物的品质特征,用文字表示-定性数

10、据或品质数据数值型数据:说明的是现象的数量特征,用数值表示-定量数据或数量数据定性数据和定量数据也可以相互转化.如年龄:老年、中年、青年、少年、儿童 学历:大学-1、高中-2、初中-3、小学-4,统计数据的分类(按收集方法分),1.观测数据(observational data)通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据2.实验数据(experimental data)在实验中控制试验对象而收集到的数据比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为实验数据,统计数据的分类(按时间状况分),1.

11、截面数据(cross-sectional data)在相同或近似相同的时间点上收集的数据描述现象在某一时刻的变化情况比如,2002年我国各地区的国内生产总值数据2.时间序列数据(time series data)在不同时间上收集到的数据描述现象随时间变化的情况比如,1996年至2002年国内生产总值数据,问题分类与解决方法,统计或数据分析中的问题大多是研究不同变量之间的关系。最常见的一类问题是分析解释变量(自变量X1,X2,X3,)对被解释变量(因变量Y)是否存在影响,有多大影响等。如何选择适当的统计理论方法?需要根据变量X和Y的数据类型不同,选用不同的统计理论方法。,作业,买教材练习EXCEL图形制作安装SPSS软件预习SPSS的基本操作,下载:cgbt(32位和64位的区别)安装(序列号见安装说明):SPSS for Windows安装的基本步骤与其他常用软件是基本相同的。启动:开始程序SPSS for Windows,SPSS22软件的安装,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号