《谁说菜鸟不会数据分析课件.ppt》由会员分享,可在线阅读,更多相关《谁说菜鸟不会数据分析课件.ppt(47页珍藏版)》请在三一办公上搜索。
1、谁说菜鸟不会数据分析,三心二意,数据处理,03,无米难为巧妇,数据准备,02,数据分析那些事,01,第1章 数据分析哪些事儿,数据分析是“神马”数据分析六部曲常用指标或术语,数据分析是“神马”,数据分析是指适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总、理解并消化。以求最大化地开发数据的功能,发挥数据的作用。,数据分析的目的,数据分析的目的是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来,总结研究对象的内在规律。,菜鸟与数据分析师的区别,数据分析师的基本素质,态度严谨负责好奇心强烈逻辑思维清晰擅长模仿勇于创新,数据分析六步曲,一般数据分析用Excel可以完成,若高级数据
2、分析,则需要使用数据分析工具,如SPSS Statistics等。,常用指标或术语,平均数 绝对数与相对数 百分比与百分点 频数与频率 比例与比率 倍数与番数 同比与环比,平均数,绝对数与相对数,绝对数:是反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合指标。也是数据分析中常用的指标,如:GDP、总人口数等。,相对数:是指两个有联系的指标对比计算而得到的数值,用于反映客观现象之间数量联系程度的综合指标。计算相对数的基本公式:比较数值(比数)相对数=基础数值(基数),分母是用做对比标准的指标数值,简称基数;分子是用做与基数对比的指标数值,简称比数。相对数一般以倍数、成数、百分数等表示
3、,它反映了客观现象之间数量联系的程度。使用相对数时需要注意指标的可比性,同时要与总量指标(绝对数)结合使用,下面我举几个例子,你一看就明白了。,百分比与百分点,百分比是相对数中的一种,它表示一个数是另一个数的百分之几,也称百分率或百分数。,百分点是指不同时期以百分数的形式表示的相对指标的变动幅度,1个百分点=1%。例如,图1-10中某公司发言人就混淆了百分比与百分点的概念。,表示构成的变动幅度不宜用百分数,而应该用百分点。因此,这位公司发言人正确的说法应该是“公司今年的利润是45%,比去年的28%提高了17个百分点”。,频数与频率,频率是每组类别次数与总次数的比值,它代表某类别在总体中出现的频
4、繁程度,一般采用百分数表示,所有组的频率加总等于100%。还是用某校A班的例子,30个男同学在50个同学中出现的频率为60%,即(3050)X100%;而20个女同学在50个同学中出现的频率为40%,即(2050)X100%,如图1-11的右图所示。,比例与比率,比例是指在总体中各部分的数值占全部数值的比重,通常反映总体的构成和结构。比如,A班共有学生50人,男生30人,女生20人,则男生的比例是30/50,女生的比例是20/50。由此可以看出,比例的基数(也就是分母)都是全体学生人数,即为同一个基数。,比率是指不同类别数值的对比,它反映的不是部分与整体之间的关系,而是一个整体中各部分之间的关
5、系。比如刚才的例子,男生30人,女生20人,则男生与女生的比率是30/20,如图1-12所示。这一指标经常会用在社会经济领域,比如我国的人口性别比就是用每100名女性数量相对的男性数量来表示的。,倍数与番数,倍数与番数同样属于相对数,但使用时容易混淆。倍数是一个数除以另一个数所得的商。比如ABC,就是说A是B的C倍。需要注意的是,倍数一般是表示数量的增长或上升幅度,而不适用于表示数量的减少或下降。,番数是指原来数量的2的N次方倍。比如翻一番为原来数量的2倍(21),翻两番为4倍(22)。如图1-13所示,,正确的说法:公司产品销量翻一番(6.4=3.2X21),从去年的3.2万件提高到今年的6
6、.4万件。此外,我们成本控制也很好,由20万元下降了50%,今年成本为10万元,同比与环比,同比是指与历史同时期进行比较得到的数值,该指标主要反映的是事物发展的相对情况。例如2010年12月与2009年12月相比,如图1-14左图所示。环比是指与前一个统计期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。例如2010年12月与2010年11月相比,如图1-14右图所示。,第一章总结,1、何谓数据分析,菜鸟与数据分析师的区别,以及数据分析师的基本素质。2、数据分析的六部曲,首先是明确分析目的和内容,然后是数据采集,第三步是将采集回来的数据进行处理,第四步是根据研究目标和内容进行分析,第
7、五步是将分析出的结果通过图表的方式展现出来,最后一步是撰写数据分析报告。3、数据分析中经常用到的指标或术语,除掌握最基本的平均数、百分比等概念以外,还需要将容易混淆的指标进行明确区分,避免在以后阐述分析结果时出现错误。,第2章 无米难为巧妇,数据准备,初识excel数据来源,初识excel,1、自动调整列宽,1)在菜单里选择“开始”主选项卡格式“自动调整列宽”。2)选中要调整的几列,鼠标移至这几列任意列标之间,直到光标变成左右带箭头的十字图形,然后双击,选中的所有列即自动调整为最合适的列宽。,2、如何录制宏,01,打开“视图”选项卡,单击“宏”的下拉菜单,先选中“使用相对引用”选项,再单击“录
8、制宏”选项。,01,01,此时,会弹出一个“录制新宏的”对话框,在里面可以命名宏名,你可以根据宏实现的功能来命名,例如在这里我将其命名为“红色加粗”,然后,设置“快捷键”,注意不要与excel本身内置的快捷键重复。,02,01,在工作表执行你的操作,比如在这里,我们选择将A1单元格的数据变为红色并加粗。,03,01,再单击“视图”选项卡,“宏”“停止录制”。,04,01,选择任意其他单元格或者区域,再单击“视图”“宏”“查看宏”,并单击“执行”按钮,也可以使用组合按钮ctrl+q,04,数据来源,1、导入文本数据,01,单击“数据”选项卡,选择“来自文本”选项。Excel会弹出相对应的对话框。
9、,01,第3章 三心二意,数据处理,1、清洗数据小妙招,清洗数据小妙招,1、冻结窗口,单击单元格B3,再选择“视图”主选项卡 冻结窗格冻结拆分窗格,重复数据处理,思考:有几种找出重复值的方法?,1、用条件格式标识重复数据,01,选择“开始”“条件格式”“突出显示单元格规格”“重复值”,01,2、用计数函数来识别重复数据,01,选中B2单元格,然后输入函数公式:=COUNTIF(A:A,A2),01,01,选中C2单元格,然后输入函数公式:=COUNTIF(A$2:A2,A2),02,01,将公式复制到B3:C11的所有单元格。,03,重复数据处理,思考:有几种删除重复值?,1、先介绍最简单的方
10、式,直接利用菜单里“删除重复项”选项,2、用菜单操作来筛选重复数据,01,选择包含数值数据的单元格区域。,01,01,在“数据”选项卡上“排序和筛选”组中,单击“高级”按钮,弹出“高级选项”对话框。,02,01,选择“将筛选结果复制到其他位置”选项,在“复制到”文本框输入B1区域,在勾选“选择不重复的记录”复选框,单击“确定”按钮。,03,思考:有几种数据表的行列互换?,01,复制好区域后,在“开始”选项卡上的“剪贴板”组中,单击“粘贴”按钮,然后单击“选择性粘贴”,01,01,复制好区域后,使用键盘快捷键方式,按”ctrl+alt+v”,在勾上“转置”即可实现转置粘贴。,02,我的快捷键ctrl+alt+v,01,复制好区域后,可以将数据粘贴在其他区域,在这时右下角会出现“粘贴”的下拉菜单,单击下拉菜单可以实现转置。,03,谁说菜鸟不会数据分析,到此结束 谢谢,