数据分析中常见图表的应用场景及优缺点对比.docx

上传人:李司机 文档编号:6893247 上传时间:2024-03-15 格式:DOCX 页数:20 大小:259.07KB
返回 下载 相关 举报
数据分析中常见图表的应用场景及优缺点对比.docx_第1页
第1页 / 共20页
数据分析中常见图表的应用场景及优缺点对比.docx_第2页
第2页 / 共20页
数据分析中常见图表的应用场景及优缺点对比.docx_第3页
第3页 / 共20页
数据分析中常见图表的应用场景及优缺点对比.docx_第4页
第4页 / 共20页
数据分析中常见图表的应用场景及优缺点对比.docx_第5页
第5页 / 共20页
点击查看更多>>
资源描述

《数据分析中常见图表的应用场景及优缺点对比.docx》由会员分享,可在线阅读,更多相关《数据分析中常见图表的应用场景及优缺点对比.docx(20页珍藏版)》请在三一办公上搜索。

1、数据分析中常见图表的应用场景及优缺点对比在数据可视化领域我们经常使用各种图表来形象直观的展现数据,业务人员或者数据分析人员可以通过图表分析公司业务的经营状况,发现公司经营过程中潜在的隐患,还可以通过图表挖掘其中潜在的价值。那么常见的图标有咖些?在什么场景下使用样的图表才能更好的展现数据呢?一、常见的图表1 .柱图(柱状图)mill柱图,又称柱状图。是一种以长方形的长度来表达数据的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况。场景:适合用于展示二维数据集,展示数据的分布情况,其中一个轴表示需要对比的分类维度,另一个轴代表相应的数值,比如:(月份,商品销量),或者在一个维度上,对多个同

2、质可比的指标的比较,比如:(月份,苹果销量,桃子产量)优点:简单直观,很容易根据柱子的长短看出值的大小易于比较各组数据之间的差别缺点:不适合较大数据集的展现类似图表:条形图、直方图、堆积图、百分比堆积图、双Y轴图等2 .线图(折线图)多指标布线IS线图:也叫折线图,将值标注成点,并通过直线将这些点按照某种顺序连接起来形成的图。场景:数据在一个有序的因变量上的变化,它的特点是反应事物随类别而变化的趋势,可以清晰展现数据的增减趋势、增减的速率、增减的规律、峰值等特征。优点:能很好的展现沿某个维度的变化趋势能比较多组数据在同一个维度上的趋势适合展现较大数据集缺点:每张图上不适合展示太多折线类似图表:

3、堆积图、曲线图、多指标折线图、双Y轴折线图、面积图3 .饼图(扇形图)11O9020ratio夕饼图:以饼状图形显示一个数据系列中各项的大小与各项总和的比例,也称作扇形统计图。场景:适用于二维数据,即一个分类字段,一个连续数据字段,当用户更关注与简单占比时,适合使用饼图。优点:简单直观,很容易看到组成成分的占比缺点:不适合较大的数据集(分类)展现数据项中不能有负值当比例接近时,人眼很难准确判别类似图表:环形图、3D饼图4 .散点图散点图:又称XY散点图,将数据以点的形式展现,以显示变量间的相互关系或者影响程度,点的位置由变量的数值决定。场景:显示若干数据系列中各数值之间的关系,类似XY轴,判断

4、两变量之间是否存在某种关联,或者发现数据的分步或者聚合情况优点:可以展示数据的分布和聚合情况适合展示较大的数据集缺点:散点图看上去比较乱,基本上只能看相关、分布和聚合,其他信息均不能很好展现类似图表:气泡图5 .雷达图(蜘蛛网图)(六边形战士)雷达图:又称蜘蛛网图,将多个维度的数据量映射到起始于同一个圆心的坐标轴上,结束于圆周边缘,然后将同一组的点使用线连接起来。场景:雷达图适用于展现多维数据集优点:适客展现某个数据集的多个关键特征适合展现某个数据集的多个关键特征和标准值的比对适合比较多条数据在多个维度上的取值缺点:多维度但是不能太多,一般四到八个比较的记录条数不宜太多6 .漏斗图漏斗图:有多

5、个梯形从上而下叠加而成。从上到下的项有逻辑上的顺序关系,梯形面积表示某个业务量与上一个环节之间的差异。场景:适用于业务流程比较规范、周期长、环节多的单流程单向分析,通过漏斗各环节业务数据的比较能够直观的发现和说明问题所在的环节,进而做出决策。说明:漏斗图总是开始于一个100%的数量,结束于一个较小的数量在开始和结束之间由N个流程环节组成,每个环节用一个梯形来表示梯形的上底宽度表示当前环节的输入情况,下底表示当前环节的输出,上底与下底之间的差异表现了在当前环节业务量的减小量,当前梯形边的斜率表现了当前环节的减小率漏斗图的所有环节的流量都应该使用同一个度量类似图表:金字塔图、对称漏斗图(旋风)、对

6、比漏斗图7 .树图3.乐万765369097555459350894629786树图:树图是通过树形结构来展现数据的组织关系,以父子层次结构来组织对象,是枚举法的一种表达方式。场景:适用于与组织结构有关的分析,即有明确的层次关系的数据优点:直观的展现层次关系可以看到各层级指标间的关系,可以进行简单的上卷、下钻等操作缺点:数据层级不宜过多每层的成员不宜过多无法展现各部分占比关系类似图表:矩阵树图8 .矩阵树图矩阵树图:采用矩形表示层次结构的节点,父子层次关系用矩阵间的相互嵌套来表达。从根节点开始,空间根据相应的子节点数目被分为多个矩形,矩形面积大小对应节点属性。每个矩形又按照相应节点的子节点递归

7、的进行分割,直到叶子节点为止。场景:适合展现具有层级关系的数据,能够直观体现同级之间的比较优点:图形更紧凑,同样大小的画布可以展现更多的信息可以展现成员间的权重缺点:不够直观、明确、不像树图那么清晰分类占比太小时不容易排布类似图表:树图、马赛克图,热力图9 .来源去向图110.9万210.9 万受110.9 万8.503万1420万W!1420万来源去向图:通过页面访问量PV和访客数量UV推算出网页的转化率,进而可以了解网站的整体运营效果和某一类商品的最终成交量场景:非常单一,适用于电商与营销有关的分析,比如分析购物网站中,哪些商品最畅销或者哪一个时间段是访问高峰。优点:特别适合分析展现网站流

8、量的运营数据显示结果直观,可以清晰的看到各个维度指标变化的情况支持以某个节点查看该节点所在流程的情况缺点:应用面很窄,只能显示三级维度的流程数据对显示的度量要求严格10 .指标看板3.206万4.215万3.89万6.423万iJt1”5tEfJmS58-fEMBX砌fSBW1.842万14561.668万643011t“5tf11*flIl切6E指标看板:通过文字、数字和符号和合理排版,对数据进行一目了然的展示。由看板标签和看板指标组成,标签由维度决定,指标由数据的度量决定。场景:适合用来展示一个维度下的一个或者多个度量,特别是对某些指标需要精确读数的场景。优点:展薪的是详细的数字,用户得到

9、的都是精确信息简单直观,重点数字突出,容易得到关键信息缺点:展现维度只能有一个展现指标不宜过多只是数字面板,不具有图形的各种优势11 .仪表盘仪表盘:像一个钟表或者可读盘,有刻度和指针,其中刻度表示度量,指针表示维度,指针角度表示数值,指针指向当前数值。场景:管理报表或报告,直观的表现出某个指标的进度或实际情况优点:适用于场景比较窄,主要用于进度或占比的展现只能一个维度,指标也不宜过多,展示信息有限类似图表:堆积图12 .地图地图,使用地图作为背景,通过图形的位置来表现数据的地理位置,将数据在不同地理位置上的分步通过颜色或者气泡映射在地图上。场景:适合带有地理位置信息的数据集展现,展现的通常是

10、以某个地区为单位的汇总的连续信息优点:和地图向结合,对数据的地理分步显示直观通过颜色深浅、气泡大小等容易判断度量的大小缺点:必须有地理信息,且数据为汇总数据,气泡容易叠加显示的都是非精确值,气泡大小和颜色深浅相近时不易分辨地理面积大小和度量值无关,容易误读类似图表:气泡地图、颜色地图(分级统计地图)、秒点地图13.极坐标图极坐标图,由多个扇区构成。每个扇区的标签由数据的维度决定,每个扇区的长度由数据的度量决定。每个扇形的角度一样,通过半径展示变化。场景:适用于枚举数据之间的比较,比如显示一段时间内的数据变化,或显示各项之间的比较情况。优点:视觉效果在部分情况下比其他图表更佳同样的画布能比部分其

11、他图表展示数据更多缺点:不适合分类过少的数据集不适合部分度量过小的数据集类似图表:饼图、环图、柱图、玫瑰图14 .词云图南省西藏区广西省懿M山西省.福建省1 M盘肾,鲁映.词云图,又称文字云,是文本数据的视觉表示,由词汇组成类似云的彩色图形,用于展示大量文本数据。每个词的重要性以字体大小或颜色显示。场景:做用户画像,对用户进行聚类,实现精细化营销。适合用于描述网站上的关键字(即标签),或可视化自由格式文本,可以对比文字的重要程度。其本质是点图,是在相应坐标点绘制具有特定样式的文字的结果优点:快速感知最突出的文字,或区别权重不同的文字可展示大量文本缺点:不适合展现数据太少的数据集不适展现区分度不

12、大的数据,即无重点关键词类似图表:点图、柱图二、图表类型和使用场景m 1 rwIlll100OBBMImm ortr*ww p*nwt* m*wVM7a* ImMMJil XAU IOOMfeKeUflB tD9t安德鲁阿伯拉(AndrewAbela)制作的这份指南(ThiSGUide)是思考图表类型的一个很好的起点,但不要把它用作决策引擎。并不是人人都同意他对图表类型的组织方式,层级结构也并未包含所有有效的图表类型。事实上,这里显示的每个图表都有许多变体和混合,而且人们时时刻刻都在创建出新的图表类型。此外,当你想要拓展自己的思维,尝试多种方法时,这个工具可能缩小你的思考范围。但是,它将帮助你

13、理解各种形式的类别(例如,比较和分布),并且可能激发你尝试一些新东西。我已经对这份指南进行了调整,使之与“交谈-画草图-创建原型”的框架相适应。至于我是怎样调整的,请参见下图。ar4%aaraBfvumMMtttIillilG/Iillil012X2矩阵也叫矩阵,水平和垂直平分的方框,形成了四个象限。它常用于说明基于两个变量的类型。优点:针对元素分类和“区域”创建的易于使用的组织原则缺点:在不同的空间间隔绘制象限内的项,暗示两者可能不存在统计关系02冲积图也称为流图,显示值怎样从一个点移动到另个点的节点和流。这通常用于展示值在一段时间内的变化,或者其组织方式的细节,例如,预算拨款如何逐月使用。

14、优点:在值的更改中公开详细信息,或者在广泛数据类别中公开地详细分解缺点:流中的许多值和变化导致复杂而且交叉的视觉效果,虽然很漂亮,但可能很难解释03条形图表示类别之间关系(“分类数据”)的高度或长度不等的条形。常用来比较同一指标下的不同群体,如10位不同CEo的薪酬。(当条形图垂直时也称为柱状图。)缺点:许多条形图可能会造成趋势线的印象,而不是突出离散值;多组条形可能变得难以解析延伸阅读:手把手教你用直方图、饼图和条形图做数据分析(PythOn代码)04气泡图散布在两次测量上的点,为数据增加了第三个维度(气泡大小),有时增加了第四个维度(气泡颜色),以显示几个变量的分布。常用来表示复杂的关系,

15、如绘制不同国家的多个人口数据块。(也被错误地称为散点图。)优点:合并“z轴”最简单的方法之一;气泡大小可以为分布式的可视化图表增加至关重要的上下文缺点:按比例调整气泡大小是棘手的(面积与半径不成比例);从本质上说,三轴和四轴的图表需要更多的时间来解析,因此不太适合于一目了然的表示延伸阅读:什么是气泡图?怎样用Python绘制?有什么用?终于有人讲明白了05凹凸图也称为疙瘩图(bumpsChart),显示随着时间推移的排名顺序变化的线条。常用来表示受欢迎程度,如每周的票房排名。优点:表现受欢迎程度、赢家和输家的简单方式缺点:变化没有统计学意义(值是序数,而不是基数);许多的等级和更多的变化使其具

16、有引人注目的优势,但也可能使其难以追踪观察排名06点图显示沿一根轴线的几个测量值。当重要的不是每根条形的高度而是条形之间的高度差时,常用于代替条形图。优点:一种在垂直的或水平的狭小空间内都适用的紧凑形式;比传统的形式(条形图)更容易沿着单一的测试方法来进行比较缺点:由于要绘制的点很多,很难有效地标记;如果这很重要,那就消除了所有类别之间的趋势感07流程图用多边形和箭头表示流程或工作流。通常用于描绘决策,数据如何在系统中移动,或者人们如何与系统交互,例如用户在网上购买产品的过程。(也称为决策树,它是流程图的一种类型。)-o1.-优点:形式化的系统,被普遍接受,用于表示具有多个决策点的流程缺点:必

17、须理解已确定的语法(例如,菱形表示决策点;平行四边形表示输入或输出等规则)08地理图也叫地图,用于表现属于现实世界中位置的值的地图。常用于比较国家或地区之间的值,如显示政治立场的地图。优点:如果看图者熟悉地理,可以很容易地找到值并在多个层次上对它们进行比较(即同时按国家和地区比较数据)缺点:使用位置的大小来表示其他值,可能会强化或弱化这些位置中编码的值09层次图用来表示元素集合的关系和相对排名的线和点。通常用来表示某组织的结构,如家庭或公司。(也称为组织结构图、家谱或树形图,所有这些都是层次图的类型。)T优点:一种记录和说明关系与复杂结构的易于理解的方法缺点:行与方框的方法在显示复杂性方面受到

18、限制;更难显示不那么正式的关系,比如人们如何在公司的层级制度之外合作10直方图基于范围内每个值的出现频率来显示分布情况的条形。常用于显示概率等结果的风险分析模拟。(也被错误地称为条形图,实际上,条形图用于比较类别之间的值,而直方图则显示一个变量的值的分布。)优点:用来显示统计分布和概率的基本图表类型缺点:看图者有时会把直方图误认为条形图延伸阅读:手把手教你用PythOn画直方图:其实跟柱状图完全不同H折线图显示值如何变化的一些相互连接的点,通常随时间的推移而变化(连续数据)。常用于通过把多条线画在一起来比较趋势,例如几家公司的收入。(也称为体温记录图或趋势线。)优点:大家都熟悉的形式;非常适合

19、于一目了然地表现趋势缺点:如果我们重点关注趋势线,将更难看到和探讨离散的数据点;太多的趋势线使得人们很难看到任何单根的线延伸阅读:什么是折线图?怎样用Python绘制?怎么用?终于有人讲明白T12棒棒糖图类似于点图,但在单个测量值上绘制两个点,用一根线连接,以显示两个值之间的关系。绘制几个棒棒糖图,可以产生类似于浮动条形图的效果,其中的值并不全都固定在同一个点上。(它也被称为双棒棒糖图。)OOO优点:既适合水平又适合垂直的紧凑的图表形式;当两个变量之间的差异最重要时,非常适合在它们之间进行多次比较缺点:当变量“翻转”(高值是前一个棒棒糖图中的低值)时,多个棒棒糖图之间的比较可能令人困惑;值相似

20、的多个棒棒糖图,使得评估图中的单个项变得困难13隐喻图箭头、金字塔、圆圈和其他公认的图形,用来表示非统计概念。通常用于表示抽象的想法和流程,如业务周期。优点:能够简化复杂的想法;由于人们对隐喻的普遍认识,所以显得天生就能理解这种图缺点:很容易混淆隐喻,误用隐喻,或者过度设计隐喻14网络图连接在一起的节点和线,以显示一个群体中各元素之间的关系。通常用于表示实物之间的相互联系,如计算机或人。优点:有助于说明节点之间的关系,这些关系在我们采用其他方式时可能很难看出来;突出显示集群和异常值缺点:网络往往迅速变得复杂起来。有些网络图虽然漂亮,但可能很难解释15饼形图被分成若干部分的圆,每个部分代表某个变

21、量在整个值中所占的比例。通常用于显示简单的总数细分,如人口统计。(也称为甜甜圈图,它是一种以圆环形式显示的变化图。)优点:无处不在的图表类型;显示主导份额和非主导份额缺点:人们对扇形楔形块的面积估计得不是很好;如果楔形块过多,将使得值难以区分和量化16桑基图显示值是如何分布和传输的箭头或条形。常用于显示物理量的流动,如能量或人。(也称为流图。)优点:使人们易于发现系统流程中的细节;帮助识别主要的组成部分和低效的地方缺点:是一种由包含许多组成部分和流动路径的复杂系统构成的图表延伸阅读:怎样用Python绘制诱人的桑基图?17散点图对照美,特定数据集的两个变量而绘制的点,表示这两个变量之间的关系。

22、常用于检测和显示相关性,如年龄与收入的关系图。优点:大多数人都熟悉的基本图表类型;这种空间方法可以很容易地看到相关、负相关、集群和异常值缺点:很好地表现了相关性,以至于即使相关性并不意味着因果关系,人们也可能做出因果关系的推测延伸阅读:PythOn数据可视化:5段代码搞定散点图绘制与使用,值得收藏18斜率图表示值的简单变化的线。通常用来表示剧烈的变化,或与大多数斜率相反的异常值,例如某地区的收入下降,其他所有地区的收入都在上升。(也称为折线图。)优点:创造了一种简单的之前和之后的叙事,无论是单个值还是许多值的总体趋势,都让人很容易看出和掌握缺点:排除了两种状态之间值的所有细节;太多纵横交错的线

23、条可能让人很难看到单个值中的变化19小型多图一系列小图表,通常是线形图,显示在同一尺度上测量的不同类别。常用于多次显示简单的趋势,如按国家划分的GDP趋势。(也称为网格图或格状图。)优点:和将所有的线都叠加在同一个图表中相比,更容易比较多个甚至几十个类别之间的差异缺点:如果没有戏剧性的变化或差异,就很难在比较中发现其意义;你在单个图表中看到的一些“事件”就会丢失,例如变量之间的交点20叠加区域图也称为区域图,描绘某一随着时间的推移而变化的变量的线条,线条之间的区域用颜色填充,以强调体积或累计总数。通常用于按时间比例显示多个值,例如一年中多个产品的销售量。优点:能很好地显示出比例随时间的变化;强

24、调体积感或积累感缺点:太多的“层次”使得每一层都太薄了,以至于很难看到随时间的变化、差异,或者难以追踪观察值的情况21叠加条形图被分成若干部分的矩形,每个部分代表某个变量在整体中的比例。通常用于显示简单的分类汇总,如各地区的销量。(也称为比例条形图。)优点:有些人认为它是饼形图的一个更好的替代图表;很好地显示主导份额和非主导份额;可以有效地处理比饼形图更多的类别;水平和垂直都适用缺点:包含太多的类别或者将多个堆积条形组合在一起,可能使你很难看到差异和变化22表格按列和行排列的信息。通常用于跨多个类别显示单个值,如季度财务业绩。优点:使每个单个的值都可用;与相同信息的单调版本相比,更容易阅读和比

25、较值的情况缺点:难以对趋势产生粗略的了解,也很难对几组值进行快速比较23树形图被分割成更小矩形的矩形,每个更小矩形代表某个变量与整个值的比例。常用于表示等级比例,如按类别和子类别划分的预算。优点:显示详细比例分解的紧凑形式;克服了饼形图的许多楔形块的限制缺点:以细节为导向的形式,不适合快速理解;太多的类别会造成令人震惊但难以解析的视觉效果;通常需要能够精确排列正方形的软件24单位图用于表示与分类变量相关的单个值的集合的点或图标。通常用于显示实物的记录,如花费的金额或者流行病中的患者。(也称为点图。)优点:以比某些统计演示更加具体、更加形象的方式来表现值缺点:太多的单元类别可能使你难以将精力集中在核心的意义上;要拥有强大的设计能力,才能使单位的安排最有效。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号