《数据可视化技术-复习指导-2023春(附参考答案).docx》由会员分享,可在线阅读,更多相关《数据可视化技术-复习指导-2023春(附参考答案).docx(55页珍藏版)》请在三一办公上搜索。
1、数据可视化技术复习指导手册一、 课程介绍数据可视化技术是国家开放大学数据科学与大数据技术专业(本科)的一门核心课程。本课程的主要任务是讲授数据可视化的方法和基本编程,注重强化培养学生的动手能力。本课程的主要目的是培养学生的数据处理、可视化能力。通过本课程的教学,使学生掌握数据的一般处理、可视化方法,并能使用至少一种数据可视化工具。主要内容包括:介绍数据可视化的基础理论和概念、不同类型的数据可视化方法,结合具体实例介绍EChartS可视化工具的使用,并以交通、校园大数据为例介绍可视化综合应用系统。通过课程学习使学生了解数据可视化基本概念、视觉感知和认知的基本原理,掌握基本可视化方法,掌握数据预处
2、理、特征提取等及数据基本处理方法,掌握可视化系统的设计过程,掌握时空数据可视化方法,掌握常用的可视化软件使用方法,注重对学生的数据分析和思维能力的引导和培养,为培养信息技术应用人才奠定必要的专业基础。先修课要求:大数据技术导论、JavaSCriPt程序设计二、 考核说明1 .考核对象国家开放大学数据科学与大数据技术专业(本科)学生。2 .启用时间2021年秋季学期。3 .考核目标通过考核使学生掌握数据可视化的方法和基本编程,注重强化培养学生的动手能力。本课程的主要目的是培养学生的数据处理、可视化能力。通过本课程的教学,使学生掌握数据的一般处理、可视化方法,并能使用至少一种数据可视化工具。主要内
3、容包括:介绍数据可视化的基础理论和概念、不同类型的数据可视化方法,结合具体实例介绍EChartS可视化工具的使用,并以交通、校园大数据为例介绍可视化综合应用系统。4 .考核依据本课程考核说明是依据国家开放大学“数据可视化技术”课程教学大纲、文字教材数据可视化技术制定的。本课程考核说明是课程考核命题的基本依据。5 .考核方式及计分方法本课程考核采用形成性考核与终结性考核相结合的方式。形成性考核占课程综合成绩的30%,终结性考核占课程综合成绩的70机课程考核成绩统一采用百分制,即形成性考核、终结性考核、课程综合成绩均采用百分制。课程综合成绩达到60分及以上(及格),可获得本课程相应学分。考核方式相
4、关信息以国家开放大学当学期发布的考试安排文件为准。6 .形成性考核加强对学生平时自主学习过程的指导和检测,引导学生按照考核要求和学习计划完成学习任务,达到掌握知识、提高能力的目标,提高学生的综合素质。本课程包含4个形考任务(习题),学生需要全部完成,详情请参照下表。形成性考核任务列表序次所属章教学内容形考任务权重1第1章数据可视化概述形成性考核一15%2第2章数据处理可视化形成性考核二15%3第3章数据可视化设计形成性考核三15%4第4章可视化软件与工具形成性考核四15%5第5章时空数据可视化形成性考核伍15%6第6章数据可视化综合应用举例形成性考核六25%7 .终结性考核(1)考核目的终结性
5、考核是在形成性考核的基础上,对学生学习情况和学习效果进行的一次全面检测。(2)命题原则第一,本课程的考试命题严格控制在教学大纲规定的教学内容和考核要求的范围之内。第二,按掌握、理解、了解三个层次命题。第三,每份试卷所考的内容,覆盖本课程教材所学内容的70%以上章节。第四,试题难度适中。一般来讲,可分为容易、适中、较难三个程度,所占比例大致为:容易占40%,适中占40乐较难占20%。(3)考试手段网考。(4)考核方式闭卷(5)考核时限90分钟(6)试卷试题类型、数量及分值a)单项选择题:20个题;每小题2分,合计40分。b)多项选择题:5个题;每小题3分,合计15分。c)判断题:15个题;每小题
6、1分,合计15分。d)简答题:5个题;每小题6分。合计30分。试卷试题数合计45个题;试卷总分数100分。三、 模拟题(一)单选题1 .张量场可视化属于可视化的哪个分支学科()。A.科学可视化B.信息可视化【C.可视分析学D.人机交互学【答案】A2 .以下不属于可视化的作用的是()oA.信息记录B.1传播交流C.数据采集D.数据分析【答案】C3.)、人、机器之间的交互是数据可视化的核心。IA.计算机B.数据rc.1大脑D.图形【答案】B4 .可视化领域最早、最成熟的跨学科研究与应用领域是()oIA.科学可视化B.1信息可视化C.可视化分析D.标量场可视化【答案】A.()的对象是抽象的、非结构化
7、的数据集合(如文本、图表等)。1.A.向量场可视化B.标量场可视化rc.张量场可视化D.信息可视化【答案】D5 .()是关于数据视觉表示形式的科学技术研究。A.数据挖掘B.数据可视化C.人机交互D.计算机图形学【答案】B6 .数据的两大特性是可变性与()oLB.随机性C.不确定性D.唯一性【答案】C7 .数据可视化的目的是准确、()、简捷的传递信息和知识。A.直观B.迅速1.C.便捷D.高效【答案】D8 .在数据激增的时代,想从海量数据集中直观的挖掘有价值的信息,利用什么技术是最佳的选择()。A.数据可视化技术B.数据挖掘技术1.C.深度学习技术D.统计分析技术【答案】A9 .数据处理中,哪一
8、过程是通过映射的方法,将高维的属性空间压缩为低维的属性空间,得到最小的属性集()。IA.数据获取B.数据预处理1.C.数据特征提取D.数据统计分析【答案】C10 .以下不是处理缺失值的方法的是()。A.删除记录B.数据插补C.平滑数据D.不处理【答案】C11 .数据清洗的必要前提是()。A.数据集成B.数据分析C.数据变换D.数据归纳【答案】B12 .什么是将多个数据源合并存放到一个数据存储中的过程()。A.数据集成B.数据可视化C.数据存储D.数据变换【答案】A13 .数据变换不包括以下哪些内容()oA.简单函数变换B.小波变换C.规范化D.归一化【答案】D14 .小波变换是一种新型的()工
9、具。A.数据可视化B.数据分析C.数据处理D.属性构造【答案】B15 .从流程的角度看,数据分析的输入是()oA.图形B.语言C.数据D.数值【答案】C16 .联机分析处理的核心表达是()oA.多维数据模型B.一维数据模型C.数据立方体D.多维数组【答案】A17 .以下哪些方法的内容是指给定一组数据点以及彼此之间的相似度,根据这些将数据分成多个类别()0A.分类B.回归C.偏差检测D.聚类【答案】D18 .知识发现基本流程不包含以下哪个()oA.图处理B.变换C.数据挖掘D.知识存储19 .关联规则中的关联可以分为简单关联、时序关联和()oA.复杂关联B.空间结构关联rc.1因果关联D.逻辑关
10、联【答案】C.下面哪种非编程类可视化工具常用于专业商用数据分析().1.A.ExcelB.EchartsC.OpenDXD.Tableau【答案】D20 .Excel作为数据可视化工具的主要优点是()。IA.扩展能力差B.使用门槛低rc.可视化样式丰富D.免费开源且跨平台【答案】B21 .Gephi能够处理的最大图规模节点数为()。A.10000B.30000C.50000D.60000【答案】C22 .Excel提供的数据获取和数据整理工具是()。A.PowerQueryB.PowerPivotC.PowerViewD.PowerMap【答案】A23 .关于R语言可视化,下面哪种说法不正确(
11、)oA.R语言可以运行于多种平台B.R语言主要使用图形界面操作C.ggplot2和lattice都是R语言的可视化扩展包D.R语言是一种被广泛使用的统计分析软件【答案】B24 .新用户可以通过一共多少种方法来获取Eeharts()。A.3种B.4种C.5种D.16种【答案】B.EChartS中图例组件的代码为()。1.A.series:B.legend:C.title:D.xAxis:【答案】B.下面哪种图形适合用于展示数据随着时间推移的趋势或变化()o1.A.折线图B.柱状图D.饼图【答案】A.散点图的类型type为()。1.A.scatterB.pieC.barD.line【答案】A25
12、.气泡图与散点图的不同之处()o【A.】显示变量之间的相关性【B.数据为点的集合C.位置分布可用来分析数据规律D.增加了气泡大小的变量【答案】D26 .异步加载数据是通过什么工具实现的()oA.CanvasB.VisualMapC.CSSD.jQuery【答案】D27 .关于图例组件,下列说法不正确的是()o【A.】可以通过点击图例组件控制哪些数据不显示B.图例数量过多时,使用滚动图例rc.1图例组件包含了不同数据项的标记、颜色和名字D.单个EChartS实例中不可以存在多个图例组件28 .如果想在坐标系内进行拖动,以及用滚轮(或移动触屏上的两指滑动)进行缩放,需要加上()oA.内置型数据区域
13、缩放组件(dataZoomlnside)B.滑动条型数据区域缩放组件(dataZoomSIider)C.框选型数据区域缩放组件(dataZoomSelect)D.无需添加组件【答案】A29 .myChart.ConvertToPixel(grid,dataltem)这句代码的作用是()。A.遍历data的每项B.1生成数据dataIC.从data到像素坐标的转换D.把像素坐标转换成grid组件中直角坐标系的dataltem值【答案】C30 .绘制日历图时,绘制图表的容器是()。A.HTMLB.CSSC.ScriptD.DOM【答案】D.完成一个数据可视化综合系统首先需要()。1.A.完成需求分
14、析B.1设计主要功能C.进行视图设计【D.】实现整体框架【答案】A31 .可视化的输入是()oA.数据B.代码rc.1视觉形式D.语言【答案】A32 .可视化的输出是()。【A.数据B.1代码C.视觉形式D.语言【答案】C.可视化的目标是()。1.A.阻止数据爆炸B.美观酷炫rc.清洗噪声D.理解数据【答案】D33 .哪句话可以说明可视化的作用()oA.一图胜千言B.掷地有声【C.力透纸背D.画龙点睛【答案】A34 .可视化可以将难以理解的原始数据变换成用户可以理解的模式和特征,并显示出来。).依据可视化流程,在原始数据和可视化中间这一步骤是(1.A.用户感知B.1数据分析C.数据采集D.数据
15、表示与变换【答案】D35 .将数据以一种直观、容易理解和操作的方式呈现给用户,需要将数据转换为可视表示并呈现给用户。是数据可视化基本流程中的()oIA.可视化映射B.1数据的可视化呈现C.用户感知D.以上答案均不正确【答案】B36 .可视化和其他数据分析处理方法最大的不同是用户起到了关键作用,可视化映射后的结果只有通过()才能转换成知识和灵感。IA.可视化映射B.1数据处理与变换C.用户感知D.以上答案均不正确【答案】C37 .TanIaraMUnZner提出的可视化设计嵌套模型具有()层。一B.二1.G.三D.四【答案】D38 .需要概括出目标用户的任务需求、目标和要解决的问题是可视化设计模
16、型的(层。【A.】问题刻画层B.1抽象层C.编码层D.具体算法和交互的实现【答案】A39 .将特定领域的专有名词转换为更通用的信息可视化描述,是领域需求到可视化需求的转换是可视化设计模型的()层。A.问题刻画层B.1抽象层C.编码层D.具体算法和交互的实现【答案】B40 .可视化研究的核心内容是TamaraMUnZner提出的可视化设计嵌套模型的()层。A.问题刻画层B.1抽象层C.编码层D.具体算法和交互的实现【答案】C.描述如何解决问题是TanIaraMUnZner提出的可视化设计嵌套模型的()层。1.A.问题刻画层B.抽象层1.G.编码层D.具体算法和交互的实现【答案】DET41 .下图
17、所示的图片体现了格式塔理论的()原则?A.贴近原则B.相似原则0.连续原则I).)闭合原则【答案】C50 .下图所示的图片体现了格式塔理论的()原则?ABCIZB14A.共势原则B.好图原则C.对称性原则D.J经验原则【答案】D51 .可视化设计过程突出重点的方法不包括()。A.高亮显示重点内容1.B.注解可视化C.增强图表的可读性(D.美学因素【答案】D52.下图这个可视化图表没有运用到()视觉通道。B.1位置C.颜色D.尺寸【答案】A53 .下图主要运用了()基本可视化图表元素?A.)折线图B.直方图C饼图D.散点图【答案】B54 .下列哪个图表属于数据关系型图表?()oA.柱形图B.雷达
18、图C.箱型图D.南丁格尔玫瑰图【答案】B55.和弦图属于通常用来展现数据的那个方面?()。【A.数据分布B.地理空间rc.1数据关系D.时间序列【答案】C56 .统计直方图又称?()o【A.1柱形图B.1条形图C.质量分布图D.星形图【答案】C57 .局部整体型可视化方法能够展示局部组成成分在整体中的什么信息?()IA.数值B.占比rc.地理信息D.时间序列【答案】B58 .用来显示时间序列变化趋势的标准方式是()oA.折线图B.堆积面积图【C.像素图D.甘特图【答案】A59 .下列哪种图表不属于时间序列型可视化方法().A.雷达图B.面积图rc.甘特图D.日历图【答案】D60 .数据关系型可
19、视化方法主要有几种类型()。A.2B.3C.4D.5【答案】A61 .数据相关型可视化方法主要展示两个或多个变量之间的关系,当变量多于3个时,可以采用高维数据可视化方法,如().A.散点图B.树形图C.矩阵散点图D.像素图【答案】C62 .数据流向型可视化方法主要用于展示两种或两种以上的状态、情境之间的流动量或流动强度,包括网络图、和弦图、桑基图、蜂巢图等。其中()可以用于展示不同类型对象之间的关系强度和内部关联关系。A.和弦图B.网络图rc.蜂巢图D.桑基图【答案】B63 .如图所示的可视化图表的名称是()。【A.】散点图(B.柱形图C.哑铃图(D.克利夫兰点图【答案】D64.如下图所示的可
20、视化图表名称是()o.雷达图B.南丁格尔玫瑰图(C.J饼图(D.径向柱状图【答案】B65.Bzs-U11Bb,!XlMnvn,上图所示是典型轨道站点日均客流量比重分布的南丁格尔玫瑰图,是基于2015年8月13日8月19日的进站刷卡数据,结合南丁格尔玫瑰图,描绘北京市8个典型的轨道交通站点的日均客运量占总体客运量的比重分布。图中,花瓣颜色表示站点类别。花瓣长度表示客运量比重大小,花瓣越长,客运量所占总体比重越大。由图所知一下信息错误的是()。A.西二旗站、西直门站和国贸站的日均客运量位居前三B.双井的日均客运量位于最后一名C.西单日均客运量比东直门多D.大望路日均客运量比北京南站少【答案】D66
21、 .雷达图主要应用于多个指标的数据()分析?【A.】比较B.综合C.质量D.分布【答案】A67 .词云图是通过使每个字的大小与()成正比。A.数量B.字号C.出现的频率D.位置【答案】C68 .圆圈状气泡的大小是映射到()。【A.】半径B.直径C.周长D.面积【答案】D69 .下图为2014年世界六大洲的碳排放量可视化展示,由下图可知,2014年碳排放量最多的国家是()。A.欧洲B.亚洲C.非洲D.美洲【答案】B70 .箱型图首次出现在美国著名数学家约翰图基(JohnTukey)的著作中。它能方便地显示数字数据的()0A.最大值B.最小值C.四分位数D.中位数【答案】C71 .人口金字塔图最适
22、合用来检测()的变化或差异。A.人口模式B.人口数量【C.】人口分布D.人口增长【答案】A72 .矩形树状图把具有层次关系的数据可视化为一组嵌套的矩形,所有矩形的面积之和代表了整体的大小,各个小矩形的面积表示每个子数据的占比大小。所以矩形面积越大,表示子数据在整体中的占比()oIA.没关系B.越大rc.越小D.一样大【答案】B73 .与折线图一样,面积图常用来显示趋势,而不能表示具体()oA.数值变化B.数值C.数值发展D.数值关系【答案】B.数据模型包括哪些内容?1.A.】数据的定义和类型,以及不同类型数据的操作功能B.目标事物的状态和行为进行抽象的语义描述C1数据对象和其属性的集合D.属性
23、值可以是表达属性的任意数值或符号【答案】A74 .数据可以被看作是什么的集合?A.符号的集合B.抽象的语义描述C.数据表达的底层描述模型D.变量、值域、特征或特性的集合【答案】A75 .数据库的主要功能是什么?A.存储和管理数据的仓库B.实现复杂数据的关系和规则的分析C.数据的有效呈现D.支持如决策支持系统的创建【答案】A.以下哪个不是数据仓库的特性?1.A.面向主题的B.集成的C.相对稳定的D.反映的是实时数据【答案】D(二)多选题1 .可视分析学涉及到的学科包括(A.计算机图形学B.1数据挖掘C.人机交互D.理论科学【答案】ABC2 .数据分析是统计分析的扩展,指用()等方法分析数据。A.
24、数据统计B.数值计算【C.信息处理D.数据拟合【答案】ABC3 .数据可视化和数据分析与数据挖掘的目标都是从数据中获取()。A.图片B.信息C.知识D.关系【答案】BC.数据可视化的三个主要分支是()。1.A.科学可视化【B.信息可视化C.可视分析学D.标量场可视化【答案】ABC4 .可视分析学被定义为一门以可视交互界面为基础的分析推理学科,它综合了()等技术。1.A.数据处理B.计算机图形学C.数据挖掘D.人机交互【答案】BCD5 .数据预处理包含哪几个过程(),A.数据清洗B.1数据集成C.数据变换D.数据规约【答案】ABCD6 .典型的属性规约方法有哪些()0IA.合并属性B.逐步向前选
25、择C.逐步向后删除D.决策树归纳【答案】ABCD7 .数据分析可以分为哪三类()o【A.】描述性统计分析B.探索性数据分析C.发现性数据分析D.验证性数据分析【答案】ABD8 .下列属于编程类可视化工具的是()。A.EchartsB.D3C.R语言【答案】ABC9 .下面属于非编程类可视化工具的是()oA.ExcelB.TableauC.OpenDXD.Gephi【答案】ABCD10 .下面哪种图表用来表示变量之间的相关性().A.散点图B.雷达图C.气泡图D.仪表盘图【答案】AC11 .下列说法正确的是()。A.数据值可以是单一的数值(一维)或者一个数组(多维)B.Echarts中通过typ
26、e值决定图表类型C.借助ViSUalMaP可以展现更多的数据维度D.当数据实时变化时,Echarts需要异步加载数据【答案】ABCD12 .下面属于EChartS中的交互组件的是()。A.VisualMap组件B.legend组件C.dataZoom组件D.timeline组件【答案】ABCD13 .dataZoom中指定控制坐标轴的参数是()。A.dataZoom.XAxisIndexB.dataZoom.yAxisIndexC.dataZoom.filterModeD.dataZoom.start【答案】AB14 .下面属于EehartS获取方法的有()。A.官网下载安装B.直接SCriP
27、t标签引入C.通过CDN引入D.通过NPM获取安装【答案】ACD15 .设计完善一个可视化分析系统,包括()oA.需求分析B.设计主要功能C.搭建整体框架D.完善视图设计【答案】ABCD16 .数据可视化基本流程中的核心要素包括()oA.数据表示与变换B.数据处理C.数据的可视化呈现D.用户交互【答案】ACD17 .TanlaraMUnZner提出的可视化设计嵌套模型包含()层。B.抽象层rc.编码层D.具体算法和交互的实现【答案】ABCD18 .可视化可以()。A.增强人类的认知能力B.作为大量工作记忆的外界辅助C.协助人类进行思考D.让人们使用感知代替认知【答案】ABCD19 .动态图可视
28、化方法有()。A.箱线图B.视图C.时间轴法D.动画法【答案】CD20 .在设计一个可视化解决方案的过程中,了解数据采集这一步骤中的(的放矢地解决问题。A.数据的采集方法B.1数据的属性C.数据的来源D.数据的处理【答案】ABC21 .颜色的视觉通道包括()。.饱和度B.色相/色调rc.1透明度D.美观度【答案】ABC22 .与传统的饼图不同的是,南丁格尔玫瑰图既可以使用不同扇区的来区分数据的大小,也可以使用不同扇区的()来区分数据的大小。A.面积B.周长【C.半径D.弧长【答案】AC23 .词云图通常用于网站或博客,以描述()也可以用来比较两个不同的文本。A.内容B.关键字C.标签D.简介【
29、答案】BC.箱型图可以用来反映一组或多组连续型定量数据分布的()。1.a.中心位置B.散布范围C.密集程度D.对称情况【答案】AB24 .下列对数据可视化方法表述正确的是()。【A.】数据关系型图表包括展示数据相关性与数据流向两种主要类别的图表B.数据分布型图表主要显示数据集中的数值及其出现的频率或者分布规律C.时间序列型图表强调数据随时间的变化规律或者趋势D.局部整体型图表主要展示数据中的精确位置和地理分布规律【答案】ABC25 .在雷达图中,每个变量都具有自己的轴(从中心开始)。所有的轴都以径向排列,彼此之间的距离相等,所有轴都有相同的刻度。轴与轴之间的网络线通常只做指引用途。每个变量数值
30、会画在其所属轴线之上,数据集内的所有变量将连在一起形成一个多边形。但是,雷达图有一些缺点()。【A.】在一个雷达图中使用多个多边形,会令图表难以阅读,而且相当混乱【B.】过多变量也会导致出现太多的轴线,使图表变得复杂,难以阅读C.仅适用于一个维度各项指标占总体的占比情况D.雷达图未能很有效地比较每个变量的数值【答案】ABD.从语义上看,有序型数据可分为以下两类。第一类是以时间轴排列的时间序列数据,如()。1.A.太阳黑子随时间的变化B.化学质谱C.股票交易数据D.奥运会比赛日程【答案】ACD26 .时变型数据的可视化设计空间涉及三个维度,即().A.时间B.比例尺C.布局D.表达【答案】BCD
31、.数据分析的常规步骤包括哪几个步骤?A.探索性数据分析1.B.模型选定分析C.推断分析D.数据可视化【答案】ABC27 .数据挖掘可以发现哪些类型的知识?A.广义型知识B.特征型知识IC.差异型知识D.预测型知识E.偏离型知识F.1关联型知识【答案】ABCDEF28 .哪些类型的数据在信息可视化中需要特别关注其空间布局?A.时空数据29 层次与网络结构数据C.文本和跨媒体数据D.多变量数据【答案】ABF33 .缺失值插补方法有哪些(),A.均值/中位数/众数插补B.最近临插补C.回归方法D.插值法【答案】ABCD34 .异常值处理方法有哪些()。A.删除含有异常值的记录B.视为缺失值C.平均值
32、修正D.使用固定值【答案】ABC35 .数值规约的无参数方法有哪些()。A.直方图B.聚类【C.抽样D.参数回归【答案】ABCD36 .数据可视化的流程包括()0A.数据分析B.1过滤C.映射D.绘制【答案】ABCD37 .以下哪些原则属于格式塔法则包括的内容()oIA.贴近原则B.相似原则C.聚类原则D.经验原则【答案】ABD38 .数据可视化的代表性方法包括()0【A.】柱状图B.直方图CJ散点图D.折线图【答案】ABCD.视图的交互主要包括()o1.A.LOD控制【B.滚动与缩放C.颜色映射的控制D.数据缩放和裁剪工具【答案】ABCD.哪些方法可以提高可视化的美学性()o1.A.聚焦B.
33、平衡C.简单D.缩放【答案】ABC39 .数据可视化的流程中的核心要素包括()oA.数据表示与转换B.数据增强C.数据的可视化呈现D.用户交互【答案】ACD(三)判断题1 .数据可视化都有一个共同的目的,那就是准确而高效、精简而全面地传递信息和知识。【答案】正确2 .数据是符号的集合,是表达客观事物的未经加工的原始素材。【答案】正确3 .数据可视化和数据分析与数据挖掘的目标都是从数据中获取信息与知识,且手段相同。【答案】错误4 .数据具有可变形与不确定性。【答案】正确5 .人机交互指人与机器之间使用某种语言,以一定的交互方式,为完成确定任务的信息交换过程。【答案】正确6 .科学可视化可粗略的分
34、为三类:标量场可视化、向量场可视化和张量场可视化。【答案】正确7 .信息可视化按数据类型可分为时空数据可视化、层次与网络结构数据可视化、文本和跨媒体数据可视化以及多变量数据可视化。【答案】正确8 .数据预处理过程包括数据清洗、数据集成、数据支持、数据规约。【答案】正确9 .数据转换处理包括基于规则或元数据的转换、基于模型与学习的转换等技术,可通过转换实现数据统一,这一过程有利于提高大数据的一致性和可用性。【答案】正确10 .在数据预处理过程中,需要将所有异常值剔除。【答案】错误11 .基于小波变换的特征提取方法主要有:基于小波变换的多尺度空间能量分布特征提取、基于小波变换的多尺度空间的模极大值
35、特征提取、基于小波包变换的特征提取、基于适应性小波神经网络的特征提取。【答案】正确12 .属性规约的目标是寻找出最小的属性子集并确保新数据子集的概率分布尽可能地接近原来数据集的概率分布。【答案】正确13 .数据清理指的是通过一些操作,清理信用数据中的空缺、噪声、异常数据等。其具体操作包括空缺值处理,噪声、异常数据的处理等。【答案】正确14 .数据可视化的设计简化为四个级联的层次,分别为问题刻画层、抽象层、编码层、创建正确完成系统设计的算法的层次【答案】正确15 .格式塔心理学认为,整体等于部分之和,意识等于感觉元素的集合,行为等于反射弧的循环。【答案】错误16 .设计者在选择数据到可视化元素的
36、映射时应该优先考虑数据的数量和复杂度。【答案】错误17 .在数据到可视化的映射中,将温度或密度映射为颜色是直观易懂的【答案】正确18 .数据可视化的基础是数据存储和备份。【答案】错误19 .对于动态数据的可视化,只需要研究新的软件算法即可。【答案】错误20 .编程类可视化方法包含ECharts.js、D3.js、及GePhi等()。【答案】错误21 .非编程类可视化方法包含EXCe1、TableUsOPenDX、GePhi及R语言等()。【答案】错误22 .大数据环境下可视化相关工具包含matplotlib、pandas.Seaborrl等(【答案】正确23 .PythOn语言具有丰富的可视化
37、库,一些R中的第三方绘图包也可以和PythOn连接,比如说ggplot。()o【答案】正确24 .利用EChartS进行数据可视化时,可以通过dataZoom组件对数轴(axis)进行数据窗口缩放!数据窗口平移J操作()o【答案】正确25 .EChartS中常用的基本可视化方法包含柱状图、折线图、饼图、散点图、气泡图及仪表盘等()o【答案】正确26 .图例组件legend、标题组件title、视觉映射组件visualMap.数据区域缩放组件dataZoom时间线组件timeline等均为EChartS中的非交互组件()。【答案】正确27 .根据不同的侧重点,数据可视化方法的基本类别介绍五类图表
38、类型,数据关系、数据分布、局部整体、时间序列、地理空间()0【答案】正确28 .数据流向型图表只用于展示三个以上的状态、情境之间的流动量或流动强度,包括网络图、和弦图、桑基图、蜂巢图等。其中,网络图可以展示出不同类型对象之间的关系强度和内部关联关系()0【答案】错误29 .数据分布型图表主要显示数据集中的数值及其出现的频率或者分布规律,包括统计直方图、核密度曲线图、箱型图、小提琴图、韦恩图、树状图等()0【答案】错误30 .局部整体图表能够显示出局部组成成分与整体的占比信息,主要包括饼图、圆环图、旭日图、华夫饼图、矩形树状图等()o【答案】正确31 .时间序列型图表强调数据随时间的变化规律或者
39、趋势,X轴一般为时序数据,丫轴为数值型数据,包括折线图、面积图、雷达图、日历图、柱形图等()o【答案】正确32 .在数据可视化过程中,可以选用克利夫兰点图、南丁格尔玫瑰图、径向柱形图、雷达图等图表类型表征数据的比较与对照()。【答案】正确33 .散点图是一种多变量图表,是气泡图的变体,也可以认为是气泡图和百分比区域图的组合()o【答案】错误34 .用二维统计直方图、箱型图、金字塔图进行数据可视化,可以展现数据的整体面貌()o【答案】正确35 .在面向公交的可视化交叉检索系统中,在进行交通出行关键特征提取的基础上,设计了可视化时空检索模块、乘客出行关联分析模块以及乘客出行轨迹可视化模块3个可视化
40、模块。【答案】正确36 .在轨道交通异常客流可视化分析系统中设计了三种可视化视图,分别为:异常客流检测、异常客流验证以及异常扩散可视化。【答案】正确(四)简答题1 .简述数据可视化的意义。【答案】可视化将不可见或难以直接显示的数据转化为可感知的图形、符号、颜色、纹理等,以增强数据的识别效率,传递有效信息。使复杂的、看似无法解释的相关数据建立联系,从其中发现规则和特征,获取更有价值的信息2 .请简单概括数据可视化与其他学科领域的关系。【答案】数据可视化与信息图形、科学可视化、统计图形等密切相关,并且是数据科学中的一个重要环节。3 .数据预处理的流程是什么。【答案】数据清洗一数据集成一数据变换一数据规约(并针对每部分做一两句简单介绍)。4 .简述数据可视化基本流程中的核心要素。【答案】数据可视化基本流程中的核心要素包括三个方面:数据表示与变换、数据的可视化呈现、用户交互。数据表示与变换:数据可视化的基础是数据表示和变换。为了允许有效的可视化、分析和记录,输入数据必须从原始状态变换到一种便于计算机处理的结构化数据表示形式。数据的可视化呈现:将数据以一种直观、容易理解和操作的方式呈现给用户,需要将数据转换为可视表示并呈现给用户。用户交互:交互是通过可视的手段辅助分析决策的直接推动力5 .格式塔理论包括哪些原则?试分别概述这些原则。【