《《数据资源管理》 习题及答案 第1--5章 数字化转型-- 数据组织.docx》由会员分享,可在线阅读,更多相关《《数据资源管理》 习题及答案 第1--5章 数字化转型-- 数据组织.docx(20页珍藏版)》请在三一办公上搜索。
1、数据资源管理配套习题第一章数字化转型一、单项选择题1.下列关于数字化转型的描述,不正确的是()。A.数字化转型实现以创新驱动的产业富质量化和跨领域的同步化发展。B.数字化转型打造不同层级、不同行业、不同部门之间的数据壁垒。C.数字化转型包含数字政府、数字经济、数字社会。D.数字化转型构建数据的采集、传输、存储、处理和反馈的闭环。(答案:B:数字化转型打通不同层级与行业间的数据壁垒。参考:LLl数字化转型定义)2 .克劳德香农认为,信息是()。A.为满足决策需要而经过处理的数据B.对客观世界中各种事物的运动状态和变化的反映C.用来减少随机不确定性的东西D.人们同外部世界进行交换的内容(答案:C。
2、参考:”1.1.4数字化转型的战略意义”分点3社会数字化转型的战略意义”)3 .华为行业数字化转型方法论白皮书中写道数字化转型需要两个保障条件,即()和()。A.通过商业模式转型激发运营活力;通过战略转型创造转型动能B.通过商业模式转型激发运营活力;通过文化转型创造转型氛围C.通过组织机制转型激发组织活力;通过战略转型创造转型动能D.通过组织机制转型激发组织活力;通过文化转型创造转型氛围(答案:DC参考:”1.2.1数字化转型机理”分点4“文化变革”)4 .数字经济时代,产品设计趋于(),生产模式趋于()。A.版本化、迭代化;模块化、柔性化B.版本化、迭代化;精细化、柔性化C.复杂化、迭代化;
3、模块化、柔性化D.复杂化、迭代化;精细化、柔性化(答案:Ao参考:”1.2.2数字化转型方法与路径”分点4“组织转型”)5 .2021年,()和()出台,数据合规领域的基本法律体系搭建完成。A.中华人民共和国信息安全法;中华人民共和国个人信息保护法B.中华人民共和国信息安全法;中华人民共和国网络安全法C.中华人民共和国数据安全法;中华人民共和国个人信息保护法D.中华人民共和国数据安全法;中华人民共和国网络安全法(答案:Co参考:1.3.1国家战略)二、不定项选择题1.下列关于数字化转型特征的描述正确的有(A.数字化转型是短期规划与总体建设协同进行C.数字化转型的关键举措是数据要素驱动E.数字化
4、转型需要从开始就进行全局转型)OB.数字化转型的关键举措是技术要素驱动D.数字化转型是一个长期战略,需要不断迭代F.数字化转型是业务和技术双轮驱动(答案:CDF:数字化转型是长期规划与局部建设协同进行;数字化转型的关键举措是数据要素驱动;数字化转型是分阶段的,不能开始就进行全局转型。参考:数字化转型特征”分点1-4)2 .大数据是高科技时代的产物,特征是()。A.高速性B.海量性C.高效性D.多样性E.普遍性F.价值性(答案:ABDFo参考:“1.2.1数字化转型机理”分点I“技术驱动”)3 .数字化转型的外部驱使因素主要体现在()方面。A.个性化需求B.共享化消费C.生态化发展D.柔性化生产
5、E.智能化技术F.在线化模式(答案:ACEF。参考:“121数字化转型机理”分点1“技术驱动”)4 .数字技术与产业设计、生产、制造、销售、服务等环节充分融合,从()方面赋能产业发展。A.物理层B.数据层C业务层D.数字层E.前沿技术F.平台层(答案:ADEFo参考:“1.2.2数字化转型方法与路径”分点2“技术转型”)5 .我国发展数据要素市场的基础条件主要包括()。A.数据法律体系B.培育交易市场C产业结构升级D.数据基础设施E.海量数据资源F.数据开放共享(答案:BDEo参考:”1.3.2数据要素”分点2”数据要素市场概念及条件”)三、填空题1.数字化转型机理由、四个方面相辅相成。(答案
6、:技术驱动:需求倒逼;管理创新;文化变革。参考:”L2.1数字化转型机理”第一句)2 .“ABCD5”是指、五种新兴信息技术。(答案:人工智能;区块链:云计算:大数据;5Go参考:“121数字化转型机理”分点1“技术驱动”)3 .数字经济时代,企业的组织结构趋于、o(答案:网络化;扁平化。参考:”1.2.2数字化转型方法与路径”分点4“组织转型”)4 .数据作为新的生产要素,独特的经济属性体现在、0(答案:非物质性:共享性:非均质性:外部性。参考:“132数据要素”分点1“数据要素概念和特征”)5 .数据价值链的基础活动主要分为、四个方面。(答案:数据获取;数据存储;数据分析;数据应用。参考:
7、“134数据资产价值”分点2”数据价值链”)四、判断题1 .企业数字化转型目标包括管理精细化、产品差异化、服务精准化、决策科学化以及客户体验个性化。()(答案:o参考:”1.1.2数字化转型目标”分点2企业数字化转型目标”)2 .大数据包括结构化、半结构化和非结构化数据,其中,非结构化数据越来越成为主要部分。()(答案:o参考:1.2.1数字化转型机理”分点】“技术驱动”)3 .数据要素市场是将尚未完全由市场配置的数据要素转向由市场配置的动态过程,推动商业模式向以生产者数据为中心转变。()(答案:X:前半句对,后半句的“生产者数据”应为“消费者数据”。参考:“1.3.2数据要素”分点2数据要素
8、市场概念及条件”)4 .数据质量评分是从业务应用角度统计数据的覆盖度和使用友好性情况。()(答案:X:数据质量评分是从数据的完整性、准确性、规范性等质量维度统计数据的通过率情况,“从业务应用角度统计数据的覆盖度和使用友好性情况”是指服务质量评分。参考:”134数据资产价值”分点I“数据价值”)5.基于数据中心的数据资产评估方法有贡献比例法和决策导向估值法。()(答案:X:基于数据中心的数据资产评估方法是基于消费的价值评估法和科研数据保护法,“贡献比例法和决策导向估值法”是基于数据使用者的。参考:“1.3.4数据资产价值”分点3“数据定价”)第二章数据与数据资源管理一、单项选择题1.DIKW网络
9、将“数据信息-知识智慧”之间转换所需的要素概括为()三个方面。A.理解、组织和观察B.洞察力、智力、学习C.洞察力、智力、理解D.分析、组织和观察(答案:BC参考:2.1.1数据、信息、知识与智慧框架)2 .认识论层次的信息是指()。A.主体关于事物运动状态及其变化方式的表述B.通过对数据的认知处理而产生的东西C.使决策更容易的数据的集合D.事物关于运动状态及其变化方式的自我表述(答案:A=参考:”2.1.3信息的概念、类型与特征”分点I”信息的概念”)3 .下列关于智慧的描述错误的是()。A.“个人智慧”和“一般智慧”的主要区别在于智慧发生时受用主体。B.根据DlKW框架,智慧构成一个人的规
10、范性判断,且这些判断在社会上被认为是可取的。C.德慧是个体在解决复杂自然科学与技术问题中展现出来的智慧。D.常规智慧是人们处在日常稳定的物理和社会环境下处理问题时展现的智慧。(答案:C;个体在解决复杂自然科学与技术问题中展现出来的智慧是物意。参考:”2.1.5智慧的概念、类型与特征”分点1、2)4.下列关于数据存取技术的说法错误的是()。A.视图不包含任何数据,只包含映射到基表的一个查询语句。B.索引是一种对数据库表中一列或多列的值进行排序的单独、物理的存储结构。C.Hash索引同时支持索引项上的随机查找和区间查找。D.查全概率大的查询总是比查全概率小的查询包含更多结果。(答案:C;Hash索
11、引用于快速执行索引项上的随机查找,B树索引同时支持索引项上的随机查找和区间查找。参考:“2.2.3数据管理技术”分点2“数据存取技术”)5.下列关于区块链技术的说法错误的是()。A.典型的区块链系统中,隐私数据分为身份隐私数据和数据隐私数据两类。B.区块链根据用户身份进行资源访问授权,也就是身份认证。C.区块链系统的节点利用数据冗余来保证数据的不可篡改性,都必须备份所有存储数据。D.基于区块链的数据管理具有数据可回溯、防篡改、数据可用不可见等优势。(答案:B:区块链根据用户身份进行资源访问授权,分为身份认证和权限访问控制两方面。参考:”2.2.3数据管理技术”分点3”数据应用技术”)二、不定项
12、选择题1 .下列关于数据的概念和特征的描述正确的有()。A.互补性是数据在不相关的两者之间建立联系的基础B.未经组织和处理的数据也能传达具体含义C.数据是由发送方根据信息进行编码,并由接收方解释为信息的储存器D.数据是用于表示客观事物的未经加工的原始素材E.数据具有时效性、穿透性和竞争性F.数据的形式有数字、文字、图像、声音和计算机代码(答案:CDFo参考:”2.1.2数据的概念、类型与特征”分点1、3)2 .信息的特征包括()。A.时间和空间上的传递性B.产生的广延性和无限性C.使用上的排他性D.存在的普遍性和主观性E.组合性和不可变换性F.使用上的时效性(答案:ABFo参考:“2.1.3信
13、息的概念、类型与特征”分点2信息的特征”)3 .下列关于知识的概念和特征的描述正确的有()。A.显性知识产生于认知者当下正在进行的认知活动之中。B.隐性知识具有稳定性、整体性和系统性。C.不同于显性知识,隐性知识可以与其载体分离D.知识是数据和信息的组合,是一种客观现象。E.知识具有复杂性、专有性和增值性。F.从信息链的角度,知识是对信息加工、吸收、提取、评价的结果。(答案:EF:隐性知识产生于认知者当下正在进行的认知活动之中;隐性知识具有非系统性:隐性知识也无法与其载体分离;知识是种主观现象。参考:”2.1.4知识的概念、类型与特征”分点1、3)4 .关于下列数据应用技术的说法正确的是()。
14、A.知识图谱也称为科学知识图谱,是符号主义发展的最新成果。B.人工神经网络是利用多个树分类器进行分类和预测的方法。C.知识图谱展示学科的核心结构、发展历史、前沿领域以及整体知识架构。D.采用分布式和并行计算的方式进行分治策略的实施,有助于规避噪音数据和冗余的干扰。E.知识图谱的图模型与传统数据库的关系模型基本类似。F.目前,关型系数据库被认为是具有主导地位的知识图谱数据库。(答案:ACD;利用多个树分类器进行分类和预测的方法是随机森林算法;知识图谱的图模型与传统数据库的关系模型存在显著差异;目前还没有种数据库系统被公认为是具有主导地位的知识图谱数据库。参考:”2.2.3数据管理技术”分点3”数
15、据应用技术”)5 .关于下列数据资源管理的说法正确的是()。A.数据资源、技术资源、财务资源和文化资源都是无形资源。B.广义的数据资源包括数据本身、数据的管理工具和数据管理人员等。C.数据资源管理需要在数据管理的基础之上挑选对企业运营有价值的数据进行加工和处理。D.数据资源开发的目标是按照社会化、专业化、产业化的原则合理组织数据资源的分配,确保数据资源能得到充分有效的利用。E.管理数据意味着管理数据质量,确保数据符合目的是数据资源管理的主要目标。E数据资源管理的任务不包括制定相关法律法规。(答案:BCE:财务资源是有形资源;确保数据资源能得到充分有效的利用是数据资源利用的目标;数据资源管理的任
16、务包括制定相关法律法规C参考:”231数据资源管理定义”、“232数据资源管理目标”、“233数据资源管理原则”)三、填空题1 .结构化数据细分为、六类。(答案:基础数据;主数据:事务数据;报告数据:观测数据:规则数据。参考:”2.1.2数据的概念、类型与特征”分点2“数据类型”)2 .根据主体的认识能力和观察过程,信息可划分为、和o(答案:实在信息;先验信息:实得信息。参考:”2.1.3信息的概念、类型与特征”分点3信息的分类”)3 .从是否被表达的角度,知识可划分为和o(答案:显性知识:隐性知识。参考:”2.1.4知识的概念、类型与特征”分点2“知识的类型”)4 .数据管理技术经历了、和四
17、个发展阶段。(答案:文件系统;数据库系统:数据仓库系统;大数据管理系统。参考:”2.2.3数据管理技术”首段)5 .数据仓库使用型数据库实现,其最常用的数据组织模型是模型。(答案:关系;星型。参考:”2.2.3数据管理技术”分点1“数据存储技术”)【备用】6 .数据资源管理流程分为、数据组织、数据分析五个步骤。(答案:数据识别与采集;数据描述:数据控制。参考:“234数据资源管理流程”第句)四、判断题1.1948年,信息论奠基人维纳指出信息既不是物质,也不是能量。()(答案::维纳是控制论创始人,信息论奠基人是香农。参考:”2.1.3信息的概念、类型与特征”分点1”信息的概念”)2 .根据信息
18、的性质,信息可划分为语法信息、语义信息和语用信息。()(答案:o参考:“2.1.3信息的概念、类型与特征”分点3”信息的分类”)3 .层次与网状数据库系统是出现最早的数据库系统,被称为第一代数据库系统。()(答案:o参考:”2.2.3数据管理技术”分点1“数据存储技术”)4 .面向业务操作的数据资源管理系统包括数据库、事务处理系统和决策支持系统。()(答案:X;面向业务操作的数据资源管理系统包括数据库、事务处理系统和管理信息系统。参考:”2.3.5数据资源管理方法与技术”分点1“数据资源管理系统”)5 .数据湖存储大规模原始数据,借助元数据目录和数据治理规则和方法提供丰富的功能列表。()(答案
19、:o参考:”236数据资源管理的发展历程”分点5“数据湖”)第三章数据架构与设计一、单项选择题1 .下列关于数据架构的说法错误的是()。A.数据架构的内容包括元数据管理、数据模型和数据分布。B.数据架构将业务需求转化为数据和系统需求,管理数据及其在企业的流动。C.元数据是关于数据的组织、数据域及其关系的信息,数据资产地图是元数据的一种应用。D.数据模型描述的内容有数据结构、数据操作两个部分。(答案:D:数据模型描述的内容有数据结构、数据操作、数据约束三部分。参考:”3.1.1数据架构定义”、“3.1.2数据架构目标”、“3.1.3数据架构内容与原则”分点5)2 .下列关于数据架构原则的说法错误
20、的是()。A.数据质量在可扩展性、数据质量和合规性问题上执行“看门狗”的工作。B.大数据表示PB级的多结构化、多类型数据,必须进行集中式数据管理。C.数据分布定义数据库、应用、平台和网络(组件)之间的需求和主蓝图,以及数据产生的源头和在各流程和IT系统间的流动情况。D.数据管理是减少用户对存储在集群中的数据访问的挫败感的绝对必要条件。(答案:A:数据治理在可扩展性、数据质量和合规性问题上执行“看门狗”的工作。参考:”3.L3数据架构内容与原则”分点5-7)3 .下列关于主题域的说法错误的是()。A.主题对应一个宏观分析领域涉及的对象,数据仓库的数据就是面向主题组织的。B.主题域分组是依据业务管
21、理边界对主题域的分组,通常同个主题域的数据所有者相同。C.主题域管辖一组密切相关的业务对象,由数据仓库的设计人员独立完成。D.不同的业务系统会存储对应流程产生的数据,是天然的主题域。(答案:C:主题域确定必须由最终用户和数据仓库设计人员共同完成。参考:“321主题域”分点1-3)4 .下列关于逻辑数据模型的说法错误的是()。A.关系模型关系模型由关系数据结构、关系操作两部分组成,大大提高了数据独立性。B.层次模型只有根结点没有双亲结点,根结点之外的结点有且只有一个双亲结点。C.网状模型允许有一个以上的结点无双亲结点,且一个结点可以有多于一个的双亲结点。D.面向对象模型中,对象之间的相互操作通过
22、发送消息和执行消息完成。(答案:A:关系模型由关系数据结构、关系操作和完整性约束三部分组成。参考:”331数据模型组件与级别”分点5”数据模型级别”)5 .下列关于UML模型图的说法错误的是()。A.用例代表一个系统或系统的一部分行为,是一组动作序列的集合。B.关系是UML模型中最基本的构成元素,是具有代表性的成分的抽象。C.类是具有相同属性相同操作相同关系相同语义的对象的描述。D.状态机描述事物或交互在生命周期内响应事件所经历的状态序列。(答案:B:事物是UML模型中最基本的构成元素。参考:”3.3.2数据建模方法”分点3“面向对象建模”)二、不定项选择题1.下列有关数据模型组件的说法正确的
23、是()。A.标识符也称为键,是唯一标识实体实例的一个或多个属性的集合。B.实体指客观存在且可以相互区分的事物,是组织收集信息的载体。C.高质量数据的基本特征是清晰、准确,但不需要完整。D.实体实例是特定实体的具体化或者取值。E.不在域中的值也可以是有效值。F.二元关系涉及两个实体,也称递归关系或自我引用关系。(答案:ABD;高质量数据的基本特征是清晰、准确、完整;不在域中的值是无效值;递归关系和自我引用关系是指元关系C参考:”3.3.1数据模型组件与级别”分点1-4)2.下列关于数据建模方法的说法正确的是()。A.类图是从用户角度描述系统功能的模型图,类是系统中的一个功能单元。B.在关系模型中
24、,实体之间的连线表示用于说明业务问题的导航路径。C.关系数据模型提供关系操作的特点和功能要求,但不对DBMS给出具体的语法要求。D.维度表对应现实世界中的一个对象或者概念,是依赖事实表而存在的。E.基于时间的建模提供数据关系以及与此数据有关的商务规则的可视化表示方法。F.常用的维度建模模型有星型模型、雪花模型和星座模型。(答案:CDF:用例图是从用户角度描述系统功能的模型图,用例是系统中的个功能单元:关系模型中的关系连线衣示业务规则:对象角色建模提供数据关系以及与此数据有关的商务规则的可视化表示方法。参考:”3.3.2数据建模方法”分点1-5)3.下列关于数据建模活动的说法正确的是()。A.规
25、划数据建模工作的交付成果包括图表、定义、争议和悬而未决的问题、血缘关系四个方面。B.物理数据模型经修改和调整形成逻辑数据模型,以使最终设计在存储应用程序中运行良好。C.逆规范化或添加冗余总是会降低性能。D.血缘关系确定属性在源系统中的情况,是验证模型和映射关系准确性的有效工具。E.索引用于访问数据库数据过程中优化查询性能,总是唯一的。F.分配给实体的属性必须是。(答案:AD:逻辑数据模型经修改和调整形成物理数据模型:在某些情况下,逆规范化或添加冗余可以极大提高性能;索引可以是唯或非唯一的;分配给实体的属性可以是键属性,也可以是非键属性。参考:”3.3.3数据建模活动”分点1、2)4.下列关于应
26、用程序数据感知的说法正确的是()。A.埋点收集并记录用户行为数据,用作统计页面加载和事件行为的支撑。B.应用程序中的数据一般是非结构化数据。C.全埋点的缺点是上报数据量大、不能设置属性、无法采集业务相关的数据。D.日志数据记录IT系统产生的过程性事件,可以分为IT硬件设备状态日志和应用系统日志两大类。E.可视化埋点无需开发人员每次添加代码,且不受前端界面影响。F.网络爬虫按照一定规则自动抓取万维网信息,是搜索引擎的重要组成。(答案:ACDF:应用程序中的数据般是结构化数据;可视化埋点受界面影响较大。参考:“341应用程序数据感知”分点1-3)5.下列关于模拟信号数据感知的说法正确的是()。AQ
27、CR指的是光学字符识别,通过检测暗、亮的模式将形状翻译成计算机文字。B.语音识别技术将语音中的词汇内容转换为计算机可读的输入,C.条形码是多个黑条和空白按一定规则排列,用以表达一组信息的图形标识符。D.磁卡可以用来记载字母、字符及数字信息。E.RFID的距离小于IOcm,具有很高的安全性,而NFC的距离从几米到几十米都有。F.传感器数据的主要特点是单一、时序化、低噪声、价值密度高。(答案:ABCD:NFC的距离小于IoCm,具有很高的安全性,而RFlD距离从几米到几十米都有;传感错数据的主要特点是多元、时序化、高噪声、价值密度低。参考:”3.4.2模拟信号数据感知”)三、填空题1 .业务对象的
28、必要条件是:;表达来自业务域的人、地点、事物或概念;O(答案:由状态和行为组成:可以重用。参考:“3.2.2业务对象”分点3“业务对象的必要条件”)2 .数据库领域公认的标准结构是三级模式结构,包括、o(答案:外模式;概念模式:内模式。参考:“331数据模型组件与级别”分点5“数据模型级别”)3 .NoSQL泛指非关系型数据库,通常有、列存储数据库、四类。(答案:键值存储数据库;文档型数据库:图形数据库。参考:”331数据模型组件与级别”分点6非关系型建模”)4 .根据数据仓库工具箱一书,维度建模分为、确认维度、四步。(答案:选择业务过程;声明粒度:确认事实。参考:“332数据建模方法”分点2
29、“维度建模”)5 .UML图可以分为、(包括类图和对象图)、(包括状态图和活动图)、(包括顺序图和协作图)、(包括构件图和部署图)五大类。(答案:用例图;静态图:行为图:交互图;实现图。参考:“332数据建模方法”分点3“面向对象建模”)四、判断题1 .事件业务对象表达应用程序中业务处理过程或者工作流程任务,通常依赖于实体.业务对象。()(答案:X:过程业务对象表达应用程序中业务处理过程或者工作流程任务。参考:”3.2.2业务对象”分点2业务对象分类”)2 .逻辑数据实体对业务对象的属性进行分组,是描述业务对象在某方面特征的属性集合。()(答案:o参考:”3.2.3逻辑数据实体”)3 .属性描
30、述业务对象在某方面的性质和特征,是信息架构的最小粒度。()(答案:o参考:“3.2.4属性”)4 .概念模型是面向数据库用户的现实世界的模型,与具体的数据库管理系统密切相关。()(答案:X:概念模型与具体的数据库管理系统无关。参考:”331数据模型组件与级别”分点5“数据模型级别”)5 .实体集中每个实体的属性名和属性的域相同,但部分属性的值不同。()(答案:参考:”3.3.1数据模型组件与级别”分点5“数据模型级别”)第四章数据存储与管理一、单项选择题1.下列关于数据存储的说法错误的是()。A.数据存储的含义包含两个方面:数据驻留的物理媒介、保证数据完整安全存放的方式或行为。B.在线存储又称
31、工作级的存储,可随时读取,满足计算平台对数据访问的速度要求。C.离线海量存储的访问是慢速度、低效率的,典型产品比如磁带。D.离线存储将不经常用到的或访问量不大的数据存放在性能较低的存储设备上。(答案:D:将不经常用到的或访问量不大的数据存放在性能较低的存储设备上是近线存储I=参考:”4.1.1数据存储定义”、“4.1.2数据存储方式”)2 .下列关于数据湖的说法错误的是()。A.数据湖提供从异构数据源提取数据和元数据的功能,并能将它们吸纳汇聚到混合存储系统中去。B.数据湖的主要思想是将半结构化的原始数据进行统一。C.数据湖提供数据转换引擎,支持数据集转换、清洗以及与其他数据集的集成。D.数据湖
32、提供用于检索和查询数据湖数据和元数据的接口。(答案:B:数据湖的主要思想是将不用类型的原始数据进行统一的存储,包括结构化数据、半结构化数据和二进制数据。参考:4.2.1数据湖定义)3 .下列有关数据湖和数据仓库对比的说法错误的是()。A.数据湖不存在结构问题,可以在需要时进行配置和重置,更灵活方便。B.数据仓库是高度结构化的,根据不同的相关业务流程来改变数据结构,更加耗时。C.数据湖定位于提供成品数据,重点解决数据需求侧的问题。D.数据湖的用户往往是高级用户,数据仓库的用户往往是操作用户。(答案:C:数据湖定位于提供原料数据,重点解决数据供给侧的问题。参考:4.2.1数据湖定义)4.下列有关入
33、湖数据的说法错误的是()。A.模拟信号数据通常是对一些物理指标的简单监测,是巨量并且反复的。B.销售数据、库存管理数据、生产流程控制数据都是典型的应用程序数据。C文本数据通常会与一个应用程序相关联,以一致的格式保存记录。D.数据湖接受任何没有监督和治理的数据。(答案:C;应用程序数据以致的格式保存记录,但文本数据不依赖于任何形式。参考:”4.2.1数据湖定义”、“4.2.2入湖数据类型”)5.下列有关数据湖体系结构的说法错误的是()。A.访问区负责确保数据安全、数据质量、数据生命周期、数据访问和元数据管理。B.原始数据区所有类型的数据都是在不进行处理的情况下摄取和存储的。C.用户可以根据自己的
34、需求转换数据,并存储所有中间数据。D.访问区允许使用自助服务数据进行不同的分析。(答案:A;管辖区负责确保数据安全、数据质量、数据生命周期、数据访问和元数据管理。参考:4.2.3数据湖体系结构)二、不定项选择题1.下列关于数据存储发展的说法正确的是()。A.文件存储阶段存在文件查询、插入、删除缓慢等问题。B.传统的关系型数据库按列进行存储,且每列数据都是结构化的。C,NoSQL数据库需要保证关系数据的ACID特性。D.分布式数据库的核心理念是让多台服务器协同工作,完成单台服务器无法处理的任务。E.内存数据库的存储量受内存大小限制,一般比磁盘小很多。F.常见的分布式数据库有Memcache和Re
35、diso(答案:ADE;传统的关系型数据库按行进行存储,且每行数据都是结构化的;NoSQL数据库不保证关系数据的ACID特性;MemCaehe和RediS是常见的内存数据库。参考:4.1.3数据存储的发展)2.下列有关数据湖的说法正确的是()。A.数据湖是面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。B.数据湖可以快速地存储、录入和计算大量来源不同、格式迥异的原始数据。C.数据湖将各数据池中的原始数据快速转化为可以直接提取、分析、使用的标准格式。D.数据湖是一个数据存储的平台,需要定义数据才能存储不同类型的数据。E.数据湖中的原始数据根据类别被提取到不同的数据池中进
36、行标准化,使用概率较小的数据被存储在文档数据池中并重新被标准化。F.大数据时代的数据量呈指数级增长,数据湖具备对T级别数据的计算能力。(答案:BCEF;数据仓库是面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策;数据湖不需要定义数据就能自由存储不同类型的数据。参考:421数据湖定义)3,下列有关数据湖和数据仓库对比的说法正确的是()。A.数据湖允许所有数据被插入,无论其性质和来源如何。B.数据仓库主要包含来自事务或操作系统的非结构化数据。C.数据湖的数据采集使用写入模式,在准备使用数据的时候定义数据。D.数据湖提高了数据模型的定义灵活性,更能满足不同业务的需求。E.数据
37、仓库是按照既定模式在操作系统中找到适当的数据,来完成数据导入的。F.数据湖属于重量级构建,投资规模大,成本更高。(答案:ADE;数据仓库主要包含来自事务或操作系统的结构化数据;数据湖的数据采集使用读取模式:数据仓库属于重量级构建,投资规模大,成本更高。参考:4.2.1数据湖定义)4.下列有关入湖数据的说法正确的是()。A.模拟信号数据通常由机器或一些其他的自动设备产生,即使并没有接入互联网,也可以产生数据。B.公司合约、电子邮件、保险申诉、销售简报都属于应用程序数据。C.文本数据被称作“非结构化数据”,因为文本可以以任何形式出现。D.数据湖中的数据是在没有任何转换的情况下被摄取的,因此能够提供
38、实时的数据。E.数据湖实时摄取数据流并对数据做出反应,因此应用程序可以直接与之互动。F.数据湖中的异构源数据集需要经过提取、转换、加载过程,即ELT。(答案:ACDE:公司合约、电/邮件、保险申诉、销售简报都属于文本数据;数据仓库中的异构源数据集需要经过提取、转换、加载过程,即ELTI:参考:”4.2.1数据湖定义”、“422入湖数据类型”)5.下列有关数据湖数据流转的说法正确的是()。A.数据存储体系的特征是可扩展性、可伸缩性和低可用性、低安全性。B.数据存储涵盖了为分析工具和用户消费而存储数据的各个区域。C.不同应用的数据编码方式相同,因此应用程序数据无需进行调整。D.数据湖的数据分析涵盖
39、描述性分析、诊断性分析、预测性分析和规定性分析领域的各种功能。E.根据数据类型的不同,数据进入数据湖时存储到模拟信号数据池或应用程序数据池中。F.当数据进入归档数据池,就会发生重构,这是为了将数据的元数据和元过程信息直接关联到数据的实体上。(答案:BDF:数据存储体系具有可扩展性、可伸缩性、高可用性和安全性;不同应用的数据编码方式不同,因此应用程序数据需要被调整成致的定义:数据进入数据湖时存储到模拟信号数据池、应用程序数据池或文本数据池中。参考:4.2.4数据湖的数据流转)三、填空题1.数据湖的特点是存储空间海量化、数据类型多样化、O(答案:存储格式兼容化:数据处理高速化:数据价值增值化C参考
40、:4.2.1数据湖定义)2 .进入数据湖的数据可以分为、三类。(答案:模拟信号数据:应用程序数据:文本数据。参考:4.2.1数据湖定义)3 .从功能构架角度,数据湖可以分为原始数据区、访问区、四个基本区域。(答案:加工区:管辖区。参考:4.2.3数据湖体系结构)4 .从数据流转和业务处理维度,数据湖架构分为数据采集模块、模块、数据分析/消费模块、模块、模块、数据治理模块六个模块。(答案:数据湖存储:数据基础设施;数据应用软件。参考:4.2.3数据湖体系结构)5 .根据大数据的特点和应用场景,数据湖体系结构分为、数据存储层、数据转换层和四个层面。(答案:数据摄取层;交互应用层。参考:4.2.3数
41、据湖体系结构)四、判断题1 .Oracle、MySQLSQLServer.NoSQL都是常见的关系型数据库。()(答案::N。SQL是非关系型数据库。参考:”4.1.3数据存储的发展”分点2、3)2 .数据湖的概念在2010年由JamesDixon在博客帖子中首次提及。()(答案:参考:”4.2.1数据湖定义”第一句)3 .数据湖根据用户需要从数据池中对数据快速挖掘、查询、选择和处理,并实时传递给用户。()(答案:=参考:4.2.1数据湖定义)4 .数据湖以几乎原始的状态加载数据,并迅速迭代使用,当需要使用这种数据时,才进行格式和结构处理。()(答案:o参考:4.2.1数据湖定义)5 .数据湖
42、存储数据之前定义架构,进行清理和规范化数据,安全性相对较高。(答案:X:数据仓库存储数据之前定义架构,进行清理和规范化数据,安全性较高。数据湖接受任何没有监督和治理的数据,安全性较低C参考:4.2.1数据湖定义)第五章数据组织一、单项选择题1.下列关于数据组织的说法错误的是()。A.数据组织是按一定的方式和规则对数据进行归并、存储和处理的过程。B.数据的逻辑组织与其物理分布位置有关,往往使用表、树、网络等进行组织。C.数据组织最终形成一个综合的数据集合,以一定的形式存贮于各种硬件介质中。D.数据的物理组织方法由计算机操作系统提供。(答案:B:数据的逻辑组织与其物理分布位置无关。参考:5.1.1
43、数据组织)2.下列关于代码表法的说法错误的是()。A.代码表法用字母、数字等组成短字串来代表特定数据,便于数据处理和通讯等。B.按表现形式,代码表的编码方法分为分为阿拉伯数字表示法、英文字母表示法和字母数字混合法。C一张代码表描述一个属性,不能把不属于同一属性的内容放到一张代码表中。D.代码表在语义层面进行数据的组织,能很好地反映数据之间的关联。(答案:D;代码表不能在语义层面进行数据的组织,也不能很好地反映数据之间的关联。参考:521代码表)3,下列关于分类法的说法错误的是()。A.自然数据产生和服务于人类社会的生产活动和生活领域,比如工业数据、消费数据。B.数据分类应以常规分类为基础,并以
44、各要素最稳定的属性特征为依据。C.结构化数据是可以用二维表结构来逻辑表达实现的数据。D衍生数据由数据被记录、存储后,依据一定的逻辑规则或计算法则进行加工运算而成。(答案:A:产生和服务于人类社会的生产活动和生活领域的是社会数据。参考:5.2.2分类法)4 .下列关于元数据的说法错误的是()。A.元数据的应用目的主要是确认和检索、著录描述以及资源管理。B.元数据架构可分为语义层次,结构层次及句法层次。C.元模型可以分为管理类、技术类、业务类、编码模型四种类型。D.元数据有助于数据的安全和长期保存,有助于不同系统的互操作,加强数据的使用率。(答案:B:元数据架构可分为集中式元数据架构、分布式元数据
45、架构和混合元数据架构,语义层次,结构层次及句法层次是对元数据标准的分类。参考:5.2.4元数据)5 .下列关于知识图谱的说法错误的是()。A.知识图谱是结构化的语义知识库,基本组成单位是实体、概念、关系、属性(值)。B.知识图谱由节点和边组成,节点是实体或抽象的概念,边是实体的属性或实体间的关系。C.模式层由事实组成,模式构建分为自底向上和自顶向下两种方式。D.垂直领域的知识图谱构建缺乏自然语言处理方面的资源,特别是词典的匮乏使得垂直领域知识图谱构建代价很大。(答案:C:数据层由事实组成。参考:5.2.6知识图谱)二、不定项选择题1.关于数据组织的原则,下列说法正确的是()。A.数据组织工作包
46、括数据采集、数据排列、数据存储等环节,其中特别注意数据采集的基础性地位。B.试图只寻找一种数据组织的方法是不正确、不现实和不可能的,应当根据不同的目的选择不同的数据组织方法。C有序性是指一个层次分明的整体,不同维度的指标处于不同层级形成一定的秩序,同层级指标之间、指标层与指标层之间具有清晰的逻辑关系。D.数据组织不仅需要发挥数据资源的作用,其组织形式还要便于扩大数据规模。E.实现数据的有序化是数据组织的重要目标之一,也是数据组织应当遵循的原则。F.数据组织的目标是对数据进行处理和整序,帮助人们在需要时迅速地从大规模数据中获取自己想要的数据。(答案:BDEF:数据组织工作包括数据采集、数据描述、数据排列、数据存储等环节,其中特别注意数据描述的基础性地位;系统性是指个层次分明的整体,不同维度的指标处于不同层级形成定的秩序,同层级指标之间、指标层与指标层之间具有清晰的逻辑关系。参考:5.1.2数据组织的原则)2,下列关于信息组织的说法正确的是()。A.信息组织按给定的参数和序列公式排列,使信息从无序集合转换为有序集合。B.信息的外部特征由关键词、主题词以及其他知识单元表达。C.信息组织利用一定规则、方法和技术对信息的内容及外部特征进行揭示和描述。D.分类法包括标题词法、关键词法、单元词法和叙词法。E.信息组织是信息检索与传播的准备,是信息收集之后的首项工作。F.信息组织