《政务数据标签.docx》由会员分享,可在线阅读,更多相关《政务数据标签.docx(10页珍藏版)》请在三一办公上搜索。
1、1 .政务数据标签本质属性1.1. 数1.1.1. 属性类 数据来源:委办局(住房城乡建设委、司法局、住房公积金管理中心、工商局、市城市管理委、民政局、安监局、水务局、公安局、质监局、城管执法局、文化局、地税局、交通委、通信管理局)、互联网、内部系统、第三方 数据类别:经济、政治、军事、文化、资源、能源、生物、交通、旅游、环境、工业、农业、商业、教育、科技、质量、食品、医疗、就业、人力资源、社会民生、公共安全、信息技术 数据性质:状态类、明细类 开放性:无条件共享、有条件共享、不共享、开放 更新频率:实时、日、天、周、月、年、不定期、一次性 数据类型:数据库、文本、图片、音频、视频 应用领域:
2、反恐维稳、证照、信用、五证合一、政务审批、城市运行 主体:数、企、人、房、车、物1.1. 2.特征类,数据质量:优、良、差数据量:KB级别、MB级别、GB级别、TB级别、PB级别、ZB级别敏感性:敏感、普通,数据日期:最早开始时间、最近更新时间1.2. 企1. 2.1.属性类企业性质:国有企业、三资企业(其中:中外合作企业、中外合资企业、外商独资企业)、集体企业、私营企业行业分类:1 .农、林、牧、渔业2 .采矿业3 .制造业4 .电力、热力、燃气及水的生产和供应业5 .环境和公共设施管理业6 .建筑业7 .交通运输、仓储业和邮政业8 .信息传输、计算机服务和软件业9 .批发和零售业10 .住
3、宿、餐饮业IL金融、保险业12 .房地产业13 .租赁和商务服务业14 .科学研究、技术服务和地质勘查业15 .水利、环境和公共设施管理业16 .居民服务和其他服务业17 .教育18 .卫生、社会保障和社会服务业19 .文化、体育、娱乐业20 .综合(含投资类、主业不明显)21 .其它是否集团企业:是、否1. 2.2.特征类环境影响分类:环保型、污染性企业规模:大型、中型、小型、微型1.3.人1. 3.1.属性类 性别:男、女、未知的性别、未说明的性别(GB/T2261.1-2003) 学历:小学、初中、中专/高中、专科、本科、硕士、博士 户籍:农业户口、非农业户口 职业:(GB/T6565-
4、2015)第一大类:国家机关、党群组织、企业、事业单位负责人;第二大类:专业技术人员;第三大类:办事人员和有关人员;第四大类:商业、服务业人员;第五大类:农、林、牧、渔、水利业生产人员;第六大类:生产、运输设备操作人员及有关人员;第七大类:军人;第八大类:不便分类的其他从业人员。注:上班族、自由职业者、无业游民、其他 婚姻状况:未婚、已婚(初婚、再婚、复婚)、丧偶、离婚、未说明的婚姻状况。1. 3.2.特征类1 年龄段:2 .童年:0岁6岁(1)婴儿期0-3周月;(2)小儿期4周月一2、5岁;(3)幼儿期2、5岁后一6岁;3 .少年:7岁17岁(1)启蒙期7岁一10岁;(2)逆反期11岁一14
5、岁;(3)成长期成岁一17岁;4 .青年:18岁一40岁(1)青春期1828岁;(2)成熟期2940岁;5 .中年:4165岁壮实期壮一48岁;(2)稳健期4955岁;(3)调整期56-65岁;6 .老年:66岁以后初老期初一期岁;(2)中老期7384岁;(3)年老期85岁以后; 收入水平:低、一般、中、高 是否有车:有车、无车 是否有房:有房、无房 是否有孩子:有、无 孩子性别:男、女、未知的性别、未说明的性别(GB/T2261.1-2003)1.4.房1. 4.1.属性类 建设时间:具体年份 用途:商用、家用 产权:商品房、经济适用房、房改房商品房:按照商品房性质购买的房屋经济适用房:按照
6、经济适用住房性质购买的房屋按照回迁房性质购买的房屋部分通过集资建房性质购买的房屋房改房:按照房改政策购买的房屋(包括:成本价购买、标准价购买及标准价优惠产权购买)部分通过集资建房性质购买的房屋 区域:(所在城市的区县,以北京为例)东城、西城、朝阳、海淀、丰台、石景山、通州、昌平、大兴、亦庄、开发区、顺义、房山、门头沟、平谷、怀柔、密云、延庆、燕郊、香河 地铁:1号线、2号线、4号线、5号线、6号线、7号线、8号线、9号线、10号线、13号线、14号线(东段)、14号线(西段)、15号线、16号线、八通线、亦庄线、昌平线、房山线、机场线1. 4.2.特征类面积范围:50平以下、50-70平、70
7、-90平、90T10平、110平-130平、130T50平、150-200平、200平以上户型:一室、二室、三室、四室、五室以上1.5.车1. 5.1.属性类排量:LOL以下、1.0-1.2LL3T.5L、L6L、1.8-2.3L2. 4-3.0L、3.OL以上品牌:奥迪、阿斯顿马丁、阿尔法罗密欧、艾康尼克、ABT、lpina宝马、奔驰、本田、别克、标致、比亚迪、宝骏、奔腾、宝沃、北京、北汽绅宝、北汽幻速、比速汽车、北汽新能源、北汽威旺、北汽制造、北汽道达、保时捷、宾利、巴博斯、长城、长安汽车、长安欧尚、长安轻型车、昌河、成功汽车、长江EV、大众、DS、东南、道奇、东风、东风风行、东风风神、东
8、风启辰、东风风度、东风风光、东风小康、DatsunDacia电咖汽车、丰田、福特、菲亚特、福田、法拉利、福迪、风诺、福汽启腾、FaradayFuture观致、广汽传祺、广汽吉奥、Genesis.GMC、哈弗、海马、华泰、华泰新能源、华颂、红旗、汉腾、哈飞、黄海、海格、华骐、Icona,吉利、江淮、Jeep、捷豹、金杯、江铃、江铃集团轻汽、江铃集团新能源、金龙、金旅、九龙、君马汽车、凯迪拉克、克莱斯勒、凯翼、开瑞、康迪全球鹰电动汽车、卡威、卡升、科尼赛克、KTM雷克萨斯、铃木、雷诺、路虎、林肯、陆风、力帆、猎豹汽车、理念、领克、陆地方舟、雷丁、劳斯莱斯、兰博基尼、路特斯、领志、朗世、莲花汽车、L
9、ucidMotors马自达、MG、MINI、玛莎拉蒂、迈凯伦、明君汽车、摩根、纳智捷、讴歌、欧朗、帕加尼、起亚、奇瑞、前途、奇点汽车、日产、荣威、如虎、Rimac斯柯达、三菱、斯巴鲁、smart双龙、SWM斯威汽车、上汽大通、思铭、首望、世爵、TESLA、腾势汽车、泰克鲁斯腾风、沃尔沃、五菱、五十铃、潍柴、WE丫、蔚来、威兹曼、WMotors、瓦滋汽车、雪佛兰、现代、雪铁龙、西雅特、英菲尼迪、一汽、野马汽车、永源、依维柯、云度、御捷、众泰、中华、中兴汽车、知豆、之诺 车型:微型车、小型车、紧凑型车、中型车、中大型车、豪华车、SUV.跨界车、MPV、跑车 结构:两厢车、三厢车、旅行车、掀背车、软
10、顶敞篷车、硬顶敞篷车 能源:汽油、柴油、油电混合、电动 进气:涡轮增压、机械增压、自然吸气变速箱:自动、手动国别:德国、美国、韩国、中国、日本、法国、英国、意大利1.5. 2.特征类 用途:家用、商用、其他 价格范围:5万以下、5-8万、8T2万、12-18万、18-25万、25-35万、35万以上 特色:只加93号油、ESP、导航、倒车影像、全景天窗、儿童乘坐、7人乘坐、四轮驱动、日行灯、非承载式车身1.6. 物1. 6.1.属性类 管理设备: 感知设备:(传感器) 位置:桥梁、道路、环境,采集频率:毫秒级、秒级、分钟级、小时级、天级、不定期、其他1. 6.2.特征类设备状态:正常运行、未运
11、行、已损坏、未知2.政务数据标签建设方案2.1.标签库ID实体标签类别标签类型类型描述标签名称父ID1数属性类SJLY数据来源委办局-12数属性类SJLY数据来源住房城乡建设委13数属性类SJLY数据来源司法局12. 2.标签形成标签作为大数据的根基,它完美地抽象出一个实体对象的信息全貌,从GLDM模型的整个分层机构来看,数据标签的形成主要在贴源层和整合层。从贴源层形成“数据”的标签,这个主要对于来源数据表而言,从宏观角度轻而易懂对数据状况就行概述,形成数据层面的标签库。通过GLDM模型在原子层对数据进行最细粒度拆分、细化,通过数据校核、整理汇聚到整合层,形成数据较全、准性性较高、维度较细的实体信息数据(人、企、房、车、物),然后通过对实体进行标签运算,形成实体数据的标签库,从而为以后的数据挖掘或者分析奠定基础。