《养老保险联网数据应用分析框架.ppt》由会员分享,可在线阅读,更多相关《养老保险联网数据应用分析框架.ppt(45页珍藏版)》请在三一办公上搜索。
1、养老保险联网数据应用分析框架,劳动保障部社保中心 刘睦平2005.5,联网数据应用,联网数据应用,综合查询,公众服务,业务支持,测算支持,模型数据支持,联网数据分析,联网数据分析,分类,归纳,比较,关联,预测,数据分析,数据挖掘,数据统计,对数据进行有效的组织(排列组合)、整理及特征提取,常用于用户查询,交互性强,深层次的数据分析,找出数据中潜在的规律和趋势,常用于决策分析系统(如精算领域中模型的建立和应用),数据仓库技术,一、联网数据指标结构,一、联网数据指标结构,一、联网数据指标结构,单位信息类,单位自然属性,单位社会属性,单位参保属性,单位基金属性,一、联网数据指标结构,单位自然属性,第
2、3项:单位编号第4项:单位名称,单位社会属性,第5项:单位类型第6项:组织机构代码第7项:经济类型第8项:隶属关系第9项:所属行业,一、联网数据指标结构,单位参保属性,第10项:征缴方式第11项:单位参保缴费状态第12项:参保日期第13项:单位缴费基数,一、联网数据指标结构,单位基金属性,第14项:本月应缴金额合计第15项:本月单位应缴金额第16项:本月个人应缴金额合计第17项:本月实缴金额合计第18项:本月单位实缴金额第19项:本月个人实缴金额合计第20项:本月补缴金额合计第21项:本月单位补缴金额第22项:本月个人补缴金额合计第23项:本月补缴滞纳金第24项:本月补缴利息第25项:累计欠缴
3、金额合计第26项:单位累计欠缴金额第27项:个人累计欠缴金额合计,一、联网数据指标结构,职工信息类,在职职工自然属性,在职职工社会属性,在职职工参保属性,在职职工基金属性,一、联网数据指标结构,在职职工自然属性,第32项:姓名第33项:性别第34项:公民身份号码第35项:民族第36项:出生日期,在职职工社会属性,第30项:所在单位编号第31项:个人编号第37项:户口性质第38项:个人身份第39项:从事特殊工种月数第40项:参加工作日期,一、联网数据指标结构,在职职工参保属性,第41项:建立个人帐户日期第42项:个人缴费状态第43项:中断或终止缴费原因第44项:个人缴费基数第52项:累计缴费月数
4、,在职职工基金属性,第45项:本月个人应缴金额第46项:个人身份参保职工本月个人应缴统筹金额第47项:本月单位缴费应划入个人帐户金额第48项:本月个人实际缴费金额第49项:本月单位缴费实际划入个人帐户金额第50项:个人帐户中个人缴费部分累计本息第51项:个人帐户中单位划入部分累计本息,一、联网数据指标结构,离退休人员信息类,离退休人员自然属性,离退休人员社会属性,离退休人员参保属性,离退休人员基金属性,一、联网数据指标结构,离退休人员自然属性,第57项:姓名第58项:性别第59项:公民身份号码第60项:民族第61项:出生日期,离退休人员社会属性,第55项:原单位编号第62项:个人编号第63项:
5、参加工作日期第64项:离退休日期第65项:退休前个人身份第66项:原单位类型第67项:离退休类别,一、联网数据指标结构,离退休人员参保属性,第68项:社会化管理形式第69项:停发养老金原因第70项:本人长期生活地,离退休人员基金属性,第71项:本月应发养老金合计第72项:本月应发基础养老金第73项:本月应发过渡性养老金第74项:本月应发个人帐户养老金第75项:本月应发补贴金额合计第76项:本月应发基本离退休退职费第77项:本月实发养老金合计第78项:本月实际补发当年待遇调整养老金第79项:本月实发其他养老保险待遇金额合计第80项:本月末个人帐户余额,二、联网数据统计表功能,固定表:16大类40
6、张表,第0类(4):汇总本月缴费、补欠、个人帐户、发放情况第1类(3):分单位类型、隶属关系、经济类型的单位个数第2类(4):分单位类型、隶属关系、经济类型的分性别的参 保人数、缴费人数、中断人数、终止人数以及分中断终 止原因的分性别的参保人数第3类(5):分经济类型的、分退休前个人身份的、分离退休 类别的、分社管形式的、分长期生活地的离退休人数第4类(1):参保职工年龄分组第5类(1):离退休人员年龄分组第6类(1):离退休时间分组第7类(1):分停发养老金原因人数,二、联网数据统计表功能,固定表:16大类40张表,第8类(3):分单位类型、隶属关系、经济类型的应缴实缴第9类(3):分单位类
7、型、隶属关系、经济类型的欠费情况第10类(3):分单位类型、隶属关系、经济类型的补缴情况第11类(1):职工个人平均缴费基数第12类(4):分单位类型的、分退休前个人身份的、分退休类 别的、分性别的人均养老金第13类(1):职工个人帐户平均储存额第14类(4):离退休人员个人帐户平均储存额、终止领取养老 金人员按性别年龄分组、按应发养老金水平分类、按 年龄分组的平均养老金水平第15类(1):按中断缴费原因分类人数和平均年龄情况,二、联网数据统计表功能,临时表:手工操作,当期停止领取养老金人员年龄分组新增退休人员应发养老金水平终止领取养老金人员年龄情况分性别和单位类型参保职工实际缴费年限分组,二
8、、联网数据统计表功能,统计表上报情况:,不全面不及时不连续不对应,严重影响:,数据应用数据分析,三、联网数据应用框架,四、联网数据分析框架,数据分析,数据分布,单位缴费情况,在职职工情况,对比分析,离退休人员情况,四、联网数据分析框架,数据分布,数量,负担水平,性别分析,参保单位,离退休人员,在职职工,四、联网数据分析框架,单位缴费情况,缴费状态,缴费情况,补缴情况,补欠情况,四、联网数据分析框架,在职职工情况,缴费状态,缴费情况,缴费基数,中断缴费情况,个人帐户,四、联网数据分析框架,离退休人员情况,人员类别分析,停发待遇原因,年龄、性别分析,个人帐户,养老金水平,四、联网数据分析框架,停发
9、待遇原因,年龄分组,平均余命,四、联网数据分析框架,离退休人员年龄、性别分析,年龄分组,提前退休人员,平均余命,四、联网数据分析框架,养老金水平,新增人员,全部人员,提前退休人员,四、联网数据分析框架,对比分析,当期收支比较,缴费水平和养老金水平比较,五、联网数据应用演示,1.分析中断缴费人员的流失,分地区、分企业经济类型(国有、集体、外资、其他企业)、分性别、分年龄段参保人员中断缴费人员数量2.分析参保人员中未来3年的预测退休人数(女50男60,不包括提前退休),数据范围一:联网省份部分数据,五、联网数据应用演示,3.当期停止领取养老金人员年龄分组,从中可算出平均余命4.分地区分性别分析离退
10、休人员退休时平均年龄,分正常退休和提前退休5.分地区、分单位类型(企业和机关事业)分性别、养老金水平差异,五、联网数据应用演示,数据范围二:地方运用联网数据开展分析应用的实例,六、联网数据质量评价,数据质量的评价:三个方面(一个指标)一是数据格式正确 二是数据内容准确 三是与相关指标逻辑关系对应,目标,建立质量评价体系,六、联网数据质量评价,联网指标的可用程度:(用于应用和分析)通过指标项数据错误率进行判定 空项缺项 错误率 准确程度 逻辑对应,六、联网数据质量评价,联网指标的可用程度:(用于应用和分析),数据可用率计算方法及公式:第一步:计算数据错误率第二步:根据指标的数据错误率分类,确定指
11、标的类别和可用度第三步:根据分类计算数据的可用率,六、联网数据质量评价,联网指标的可用程度:(用于应用和分析),数据可用率计算方法及公式:第一步:计算数据错误率数据错误率 空项缺项率or准确率or逻辑对应正确率(or指或运算),六、联网数据质量评价,联网指标的可用程度:(用于应用和分析),数据可用率计算方法及公式:第二步:根据指标的数据错误率分类,确定指标的类别和可用度 第一类:指数据错误率在1%以下,可用度=1 第二类:指数据错误率在120%之间,可用度=2 第三类:指数据错误率在2050之间,可用度=3,六、联网数据质量评价,联网指标的可用程度:(用于应用和分析),数据可用率计算方法及公式
12、:第三步:根据分类计算数据的可用率每类指标的数据可用率 该类指标的数据总量全部数据总量 100%数据总量 单位库数据量单位库指标总量 在职库数据量在职库指标总量 离退休库数据量离退休库指标总量,六、联网数据质量评价,联网指标的可用程度:(用于应用和分析)对北京、天津、河北、辽宁、吉林、上海、福建、陕西8省的数据质量进行了评价。1可用程度较高的是上海、北京、天津。2离退休库的指标可用度最高。,六、联网数据质量评价,联网指标的可用程度排名(第一类),六、联网数据质量评价,联网指标的可用程度综合排名(第二类),六、联网数据质量评价,联网指标的可用程度综合排名(第三类),规范整理数据建设优质数据环境 是支持事业发展的当务之急!,谢谢!,