个人征信系统数据库以及数据分析处理.docx

上传人:小飞机 文档编号:3212361 上传时间:2023-03-11 格式:DOCX 页数:4 大小:38.99KB
返回 下载 相关 举报
个人征信系统数据库以及数据分析处理.docx_第1页
第1页 / 共4页
个人征信系统数据库以及数据分析处理.docx_第2页
第2页 / 共4页
个人征信系统数据库以及数据分析处理.docx_第3页
第3页 / 共4页
个人征信系统数据库以及数据分析处理.docx_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《个人征信系统数据库以及数据分析处理.docx》由会员分享,可在线阅读,更多相关《个人征信系统数据库以及数据分析处理.docx(4页珍藏版)》请在三一办公上搜索。

1、个人征信系统数据库以及数据分析处理第 1 页 个人征信系统数据库以及数据分析处理 一、个人征信数据库 个人征信数据库是用于存储个人信用信息的计算机软硬件设备,是信用数据中心的 核心和基础,个人征信数据库必须确保信息及服务安全。 征信数据库建设的原则: (1)信用信息的全面性和广泛性; (2)信用信息的时效性; (3)信用信息的安全性。 |二、个人征信数据分析处理 征信机构收集到的原始数据,只有经过一系列的科学分析之后,才能成为具有参考 价值的征信数据。原始征信数据处理包括核实、分类、剔除不良的数据项、筛选出不真 实数据,并进行深加工,包括误差修正、形成中间变量、配以符号等,可以用于量化分(一)

2、征信数据处理技术 征信数据的处理过程中涉及很多技术,而这些技术的提供又涉及不同的行业,并且 需要由不同的公司来完成。例如数据的存储、管理是由数据库技术来实现的,而数据库 技术并不是征信公司所特有的核心技术?。 征信公司的核心技术之一,是个人数据的配对处理,即把有关某个消费者在各个部 门、各个领域、各地方的分散数据甄别出来,集中到一起并形成一个完整的整体。 征信公司的核心技术之二,是对数量庞大的原始数据进行加工,形成数以千计的中 间变量,或称特征变量,使得它们能够完整地刻画消费者的风险和价值特征。 与征信公司业务相关但不属于征信公司独有的另一核心技术,是建立在信公司数 据库基础上的分析功能,其产

3、生的主要结果就是风险评分。在变量的选择、权重的分 配、模型的调整上,国外有较成熟的经验。在实际操作过程中,国内一些机构开始积 累一些有中国特色的经验,目前需要通过总结、调试、跟踪、分析,进行不断优化的 W工作。 (二)数据查证 第 2 页 数据查证是保证征信产品真实性的关键步骤。一查数据的真实性。对于存疑的数 据,征信机构可以通过比较不同采集渠道的数据,来确认正确的数据。当数据来源唯 一时,可通过二次调査或实地调査,进一步确定数据的真实性。二查数据来源的可信 度。某些被征信人为达到不正当目的,可能向征信机构提供虚假的信息。如果发现这 种情况,征信机构除及时修改数据外,还应记录该被征信人的“不诚

4、信行为”,作为以 后业务的参考依据。三查缺失的数据。如果发现采集信息不完整,征信机构可以依据 其他信息进行合理推断,从而将缺失部分补充完整。四是被征信人自査,即异议处理 程序。当被征信人发现自己的信用信息有误时,可向征信机构提出申请,修正错误的 信息或添加异议声明。特别是批量报送数据时,征信机构无法对数据进行一一查证, 一般常用异议处理方式(三)数据清洗 数据清洗就是把“脏”数据“洗掉”。因为数据仓库中的数据是面向某一主题的数据 的集合,这些数据从多个业务系统中抽取而来而且包含历史数据,这样就避免不了有的 数据是错误数据、有的数据相互之间有冲突,这些错误的或有冲突的数据显然是我们不想要的,称为

5、“脏”数据。我们要按照一定的规则把“脏”数据“洗掉”,这就是数据 清洗。而数据清洗的任务是过滤那些不符合要求的数据,主要分为不完整的数据、错误 的数据、重复的数据三大类。 1.不完整的数据 这一类数据主要是一些应该有的信息缺失,如被征信人的名称、出生日期、家庭住 址信息缺失。对于这一类数据需过滤出来,按缺失的内容分别写入不同文件后提交,要 求在规定的时间内补全,补全后才写入数据仓库。 2.错误的数据 这一类错误产生的原因是业务系统不够健全,在接收输入后没有进行判断直接写 人后台数据库造成的,比如数值数据输成全角数字字符、字符串数据后面有一个回车 操作、日期格式不正确、日期越界等。这一类数据也要

6、分类,对于类似于全角字符、 数据前后有不可见字符的问题,可以通过写SQL语句的方式找出来,然后要求客户在 业务系统修正之后抽取。日期格式不正确的或者是日期越界的这一类错误需要挑出修 正之后再抽取。 第 3 页 3.重复的数据 对于这一类数据,需将重复数据记录的所有字段导出,让客户确认并整理。 数据清洗是一个反复的过程,不可能在几天内完成,只有不断地发现问题,解决问 题。对于是否过滤,是否修正一般要求客户确认,对于过滤掉的数据,写入Excel文件或 者将过滤数据写人数据表。数据清洗需要注意的是不要将有用的数据过滤掉,对于每个 过滤规则认真进行验证,并由客户确认。 三、个人征信系统 个人征信系统主要为消费信贷机构提供个人信用分析产品。由专门的机构给每个人 建立一个“信用档案”,再提供给借贷机构、数据主体本人、金融监 管机构、司法部门以及其他*机构使用。 目前个人征信系统的数据已经不局限于信用记录等传统运营范畴,注意力逐渐转向 提供社会综合数据服务的业务领域。个人征信系统含有广泛而精确的消费者信息,可以 解决顾客信息量不足对企业市场营销的约束,帮助企业以最有效的、最经济的方式接触 到自己的目标客户,因而具有极高的市场价值,个人征信系统应用也扩展到直销和零售 等领域。在美国个人征信机构的利润有1/3是来自直销或数据库营销,个人征信系统已被 广泛运用到企业的营销活动中。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号