《大数据环境下医保数据监测和预警平台关键技术研究.docx》由会员分享,可在线阅读,更多相关《大数据环境下医保数据监测和预警平台关键技术研究.docx(23页珍藏版)》请在三一办公上搜索。
1、科技专项: 科技惠民 计划类别: 科技支撑计划(社会发展) 指南代码: 3140(其他社会事业) 常州市科技计划项目申报书( 科技支撑计划-社会发展 )项目名称: 大数据环境下医保数据监测和预警平台关键技术研究 承担单位: 河海大学常州校区 所在地区: 常州市新北区 单位地址: 江苏省常州市晋陵北路200号 邮编: 213022 项目负责人: 徐绪堪 电话: 13861133668 主管部门: 常州市科技局 申报日期:2013年4月23日常州市科学技术局二一三年 一、立项依据1、本项目国内外科技创新发展概况和最新发展趋势随着常州市社会保障信息系统的广泛应用,特别是医保数据爆炸式增长,积累了海量
2、的历史数据,数据量更是有1.5T之多。这些数据有对医保行业最关键的资金数据,还有尚未被利用的病人信息、医院信息、治疗项目和药方信息等,对这些高关注度民生数据的应用大多停留在录入、查询、修改和简单的统计等数据展现功能。而目前对恶意配药等骗保行为的监管还主要靠人工,面对日益膨胀的数据,仅靠人工检测已明显不能满足需求。所以目前已有的医保系统无法对医保资金进行有效监管,也无法获取病人治疗等规律或变化趋势,由于医保资金涉及范围广、人数多、业务复杂等特点,虽有配药、治疗、费用使用明细等信息,但这些信息没有得到充分利用和发挥效益,难以为人社局制定政策、资金预算和监管提供决策支持。1.1医保数据高关注度和高敏
3、感度医保数据主要涉及社会医疗保险基金征缴和使用,而医疗保险基金是为实施社会医疗保险制度而建立起的专项基金,是给予参保人员基本医疗保障的经济基础。它主要由参保个人及单位所缴纳的医疗保险费组成,并交专门的经办机构统一组织与管理,用于补偿参保人员因疾病所需要的医疗费用医疗保险基金是货币形态的后备资金,是职工的“保命钱”。常州医保系统依据的医保政策及各种待遇极其复杂,主要包括职工医疗保险、居民医疗保险、低保二次补助、大病救助等,。医保数据直接关系到常州广大群众“治病救命”的切身利益,同时也关系到常州国计民生和社会稳定,对平稳安全运行保障要求极高。因此研究医保数据监测和预警显得非常必要。医保数据监测和预
4、警是一项以防范和控制医保基金运营风险为目标的复杂且长远的课题,其涉及参保人员,各级医疗机构,医生体系,定点药店等多方面,人力资源和社会保障信息中心拥有所有参保人账户信息,医疗机构信息,药店和药品信息等等,同时还维护了所有参保人就诊、购药等海量实时数据信息。医保数据监测和预警的关键问题在于如何从海量数据中获得有价值的信息,从而指导医疗保险政策决策,提高医疗效果和管理效率。目前国内医疗保险信息化已经逐渐完善,数据库和数据仓库技术对医疗保险实时交易数据和历史数据的存储起到了重要作用,在医疗保险信息化过程中操作型数据库记录了大量详细的医保相关的交易信息,并通过每日更新至数据仓库,数据仓库保存海量的历史
5、数据,并维护数据的准确性,通过对数据仓库的统计分析等操作可以生成业务报表,然而随着业务需求的不断扩大,对运营决策支持需求日益强烈背景下,简单的报表己经不能满足需要,医疗保险机构的决策者和医保基金运营监管人员希望能够从海量数据中获取更多的知识,以辅助决策和监管,维护基金的稳定运营。1.2最新大数据发展趋势大数据能够成为可用的资源得益于大数据处理技术的出现。计算机历史前五十年主要是利用人们专门收集的数据,这些资料被视为资源,而现在计算机开始关注工作流程中顺带积累的超大规模数据,无处不在的信息设施不停地记录了人们行为的信息痕迹,利用大数据技术能够分析这些信息痕迹,从中提取重要信息以减少对环境认识的不
6、确定性,提高工作与生产效率。大数据已成为新时期人类可开发利用的重要资源,以美国为代表的发达国家已经开始把大数据的利用与大数据技术的开发视为国家一项战略性任务。目前,我们已进入大数据时代,科学研究的主导方式已经从逻辑驱动、实验驱动转向了数据驱动的研究范式。数据就像货币、黄金以及矿藏一样,已经成为一种新的资产类别,我们认为,大数据必将在我国国民经济中成为一个重要产业。美通社最新发布的大数据市场:2012至2018年全球形势、发展趋势、产业分析、规模、份额和预测报告指出,2012年全球大数据市场产值为63亿美元,预计2018年该产值将达483亿。2012年,美国政府拨款2亿美元启动“大数据研究和发展
7、倡议”计划。IBM、微软、谷歌等国外IT巨头早已嗅到了“大数据时代”的商机,这些国际巨头借助自己拥有领先技术和丰富资源,以及稳定的大客户群,实力雄厚,率先涉足。我国互联网数据中心(IDC)对中国大数据技术和服务市场2012-2016年的预测与分析指出:该市场规模将会从2011年的7760万美元增长到2016年的6.17亿美元,未来5年的复合增长率达51.4%,市场规模增长近7倍。在国内,大数据正在引起越来越多的企业关注。不但阿里巴巴、腾讯等把大数据当成近期的重点项目。作为国内互联网产业的发源地和创新高地,中关村也在抢抓大数据发展机遇,着手布局大数据产业。工信部发布的物联网“十二五”规划上,把信
8、息处理技术作为四项关键技术创新工程之一被提出来,其中包括了海量数据存储、数据挖掘、图像视频智能分析,这都是大数据的重要组成部分。而另外三项信息感知技术、信息传输技术、信息安全技术,都与“大数据”密切相关。适逢世界走向数据化,迈入大数据时代的时刻,我们迎来了新的机遇,在这个新一轮产业发展中,医保作为国家、省以及常州市重点民生工程领域,我们应该如何应对?如何开发利用大数据抢占竞争制高点? 如何使未来大数据产业在常州医保监控、管理和预警等方面快速、健康和领先发展?大数据在医保领域应用是新一代信息技术的集中反映,是一个驱动性很强的服务领域,能有效解决大数据及医保领域的技术问题。1.3本项目国外技术发展
9、概况数据挖掘(DataMining,简称 DM)技术是用于发现潜在数据信息和隐藏模式的技术。该技术最早出现于 20 世纪 80 年代后期,是机器学习、模式识别、数据库、统计学以及管理信息系统等多学科研究成果的交汇,其在 90 年代有了飞速的发展,曾被认为是未来对人类产生重大影响的 10大新兴技术之一。全球研究数据挖挖掘比较著名的大学和研究机构有:麻省理工学院,ACM(ACM Special Interest Group on Knowledge Discovery in Data and DataMining)等。典型数据挖掘系统有:IBM Intelligent Miner、SAS Ente
10、rprise Miner、SPSS Clementine 及 Oracle Data Mining 等。数据挖掘技术起源于上个世纪的八九十年代,在西方发达国家首先得以推广运用。在金融、电信、商业和保险界等拥有大量客户数据的领域得到了成功的应用。目前数据挖掘的产品较多,但主要是国外的产品。例如SAS公司的SAS Enterpriser Miner,SPSS 公司的SPSS系列产品,IBM公司的Intelligent Miner, Microsoft公司的SQL Server 2008等。数据挖掘在国内外医疗保险行业的应用案例同样也很丰富。国外的商业保险公司中常使用定向营销为不同的客户制定相应的营
11、销策略,还有客户忠诚度分析,客户流失分析,保险产品的交叉销售等等使用的数据挖掘技术也多样化。IBM研究中心的Marisa等人基于澳大利亚医疗保险机构采集的数据,将关联规则和神经分割技术应用于医疗保险信息系统中,从GB级的数据中获取未知模式。MohitKumar等使用数据挖掘和机器学习技术预测和预防保险公司在处理医疗保险申诉过程中的支付错误,用以降低日益增长的医疗保险开销。还有许多数据挖掘方法研究集中在医疗保险行业的异常和欺诈检测。1.4本项目国内技术发展概况我国社会医疗保险起步较晚,数据挖掘技术在保险欺诈检测中的应用较少,同时与国外的医疗保险面临的欺诈问题也存在诸多差异根据研究,当前我国医疗保
12、险的欺诈可能涉及的主体有参保人,定点医院,定点药店,医保经办机构等多方面,存在的欺诈方式多样:如在征缴保费时参保人出现少报或漏报,在支付保费时的超支或套现行为,此外还有保险基金管理机构的资金挪用等。目前,国内对医保基金的风险相关研究主要集中于由于道德风险带来的基金风险及控制医疗费用增长的具体方法上,采用的手段较为简单,往往是人工控制,辅助以简单规则的数据筛选。缺乏系统、全面的医保基金风险控制框架,缺乏强有力的数据分析和系统的支持。上海市医疗保险信息中心秦德霖基于 SOA 和动态数据仓库技术,利用数据挖掘和分析技术,针对基金运行管理的主要环节和基金风险的主要因素,建立对医保基金风险防控基础技术平
13、台。该平台实现实时数据抽取、海量数据的整合、异构平台的集成。上海医保基金风险防控平台的研究,为控制医保基金的风险、保障基本医疗、促进医疗保险可持续发展提供强有力的支撑。在医保管理过程中,存在一种特殊的就医现象,称之为就医聚集行为。就医聚集行为通常表现为多张医保卡过于频繁地同时同地消费。就医聚集行为可能是由于某些特殊病症人群如某些慢性病人群造成,也有可能存在欺诈行为。找出这些具有就医聚集行为的人群,一方面能够对特殊疾病人群提供针对性的管理和服务,另一方面能有效提高对违规人群的监督力度。复旦大学何俊华基于 CBM 算法,开发出 B/S 结构的一致行为挖掘平台,该平台能够有效地对一致行为进行监控。并
14、将一致行为与参保人费用记录的信息,药品使用情况,医院医生信息等相关联。通过一致行为挖掘平台,在医保管理中能迅速锁定慢性病人群,了解这些特殊人群的医疗费用负担等情况。挖掘平台为医保管理决策提供参考,便于为不同参保人群提供针对性的管理和服务。此外,该平台能有效检测出可疑违规人群,这类可疑违规人群可能同时使用了多张医保卡进行就医,针对这些可疑违规人员,需要对其进行严格监管。石萌利用数据挖掘的关联分析方法,对社会医疗保险基金收支情况进行了研究,深入分析了参保人员、参保单位、医疗单位等各因素对社会医疗保险基金平稳运行的影响,为社会保障部门适时调整基金收缴政策、确保医疗保险制度的顺利实施提供有力的技术支持
15、。国防科学技术大学朱攀利用人工神经网络模型对医保定点医疗机构的信用等级进行学习,并且根据学习过程中出现的问题,对人工神经网络做了改进,克服了医保定点医疗机构信用等级评价网络原有的不足。并以医保信息系统形成的大量数据为基础,利用LOF算法对大量数据进行挖掘,找出了医保定点医疗机构的违规行为。翁滔华等通过利用数据挖掘软件SPSS11.0对病毒性肝炎的住院费用情况进行分析,并分别给出了病毒性肝炎费用控制的上下限,发现能能起到控制医院的住院费用的作用。黄晶晶等利用数据挖掘技术制定医保定额指标并进行相关数据的分析,结果发现数据挖掘技术能够制定动态的定额指标,加快分析反馈的速度,并做出及时的分析返溯。综上
16、所述,国内对医保人群医疗费用的分析研究还处于起步阶段,方法与手段一般, 研究结果尚不科学全面;国外有不少相关的产品,由于国外医保制度与我国的医保制度差别很大,不能直接采用;另外,这些系统但大都是专有产品并且价格高,难以集成。国内关于医保人群医疗费用分析的研究,大都采用订立措施制度和传统半手工方式进行。不少单位制定相关规定和制度进行管理,这些规定和制度大都是针对医保政策和现有的医院管理条文,结合医保进行修改的结果;或者,各医院针对控制定额费用情况,进行大量的数据采集及统计,制作医保分析报表并利用该报表对当月医保费用进行分析,由于均采用手工与信息系统的结合方式,对于超定额费用考核方面明显滞后,也难
17、以对医保各方面进行灵活的详细分析,进而无法及时分析产生各种异常情况的根本原因,亦不利于监控实时费用,没有解决医保病人医疗费用的不断上涨的根本问题,更谈不上对医保预算和预警。因此,本课题拟采用先进的关系挖掘模型技术,分析常州医保现状,开发医保数据监测和预警模型。2、本项目研究的目的、意义2.1 项目研究的目的项目以常州市人力资源和社会保障信息系统中医保海量数据为研究对象,以提高医保资金使用效率为目的,通过静态的社会保障知识与动态的社会保障决策相结合方式,借助数据挖掘模型和联机分析理论和算法,对医保征收和使用等海量数据进行联机分析和数据挖掘研究,寻求医保资金使用网络、病人诊治规律以及医保资金回溯和
18、跟踪,对医保中心各定点医疗机构的监管、各种疾病的常用治疗方案提供数据支持,以实现对医疗单位和参保人精细化管理。最终为市社会保障部门具体政策的合理制定及市政府的宏观决策提供科学的依据,从而可以精确控制社会保障部门的决策过程,加强社保决策过程的信息化,保证决策过程的科学性、合理性和有效性。2.2 项目研究意义常州市医保数据涉及范围广、人数多、数据庞大、业务复杂,是市民高关注度和敏感的数据,因此对医保数据监测和预警研究具有社会、学术和经济三个层面的价值和意义。(1)社会层面医疗保险是社会保障制度的重要组成部分,涵盖的参保人总多,其中核心就是医保数据,例如常州市参加职工医疗保险、居民医疗保险等的参保人
19、数就超过100万人,使用好数据挖掘对众多的参保人进行有效的管理,掌握参保人的概况,群体特征和变化等信息对于医疗保险机构的管理和决策具有很高的参考价值,不仅是国家、省、市等政府部门制定政策预计影响范围和程度,也是一项民生工程,为医保管理决策部门和医疗机构提供科学可行的建议,对科学合理地利用现有医疗资源,控制医保医疗费用的上涨,尽量减少群众的经济负担,构筑一个和谐的医、保、患关系,促进关系千家万户的民生与幸福的医药卫生体制改革顺利进行和实现,都具有非常重要的社会和现实意义。(2)学术层面本项目涉及统计学、公共管理、计算机技术等多个学科交叉,通过对常州医保海量数据分析,丰富社会经济统计理论,有助于在
20、医保领域探讨不同的数据挖掘算法和实践应用。通过在常州医保监测和预警中的应用,不断优化数据关联规则和挖掘算法,提供较好的数据支撑。(3)经济层面通过对医保数据监测和预警,可以从系统角度对医保过程中治疗、资金合理使用等在线监测,有效避免恶意配药等不合理行为,提高市民治病的治疗效果;同时通过预警预测技术分析医保资金使用情况,有助于提高医保资金预算精确度和资金使用效率,最终为常州市医保资金预算和高效使用提供数据支撑,间接地为政府和市民节约医保费用。3、本项目研究现有起点科技水平及已存在的知识产权情况河海大学常州校区与常州市人力资源和社会保障信息中心双方不断探讨、沟通,明确系统总体目标和思路,并开展了前
21、期调研,掌握目前常州市医保数据现状和亟待解决的监测和预警问题。通过研究和积累,课题组已获得获软件著作权8件,出版基于模糊信息的多属性决策方法研究及应用、生态视角下企业管理与信息系统匹配研究两本专著,相关学术论文12篇。4、本项目研究国内外竞争情况及产业化前景在商业智能的研究和应用不断发展的同时,我国政府部门对于数据分析工作越来越重视,开始对数据仓库技术有了一定的需求。就社保领域而言,相关的研究虽然不多,但已不断的开始出现,是一种发展必然趋势,是本项目产业化的基础和前提。预计到2014年,我国六十岁以上人口将达到2亿,2026年将达到3亿,成为超老年型国家。与年轻人相比,老年人的患病率和人均医药
22、费用均较高,并且多患有慢性非传染性疾病,疗程长、预后差、费用大。这将进一步加剧社会医疗保险的支出压力,因此有必要对医疗保险基金运行平衡做长期的测算,提前进行预警,本项目具有广阔的应用范围。二、研究内容1、具体研究开发内容和要重点解决的关键技术问题;针对医疗保险业务中的各项数据进行分析计算,利用计算机网络技术和数据仓库与数据挖掘技术对参保单位、门诊费用、住院费用等多年数据进行采集、转换、聚合或重用,提出了一套科学、合理、符合实际需求的多维数学模型,旨在分析不同病因、不同病种随年龄变化的趋势,掌握人们随年龄增长的平均健康状况,从而为医疗保险政策指标的制订提供依据,如下年度基本医疗保险费的测算、医保
23、费用补偿比的合理确定、个人帐户随不同年龄段计提比例的合理确定等,并据此建立医保数据监测和预警模型,首先自动提取医保业务数据,构建数据仓库,进行多维分析测算,并用各种图表形式来反映结果。这为政府各相关部门确定保障金制度及比例,拓宽医疗保障的范围,为医保资金预算和监管提供直接的科学依据。项目具体研究开发内容主要包括监测和预警数据的准备、医保数据抽取与分类、算法选择与改善、医保数据仓库设计、医保数据再组织和分析、监测和预警模型构建以及医保数据展现等。项目总体结构如图1所示。1.1监测和预警数据的准备对医保数据分析目的是提高医保资金使用效率,通过对海量的医保大数据进行分析,寻求医保资金使用网络、病人诊
24、治规律以及医保资金回溯和跟踪,为医保资金预算和监管提供科学决策支持,同时也医保中心各医疗单位的监管、各种疾病的常用治疗方案提供数据支持,以实现对医疗单位和参保人精细化管理。无论是医院、患者还是人社局,对于医保数据都是密切相关的,按照常州市社会医疗保险政策和制度,确定问题的主题,主要包括医保运行主题、医保监督主题以及医保征收主题三大部分,对医保数据的获取都是针对这三类主题展开收集和组织。1.2 医保数据抽取与分类从医保各个业务系统中抽取原始的医保住院、门诊、药店、征缴等数据,是医保数据监测和预警所需数据的源头,结合知识组织相关理论,以数据单位为基础的知识组织,按照数据来源或者用途等标准进行分类,
25、通过系统层次、数据颗粒度、数据成分描述成静态医保数据网络。图1 项目总体结构图1.3 算法选择与改善常州医保数据有其自身的特点,直接影响对关联规则和算法的选择,其特点主要体现在以下几个方面:(1)事务数量巨大,医保发生频率往往较高,随着时间的增长,医保数据也会随之快速增长,医保数据库中包含的大量数据会给数据的预处理和挖掘工作带来很大的困难。(2)医保开户类型可能多值,由于有不同的人,不同的单位,所以开户类型有不同的需求。(3)医保开户日期”不是名词性属性,不便进行关联分析。(4)不同的属性值具有不同的重要性,如开户类型中,不同的类型,保险公司的盈利情况不一样,但是大多数情况下,大的保险单的发生
26、概率要低于其他类型,所以关联分析要体现出重要属性的发生规律。针对以上特点,通过在数据预处理阶段将医保数据根据时间间隔进行划分,例如按照季度或者月份进行划分;对于“开户时间”不是名词性属性,可在预处理阶段先将数值属性做离散化处理。通过引入权值参数解决出现频率较小的易被忽略的问题,在关联规则挖掘阶段通过不同的权值来衡量各种开户类型的不同重要性从而挖掘出大保单的关联规则。综上所述,医保数据的关联分析采用的算法以Apriori算法为基础,在数据处理阶段加以相应改造,在关联规则发现阶段,通过引入权值参数来挖掘医保数据中潜在的规律。 改进后的Apriori算法的基本思想是:首先找出所有的频集,这些项集出现
27、的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递推的方法。 (1)L1 = find_frequent_1-itemsets(D); / 挖掘频繁1-项集,比较容易 (2)for (k=2;Lk-1 ;k+) (3)Ck = apriori_gen(Lk-1 ,min_sup); / 调用apriori_gen方法生
28、成候选频繁k-项集 (4)for each transaction t D / 扫描事务数据库D (5)Ct = subset(Ck,t); (6)for each candidate c Ct (7)c.count+; /统计候选频繁k-项集的计数 (8) (9)Lk =c Ck|c.countmin_sup / 满足最小支持度的k-项集即为频繁k-项集 (10) (11) return L= k Lk; / 合并频繁k-项集(k0)Apriori候选产生函数Apriori-gen的参数Lk-1,即所有大型(k-1)项目集的集合。它返回所有大型k项目集的集合的一个超集(Superset)。首
29、先,在Jion(连接)步骤,我们把Lk-1和Lk-1相连接以获得候选的最终集合的一个超集Ck:(1) insert into Ck(2) select p1,p2,pk-1,qk-1(3) from Lk-1p,Lk-1q(4) where p1 = q1,pk-2 = qk-2,pk-1 qk-1接着,在Prune(修剪)步骤,我们将删除所有的项目集 cCk,如果c的一些k-1子集不在Lk-1中,为了说明这个产生过程为什么能保持完全性,要注意对于Lk中的任何有最小支持度的项目集,任何大小为k-1的子集也必须有最小支持度。因此,如果我们用所有可能的项目扩充Lk-1中的每个项目集,然后删除所有k
30、-1子集不在Lk-1中的项目集,那么我们就能得到Lk中项目集的一个超集。1.4 医保数据仓库设计按照医保运行、监督以及征收主题进行医保数据仓库的设计,由于医保数据分布于定点医疗机构、药店等不同的业务系统中,需要通过抽取工具获取和清洗、数据转换、关联分析、知识点获取以及数据仓库构建等过程,并结合数据颗粒度原理,按照医保监测和预警规范进行数据组织,医保数据仓库设计层次结构图如图2所示,通过分类和聚类算法,结合常州市人力资源和社会保障中心实际,形成医保运行主题数据(职工医保运行、医疗救助、公务员补助、居民医保、离休、荣军分析、工伤保险分析、生育保险分析等)、医保监督主题数据(参保人医疗异常、定点单位
31、医疗异常等)、社会医疗保险参保征缴主题数据(社会医疗保险参保情况、社会医疗保险基金征缴情况)等。图2 医保数据仓库设计层次结构图其中核心部分是数据关联分析,是建立在医保数据抽取和分类基础上,按照粒度聚类和分类原理,形成动态的医保数据网络。1.5 监测和预警模型构建监测和预警模型包括两个方面的内容:其一是建立监测指标体系,它将直接反应医保数据运行现状,同时可以抽取和挖掘形成治疗方案库;其二是建立预警指标体系,它直接影响着监测和预警模型的敏感性和正确率,融入数据挖掘算法进行预警算法模型,并给出科学合理的预警结果。监测和预警模型如图3所示。医保数据监测和预警模型监测指标体系运行指标异常指标征缴指标预
32、测算法动态监测结果预警指标体系警情指标警兆指标警源指标动态预警报告医保预警模型治疗方案库图3 监测和预警模型1.5.1指标选择原则 监测和预警指标的选择要遵循代表性、全面性、可比性、可获得性等几项原则。 (1)代表性是指选择的指标具有同类指标的基本特征,能够反映医保基金收入支出的主要方面,并能够代表同类指标的变化趋势。 (2)全面性是指选择的指标应该要涉及医保基金运行的各方面,既要涉及医疗保险基金内部的因素,也要涉及其外部因素;既要有微观的财务指标,也要有宏观的经济指标。 (3)可比性是指预警指标要能够连续计算,使其具有可比性,从而可以连续观察医疗保险基金收支运作的情况。 (4)可获得性是指选
33、择的预警指标应该是公开的,便于获取并能够直接用于研究的。1.5.2 具体内容通过对现有医保静态数据的分析整理,并综合了相关专家意见,医保基金运行平衡的监测和预警指标包含三个方面,即财务性指标、客户性指标和成长性指标。在医保监测体系中主要通过分析和整理明确医保基金的状态和现状。医保预警体系一般包括以下几个方面:明确警情、寻找警源、分析警兆和预报警度。(1)在预警体系中明确警情是第一步。警情是指影响医疗保险基金正常运行的负面扰动因素不断发展到一定程度,从而表现出来的、能够被外界所观察到的外部形态。通常设定一个医保基金运行平衡指标的安全区间,当实际运行数据超过特定的区间,则表明医保基金运行的危机警情
34、出现。警情严重时会引发整个医疗保险制度性危机,因此,在保障基金稳定运行的过程中,明确警情是进行医疗保险基金危机预警的前提,而警源是警情发生的根源。(2)寻找警源是预警过程的起点和基础。所谓警源,就是指产生医保基金运行机制出现危机的根源,是医疗保险危机警情的策源地。警源主要有以下几种:第一类是内生警源,即是医疗保险制度自身内部的因素。如医疗保险水平指标的高低、基本医疗保险支出占国家财政支出的高低、基本医疗保险范围内的支出状况、城乡不同的医疗保险政策以及缴费率的高低等。第二类是外来警源,即医疗保险的外部因素。如医疗保险法制、行政管理体制的有效性、监控机制的完善程度、国内经济发展状况、合理的计划调控
35、以及其他社会政策的配套。(3)分析警兆是预警过程中的关键环节。在警情在爆发之前必然会有相关的警兆出现,所以分析警兆及其报警的区间,便可以进行相关的预测和预报警情。(4)预警的目标是对预报系统所存在的危机程度,这就是预报警度。根据警兆的变动情况,参照警情的警限或警情等级,分析警兆的报警区间与警情的关系,结合专家的意见和经验,预报实际警情的严重程度。在对医保基金运行的平衡状况进行监测和预报警度时,一般按照以下步骤进行。首先是定量描述,也就是找出能够反映警情指标的数量特征标志。比如,有些警情指标的数量标志是变化率,以百分比作为计量单位,根据历史的经验和一定的理论分析,我们确定其可能变化的最大值和最小
36、值,也就是说确定一个数值的波动区间,观察实际运行数据在波动区间的变化情况。第二步是在描述的基础上进行定量处理,即将警情指标可能波动的最大区间划分为若干个性质不同的二级区间,称为警限。不同的耳机区间代表不同的警限。本系统中,我们对警限采用了三个区间来表示:无警警限(R0),轻警警限(R1)和重警警限(R2),无警警限是警情变化的安全区间,我们的基金应尽量在此区间进行安全运营。对于风险预警来说,不同的二级区间,也就是各类警限是最具有根本意义的。尤其是无警警限的确定是最为困难的。对于医保基金运行平衡的预警系统来说,我们应该根据医保基金历年来的运营情况、国内和国外的比较与理论分析的情况以及专家意见来综
37、合考虑,最终予以确定。确定了各类警限和警区之后,就可以在日常的运行中观测警情指标的实际值及其变动区间,监测其警度和警情的发展。重点解决的关键技术问题(1)医保数据仓库设计,医保主题数据设计要符合常州医保基金管理要求,同时又要符合数据仓库设计和关联规则,方便医保数据组织和使用。(2)监测和预警模型构建,监测模型是反应当前医保基金运行状态,通过分析和监测医保基金当前状态,借助预测算法和模型,预测医保基金发展趋势,形成适合常州市人力资源和社会保障信息中心的医保数据监测和预警模型。2、项目的特色和创新之处;(1)从知识组织的视角设计医保数据仓库,以方便挖掘医保数据中潜在规律为目的,按照知识组织理论对医
38、保数据进行抽取和分类、再组织等方式分析医保基金运行规律和诊疗资料发展趋势。(2)从服务的角度构建监测和预警模型,医保数据分析和预警最终成果可以提供医保相关的数据服务,可以为政府、医疗机构、药店、患者等提供数据服务。3、要达到的主要技术、经济指标及社会、经济效益。(1)主要技术及经济指标构建一套适合常州医保基金管理要求的医保数据监测和预警模型,实现项目预期目标,形成示范应用。(2)经济及社会效益医保数据与市民生活息息相关,是一项基础性的民生工程。推进民生工程建设,有利于提升医保基金管理水平,提高医保基金利用效率,满足群众民生期待。要高度重视医保数据的监测和预警,切实做到覆盖全面、信息融合、运转高
39、效,确保第一时间发现问题、处置问题和解决问题,建立健全科学、合理的医保监测和预警体系,不仅对医保管理工作提高效率大有作用,最终的目的是服务于广大市民群众,具有广泛社会效益。同时通过该项目的实施,形成医保监测和预警管理模型,具有较强的推广价值。三、研究试验方法、技术路线以及工艺流程3.1 研究方法本项目结合数据挖掘、知识组织和医保基金管理研究中多种方法。(1)文献调研法。阅读和参考了国内外相关论文、论著、工具书、医保相关业务系统,用于医保基金知识背景、医保数据监测和预警研究现状、设计、构建和应用模式等研究。(2)统计分析法。通过收集大量医保数据, 利用统计分组方法对数据进行预处理,将数据按照建立
40、的模型进行分类挖掘,分析医保基金运行、监管和征缴现状。(3)聚类分析法。对医保数据的属性值进行相似程度计算,实现对医保数据的自然划分,便于分析隐藏在医保数据中的规律。(4)关联规则法。建立关于医保事物数据集或关系数据集的数据关联规则,挖掘对管理者有用的或者有意义的联系。(5)时间序列预测。对不同时期的医保数据序列进行挖掘,期望对数据的趋势变化进行分析和预测。3.2 技术路线项目借用知识组织理论和软件生命周期开发方法,形成如下项目技术路线图3所示。图3 项目技术路线图四、工作基础和条件1、承担单位概况,拥有知识产权状况河海大学是教育部直属高校,常州校区是其重要组成部分,现有三个学院,6个硕士点,
41、5000多本科生,300多研究生,具有副高以上、博士学位的科研人员200多人,每年承担国家、部、省、市及企事业单位委托项目200多项。校区拥有发明专利、实用新型专利数百项。与本项目相关的研究成果:先后发表10多篇研究论文,出版专著2本、获得软件著作权8项。2、本项目现有的研究工作基础河海大学常州校区与常州市人力资源和社会保障信息中心双方不断探讨、沟通,明确系统总体目标和思路,并开展了前期调研,掌握目前常州市医保数据现状和亟待解决的监测和预警问题。通过研究和积累,课题组已获得获软件著作权6件,(见附件),出版基于模糊信息的多属性决策方法研究及应用、生态视角下企业管理与信息系统匹配研究两本专著,相
42、关学术论文12篇。相关软件著作权一共有6项(1)防洪预警管理系统软件 2011SR062578 (2)高校研究生教务管理系统软件 2009SR017554 (3)工程管理系统软件 2011SR061862 (4)计生智能报表组件软件 2008SR32008 (5)快递货运管理系统软件 2009SR055198(6)食堂进销存管理系统软件 2009R017396 (7)楼盘表管理系统软件 2012SR073731(8)河道地理信息系统软件 2012SR084973主要学术论文(1)徐绪堪.生态视角下企业管理与信息系统匹配研究M.化学工业出版社.2012. (2)徐绪堪.企业信息系统生态环境成熟度
43、研究J.情报杂志.2011,(29)2:207-210.(CSSCI)(3)徐绪堪,卞艺杰,田泽.ERP系统导入模式的博弈分析J.情报科学,2009,27(10):1575-1580.(CSSCI)(4)徐绪堪,李晓东.基于生态理论的信息系统生长模型构建J.情报杂志,2009,28(9):-17-20.(CSSCI)(5)徐绪堪,段振中,郝建.基于模糊层次分析法的信息系统绩效评价模型构建J.情报杂志,2009,28(2):11-13,49.(CSSCI)(6)徐绪堪,汪利利,钱常春.基于MVC的教参信息系统分析与设计J.现代图书情报技术.2005,127:79-71.(7)徐绪堪,汪利利.基于
44、Web的数字参考咨询系统设计与实现J.现代图书情报技术.2005,128:85-88.(8)龚艳冰,梁雪春. 基于组合模型的直觉模糊集多属性决策方法J. 控制与决策,2010,(03):469-472.(9)龚艳冰. 基于支持向量机的金融衍生品风险评价J. 统计与决策,2010,(05):65-67.(10)龚艳冰. 高校青年教师教学能力培养的实践因素分析J. 高等教育研究学报,2010,(02):61-63.(11)龚艳冰,张继国,梁雪春. 基于全排列多边形综合图示法的水质评价J. 中国人口.资源与环境,2011,(09):26-31.(12)龚艳冰. 基于正态云模型和熵权的河西走廊城市化生
45、态风险综合评价J. 干旱区资源与环境,2012,(05):169-174.(13)龚艳冰,张继国. 基于正态云模型和熵权的人口发展现代化程度综合评价J. 中国人口.资源与环境,2012,(01):138-143.(14)张继国,刘新仁. 水文水资源中不确定性的信息熵分析方法综述J. 河海大学学报(自然科学版),2000,(06):32-37.(15)张继国,刘新仁. 降水时空分布不均匀性的信息熵分析()基本概念与数据分析J. 水科学进展,2000,(02):133-137.(16)张继国,刘新仁. 降水时空分布不均匀性的信息熵分析()模型评价与应用J. 水科学进展,2000,(02):138-
46、143.3、项目负责人以往承担国家、省级等各类科技计划项目完成情况主要相关科研项目:(1)面向知识服务的知识组织模型与应用研究(国家自然科技基金项目(71273126),是本项目的研究基础);(2)基于生态理论企业信息系统成长机理及模型研究省教育厅高校哲学社会科学基金(09SJD870001);(3)生态视角下企业信息系统成长过程及演化研究中央高校基本科研业务费专项资金项目(2009B32914)。4、项目实施具备的人才队伍、经费配套投入能力及科技服务管理能力;本课题组技术力量雄厚,系统工程、计算机技术、情报学、统计学等专业技术人才,目前有教授1名、副教授2名,讲师3名及多名在读研究生。校区可确保对项目经费给予配套,校区科技处是校区专门的科研项目管理单位,有丰富的项目管理经验,组织管理工作到位。5、本项目实施可能对环境的影响及预防治理方案。本项目实施对环境没有任何影响。五、项目研究预期成果及效益1.设计常州医保数据仓库,按照不同医保主题进行分类和集成形成常州医保数据仓库。2.构建常州医保数据监测和预警指标体系,便于对医保基金运行状态监控,同时可以对医保资金预算和管理提供预警。3.获得研究成果申请软件著作权2项,发表相关学术论文3篇。六、计划进度安排与考核指标工作进度主要工作内容2013年4月至2013年7月项目前期调研,医保数据现