doc数据挖掘技术在会计信息系统中的应用研究.doc

上传人:仙人指路1688 文档编号:2395987 上传时间:2023-02-17 格式:DOC 页数:14 大小:36.50KB
返回 下载 相关 举报
doc数据挖掘技术在会计信息系统中的应用研究.doc_第1页
第1页 / 共14页
doc数据挖掘技术在会计信息系统中的应用研究.doc_第2页
第2页 / 共14页
doc数据挖掘技术在会计信息系统中的应用研究.doc_第3页
第3页 / 共14页
doc数据挖掘技术在会计信息系统中的应用研究.doc_第4页
第4页 / 共14页
doc数据挖掘技术在会计信息系统中的应用研究.doc_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《doc数据挖掘技术在会计信息系统中的应用研究.doc》由会员分享,可在线阅读,更多相关《doc数据挖掘技术在会计信息系统中的应用研究.doc(14页珍藏版)》请在三一办公上搜索。

1、数据挖掘技术在会计信息系统中的应用研究2006年2月第9卷第2期中国管理信息化ChinaManagementInformationizationFeb.2006Vo1.9.No.2数据挖掘技术在会计信息系统中的应用研究张志恒.陈旭(重庆工学院会计学院,重庆400050)f摘要1随着数据库和网络技术的迅速发展,目前的会计信息系统可以高效地实现财务数据的录入,修改,统计,查询以及简单的财务分析等功能,但是无法发现数据中存在的潜在关系和规则,无法根据现有的数据预测未来的发展趋势.缺乏挖掘数据背后隐藏的知识的手段.本文提出将数据挖掘技术应用于会计信息系统,增强会计信息系统的财务分析功能.将海量的数据转

2、化为有用的知识,为决策者提供有效的信息.本文简单介绍了数据挖掘的主要功能和常用的挖掘方法.以及数据挖掘在会计信息系统中的主要应用.最后给出了一个数据挖掘在会计信息系统中的应用实例.f关键词1数据挖掘;会计信息系统;财务分析;规则提取;粗糙集理论【中图分类号】F232【文献标识码】A【文章编号】16730194(2006)020036041引言随着以网络为代表的信息技术的发展,信息技术在会计领域中得到了广泛的应用,越来越多的企业的会计信息系统从手丁环境转向IT环境,基于计算机的会计信息系统(简称为会计信息系统)受到越来越广泛的关注.随着计算机处理能力的提高和网络技术的飞速发展,会计信息系统的网络

3、计算模式经历了单机一多机一网络化的发展过程,在功能上也实现了从核算型向管理型飞跃.当前我们对会计信息系统的理解是:会计信息系统是利用信息技术对会计信息进行采集,存储和处理,完成会计核算任务,并能够提供会计管理,分析,决策辅助信息的系统(杨周南.2000).会计信息系统的目标是:为向组织内外部的决策者提供需要的会计信息及对会计信息利用有重要影响的其他非会计信息(张瑞君,2004).从这个意义上说,完善会计信息系统的过程将永无止境,在新的形势下必然会对其提出更高的要求.随着海量信息的涌现,目前会计信息系统的分析功能将更显薄弱.丰富的信息的确可以为企业利益各方做出决策提供方便,但同时也带来很多问题,

4、比如:大量信息难以全部掌握,等于信息丢失;信息过多,导致真伪难辨,容易造成误导.面对大量的信息.如果不采用相应的技术手段.就不能发现隐藏在信息背后的知识,不能分析数据中存在的关系和规则,也不能根据现有的数据预测未来的走势,从而无法给正确的辅助决策的信息.因此,笔者提出了将数据挖掘技术应用于会计信息系统,在现有的财务分析功能的基础上增加数据挖掘功能2数据挖掘技术简介数据挖掘(DataMining)是20世纪90年代兴起的一门信息技术领域的前沿技术,它是在数据和数据库急剧增长的背景下产生的,也是数据库,统计学,机器学习与计算技术等多学科发展融合的结果.数据挖掘是从大量的,不完全的,有【收稿日112

5、005-10-08作者简介】张志恒,男,管理学硕士,讲师.研究方向:会计信息化和审计信息化.36/CHINAMANAGEMENTINFORMATIONIZATION噪声的,模糊的,随机的数据中提取隐含在其中的,人们事先不知道的,但又是潜在有用的信息和知识的过程.2.1数据挖掘的主要功能(1)关联分析两个或两个以上变量的取值之间存在某种规律性.就称为关联.数据关联是数据库中存在的一类重要的,可被发现的知识.关联分析的目的是找出数据库中隐藏的关联关系,一般用支持度和置信度两个参数来度量挖掘出来的关联规则是否符合要求.(2)分类分类就是找出一个类别的概念描述,它代表了这类数据的整体信息,即该类的内涵

6、描述,并用这种描述来构造模型,一般用规则或决策树模式表示.分类是利用训练数据集通过一定的算法求得分类规则.(3)聚类分析聚类分析处理的数据对象的类是未知的.聚类分析就是将对象集合分组.按某种共同特征或趋势将对象组成的多个集合的过程.其基本思想是:在对数据进行分拆的过程中.考虑数据间的距离的同时,更侧重考虑某些数据间具有的类的共同内涵.聚类分析是对一组数据进行分组.这种分组基于如下的原理:最大的组内相似性和最小的组间相似性.(4)预测预测是利用历史数据找出变化规律,通过建立模型,对未来数据的种类,特征及发展趋势进行预测.(5)时序分析时序模式是指通过时间序列搜索出的重复发生概率较高的模式.与回归

7、一样.它也是用已知的数据预测未来的值.但这些数据的区别是变量所处时间的不同(6)偏差分析数据库中的数据常有一些异常记录,从数据库中检测出这些偏差很有意义.在偏差中包括很多有用的知识,如分类中的反常实例,不满足规则的特例,观测结果与模型预测值会计信息化的偏差等.偏差检测技术用于抽取数据中的偏差和异常.有助于过滤较所抽取的无关信息和不合适的数据.偏差检验的基本方法就是寻找观察结果与参照之间的差别.数据挖掘的各项功能不是独立存在的.而是在数据挖掘中互相联系的.一起发挥作用.2.2数据挖掘常用方法数据挖掘是处理海量数据的新兴技术.是许多学科的交叉.综合运用了统计学,概率论,计算机,数学及各数学分支等学

8、科的知识.面对的数据可能是不完全的,有噪声的,随机的,并常常具有复杂的数据结构.一般处理不同的数据可以采用不同的挖掘方法.下面介绍几种最常用的方法.(1)传统统计方法统计分析方法是利用统计学,概率论的原理对关系中各属性进行统计分析.从而找出它们之间的关系和规律.统计分析方法是最基本的数据挖掘技术方法之一.常用的统计分析方法有:判别分析,因子分析,相关分析,多元回归分析,偏最小二乘回归方法等.(2)可视化技术用图表等方式把数据特征直观地表述出来.如直方图等.这其中运用了许多描述统计的方法.可视化技术面对的一个难题是高维数据的可视化.(3)决策树决策树是一种常用于预测模型的算法,它通过将大量数据有

9、目的地分类.从中找到一些有价值的,潜在的信息.它的主要优点是描述简单.分类速度快.特别适合大规模的数据处理.(4)神经网络模拟人的神经元功能.经过输入层,中间层(隐含层),输出层等,对数据进行调整,计算,最后得到结果.主要用于分类,预测和时间序列模型.神经网络由于本身良好的鲁棒性,自组织和自我适应性,并行处理,分布存储和高度容错等特性,非常适合解决数据挖掘的问题,但缺点是它的行为像是黑盒.人们难以理解网络的学习和决策过程,也无法满足分析员的置信度要求.(5)遗传算法遗传算法是一种基于生物自然选择与遗传机制的随机搜索算法.是一种仿生全局优化方法.遗传算法具有的隐含并行性,易于和其他模型结合等性质

10、,因此它在数据挖掘中经常被应用.(6)粗糙集方法粗糙集是一种研究不确定性问题的数学工具.粗糙集作为集合论的扩展.主要用于研究不完全和不完整信息描述的数据挖掘技术.它能够在缺少关于数据先验知识的情况下,以考察数据的分类能力为基础,解决模糊或者不确定数据的分析和处理.该方法模型简单,易于操作,目前,以此为基础构造的数据挖掘工具很多.2.3数据挖掘的步骤(1)确定挖掘对象,明确目标这一初始阶段要求明确问题的要求和目标,确定挖掘对象.将对具体问题的理解转化为数据挖掘问题,并制订一个实现目标的方案.清晰认识问题,认清数据挖掘的目的是数据挖掘成功的重要一步.挖掘的结果具有不可预测性,但要解决的问题应该是明

11、确的,有预见的.(2)数据准备数据准备阶段是对原始数据进行加工,预处理.直到符合挖掘模型要求的数据集合的全部过程.具体包括:a.数据的选取,即根据问题的目标选取适用于挖掘的数据-b.数据的预处理,即分析数据的质量,剔除异常数据,补充缺失数据等;c.数据的转换,即将预处理过的数据转换成适合于具体数据挖掘算法的形式.(3)数据挖掘选择合适的挖掘算法.对经过数据准备阶段处理过的数据进行挖掘.(4)结果输出根据具体程序设计,挖掘结果的形式是多样的.可以是表格,图形,也可以是规则描述等.(5)反复挖掘数据挖掘算法很多.针对同一问题可以采用多种方法进行挖掘,得出的结果也可能存在差异,因此,我们可以重复(2

12、)一(4)步,每次选择不同的挖掘算法.通过多次比较,分析,挖掘出来的结果会更加客观.(6)完成分析报告数据挖掘一开始就是面向应用的,是为决策服务的.而决策者又不一定具备太多的技术知识,因此.需要针对不同使用对象.将数据挖掘结果以可理解的形式完成不同的分析报告.分别交给决策者.3数据挖掘技术在会计信息系统中的应用目前.市场上的大部分会计信息化软件都具有财务分析模块,但其财务分析功能基本上都停留在较低层次的分析水平上.比如:因素分析,比率分析,趋势分析等,而且大部分功能只能根据企业自身产生的财务数据进行分析,这样的分析结果对决策的辅助作用不大.除此之外,信息需求者更希望在已有信息的基础上获得更深层

13、次的,隐藏在数据背后的潜在信息.针对企业自身和相关企业的财务状况及未来发展趋势做出比较完整的分析和判断.企业面对的不仅仅是企业内部信息,更多的是外部信息,不仅仅是财务信息,更多的是非财务信息.一个很重要的问题是,如何从大量的数据中经过深层次分析.获取有价值的信息.笔者认为,建立数据仓库,将数据挖掘技术引入会计信息系统,是解决此问题的有效途径.建立数据仓库并引人数据挖掘技术,增加数据挖掘模块后的会计信息系统如下图所示:图加入数据挖掘功能模块的会计信息系统数据挖掘在会计信息系统中的应用主要有如下页表1所示的几个方面:CHINAMANAGEMENTINFORMATIONIZATION/37会计信息化

14、表1会计信息系统中数据挖掘技术的主要应用所使用的主要数据挖掘问题数据挖掘目标数据挖掘技术根据企业过去,现在的财务状况判断分类技术.预测财务信息判断其财务状况,并预测未来的财务技术状况财务危机预警根据可收集到的企业信分类技术.预测息资料.判断企业未来技术发生财务危机的可能性供应商选择跟踪原料的供货信息.分类技术,蓣测收集相关企业信息.选技术择最优的供应商客户细分跟踪不同客户的消费行聚类技术,分类为,特征,确定不同客户技术群.针对不同用户实施差异化的营销策略竞争对手状况实时监控并判断竞争对预测技术,关联分析手状况分析投资项目选择在众多项目中选择最有预测技术,关联价值的项目,实现资金效分析率最大化其

15、他:如宏观进行市场分析,预测等预测技术,关联环境分析,市分析场预测等4举例数据挖掘技术在企业财务危机预测中的应用财务危机是指企业丧失偿还到期债务的能力.包括从资金管理的技术性失败到破产以及处于两者之间的各种情况.我国由于市场经济发展较晚,真正破产的案例不多,一般认为一个上市公司被特别处理(简称ST)就认为该公司进入了财务危机状态.财务危机预测是以现有的财务比率为基础.建立数学模型来预测企业财务危机发生的可能性.传统的财务危机预测模型多采用多元判别方法,采用解析式来判断某企业未来几年发生财务危机的可能性.本文采用基于粗糙集理论的数据挖掘技术.找出企业发生财务危机的规律性,进而提取出预测财务危机的

16、规则.规则形式为:IFTHEN4.1样本选取为了简明,有效地说明数据挖掘技术在财务危机预测中的应用,并尽可能简化规则集.本文选取了2003年发生ST的51家上市公司作为财务危机公司样本,其中排除了净资产为负数的和以前曾经发生过ST的5家.保留46家作为财务危机公司样本.同时,配对选取46家行业相同,资产规模相近并且无亏损记录的非ST公司作为健康公司样本.38/CHINAMANAGEMENTINFORMATIONIZATION以样本公司各财务指标作为条件属性.以2003是否被ST为决策属性建立决策表,并进行预测规则的挖掘.本实例只为说明模型的应用,故只选择一年即2001年数据进行挖掘并提取预测规

17、则.4.2数据预处理借鉴传统财务危机预测的大量研究成果,本文选取l2个财务指标分别反映了企业的盈利能力,偿债能力,营运能力和发展能力,并根据模型的要求对指标进行离散化处理.指标选取及离散化方法如表2:表2指标选取及其离散化净资产报酬率(X.)资产报酬率(X)主营业务利润率(x)流动比率()负债比率(X)营运资产与总资产比率(X)存货周转率(x)应收账款周转率(X)总资产周转率(x.)利润增长率(x)总资产增长率(X.)股东权益增长率(X.:)Xl<00l<O,1l0.1,<002<0.1,0.100<O.10.1X4<11X4<22X5<O.20

18、.2<O.5X0.5X6<0OX6<O.10.1X6<O.2X60.2X7(22X7<5X,5Xs<l18<225.85X9<0,30.30.5X.0.5JOmOXll<00ll<O.1XllO,1l2<00l2<0,1l20.14-3建立信息系统信息系统IS用四元有序组IS=CUD,)表示.内容如下:f.,样本集,作为论域;C=.,X:一,X.卜一财务指标集,作为条件属性集合,离散化方法如上表,2001年财务数据的离散化值如下表:D=2003年是否被ST卜一作为决策属性,O代表两年后未发生财务危机,1代表两年后发生财务危

19、机;:V.,V,.】代表对应财务指标的离散值:p为信息函数.针对具体问题,由财务指标(作为条件属性)及决策属性D可以建立预测信息系统.4.2数据挖掘:约简信息系统并挖掘预测规则根据基于粗糙集地属性约简算法,分别计算上表中各条件属性的信息量,并确定其重要性.为本实例简化预测规则,保留5个条件属性的规模.经约简计算,保留了:,.,并得到预测规则集,规则形式如下(只列示4个规则,其置信度超过90%):(1)IF(X2=1)THEN(D=I)(2)IF(X2<3)(X5=3)THEN(D=I)(3)IF(X4<3)()(5>2)(X9<3)THEN(D=I)(4)IF(Xg=1

20、)(XJ=1)THEN(D=1)注:规则中的指标值为离散值,指标离散化方法见表2本实例采用数据挖掘技术进行财务危机预测时,是通过分类技术使采集的数据按影响因素分为不同的类.选用同类2006年2月第9卷第2期中国管理信息化ChinaManagementInformationizationFeb.,2006Vo1.9.No.2集团公司集中式银行资金管理系统的构建曾小青,陈宏明(长沙理工大学管理学院长沙,410076)【摘要】集团公司实现资金的集中管理和统一调配,可提高资金使用效率,降低经营成本.为满足集团公司的集中式资金管理需求,建立集中式银行资金管理系统十分必要.本文对如何实现集团账户资金的集中

21、调配进行了分析:围绕信息系统的建设,阐明了集中式银行资金管理系统的功能需求;并对企业与银行互联的技术方案,技术要求进行了充分阐述.【关键词1集团公司;集中式;资金管理;信息系统建设【中图分类号】F275.1【文献标识码】A文章编号】16730194(2【)06)020039031引言随着市场经济的不断发展,企业之间的竞争日益激烈.集团公司面临着提高市场竞争力.降低运营成本,加速资金周转,加强财务监管力度,追求现代企业财务管理的高标准,高质量和高效率等多方面的严峻挑战.因此,为加强集团公司的资金管理,运用现代网络技术,建立资金管理系统,提高资金的调控和使用水平,已成为大多数集团的共识.传统的集团

22、资金管理方式存在诸多问题.比如:下属单位多头开户,集团无法实施有效的监控:资金账外循环,流向不清;内部资金闲置与短缺无法调节;成员企业资金沉淀严重,占用不尽合理,周转缓慢.企业信用和盈利能力下降;资金使用效率低.资金风险大【收稿日期120051005【作者简介】曾小青(1975一),男,汉族,副教授,博士.研究方向网络与信息系统,电子商务,企业信息化等.这些都不利于规范财务管理,影响集团资源的整合.随着集团企业信息化水平的提高和经营理念的转变,集团公司纷纷提出资金集中管理,提高资金使用效率,降低经营成本,简单高效的财务管理需求.实现资金的集中管理和统一调配.加强了对所属子公司的资金控制能力,集

23、团总公司可以利用集中起来的资金.在各所属子公司之间进行余缺调剂,降低贷款额度,帮助企业实现三高变三低.即将企业的高存款,高贷款,高费用变为低存款,低贷款,低费用.从而提升集团公司的资本运作水平.使资金得到最高回报和创造最大价值.实现整合优势为满足集团公司的集中式资金管理需求.很多银行纷纷推出了集账户信息查询,款项划拨,融资于一体的服务手段.然而,现阶段许多银行都要求集团公司必须登录到银行网站才能获得银行提供的网上业务.这种方式不利于公司全面掌握资金信息.集团企业迫切需要将运行在企业内部的计算机信息系统与商业银行特征数据作为预测输入.强化了规律性,弱化了随机性,较大地提高了预测的精度和系统的实用

24、性.这个方法避免了解析式数学模型建立的困难.同时能处理定性,定量因素的不确定性因素.该方法的不足之处是得到的预测规则集有时候会过于庞大,也可能会得出不一致的预测规则,进而影响决策的制定.如何提高精度以及预测规则的一致性问题需要进一步研究.5结论随着数据库和网络技术的迅速发展,会计信息系统也在逐步完善,人们获取数据的能力越来越强.将海量的数据储存在数据库和数据仓库中.目前的会计信息系统可以高效地实现财务数据的录入,修改,统计,查询以及简单的财务分析等功能,但是无法发现数据中存在的潜在关系和规则.无法根据现有的数据预测未来的发展趋势,缺乏挖掘数据背后隐藏知识的手段.本文提出将数据挖掘技术应用于会计

25、信息系统,增强会计信息系统的财务分析功能.将海量的数据转化为有用的知识,为决策者提供有效的信息.更好地实现会计信息系统的目标.使会计信息系统成为辅助决策者进行决策的有力T具.主要参考文献【11杨周南,张瑞君.会计信息系统【M】.北京:经济科学出版社,2000.【2】张瑞君.会计信息系统【M】.北京:中国人民大学出版社,2004.【3】蔡强,薛森.数据挖掘技术及其在经营分析系统中的应用【J】.电信科学.20o5(1).【4】李剑锋,李一军等擞据挖掘在公司财务分析中的应用【J】.计算机工程与应用.20o5(2).【5】肖智,张志恒等.粗糙集理论在企业财务危机预测中的应用【J.统计与决策,2004(3).CHINAMANAGEMENTINFORMATIONIZATION,39

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号