《精准扶贫项目解决方案说明书.docx》由会员分享,可在线阅读,更多相关《精准扶贫项目解决方案说明书.docx(12页珍藏版)》请在三一办公上搜索。
1、精准扶贫项目解决方案说明书XX科技股份有限公司编制目录一、项目存在问题及需解决问题41 .存在问题41.1. 1.扶贫信息化建设管理相对滞后41.2. 扶贫工作政策及信息上传下达不通畅41.3. 一线帮扶干部缺乏有效线上管理51.4. 扶贫措施管理和落地原始粗放51.5. 缺乏全面的数据决策分析系统51.6. 社会扶贫缺乏参与平台或途径51.7. 未建立完整的退出管理机制62 .需解决问题6二、解决方案71 .解决方案总体架构72 .核心技术8(1) )Hadoop8(2) SpringMVC8(3) MyBatis9(4) Echarts9(5) MySQ1.9(6) Hive9(7) HB
2、ASE10(8) Zookeeper10(9) F1.ume10三、开发范围111 .数据生产112 .数据采集/消费113 .数据分析124 .数据展示13一、项目存在问题及需解决问题1.存在问题我国政府历来高度重视扶贫工作,国家“十三五”规划明确提出扶贫工作在2020年的整体目标为“实现农村贫困人口全面脱贫”,精准扶贫已成为全党和各级政府实现同步小康的共识。目前距2020年还有不到4年时间,扶贫开发工作已进入“啃硬骨头、攻坚拔寨”的冲刺期。扶贫信息化建设作为推进精准扶贫、精准脱贫的基础性工作和检验“扶贫工作六个精准”的重要平台,发挥着越来越重要的作用。而在历年的扶贫工作中,伴陨者扶贫对象的
3、多样化,扶贫项目多样化、资金使用多样化、扶贫措施多样化、人力资源配置多样化,面对资金统一监管、脱贫效果统一评估、区域协同发展、上级部门无法及时掌握扶贫干部帮扶情况等一系列问题,传统的扶贫建档立卡信息管理已越来越不能满足现有的信息化扶贫管理要求。1.1. 扶贫信息化建设管理相对滞后各地扶贫单位大多使用国扶办的扶贫开发信息管理系统”,囿于全国信息数据的庞大,功能模块设计有一定局限性。建档立卡无法满足扶贫的过程管理和精准要求。扶贫数据基本依靠扶贫干部手动纸质填写收集,数据填报基本依靠后台专人不定时人工操作,费时费力且更新不够及时。扶贫工作是一个动态过程,由于贫困户数量、致贫原因、脱贫返贫数据经常变化
4、,而数据滞后给统计汇总工作带来极大困难。一方面,传统的逐级汇总、上报方式难以应对如此规模的信息统计;另一方面,数据更新不及时也造成统计数据不准确,精准扶贫工作落实和扶贫成效均难以体现。1.2. 扶贫工作政策及信息上传下达不通情工作任务的下达、分配常通过会议、电话等方式,造成工作安排缺乏高效性;上级部门无法实时掌握帮扶干部的帮扶工作情况,导致对基层帮扶干部的帮扶工作难以监督。贫困户和帮扶干部通过纸质文件查询政策信息效率较低,扶贫工作政策及信息上传下达不通畅。1. 3.一线帮扶干部缺乏有效线上管理驻村帮扶干部的工作管理粗放,贫困户遍访、扶贫过程、扶贫纪事等扶贫工作动态跟踪和评估机制缺乏精确的数据支
5、撑,难以做到准确考核和有效奖惩。1.4. 扶贫措施管理和落地原始粗放扶贫不仅是扶贫办一个部门,也是政府各层面所有部门参与的大扶贫,扶贫项目尤其是资金是各方管理,专项扶贫项目和资金管理各部门各自为政,未打通业务关键数据,帮扶干部无法全面掌握帮扶对象资金情况。贫困户实际情况掌握不清楚,产业项目的实施缺乏科学的制定过程,以农产品销售为例,以粗放、简单的模式难以稳定的提供产品输出,很难形成规模效应,这也是制约农产品输出和产村电商发展的重要原因。1. 5.缺乏全面的数据决策分析系统缺乏指挥调度大屏展示,当地政府和相关部门无法及时掌握区域扶贫全局、扶贫项目工程落实实施、扶贫资源配置和风险应急处置等情况;数
6、据的分析呈现仍以手工统计层层汇总、文字汇报的方式,信息滞后容易虚报、瞒报。1.6. 社会扶贫缺乏参与平台或途径贫困户受限于知识水平与经济条件,获取帮扶政策、信息的渠道有限,处于信息匮乏状况。社会扶贫力量缺乏获得贫困户信息及诉求的渠道,有心帮扶但难以找到真正的帮扶对象,缺乏参与平台和帮扶途径。1.7. 未芝立完整的退出管理机制在国家扶燹办根据年收入单一脱贫标准的基础上,各地政府结合当地扶贫现状制定一套符合当地特点的脱燹评估标准,这就要求扶贫系统具备灵活的贫困户贫困村脱贫评估指标、脱贫评估规则配置支撑。传统退出只看收入是否达标,很廉通过新的脱贫险收评估要求。2.需解决问题 扶贫信息化建设管理相对滞
7、后 扶贫工作政策及信息上传下达不通畅 一线帮扶干部缺乏有效线上管理 扶贫措施管理和落地原始粗放 岐乏全面的数据决策分析系统 社会扶贫缺乏参与平台或途径二、解决方案1 .解决方案总体架构!S1精准扶贫第决方案总体架构HBaSe是一个分布式的、面向列的开源数据库,该技术来源于FayChang所撰写的GOOgIe论文Bigtab1.e:一个结构化数据的分布式存储系统就像BigtabIe利用了GOogIe文件系统(Fi1.eSystem)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtab1.e的能力HBase是,pache的HadOoP项目的子项目。HBase不同于一般的
8、关系数据库,它是一个适合于非结构化数据存储的数据库。另一个不同的是HBaSe基于列的而不是基于行的模式。系统采用面向对象的软件设计方法,把整个系统看作是多个离散对象的组合。系统设计时,首先把业务流程分解成功能模块及其业务实体对象,然后根据业务流程分析对于这些业务实体对象的操作方法,形成业务处理对象,最后把各个功能模块关联起来,形成系统。软件设计是一个将需求转变为软件的过程,系统通过逐步求精使得设计陈述逐渐接近于源代码。系统程序采用MVC的设计思想,将展现逻辑、控制逻辑、业务处理逻辑分离。系统采用参数化的设计思想,定义和管理系统的实体及配置,调整实体以适应外部变化。系统采用J2EE技术保证程序逻
9、辑实现的平台无关性,并便于安装部署。系统采用AJAX技术,提高客户操作的交互性,保证实际使用的易用性。系统采用echarts可视化框架实现数据展示。2 .核心技术(1) HadoOPHadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。(2) SpringMVCSPringMVC:属于SpringErameWork的后续产品,已经融合在SpringWebFIoW里面。Spring框架提供了构建Web应用程序的全功能MVC模块。(3) MyBatisMYBatis:是支持普通SQ1.查询,存
10、储过程和高级映射的优秀持久层框架。MyBatiS消除了几乎所有的JDBC代码和参数的手工设置以及结果集的检索。MyBatis使用简单的XM1.或注解用于配置和原始映射,将接口和Java的PoJOS(P1.ainO1.dJavaObjeCtS,普通的JaVa对象)映射成数据库中的记录。(4) EchartsECharts是一款基于Javascript的数据可视化图表库,提供直观,生动,可交互,可个性化定制的数据可视化图表。(5) MySQ1.MySQ1.是一个关系型数据库管理系统,由瑞典MySQ1.AB公司开发,属于OraCIe旗下产品。MySQ1.是最流行的关系型数据库管理系统之一,在WEB应
11、用方面,MySQ1.是最好的KDBMS(Re1.ationa1.DatabaseManagementSystem,关系数据库管理系统)应用软件之一。MySQ1.是一种关系型数据库管理系统,关系数据库将数据保存在不同的表中,而不是将所有数据放在一个大仓库内,这样就增加了速度并提高了灵活性。MySQ1.,所使用的SQ1.语言是用于访问数据库的最常用标准化语oMySQ1.软件采用了双授权政策,分为社区版和商业版,由于其体积小、速度快、总体拥有成本低,尤其是开放源码这一特点,一般中小型网站的开发都选择MySQ1.作为网站数据库。(6) HiveIIiVe是基于Hadoop构建的一套数据仓库分析系统,它
12、提供了丰富的SQ1.查询方式来分析存储在Hadoop分布式文件系统中的数据:可以将结构化的数据文件映射为一张数据库表,并提供完整的SQ1.查询功能;可以将SQ1.语句转换为MaPRedUCe任务运行,通过自己的SQ1.查询分析需要的内容,这套SQ1.简称HiveSQ1.,使不熟悉mapreduce的用户可以很方便地利用SQ1.语言查询、汇总和分析数据。而mapreduce开发人员可以把自己写的mapper和reducer作为插件来支持hive做更.复杂的数据分析。它与关系型数据库的SQ1.略有不同,但支持了绝大多数的语句如DD1.、DM1.以及常见的聚合函数、连接查询、条件查询。它还提供了一系
13、列的:具进行数据提取转化加载,用来存储、查询和分析存储在Had。P中的大规模数据集,并支持UDF(User-DefinedFunction),UD.,F(User-DefnesAggregateFunction)和UDTF(User-DefinedTab1.e-GeneratingFunction),也可以实现对map和reduce函数的定制,为数据操作提供了良好的伸缩性和可扩展性。(7) HBASEHBase-HadoopDatabase,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PCSerVer上搭建起大规模结构化存储集群。(8) ZkeeperZo
14、oKeeper是一个分布式的,开放源码的分布式应用程序协调服务,是GoogIe的ChUbby一个开源的实现,是HadOoP和HbaSe的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。(9) F1.umeFIUrne是CIOUdera提供的一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统,F1.umc支持在日志系统中定制各类数据发送方,用于收集数据;同时,F1.ume提供对数据进行简单处理,并写到各种数据接受方(可定制)的能力。三、开发范围1 .数据生产对于该模块的业务,印数据生产过程,一股并不会让你来进行操作,数据生
15、产是一套完整且严密的体系,这样可以保证数据的安全性。但是如果涉及到项目的一体化方案的设计(数据的产生、存储、分析、展示),则必须清楚每一个环节是如何处理的,包括其中每个环境可能隐藏的问题;数据结构,数据内容可能出现的问题。2 .数据采集/消费数据采集模块(消费),在企业中你要清楚流式数据采集框架f1.ume和kafka的定位是什么。我们在此需要将实时数据通过f1.ume采集到kafka然后供给给hbase消费。f1.ume:CIOUdera公司研发适合下游数据消费者不多的情况:适合数据安全性要求不高的操作:适合与Hadoop生态圈对接的操作。kafka:Iinkedin公司研发适合数据下游消费
16、众多的情况;适合数据安全性要求较高的操作(支持rep1.ication);因此我们常用的一种模型是:线上数据一f1.ume-kafkaf1.ume(根据情景增删该流程)HDFS线上数据一f1.umekafkaSParkStreaming实时流式处理消费存储模块流程图:图2消费存储模藻流程图3 .数据分析我们的数据已经完整的采集到了HBaSe集群中,这次我们需要对采集到的数据进行分析,统计出我们想要的结果。注意,在分析的过程中,我们不一定会采取一个业务指标对应一个mapreduce-job的方式,如果情景允许,我们会采取一个mapreduce分析多个业务指标的方式来进行任务。分析模块流程图:图3分析模块流程IS4 .数据展示数据展示模块流程图:图4数据展示模块流程图