《基于大数据的高校大学生“毕业账单”的设计与实现.docx》由会员分享,可在线阅读,更多相关《基于大数据的高校大学生“毕业账单”的设计与实现.docx(22页珍藏版)》请在三一办公上搜索。
1、封面基于大数据的高校大学生“毕业账单”的设计与实现摘要随着互联网技术的不断发展和应用,使用互联网及相关产品的用户每时每刻都在产生大量的数据,不断累积就形成了大数据。这些大数据的背后,正是每个用户的观念体现和行为措施,利用这些大数据进行相关用户“个人画像”的描摹,可以为相关用户更好地了解自己,合理地对未来进行规划。本文借鉴支付宝等社交软件的“年度账单”模式,借助大数据技术、基于ReaCt框架使用java语言设计了一款面向高校学生的“毕业账单”系统,系统基于校园消费客户端、校园信息系统数据库、校园信息系统日志数据库的相关信息,结合来源多种多样的各类信息,为校园内的毕业生提供包括个人学习数据、食堂消
2、费情况、体育馆使用情况和其他相关信息的汇总和生成,帮助高校学生更好地了解自己,为后续的深造和就业制定具有针对性的计划和策略。关键词:大数据;高校大学生;“毕业账单”;设计;实现AbstractWiththecontinuousdevelopmentandapplicationofInternettechnology,usersusingtheInternetandrelatedproductsaregeneratingalargeamountofdataatanytime,andcontinuouslyaccumulatingtoformbigdata.Behindthesebigdatais
3、theembodimentofeachuser,sideasandbehavioralmeasures.Usingthesebigdatatodescribethepersonalportraits77ofrelevantuserscanhelptherelevantusersbetterunderstandthemselvesandreasonablyplanforthefuture.ThisarticledrawsonthezzannualbillzzmodeofsocialsoftwaresuchasAlipay,withthehelpofbigdatatechnology,anddes
4、ignsazzgraduationbill”systemforuniversitystudentsbasedontheReactframeworkandJavalanguage,Thissystemisbasedontherelevantinformationofthecampusconsumerclient,thecampusinformationsystemdatabase,andthecampusinformationsystemlogdatabase,combinedwithvarioustypesofinformationfromvarioussources,toprovidegra
5、duatesoncampuswithpersonallearningdata,canteenconsumption,andgymThecollectionandgenerationofusageandotherrelatedinformationhelpcollegestudentsbetterunderstandthemselvesanddeveloptargetedplansandstrategiesforsubsequentfurthereducationandemployment.Keywords:bigdata;collegestudents;zzgraduationbill”;de
6、sign;realization目录一、绪论5(一)研究背景5(二)文献综述5(三)研究目的7(四)研究内容7二、“毕业账单”系统概述12(一)“毕业账单”定义12(二)“毕业账单”用户数据来源12三、“毕业账单”系统需求14(一)目标用户与系统需求14(二)系统建设目标14(三)“毕业账单”系统面临的挑战15四、“毕业账单”系统设计与功能实现16(一)总体架构16(二)数据仓库16(三)个人“毕业账单”应用服务17(四)功能优化19五、结束语21参考文献22致谢23一、绪论(一)研究背景大数据就是在信息化过程中,系统生成积累用户网络行为的数据。这些数据规模巨大,远远超过传统数据的信息量,隐藏
7、着巨大的商机和应用价值。近几年来,能够将这种具有动态性,海量性、多变化的结构性和非结构性的数据,进行一系列的数据处理等一系列大数据分析技术,己成为各行各业把握商机的重要途径。分析这些数据背后的信息,可以带来价值的财富。此外这个市场也属于蓝海市场,尚未被深入挖掘。由此可见,企业想要发展,应对大数据带来的挑战是成功的关键。近两年来,支付宝和网易云音乐在用户行为采集方面采取了更多创新的方式,引起了众多用户的兴趣,确实对用户的行为,重大和习惯进行了总结和总结,可以帮助用户更好的了解自己的使用情况,并根据相关信息进行调整。这种“年度账单”式的系统实现,归根结底是大数据技术的挖掘和应用。同时,考虑到学生,
8、所有的日常行为都与校园息息相关,无论是吃饭,休息,学习还是锻炼,一般都与校园卡的消费记录有关。因此,笔者有兴趣对校园内的学生情况进行总结,希望通过支付宝采用的“年度账单”的形式,为校园内的学生提供类似的数据服务,并形成“师生画像”,帮助用户更好地了解自己。大学生毕业账单系统的设计与实现,也意味着高校数据服务的研究与创新,可以进一步推动高校信息化进程。(二)文献综述随着大数据技术的不断深入发展和用户对于“个人画像”需求的日益增加,关于这一方面的研究也逐渐增多。无论是国内还是国外,都十分注重对于大数据技术的多重应用和深入挖掘。在我国高校管理系统中,也不断引入大数据技术力求提高管理效率和管理成果,希
9、望通过计算机技术进一步减少高校日常运营中的人力和资源投入成本,也为学生提供更全面、更灵活、更具针对性的服务。陈桂香于2017年在大数据对我国高校教育管理的影响及对策研究中,以现有的大数据技术背景、经济环境和社会文化为研究背景,深入探索了大数据、物联网、互联网和云计算技术在高校管理领域的应用。并对之进行了深入的分析。大数据的本质特征。同时,本文系统地研究了大数据对中国高等教育管理发展的正反作用。在对高校教育管理现代化的本质特征进行分析的基础上,指出我国传统商学院的教育管理模式不够人性化,存在着管理形式单一和管理方法固化等问题。而高校大数据教育管理在未来的发展趋势势必趋向于智能化、个性化、科学化和
10、适应化,与传统的大学教育管理相比具有不可比拟的优势。具体来说,大数据技术将为大学校园在数据采集、决策建议、教学计划、科研发展和个人评估等多个方面提供更大的平台和机会。同时,高校大数据教育的管理面临着诸多挑战,例如隐私与自由的平衡,数据霸权,数据垃圾,数据标准和数据安全。本文还指出,我国大数据教育的管理存在一些问题,如顶层设计不足,资金保障不足,数据人才不足,法律法规不完善,共享机制不完善等。在此基础上,本文思考并提出了促进我国高校大数据教育与管理发展的对策。针对教育现代化的要求,针对教育管理的智能化和人性化,针对我国高校大数据教育管理中存在的问题,提出了促进大数据管理的对策。借鉴美国和其他发达
11、国家商学院的大数据教育和管理经验,在中国的高等学校进行教育。高校要树立大数据教育管理的理念,坚持以人为本,强弱组合,畅通结合的原则,通过加强对大数据的发展,实现“规避风险,发挥优势”的大数据发展目标。顶层设计,加强制度规章制度建设,建立协调机制,共享机制和考核机制,建立数据教师运维体系。寇进科于2018年在基于大数据的企业用户画像系统的设计中认为,在互联网和物联网应用普及的背景下,利用大数据相关技术设计企业用户肖像系统可以解决企业准确识别的问题。本文主要研究在企业范围内,为企业用户垂直索引系统的研究提供有益的补充。这也是对软件工程领域的企业用户肖像系统设计概念的初步探索。该文针对企业用户肖像指
12、标项目的构成,提出用德尔菲法和层次分析法确定指标模型的基本构成,通过逻辑回归分析模型动态调整系统运行过程的权重,建立企业评价模型,对企业模型进行分析。应用场景分析方法分析政务和商务,设计并完成企业基本信息和企业行为信息,企业评估信息和企业供应链信息四大类的64个子企业用户纵向指标体系。针对企业用户肖像的各种索引数据类型和责任来源的特点,提出了利用大数据采集和大数据存储的相关技术来构建系统数据层的解决方案,研究并形成了数据库构建标准基于大数据技术的整体结构;根据企业用户画像的多样化需求,结合软件工程需求分析方,利用MVC架构的概念,研究设计了企业的整体架构和功能设计,形成了一个用户画像系统。元数
13、据管理,索引管理和计算,用户自定义等的松散耦合功能结构,以满足不同用户的需求。颜辉强于2018年在基于大数据的客户用电行为分析系统设计与实现中指出,随着智能电网的普及,电网和省级电力公司拥有大量的用户用电数据,而这些数据都能够成为利用大数据技术分析用户行为的基础,合理的运用能够有效挖掘用户的用电需求,激活其中包含的商业价值,是电力企业亟待解决的问题。尽管某些系统可以分析用户的用电行为,但大多数系统使用一些传统的数据分析方法或工具。海量数据的处理和计算不足,系统功能结构相对简单,对用户用电行为的深入,全面研究具有一定的局限性。(三)研究目的研究希望能够利用大数据技术,基于ReaCt框架并采用ja
14、va语言,为高校内的师生打造一个能够呈现基于个人行为的“个人画像”系统,可以生成学生的“毕业账单”,帮助高校学生更好地了解自己。(四)研究内容研究以学生在校园的各项行为为基础,希望以支付宝采用的“年度账单”的形式,为校园内的学生提供类似的数据服务,形成“毕业账单”系统,帮助更好地了解自己。(五)ReaCt技术框架React是Facebook公司在2013年发布的一款针对视图层开发的框架,主要用于构建大型系统应用或Webappo它不仅解决了大规模应用程序在运行时,随着时间数据不断变化的问题,而且创建了高性能的组件化开发方式。React完全使用JavaScript来构建用户界面,因此可以认为是一个
15、用来构建用户界面的JavaScript库。由ReaCt构建的用户界面完全通过数据状态的改变来驱动更新,每一种数据状态对应一种视图展现效果,交互功能的实现同样能适应这种方式。React能够创建可复用的高性能组件,且具有良好的跨平台兼容性,在使用React框架时,只需要聚焦组件层的构建,而无需过多关注DOM层的结构和操作,这得益于React拥有良好的组件封装性,使得组件能方便的复用和测试,并进行关注分离。1 .工作原理在Web开发中,通常需要将随时间变化的数据展现在视图界面上,而传统的方式则是通过操作DOM元素来达到实时更替的效果。对于单页应用而言,复杂频繁的DOM操作往往是性能瓶颈产生的主要原因
16、,这也对功能的修改和后期的维护造成了巨大的障碍。为了解决此类问题,React框架引入了VirtualDOM机制,该机制主要是利用JaVaScript脚本在浏览器端实现了一套类似DOM的APIo在使用React进行Web开发时,页面所有的DOM节点都是通过VirtualDOM构造的。当页面数据需要变化更新时,React会依据最近的状态数据重新构建出整个虚拟DOM树,然后利用diff检索算法,将当前最新构建的DOM树和前一次构建的DOM树进行对比,得出两者之间的差异,这些差异即为需要更新的部分15。最后只要在浏览器中将这些差异的部分进行替换即可。由于VirtualDOM是存储在内存中的数据,所以性
17、能相对较高,而实际在浏览器中进行DOM更替操作的仅仅是Diff算法检索出的部分,极大的降低了不必要的性能开销,因此也从侧面对数据的更新提供了性能支持。在保证了高性能的同时,开发人员不在需要考虑如何将变化的数据更新到具体某一个或多个DOM元素上,而只需要关注界面在某个数据状态下是如何渲染的。React在实际开发中的工作原理,主要流程可分为如下几个阶段:首先通过JSX语法(JSX语法是一种JaVaSCriPt语言的语法糖,属于JS的一种扩展)统一声明性地制定WebUI组件分层结构;然后通过React内部的JSX转换编译器,将JSX语法编写的UI组件编译为JavaScript文件,每个JS文件就代表
18、一个能被React渲染引擎识别的基础视图组件;接着React内嵌的渲染引擎会对每一个基础视图组件进行识别,并用JS对象将识别后的基础组件模拟为虚拟DOM,然后会在内存中构建形成虚拟DOM树(Virtual-DOM);虚拟DoM树形成后,浏览器中的JS解释器开始解析由JS对象模拟出的Virtual-DOM,由此产生能够被浏览器渲染引擎识别的真实DOM树(real-DOM),进而渲染得出BrowserDOM;当BrowserDOM需要发生变更时,Virtual-DOM会针对当前的real-DOM执行一次diff检索,目的是让UI整体在更新时所消耗的资源最少。2 .设计思想虚拟DOM(VirtUaI
19、-DoM)不仅使传统的UI开发变得简洁高效,同时也为React框架形成了一套自身独有的组件化开发思想。所谓组件,即封装起来的具有独立功能的Ul部件。React推崇以组件的方式去重新思考Ul的构成,将UI上每一个功能相对独立的部分划分为单独的模块,再根据划分的模块来组织和编写代码形成视图组件,每个组件只需要关心自己部分的逻辑,彼此独立。然后将基础的组件通过组合或者嵌套的方式构成大的组件,最终完成整体UI的构建。ReaCt设计构成的组件具有如下几个特征:可组合(ComPOSeabIe):每个组件都能够非常容易的与其他组件一起结合使用,或通过嵌套的形式创建在组件内部。如果某个组件内部创建了另一个组件
20、,可以认为该组件创建了其内部的子组件,同时它成为创建子组件的父组件。通过这一特性,就能将一个复杂的UI视图拆分成多个功能单一,相对独立的基础UI组件。可重用(Reusable):由于每个封装完成的组件都具有相对独立的功能,彼此之间不会产生干扰,耦合度较低。因此能够被应用在多个不同的UI场景中。可维护(Maintainable):每个组件由于只包含了自身的逻辑功能部分,因此在测试及维护时,能够很好的让开发人员操作和理解。视图界面由React组件嵌套拼接而成,而组件的数据状态和相关配置参数,才是决定最终呈现效果的决定因素。每个有状态组件都有自己的状态,并且每个状态可能拥有多个状态值,每一种组件状态
21、都可以在它所拥有的状态值之间进行切换。ReaCt用State字段来保存这些动态变化的组件状态。组件中的State不仅可以用于存储组件状态,同时组件自身也能够对其进行修改,外界无法访问组件内部的状态数据,只能通过指定的接口来调用。可以把State看成是一个容器,组件利用该容器来控制自身状态。组件的State仅在组件内部有效,这样很好的将状态与外部环境进行隔离。在选择使用的组件时,需要根据不同的功能需求而定。由于每个组件都具有独立性和复用性,同时也需要和其他的外部组件进行通信,所以组件本身也提供了接收外部数据的方式。Props就是与外部通信的接口,也是让组件具备灵活配置性的重要因素。组件的Prop
22、s字段存储着当前组件中的全部配置属性,其本质是一个JS对象,在每个React组件中都存在着这样一个Props对象,同时也能够接收外界传入的Props对象参数。React组件生命周期的每个阶段都有对应的钩子函数:getDefaultProps:该方法主要用于定义组件的默认Props值。在创建阶段被调用,而且只会调用一次。需要注意的是,由ES6或ES7创建的组件,不能使用这个方法。它只能用于特定方法创建的组件,即React,createClass方法。getlnitialState:该方法主要用于创建组件实例的State状态值。在创建阶段被调用,而且只会调用一次。调用该方法时同样可以访问Props
23、值。ComponentWillMount:该方法允许渲染前最后一次修改组件,包括修改组件State状态和传递新的Props值。只在创建阶段被调用,而且仅调用一次。这也让页面在呈现前,提供动态任务绑定的时机,和复杂交互的设置。render:该方法是组件渲染的必须方法,调用之后会将JSX描述的组件转换为VirtualDOMo该方法拥有一些特殊的规则:(1)只能通过this.props和this,state访问数据;(2)可以返回null、false或任何React组件;(3)只能出现一个顶级组件(不能返回数组);(4)不能改变组件的状态;(5)不能修改DOM的输出。ComponentDidMoun
24、t:该方法在组件第一次渲染后被调用,而且仅调用一次。此时组件已从VirtualDOM变为RealDOM,可以直接对浏览器文档对象模型进行访问。该方法也常用于异步数据的获取,也能设置setIntervalsetTimeout定时器。ComponentWi11ReceiveProps:该方法会在组件的Props更新时被调用。触发组件ProPS的更新有两种可能,第一种是外界直接传递新的Props值,第二种是子组件的Props值被父组件更改。新的Props值传入组件后,会自动覆盖旧的Props值,以便后续this.Props的调用。在该方法中也能够用于更新State状态来触发组件重新渲染视图。需要注意
25、的是,创建阶段不会调用该方法。ShOUleICOmPOnentUPdate:该方法在组件的Props或State发生改变时被调用,其主要作用是决定组件是否需要重新渲染。若方法返回false则不会重新渲染视图组件,默认返回trueo当方法返回false后,将不会再执行render函数和后续的生命周期方法。需要注意的是,在组件的创建阶段,不会调用shou1ClComponentUpdate0ShouldWil!Update:该方法会在ShouldComponentUpdate返回true之后,即将render前被调用。此时最新的Props或State值已传入组件中。需要声明的是,组件的Props和
26、State不能在该方法中修改。ShouldWillUpciate在组件创建阶段不会被调用。ComponentDidUpdate:该方法的调用时机是在shouIdWi11Update执行完并且ren-der被调用后。此刻已经能够直接对浏览器文档对象模型进行访问。ComponentWi1IUnmount:该方法处于组件的移除阶段,会在组件被移除前调用。当组件使用完成之后会进入移除阶段,此时能够设置相关的清理回收操作,例如删除定时器、注销事件句柄等。3 .优缺点分析React作为一项新的前端工程组件化技术,存在其自身独特的优势,但就其本身而言,它不是一种传统意义上的前端开发框架,它只负责处理视图层的
27、控制,而且不涉及网络请求以及数据存放等功能,这也造成在考虑使用React时有相当大的局限性。因此如何更好的扩展React组件功能,同时避免增加不必要的累赘,设计可配置可管理的组件化方式是需要思考的主要问题。下面列出了React框架在组件化开发中的一些优势和缺陷:其优势在于:性能高效:React引入VirtualDOM概念,不直接对真实DOM进行操作,减少更新内容,使应用程序更轻便;跨浏览器兼容:虚拟DOM的形成,提供了标准化的API,能够兼容IE8在内的浏览器;组件模块化:每个组件都能够进行独立的开发和测试,且具有较高的灵活性,可方便的进行组装和拆解,提高了代码的可维护性;JavaScript
28、同构:React能够在服务器端进行渲染,完成后发送给客户端。全的执行均通过JavaScript来实现,这有助于搜索引擎的优化;跨平台性:React拥有强大的生态系统,使其衍生物能在移动端,桌面应用程序等不同环境平台下拥有良好的表现。其缺点在于:React不属于一种完整的前端MVC框架,它仅仅负责视图层的展现,在使用时需要结合其他框架完成特定功能的开发;React组件不具备获取网络数据的能力,并且未提供异步控制功能,需要对组件结构进行改造;对于组件内部或组件之间不断变化的状态数据,React缺乏管控机制,在对系统进行扩展和维护时会变得非常复杂。二、“毕业账单”系统概述(一)“毕业账单”定义研究中
29、所描述的“毕业账单”,是指通过大学生在学校期间的相关信息,比如各科目成绩记录、食堂消费记录、图书馆使用记录和其他相关信息等,将收集到的学生个人信息进行归纳和整理,形成完整的描述展现用户的信息全貌,为学生提供个性化的用户画像,进而为学生毕业后的职业规划提供参考。(二)“毕业账单”用户数据来源本系统中构成画像系统的数据,从来源上可分为校园消费客户端上报的数据、校园信息系统数据库和校园信息系统的日志数据。从属性上可分为用户的基本信息、设备信息、位置信息、业务信息等。以下主要从不同来源的角度来简要说明。1.校园消费客户端上报数据这里的校园消费客户端包含了食堂、图书馆和体院馆等多个建筑的消费信息系统,以
30、校园卡的花费为主。客户端数据上报可简单划分成代码埋点与全埋点。埋点是数据采集领域的术语,是指在应用中对特定事件或行为采集相应的数据,按照与服务端约定的协议格式进行数据上报。上报的数据例如消费时间、消费时长和消费金额等,这些数据可以提供给后台用于进一步形成个人画像也就是“毕业账单”品。代码埋点是指在SDK中嵌入指定事件的上报,上报更为精确,可以分析较为复杂的用户行为。而全埋点则是预先收集所有用户行为数据,然后在数据分析阶段再提取还原用户行为。校园消费客户端上报的数据真实地反应了大学生们的生活与消费习惯,是构建画像的重要数据来源。虽然全埋点覆盖的用户数据更多,但数据量会比代码埋点多几倍,存储与数据
31、清洗所需要的资源都更多。考虑到投入产出比,本文中客户端上报采用了代码埋点的方式。通过对客户端上报数据的分析,一般可以挖掘出用户在校园消费客户端中进行的行为数据,例如使用校园消费客户端的常在线时间段、消费频率、消费项目和消费金额等。另外,在征得用户同意的情况下,可以提取出位置信息,在一些社交应用中常见的“附近的人”就是通过位置数据计算得到。2校园信息系统数据库校园信息系统数据主要记录了大学生的学习信息,包括四年来的选课和考试成绩,是与“毕业账单”生成紧密相关的数据。该部分数据与学生个人情况结合紧密,从中可以提取出大量学习相关的用户信息,对该部分数据的挖掘往往能对业务产生指导作用。由于该部分数据来
32、源于校园内部服务端,在调用数据时会对数据进行校验,因此该部分数据的真实性是可以保证的。3 .校园信息系统日志数据校园信息系统日志数据是指在服务端生成的日志信息。该部分信息往往不是重要信息,因此未加入埋点,也没写入业务方数据库,属于补充性数据。从业务日志可以较为直观地找出非学生的用户,但是仍需要结合上报与其它数据来检验假设是否成立。三、“毕业账单”系统需求(一)目标用户与系统需求学校虽然对于学生包括学习成绩、校园卡消费、在校时长和行为轨迹等信息有着记录和分析,但是并没有形成个人画像的能力。借助大数据分析,主要可以解决如下问题:1.根据系统所抓取的数据,形成以学生个体为准的大学概况,包括学生的在校
33、时长、内容分配、校园卡消费金额和消费次数等都能够以可视化的模式展现,同时支持热力地图的模式,更直观地展示学生的行为习惯和消费行为等内容,让使用者能够对于自己大学的情况一目了然。4 .建立消费情况模块,学生能够通过这一模块看到自己使用校园卡刷卡的次数,校园卡消费的金额,以及变化的趋势。更进一步细化来说,可以区分为图书馆、餐厅、商店等模块呈现,更好地展现使用者的消费习惯。5 .支持模糊搜索,同时以校内学生实时动态展示为基础,能够由使用者选择是否研究个体或者观察整体的口常习惯,同时这一模块也会展示学生的选课情况,包括上课市场、总学习科目和学习成绩等项目。(二)系统建设目标本文的系统设计,数据基础正是
34、学校各个系统中的学生行为数据资源。以这种丰富、全面的信息资源为基础,能够通过信息采集、数据归纳和智能分析等措施,深入挖掘高校学生的行为习惯和行事特点。通过对于这些信息进行分类、处理、分析和汇总,能够全方位提取学生信息,形成学生个性化的“个人画像”也就是“毕业账单”。这种“毕业账单”的生成,也能够为高校毕业生找到个人总结的最佳切入点,让毕业生甚至是其他年级的大学生在系统帮助的基础上,更好地规划自己未来的生活安排和职业计划,制定更有针对性和适用性的方案。具体来说,就是如下三个方向:1 .通过塑造学生个人的学生画像,为后续具有类似特点的学生其提供针对性的学习方案和其他安排,提高培养学生的能力。2 .
35、为学生形成自我认知提供基础,通过分析和整合学生的个人行为数据记录,形成完整的个性化描述,支持学生查找和审阅,有助于使用者也就是学生更好地了解自己。3 .为后续业务创新提供可能性和支撑。在此系统生成的大数据基础上,能够有利于后续开发别的项目,比如为学生提供日程安排建议、消费建议或者其他一些辅助,更是有利于高校智库的发展和运行,带来更多的可能性和拓展业务。(三)“毕业账单”系统面临的挑战从学校的整体系统架构来看,其主要面临以下几个方面的挑战:1 .高校适用的传统客户端信息较为分散,资源和信息难以实现共通。无论是来自学生个人成绩、食堂消费情况、体育馆使用情况和其他各类繁杂的信息,都有着格式不统一、信
36、息不互通等问题,想要进行完善的整合,还需要对数据进行统一处理和调整。2 .数据存储具有分散化和散乱化的问题。想要对高校毕业生生成“毕业账单”,势必要把属于同一个人的所有信息完成整合,同时把所有毕业生的信息按照同样的格式进行存储,才能够批量生成格式统一、风格类似的个人“毕业账单”。而目前不仅是高校毕业生的信息分散,并且也存在着较大的管理难度,因此对于数据的汇总也是需要完成的任务。3 .高校适用的相关系统往往较为落后,传统的数据库承担着巨大的压力,并且随着系统的升级而逐渐混乱。随着高校管理项目和学生数量的不断增加,带来的问题也包括冗余数据和繁杂信息的产生,而传统的数据库模式又导致扩容困难,因此也给
37、“毕业账单”系统的生成带来了一定的管理和升级困难,造成成效降低和压力增大的问题。应用层应用:未来嬲标答存转 标签计8存储S采集层数酶个人回像实时分析周线计算 斯寸计自数无来源商线数孙处理学习慢块.食堂慢块、体苜蟆块、其他樽块SDKJSS 服务精采集数据校四消数名E3附螭.校园信息系统数据序、校园信息系统日志数足敛后推送内容巡实时数提处Sj四、“毕业账单”系统设计与功能实现(一)总体架构目前接入画像系统的产品每日新增数据量己经达到一个较高的级别,囊括了学生生活的方方面面,因此该系统从一开始就是基于大数据架构来设计的。本文实现的“毕业账单”系统整体架构如图4-1o本系统架构设计时也参考了著名的La
38、bnida架构,将离线批处理与实时流计算相结合,形成相互补充。毕业IW生成:用户违询.账单生成图1“毕业账单”系统整体架构(二)数据仓库传统的关系数据库系统具有在线事务处理的功能,它专注于事务的读写和实时响应。在“毕业账单”系统中,需要深入挖掘包括用户行为、服务数据、用户基本属性和其他数据在内的大量原始数据。因此,图像系统需要面向联机分析处理的数据仓库。系统选用的数据仓库主要具有以下特点:1.面向主题数据仓库比数据库具有更高级别的数据抽象。数据库的关键工作是详细记录每笔交易的数据,以确保业务的正确可用性。数据仓库将同步详细数据,然后根据该数据(例如上个月用户在某一领域的总消费)来计算特定维度的
39、摘要数据。通过与上个月的数据进行比较,可以了解用户的信息变化,以此作为后续的决策依据。2 .数据集成数据仓库通常来自不同的数据源。例如,在该系统中,数据仓库的数据来自移动终端SDK报告与服务器数据库的数据同步。3 .数据稳定数据库的数据需要经常更新,例如,将为每个用户消耗生成一条记录。对于数据仓库,并非每条记录都是实时更新的。数据仓库通常会定期加载原始数据。例如,此系统中的大多数方案每天都加载数据,而某些方案每小时都加载数据。数据很少涉及更新和删除,而更多涉及覆盖和同步。4 .反映历史变化数据仓库通常用于存储特定时间范围内的数据并汇总结果。如前面的示例中所述,仓库会定期同步数据库中的数据。因此
40、,数据仓库将随着时间累积新数据。(三)个人“毕业账单”应用服务1.登录与注册根据系统登录的需求设计登录功能,用户打开系统会进入系统登录页面,页面会显示用户需要输入的信息,同时用户还可以选择登录方式,比如是管理员还是教师等。用户输入账号密码与数据库中所存储的账号密码进行比对,账号密码比对一致表示成功验证本用户身份,用户即可跳转至系统操作页面。用户输入的登录账号与密码与数据库中存储的账号密码不一致,则验证失败不能登录成功。具体登录界面见图2。用户名:密码:显示密码忘记登录密码?请点击找回密码登录注册图2毕业账单系统登录界面5 .大学概览模块大学概览模块基于消费情况、大学轨迹回放模块,进行一个数据集
41、合,这一模块包含学生的上课次数、活动参加次数、荣誉获得次数和卡路里消耗等数值,同时以饼图的形式展示学生在各个活动项目中花费的时间占比。同时,这一模块也支持对于其他使用该系统的学生的实时查询,展示校内学生的分布情况和IP地址。此外,这一模块为了适用于对于整体学生的查询,也特别设置了区域搜索和模糊搜索等功能,能够充分发挥系统的比对意义和查询作用,便于使用者对于整体的情况有一个较好的了解。这一模块的意义在于,通过不同的数据维度,为每位毕业生生成属于自己的个性化展示。6 .消费情况模块消费情况模块也采用了整体分布展示的功能,使用热力地图的形式展示着不同区域学生的消费行为。同时,这一模块对于使用者的消费
42、情况进行了更直观的描述,包括在校时长的行为分配,比如写论文、娱乐与休闲、上课和社会实践项目各自花费的市场占比,同时也直观的地展示使用者校园卡消费的总金额和刷卡总次数,以及使用趋势和整体排名,通过上升或者下降的箭头更直观地展示。7 .大学轨迹模块大学轨迹模块主要分为今日新增、历史累积、分布呈现和排名查询几个功能,分别展示检测到的使用者当日行走轨迹和其他相关信息,并且以过去的信息累加形成历史累计模块。这一模块同样支持模糊查询和排名比对,能够让学生更好地了解自己的大学轨迹在整体学生中的排名和分布,也有利于后续进行针对性的调整或者安排休息。(四)功能优化React组件生命周期是指在系统运行时,组件实例
43、从类的创建及实例化开始,到组件的留存阶段,再到组件的销毁阶段,这个过程被称作是React组件的生命周期。在原有的React组件生命周期模型基础上,加入了数据请求模块,解决组件在数据请求和异步管理上存在的复杂控制问题。具体的改进做法是在React组件的getDefaultProps和getlnitalState阶段引入Fetch和Promise模块,让React组件在创建初期就拥有与服务端交互通信的能力,并将通信获取的数据用于组件内部State和Props的初始化存储。同时利用Proimse的异步控制机制,将返回的数据结果按照组件的依赖顺序传递给子组件,传递的方式需要使用React组件中的Pro
44、ps参数。在React组件的COmPonentWillMOUnt阶段(预渲染阶段)引入Fetch和Promise模块,并与数据请求的事件进行绑定,这样当组件在触发交互事件时,就能立刻调用fetch()方法获取网络数据。在React组件的ComponentWi1IUnniount阶段(销毁阶段)需要将挂载在组件上的事件进行注销处理,并对销毁后的数据进行管理,因此也需要引入Fetch和PromiSe模块。这样不仅能够保留组件在与用户进行交互操作时所产生的历史数据,而且对资源定位以及数据追踪都有极大的帮助。另外,Fetch在获取数据时,需要对相关的网络参数进行设置,获取数据后将数据结果通过计算转化为
45、Promise对象,从而进一步采用异步管控机制对异步操作进行处理。利用Promise对象状态的变化来管理整个Fetch的数据请求过程,从本质上分离异步数据获取和业务逻辑之间的关系,并且解决了异步回调函数层层嵌套的问题,这使得组件对于异步操作的控制变得更加容易。从宏观的角度来分析改进的React组件生命周期模型可以发现,实质上是向原始的React组件模型中嵌入了由Fetch和Promise封装的数据请求模块。由于该模块属于独立的功能部分,并且已经被ES6语法与各种主流浏览器所支持,所以这种嵌入方式不仅具有良好的兼容性以及跨浏览器和跨平台的特性,而且不会影响到原有React组件生命周期模型各个阶段
46、的执行,因此这种模块嵌入的方式是完全有效的。在创建React组件时,完全可以采用原有的设计思想进行开发,但不同之处在于开发后的组件拥有了数据请求原生模块,因此组件本身在数据初始化、事件触发和事件销毁阶段可以利用数据请求模块获取所需的数据,并对请求的过程进行异步控制。组件的意义在于复用,在对组件内部生命周期进行改造后,要让组件具有独立性和复用性,就需要完成封装和打包工作。组件在构建的过程中会产生很多资源文件,并且资源文件的类型也可能各不相同,例如由JSX语法创建的JS.CSS等代码文件,或是图片、音频、视频、txt等静态文件。这些资源文件需要进行科学合理的打包封装。利用Webpack打包工具将组
47、件中不同类型的资源文件转换为Webpack能够处理的有效模块。再通过进一步的压缩优化处理,最终整合出所有的组件依赖资源。这样不仅能够减轻组件实例的体量,而且使组件统一规范化。鉴于组件包含多样化资源文件,以及Webpack对于不同类型文件的编译和压缩特点,将Webpack作为组件构建后期的打包工具,是完全可行的。这不仅解决了组件内部结构繁杂的缺陷,还为组件的调用及维护提供了统一标准。五、结束语本文以高校毕业生在校期间的各类情况,包括学习记录、食堂消费情况、体院馆和体能测试情况以及其他信息,通过大数据技术形成高校毕业生个人的“毕业账单”,具有较强的实践意义和指导作用。在大数据时代,高校作为培养高素
48、质人才的重要场地,更应该充分意识到高新技术的价值和作用,积极勇敢地探索包含大数据技术在内的多项技术在高校的运用。特别是要把冗余、落后、繁杂的数据进行整理和归纳,为后续发展奠定坚实基础。具体来说,本文所提出的“毕业账单”,完全基于学生个人的生活、学习和消费行为,具有针对性和特异性,基于此产生的相关分析也完全能够作为学生制定未来计划的指导和参考,帮助学生更好地规划自己的生活。参考文献1郝胜宇,陈静仁.大数据时代用户画像助力企业实现精准化营销J.中国集体经济,2016,000(004):61-62.2吴苏倪.基于微博的大数据用户画像与精准营销UL现代经济信息(16).3袁章帅.基于大数据驱动下大学生个人信用画像构建研究UL营销界,2019(13):112-113.孙秋莲.基于大数据的农产品电商用户画像系统的设计和应用UL山西农经,2019,246(06):102.5徐璐瑶,姜增祺,黄婷婷,etal.基于大数据的用户画像系统概述J.电子世界,2018.6许志强,徐瑾钮.基于大数据的用户画像构建及用户体验优化策略J.中国出版,2019,455(06):54-58.7Sar