《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx

上传人:李司机 文档编号:7016867 上传时间:2024-04-12 格式:DOCX 页数:4 大小:29.49KB
返回 下载 相关 举报
《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx_第1页
第1页 / 共4页
《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx_第2页
第2页 / 共4页
《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx_第3页
第3页 / 共4页
《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx》由会员分享,可在线阅读,更多相关《《Spark大数据技术与应用案例教程》教案第23课实时统计逾期还款的用户数量.docx(4页珍藏版)》请在三一办公上搜索。

1、课题实时统计逾期还款的用户数量课时2课时(90min)教学目标知识技能目标:(1)掌握自动生成数据源的方法。(2)使用DStream的不同操作分析数据。素质目标:综合应用所学知识,提升归纳总结能力和实践能力.教学重难点教学重点:使用DStream的不同操作分析健教学睚点:实时统计数据教学方法案例分析法、问答法、讨论法、i井授法教学用具电脑、投影仪、多媒体课件、教材教学过程主要教学内容及步骤课前任务【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务请大家回顾前面所学内容.【学生】完成课前任务考勤【教师】使用APP进行签到【学生】班干部报请假人员及原因问

2、题导入【教师】提出以下问题:如何统计实时数据?【学生】思考、举手回答课程实践【教师】描述和分析本次任务内容,并详细演示任务操作过程,弓I导学生操作【任务描述】使用SparkStreaming实时统计逾期还款的用户数量,有助于银行更好地管理业务。如果逾期还款的用户数量增加,银行可以迅速调整管理策略,提高监管强度,从而最大程度地减少损失。本任务先以银行个人信贷业务数据为基础,自动生成数据源;然后使用SparkStreaming实时统计逾期还款的用户数量。1.自动生成数据源【任务分析】本任务先设置每隔10秒从CreditCarcLdataiSV文件中随机获取100行数据并写入新的日志文件中,然后将新

3、生成的日志文件存放在新建的7usr/local/spark/mycode/CreditCard/credit_dataH目录下。这样做便可以自动生成数据源。打开PyCharm,在CreditCard目录下新建MsgProducepy文件,然后在该文件中编写应用程序,自动生成幡源。实现步骤如下。步骤1定义generateOgjlleo函数。步骤2在函数内部,定义两个变量log_file_directory和da(a_file_paih,分别表示存储日志文件的目录和数据文件路径。步骤3A在函数内部,使用无限循环whileTrue不断生成日志文件。(详见教材)【参考代码】importtimeimpo

4、rtrandomdefgenerate_log_file():#存储日志文件的目录和数据文件路径log_file_directorr=/usr/local/spark/myco=l).count()overdue_count_60_89=df.filter(dflTime60-89=l).count()overdue_count_90=df.filter(dfTimes90=l).count()# 输出逾期不同天数还款的用户数量Prin1(逾期3059天还款的用户数量:overdue_counl_30_59)PrinI(逾期6089天还款的用户数量:(overdue_counl_60_89)P

5、rinI(F逾期90天以上还款的用户数量:(overdue_count_90)# 将ProCeSs_stream函数应用于Iog_Slream中的每个RDDlog_stream.foreachRDD(process_s(ream)# 输出数据流中的内容和逾期不同天数还款的用户数量Iog-Stream.pprint()# 启动StreamingContext对象ssc.start()# 等待StreamingContext对象终止ssc.awaitTermination()【运行结果】在PyChann中运行代码,控制台输出数据流中的内容和逾期不同天数还款的用户数量,如图7-7所示。Time:20

6、23。82823:25:2811454r74r425,rr,fer8.01l96387r.41919583,13,169515628216,1,8,2,。,C.3731285,.3746367,11,244261,38,5143,2r,rr,.9999999,.A9825389,Irl124612,45r783,lferferer.Gie552862,.e86674195f25fl13673r61r94l,lf,.27968822,.198893852,14,242e85,32,8ever,erere,0.663293468fe.l936e8,12,l147596,47,89,lf,.,.28

7、1278826,8.235591587,11.117488,25,37fr,j.855568929i.l74961,5r91487,71.583.0,0,8,0,8,8.245418681,.285611882,11,64394,28,5,f,.7456714i.153369326,6r法期3。59天还款的用户敛鼻:7逾朗6B89天迁软的用户故量:8泳期98天以上还款的用户敛员:5图7-7数据流与实时统计结果【小提示】运行StreamingAnaIysispy文件之前,请确保MsgProducepy文件处于运行状态。【学生】认真聆听,按照要求进行操作,如遇问题可询问老师【教师】巡堂辅导,及时解决学生遇到的问题课堂小结【教师】简要总结本节课的要点实时统计逾期还款的用户数量的操作【学生】总结回顾知识点作业布置【教师】布置课后作业请根据课堂所学知识,课后自己尝试实时统计数据的操作。【学生】完成课局王务教学反思

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 生活休闲 > 在线阅读


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号