《数据处理与智能决策论文.docx》由会员分享,可在线阅读,更多相关《数据处理与智能决策论文.docx(17页珍藏版)》请在三一办公上搜索。
1、广州商学院数据处理与智能决策课程论文题 目:数据挖掘与智能决策大数据中商铺选址问题姓 名:曾柏树学 号:201306114414院名:信息技术与工程学院专业班级:商业软件2班指导教师:孔宇彦2016年5月9日目录1、绪论11.1研究背景11.2研究的意义21.3研究工具32、数据分析选址研究与应用32.1 Big Data Lab 数据分析:32.2慧选址数据分析(以餐饮快餐行业选址为例)73、总结和展望11参考文献:121、绪论“大数据”的定义是可以归纳为4个V:海量的数据规模(volume)、快速 的数据流转和动态的数据体系(velocity)、多样的数据类型(variety)和巨大 的数
2、据价值(value)。利用大数据时代的对目标地段的位置,是否是热门商圈, 离居民区、学校、商业区的距离,还有调查人流量、交通方式等等数据分析挖掘, 期间还要面临种种情况导致信息不对称情况,数据挖掘技术在大数据时代中为商 铺选址带来了他们的答案。关于商铺选址,派人深入该地实地调查应该是最笨的土办法。而当将范围扩 展至全国百余城市的重点商业圈时,个人和小团队仅凭商业直觉和有限的知识是 远远不够的。这从而推动了利用商业地理数据进行商业选址及消费者地理细分的 普及。但目前市面上已有基于数据驱动的选址方案同样也存在一定问题,一般是 通过人群密度或者人群画像,来观察可能的消费者的分布。但是人群密度大的地
3、方,并不代表潜在的消费者分布也多;同样,人群画像的属性也难以准确表达用 户对具体位置服务的需求。1.1研究背景大数据首先要考虑的应该是“大”一一海量的数据规模。谷歌执行董事长艾 瑞克.施密特曾说,现在全球每两天所创造的数据量等同于从人类文明至2003 年间产生的数据量的总和。而具体到企业应用领域,漫无边际、浩如烟海的数据 对企业并无意义,日立数据系统公司(HDS)副总裁兼CTO Hubert Yoshida表示, 数据量的“大”是相对而言的概念,对于像SAP的HANA那样的“内存数据库” 来说,能把2TB的数据用好就是胜利;而对于像谷歌这样的搜索引擎,EBC1024 X1024 TB)的数据量
4、才能称得上是大数据。海量数据的危机并不单纯是数据量的爆炸性增长,它还牵涉到数据类型的改 变。原来的数据都可以用二维表结构存储在数据库中,如常用的Excel软件所处 理的数据,称之为结构化数据。但是现在更多互联网多媒体应用的出现,使诸如 图片、声音和视频等非结构化数据占到了很大比重。有统计显示,全世界结构化 数据年增长率大概是32%,而非结构化数据则是63%。2012年,非结构化数据占 有比例已经达到互联网整个数据量的75%以上。而产生智慧的大数据,往往是这 些非结构化数据。大数据是指无法使用传统和常用的软件技术和工具在一定时间内完成获取、 管理和处理的数据集。进一步,当今“大数据”一词的重点其
5、实已经不仅在于数 据规模的定义,它更代表着信息技术发展进入了一个新的时代,代表着爆炸性的 数据信息给传统的计算技术和信息技术带来的技术挑战和困难,代表着大数据处 理所需的新的技术和方法,也代表着大数据分析和应用所带来的新发明、新服务 和新的发展机遇。在商业社会中,“从数据中得到价值”一直都不是什么新鲜的东西,但是当 大数据时代到来,经济的新增量逐渐显露出来。尽管数据挖掘从“啤酒与尿布” 开始做了几十年,但是“大数据”与我们通常所说的“数据”还是有显著的不同。由于大数据处理需求的迫切性和重要性,近年来大数据技术已经在全球学术 界、工业界和各国政府得到高度关注和重视,全球掀起了一个可与20世纪90
6、 年代的信息高速公路相提并论的研究热潮。美国和欧洲一些发达国家政府都从国 家科技战略层面提出了一系列的大数据技术研发计划,以推动政府机构、重大行 业、学术界和工业界对大数据技术的探索研究和应用。1.2研究的意义对于快餐连锁店,能够对比各种各样的数据,了解车流量、消费群体分布、 安全信息、商业构成以及其它相关信息,可以帮助他们在决定门店选址中节省大 量的开支。从全球范围来看,采用商业地理数据进行商业选址及消费者地理细分在发达 经济体已经非常普及。为更精准地服务不断升级的中国消费者,宜家家居、麦当 劳、星巴克等专门成立了商业地理分析团队,来指导其在中国的店铺选址。麦肯 锡的“解读中国”商业地理分析
7、团队亦感受到来自客户方越来越强烈的需求。1.3研究工具Big Data Lab (百度大数据实验室)通过分析时间、空间、网点、交通便利 程度、竞争对手情况等等因素,结合用户需求,告诉用户开店地点。慧选址在网站上提供了一个以上海为试点,可供展示的beta体验版系统。 可以快速直观地看到店铺的信息、商品购买分布热度。而在这背后,是多到难以 想象的数据在做支撑。实地考察的兴趣点、网民行为、消费能力、消费习惯、人 口、经济数据、小区、房屋、商圈面数据在这种种海量数据作支撑的基础上, 慧选址构建了一套精准的选址分析模型,可以快速准确的分析出什么类型的店开 在什么地方可以挖掘最大的用户群体。2、数据分析选
8、址研究与应用2.1 BigDataLab 数据分析:下面是一份研究的是星巴克和海底捞未覆盖地区的用户对这两家店的需求 分析的数据如图1-1所示日职距离(km)图1-1图一:对比一周的需求,顾客们在周末对海底捞的需求高过星巴克。图二:在一天之内,午后星巴克顾客更多。图三:七成星巴克消费者一般选在附近1公里,而吃海底捞一般需要跑更远 的距离(大约3公里)。Big Data Lab (百度大数据实验室)要做的就是通过分析这些时间、空间、网点、交通便利程度、竞争对手情况等等因素,结合用户需求,告知开店地点。数据经过大数据进一步处理,就得到下图1-2图1-2现有网点未覆盖的用户需求分布热力图,红色的点表
9、示现有的海底捞火锅店 的位置。选址优化模型计算出的新网点候选位置,如图1-3气泡标示。图1-3用大数据测算结果跟实际地址对比一下。水滴标记是初算的地址,小圆点是 第二、三步复算出的地址,大圆点是最终的建议选址,图1-4所示。图1-42.2慧选址数据分析(以餐饮快餐行业选址为例)基于大数据的前提,慧选址基于大量的消费者行为和搜索数据,可以让店铺 的经营变得越来越清晰。它从受众洞察、受众定位、受众接触到受众转化几个步 骤,每一步都提供精准细致高效经济的数据引导,从而实现大众创造的C2B,即 由用户需求决定店铺的日常经营销售决策,最终为你的店铺提出针对性的经营建 议,而不仅仅是在最初的位置选址上。管
10、中窥豹,结果背后是由海量的数据和高 精准的复杂模型在做支撑。慧选址的核心价值是大幅度降低了传统开店模式下选址的时间和精力成本。 可以再结合线下调研,从而得到更精确的结果。如图2-1选址为例,已瞄绿新版体验大众制图企业服务 我的慧选址欢迎您:大树科技 退出*彭浦镇政府,勺桃浦镇政府如,育馆5路街31I平公园定海岫广中路街晅四川北路山道上海西站却兴荣温真如镇政府桥镇政府长征镇政审K育馆您1上海国丰酒店倒浦东新区政府,老西门街道新浸旗政府新浸村,上海动物园世博公园虹桥琪政府同福村杨浦区人民政府,东政法大 御长宁校区虹口区人 民政府七海站 I 闸北区政点上海科技馆*纪公园大桥街道江淄路街道J条园 归云
11、观热力图例:关注用户T8猝肋冲曜粽曲银多拜用户非:图2-1图中热力图例红点表示关注人数非常多,餐饮选址应该选在0.5到3公里之间红点数量多的地方,考虑到交通方面,以及餐饮业的分布,(图2-2)分析:商品概览?周边商品分析结果共计3061家店浦快餐简餐江西菜川菜小茏粥店 清真菜 小龙虾火锅一一西北菜韩国料理日本料理 东南丑菜 自助餐湘菜 东北菜小吃烧烤海鲜 安徽菜 闽菜 创意菜 锅贴 山东菜 北京或 麻楝烫生前面谊愠饨贵州菜白斩鸡台港荣熟食其他新疆菜包子本帮江浙菜饺子寺-食图2-2周边人群消费水平分析(图2-3):周边店铺人均消费情况共计167。家图2-3结合周边配套分析(图2-4)周边朝套?周
12、边配套分析结果数据统计53图2-4以及选址位置不利因素,公厕等(图2-5)所?名称蹈(球)图2-5从大数据分析选址位置人群消费时间,目的能让快餐店适时调控高峰时期(图 2-6)周边竞品周边关注周边商销客卢分析根据您塑的行业r对该行业感兴趣的网民行业进行分析:时间段图2-6综合数据分析,选址位置评分(图2-7)升店规则臼天人匚:30%晚上人匚:30%消巷主方:二民上海闸北区中兴绿地评分:76上海静安区建行西康踣支行评分:衽上海徐汇区靠在冠点评分:衽图2-73、总结和展望从大数据分析店铺选址上,可以看出地理信息系统(GIS )利用数据分析与 决策软件,在商业地理扮演着不可或缺的角色。地理信息产业在
13、中国方兴未艾。近年来,提供地理信息系统、数据和服务的 公司呈现出跨越式增长。从地图测绘和遥感影像获取,到地图加工并构建地理信 息数据库,再到数据的批发与零售,一个完整的地理信息产业链已经形成。借助 成熟的GIS软件,通过图形化的二次开发界面,商业地理分析员可以根据客户需 求快速地进行定制分析。最大的赢家将是站在产业链顶端的定制商业地理分析产品的提供者。商业地 理分析产品将涵盖:选址分析、销售区域分配、配送路径优化、潜在消费者空间 分布、城市规划等。其中,如前所示的选址分析应用最广最深,涉及经济环境分 析、交通条件分析以及竞争/互补店分析,称其为商业地理的灵魂亦不为过。几乎所有的行业都需要商业地
14、理分析:银行、快消、电信、医药、航运、家 具等等,即便是电子商务这样虚拟的行业,也需要商业地理的帮助,来判断消费 者的地理分布以及不同地区消费者的特点,从而有的放矢地发布网络或者平面广 告,抑或根据不同地区制定相应战略。物流公司更是离不开商业地理分析的统筹 规划,通过与全面系统的商业地理信息数据库相结合,传统的运筹学焕发出新的 活力。从商业地理的全球实践来看,发达经济体可以将地理信息成熟运用于商业的 各个环节,在印度、印尼这样的新兴经济体中,地理信息技术也日益得到重视。相比国外完善的商业地理数据服务,目前在中国,地理信息数据的可获取性、 准确性和全面性仍然制约着中国地理信息产业的发展。能够提供
15、商业价值较高的 街道及以下层次(如街道、邮编区域、居委会乃至小区)边界的地图供应商极为 稀少,与之相配套的数据,如人口、收入、消费、住房房价和商业楼盘的租金, 也不易获取。在二线以下城市,边界地图数据可能要从各地测绘机构零散地加以 收集,获取覆盖全国的数据非常困难。过去几年,在麦肯锡全球商业地理分析团队的帮助和多方努力下,我们已经 构建了深入到街道级别的地理信息数据库,涵盖近千万的商业信息点,并已经应 用于数十个客户项目的分析中,在中国处于领先地位。目前,全国人口普查数据、 房价数据都已经整合进入这一空间数据库,更细层次(如居委会等)的数据整合 工作正在进行中。正如大数据改变着世界一样,地理坐标数据分析将推动新一轮大数据的进 化。前瞻未来,也许重要的变革机遇就蕴藏在商业地理分析中。参考文献1. 中国视角:大数据与商业地理分析 大数据邦2. 慧选址: