《基于百度用户关注度的电影票房分析.doc》由会员分享,可在线阅读,更多相关《基于百度用户关注度的电影票房分析.doc(5页珍藏版)》请在三一办公上搜索。
1、基于百度用户关注度的电影票房分析刘佳霖1,张爱华1,段婧2(1. 北京邮电大学经济管理学院,北京 100876;5101520253035402. 航天信息股份有限公司,北京 100195)摘要:通过对 2010-2011 年国内上映的部分电影与其百度用户关注度进行基于总体的相关性分析和单个电影的历史票房与搜索量的相关性分析。本文研究发现,无论从总体上还是单个电影上,电影的票房与百度用户关注度之间存在显著的相关关系,最后提出一些互联网搜索量应用的思考。关键词:统计分析;关性分析;百度用户关注度;电影票房中图分类号:C812Study On Movie Box Based On Baidu Us
2、er AttentionLIU Jialin1, ZHANG Aihua1, DUAN Jing2(1. Economics and Management School, Beijing university of posts and telecommunications,Beijing 100876;2. Aerospace information co.LTD, Beijing 100195)Abstract: With some movie box office from 2010 to 2011 in china and the relative baidu userattention
3、, this paper has done correlation analysis between the total box office and the Baidu userattention and the correlation analysis between the history box office and the relative user attention.The study shows that the films box office has a significant correlation with the baidu userattention, Finall
4、y ,the study puts forward some internet search volume application thinking.Keywords: Statistical analysis; Correlation analysis; Baidu user attention; The movie box office0 引言随着互联网的不断发展,网络世界对现实世界的影响也越来越大。在互联网中,我们可以迅速地获取信息、开展电子商务或者进行各种娱乐活动等。截止到 2012 年 6 月底中国网民数量达到 5.38 亿,普及率达到 39.9%。搜索引擎的用户达到 4.29 亿,
5、网民的使用率达到79.7%1。搜索引擎的使用已成为人们网络生活密不可分的一部分。在互联网不断发展的同时,许多学者开始研究互联网中信息的应用。2007 年,谷歌公司推出一款基于谷歌搜索的应用,可以方便用户随时查询某些关键字在谷歌搜索中的用户搜索频次信息。Hyunyoung Choi,Hal Varian(2009) 2提出应用谷歌指数预测现实生活中的各种需求,如福特、雪弗兰、丰田等汽车的销售、房屋需求、各国旅游人数需求等,并且提出可应用谷歌指数进行各种科学研究。随后不久两位学者又应用谷歌指数进行失业率的预测,并取得了不错的预测效果。Nathaniel M. Schuster(2010)研究了谷歌
6、指数与立普妥和辛伐他汀两种药物销量之间的关系,发现两者之间存在显著的相关关系3。电影是一款与互联网关系非常强的产品,在电影的宣传途径中,互联网是一个必不可少的工具。电影公司通过互联网宣传电影的相关信息,让更多的消费者了解该电影,知道电影的背景信息及其他信息等,从而对电影产生兴趣。侯永翔,董禹含(2011) 4在探讨大学生电影消费特点时发现在大学生获取电影信息的来源(人际口碑、传统媒体、互联网、移动媒体)中,大学生对互联网的倚重程度比较高,互联网取代了传统媒体的优势地位。Yong Liu(2006)作者简介:刘佳霖,(1987-),男,硕士研究生,主要研究方向:信息管理与信息系统。通信联系人:张
7、爱华,(1964-),女,副教授,主要研究方向:统计、预测与决策分析。 E-mail:13501262266-1-5后的每周的票房和电影总票房进行预测。学者使用上映数、专家评论数、积极口碑数、负面口碑数等变量建立多元回归模型,研究口碑对电影票房的营销。研究发现口碑信息对电影未45505560657075来的票房具有很好的预测效果,这种预测的提升主要是体现在口碑的数量上,口碑的特性的解释效果不够显著。从以上学者的研究来看,互联网对电影具有一定的影响。1 数据来源1.1 电影票房数据本文的电影票房数据来源于艺恩咨询的门户网站艺恩网和时光网中国内地电影历史排行两个网站。艺恩咨询是国内首家娱乐产业研究
8、机构,提供包括市场调查、行业研究咨询、媒体会务等服务,服务于电影、电视剧、游戏、动漫、新媒体等领域客户。与艺恩咨询类似,时光网也是一个公布电影票房数据的网站,他不仅公布电影的历史排行,使我们能够轻松地了解到各个票房阶段的电影及其票房,还公布了一些最近即将上映的电影,以供参考。通过下载艺恩网提供的试用软件艺恩娱乐决策智库,本文获取到了中国内地历史排行榜前二十的各电影的历史票房数据,以此数据为基础,本文开展下一步的研究。同时由于研究的需要,本文需要的电影的票房数据较多,而艺恩娱乐决策智库上免费提供的电影数据有限,因此,以 6 月 1 日为截止日期,本文同时在时光网上获取 2010 年和 2011年
9、票房金额在 1 亿以上的电影的数据,以此数据位基础,开展本文的研究。1.2 互联网搜索量数据目前,互联网上公开提供搜索量数据的互联网产品有谷歌趋势和百度指数,本文选取百度指数作为互联网搜索量指数的来源,理由如下:在中国,百度搜索的应用比谷歌更广,2011 年百度的用户渗透率为 98.3%,而谷歌只有 43.3%6。因此,百度搜索比谷歌搜索代表的用户群更广。本文的票房数据选择的是中国内地的电影票房数据,百度指数是用以反映关键词在过去30 天内的网络曝光率及用户关注度。用户关注度是以数千万网民在百度的搜索量为数据基础,以关键词为统计对象,科学分析并计算出各个关键词在百度网页搜索中搜索频次的加权和,
10、并以曲线图的形式展现。电影的搜索关键字以电影名为主,例如:阿凡达的电影搜索量则是以“阿凡达”为关键字在百度指数上搜索所得的百度用户关注度。在研究中,电影的票房数据均是以周为单位,进行展示的。但电影的上映的首次上映并非都在周一,因此,第一周的数据可能并不是全周七天的电影播放数据。为了排除由于每周播放天数的不同,对电影票房造成影响。本文将所有的电影票房按每周天数,取一周平均值。相应地,电影的互联网搜索量也取周平均值。2 电影票房相关性分析Yong liu 分析了电影的票房数据和雅虎电影版中用户的口碑信息之间的关系。与该学者类似,本文将从总体和单个电影两个方面上分析电影的搜索量数据和票房之间的相关性
11、。2.1 总体电影票房相关性分析以每个电影的搜索量和票房为一个单位,本文将时光网上公布的 2010 年和 2011 年票房数据在 1 亿以上的电影票房数据和搜索量数据做散点图如下:-2-选取 40 部电影为基础,使用从雅虎电影版上获取的用户的口碑信息,对电影上映周及以8085图 1 总体电影票房与电影的互联网搜索量散点图Fig.1 The scatter diagram between Overall movie box office and film Internet search quantity从上图中,我们可以看出,大多数的电影的票房都在 2.5 亿以下,而电影的搜索量也在40 万以下
12、。同时,随着电影搜索量的增加,电影的票房也逐渐增加。应用 SPSS17.0 得知两者之间的 Pearson 相关系数为 0.641(P=0.000)。运用类似的方法,本文得到分年度和分区域的电影的相关性如下:表 1 2010 与 2011 年总体电影票房与电影互联网搜索量相关性表Tab.1 The correlation tables of general movie box office film and Internet search quantity in 2010 and 2011时间相关性数量2010 0.590 272011 0.692 3490表 2 国内外总体电影票房与电影互联
13、网搜索量相关性表Tab.2 The correlation tables between movie box office and Internet search quantityat home and abroad区域 国外 国内 相关性 0.858 0.737 数量 25 36 注:相关性的显著性水平均为 0.01。95从上面两个表中,我们可以看出,随着时间的发展,在同一显著性水平下,电影的票房数据与电影的搜索量之间的相关性越来越大,而国外电影的相关性较国内电影的相关性更高。电影的搜索量数据能够在一定程度上反应电影的总票房。2.2 个体电影票房相关性分析100电影在上映之前都会大力宣传,做
14、好上映前的准备工作。自上映后,广大用户会不断通过网上的各种渠道了解该电影的相关信息,为自己的观影作准备。以艺恩决策智库中国内地电影票房历史排行榜第一(截止到 2011 年 12 月)阿凡达为例,自 2010 年 1 月 4 日上映以来,其累计票房超过 13 亿人民币,自上映以来各周历史票房与周关注度之间的散点图如下:-3-105110图 2 阿凡达历史票房均值与均关注度散点图Fig2. The scatter diagram of the avatars mean box office and mean attention从上图中,我们可以看出阿凡达的票房与周关注度之间的散点呈现出从左到右倾斜
15、向上的关系,具有明显的线性关系。应用统计软件 SPSS17.0,得出两者的 Pearson 相关系数为0.886(P=0.000)。应用相同的分析方法,以 2012 年 5 月 1 日所得的艺恩决策智库中内地电影历史排行榜前 20 名的电影票房数据为基础。对电影的历史票房、观影人数和互联网搜索量之间的做相关性分析结果如下:表 3 各大电影票房和观影人数日均值与周关注度相关性表115Tab.3The correlation tables of each movies box office and weeks mean attention电影票房观影人数电影票房观影人数阿凡达0.886 0.867
16、加勒比海盗 4 0.919 0.927碟中谍 4变形金刚 3让子弹飞唐山大地震功夫熊猫 2金陵十三钗龙门飞甲0.7680.9960.6180.8970.9710.8020.9350.7740.9960.410.9050.9710.80.937盗梦空间变形金刚 2建国大业哈利波特与死亡圣器下建党伟业地心历险记赤壁上0.9090.9970.9850.9560.9270.9920.7760.9030.9970.960.9650.9880.796非诚勿扰 20.8660.878注:1.红色字体表示关系不显著,p=0.05;2.本表中包括 17 个电影的数据,其余的电影由于没有搜索量信息或数据不全未予列
17、示;从上表中,我们可以看出在历史票房排行版前的各大电影中,除让子弹飞外,无论是电120影票房还是观影人数,他们都与该电影的互联网搜索量数据有着密切的关系。在上表中,电影的票房和观影人数都与互联网搜索量数据有着显著的相关关系,说明互联网中的电影的搜索量数据能够很好地体现电影历史票房或观影人数的变化。另外,从表中,我们还可以看出,电影票房与电影互联网搜索量之间的相关系数同电影观影人数与电影互联网搜索量之间的相关系数相当,两者之间差值不大。-4-1251303 结论与讨论本文从电影的总体票房和历史票房上分析了电影票房与该电影在互联网上的搜索量之间的相关关系。研究发现,无论是总体还是个体,电影票房和电
18、影的互联网搜索量之间存在显著的相关关系,这就为电影票房的研究提供了一个新的方向运用互联网搜索量来对电影的未来票房进行预测。随着互联网的不断发展,互联网对现实生活中影响越来越大。他给予了我们一个获取信息快捷途径,而搜索引擎则是我们应用的工具。不止是电影,其他一些产品或服务,如旅游景点人数、汽车销量、手机的销量等都可以探讨互联网搜索量和实际销售之间的关系,进而探讨如何运用用户的互联网搜索量信息为企业的经营提供决策参考,未来是互联网的时代,也是搜索引擎的时代。135参考文献 (References)1 中国互联网信息中心.中国互联网络发展状况统计报告R.北京:中国互联网信息中心.2012:26-27
19、.2 Hyunyoung Choi,Hal Varian.predicting the present with Google trendsR.technical Report,Google INC,2009.3 Nathaniel M. Schuster, Mary A. M. Rogers, Laurence F. McMahon. using search engine query data to track140pharmaceutical utilization:a study of statinsJ.the American journal of managed care.16(8).2010:215-218.4 侯永翔,董禹含.大学生电影消费者信息搜索的特点J.传媒经济观察.1.2011:72-74.5 Yong Liu. Word of Mouth for Movies: Its Dynamics and Impact on Box Office revenueJ.journal ofmarketing.70.2006:74-89.6 中国互联网信息中心.2011 年中国搜索引擎市场研究报告R.北京:中国互联网信息中心.2011:18-19.145-5-