电商销售数据分析.ppt

上传人:仙人指路1688 文档编号:2901953 上传时间:2023-03-01 格式:PPT 页数:33 大小:763KB
返回 下载 相关 举报
电商销售数据分析.ppt_第1页
第1页 / 共33页
电商销售数据分析.ppt_第2页
第2页 / 共33页
电商销售数据分析.ppt_第3页
第3页 / 共33页
电商销售数据分析.ppt_第4页
第4页 / 共33页
电商销售数据分析.ppt_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《电商销售数据分析.ppt》由会员分享,可在线阅读,更多相关《电商销售数据分析.ppt(33页珍藏版)》请在三一办公上搜索。

1、1,电商销售记录分析 严智强、贺强、刘瑞、崔亚松、臧茹歌,2,Background,3,Contents,4,淘宝网作为国内第一大电商,占有近50%市场份额,而天猫商城则是所有优质店铺的集合,每月会产生大量销售数据,这里以天猫近一个月的手机销售数据进行分析,找出这些数据隐含的价值。,天猫手机销售数据分析,5,天猫手机销售数据分析,数据的获取与预处理,替代商品的挖掘,价格空洞的发现,6,数据的获取与处理,天猫销售数据分析,7,构建一个爬虫脚本,从天猫上获取销量前600的手机销售记录,并匹配出每条记录的机型、售价、销量。,How to get the data,8,爬虫脚本,#coding=gbk

2、import urllibimport ref1=open(rE:tmaoshoujihtml.txt)#此处存储了销量前600的网页地址http=f1.readlines()f1.close()f2=open(rE:tmaoshouji.txt,a)for i in http:content=urllib.urlopen(i.strip().read()f2.write(content)f2.write(n)f2.write(#*50)f2.write(n)f2.close()f3=open(rE:tmaoshouji.txt)lines=for line in f3.readlines()

3、:lines+=line.strip()f3.close()pattern=r.*?target=_blank title=(.*?).*?(.*?)result=re.findall(pattern,lines)f4=open(rE:tmaoshoujiInformation.txt,w)#该文件中存储了每件手机的记录(机型、售价、销量)for item in result:for j in range(3):f4.write(itemj)f4.write(t)f4.write(n)f4.close(),天猫销售数据分析,9,销量价格 散点图,10,天猫销售数据分析,替代商品的挖掘,我们认为

4、,如果两件手机的售价和销量十分接近,则认为这两件手机互为替代商品。从网络营销的特点来看,从店铺的角度出发,选择进价更低的手机可获得更多利润。,11,替代商品的挖掘,天猫销售数据分析,我们以欧氏距离小于等于2为标准sqrt(a.price-b.price)2+(a.sales_number-b.sales_number)2)=2将手机聚类,找出互为替代的手机。,12,替代商品的挖掘,天猫销售数据分析,from _future_ import divisionfrom math import sqrt#coding=gbkf1=open(rE:tmaoshoujiInformation.txt)r

5、ecords=f1.readlines()f1.close()price=number=product=for i in range(len(records):item=recordsi.split(t)price.append(item0)product.append(item1)number.append(item2)for i in range(len(price):for j in range(i+1,len(price):distance=sqrt(pow(float(pricei)-float(pricej),2)+pow(int(numberi)-int(numberj),2)i

6、f distance=2:#if the distance minuse 2,we consider the two is replaced product print producti,t,productj else:pass,13,所得结果,结果发现,下列每一组中的手机互为替代商品(a)UMO/优摩 w9220 Yusun/语信 T28(b)Huawei/华为 C8812 ZTE/中兴 N807(c)OPPO U705T TCL Y910T(d)Coolpad/酷派 8150D ZTE/中兴 V889D(e)K-Touch/天语 E800 UMO/优摩 W800 七喜 TD710(f)UM

7、O/优摩 W800 七喜 TD710 Konka/康佳 E5680(g)UniscopE/优思 U1201 Huawei/华为 Y300-0000(h)Coolpad/酷派 8050 Coolpad/酷派 E239(i)Motorola/摩托罗拉 XT800 索爱正品SA-I960 安卓4.0(j)Coolpad/酷派 8020 Haier/海尔 HT-I600(k)七喜 H750 Gionee/金立 C620(l)Lenovo/联想 A790E 广信 ef58(m)Huawei/华为 c8810 Samsung/三星 s6108(n)AUX/奥克斯 V930 TCL Y710(o)Phili

8、ps/飞利浦 W8355 ONN/欧恩 V8 16G版(p)TCL Y710 Gionee/金立 GN705w,天猫销售数据分析,14,天猫销售数据分析,价格空洞的发现,经过分析,我们发现,作为中高端机营销,可选择3500-4000的价格空洞。可在较小压力下打入市场。,15,京东商城销售数据分析,牛仔裤销售数据分析,用户消费记录的分析,从生产厂家的角度来说,如果得到大量消费者的尺码大小及颜色偏好,则对生产和销售是非常有利的。因此,我们统计了京东女性牛仔裤的销售记录,从中得到各尺码和颜色在总的销售数据中的比例,从而指导生产。,通过用户的消费记录,分析出用户的喜好品牌,从而当该品牌有新产品推出和促

9、销活动时优先推荐给这些用户。,16,牛仔裤销售数据分析,用户尺码大小 颜色偏好,17,数据获取与预处理,以爬虫程序从京东商城获取牛仔裤销售记录,并过滤出每个用户所购买的颜色、尺码。,18,数据获取与预处理,京东商城销售数据分析,#coding=gbkimport reimport urllibpage=16,16,16,16,16,16,16,16,15,15,15,15,15,15,15,14,14,14,14,14,13,13,13,13,13,13,12,12,12,12,12,12,12,12,12,12#page记录了每件商品的评论页面数目f1=open(rC:UsersYANZHI

10、QIANGDesktopjdongNiuZaiKuAdd.txt)#goods存储商品评论地址goodslist=f1.readlines()f1.close()s1=rE:jdongniuzaikupinglunAdds3=.txtfor i in range(0,len(goodslist):for j in range(1,pagei+1):content=urllib.urlopen(goodslisti.strip()+str(j)+-0.html).read()print goodslisti.strip()+str(j)+-0.html save=s1+str(i)+s3 f2=

11、open(save,a)f2.write(content)f2.write(goodslisti.strip()+page+str(j)+downloaded n)f2.write(#n)f2.close()s1=rE:jdongniuzaikupinglunAdds3=.txt,19,数据获取与分析,for i in range(0,35):s=s1+str(i)+s3 f=open(s)lines=for line in f.readlines():lines+=line.strip()f.close()color=r颜.*?色:(.*?)size=r尺.*?码:(.*?)date=r购买

12、日期:(.*?)multiColor=re.findall(color,lines)print file,i,has,len(multiColor),color recordsn multiSize=re.findall(size,lines)print file,i,has,len(multiSize),size recordsn multiDate=re.findall(date,lines)print file,i,has,len(multiDate),date recordsn f1=open(s1+str(i)+color+s3,w)for c in multiColor:f1.wr

13、ite(c)f1.write(n)f1.close()f2=open(s1+str(i)+size+s3,w)for s in multiSize:f2.write(s)f2.write(n)f2.close()f3=open(s1+str(i)+date+s3,w)for d in multiDate:f3.write(d)f3.write(n)f3.close(),京东商城销售数据分析,20,用户尺码大小与颜色偏好挖掘,#coding=gbkimport rename=白,黑,粉,枣红,酒红,大红,红,紫,绿,杏,黄,棕,宝蓝,彩蓝,海蓝,深蓝,浅蓝,灰蓝,中蓝,天蓝,墨兰,墨蓝,藏蓝,蓝

14、,橙,灰countColor=0*i for i in range(len(name)f1=open(rE:jdongallNiuZaiKuColor.txt)color=f1.readlines()f1.close()for j in color:for k in range(0,len(name):if re.search(namek,j):countColork=countColork+1 break f2=open(rE:jdongcolorSummary.txt,a)d=dict(zip(name,countColor)for key in d.keys():f2.write(str

15、(key)+t+str(dkey)f2.write(n)f2.close()daxiao=str(i)for i in range(10,36)countSize=i*0 for i in range(len(daxiao)f3=open(rE:jdongallNiuZaiKuSize.txt)size=f3.readlines()f3.close(),21,用户尺码大小与颜色偏好挖掘,for a in size:for b in range(0,len(daxiao):if re.search(daxiaob,a.strip():countSizeb=countSizeb+1 break e

16、lif re.search(XS$,a.strip():countSize14=countSize14+1 break elif re.search(S$,a.strip():countSize15=countSize15+1 break elif re.search(M$,a.strip():countSize16=countSize16+1 break elif re.search(L$,a.strip():countSize17=countSize17+1 break elif re.search(XL$,a.strip():countSize18=countSize18+1 break

17、 elif re.search(XXL$,a.strip():countSize19=countSize19+1 break elif re.search(XXXL$,a.strip():countSize20=countSize20+1 break else:breakf4=open(rE:jdongsizeSummary.txt,a)d2=dict(zip(daxiao,countSize)for key in d2.keys():f4.write(str(key)+t+str(d2key)f4.write(n)f4.close(),最后得到33,098条牛仔裤的颜色、尺码等销售信息。,2

18、2,用户尺码大小与颜色偏好挖掘,23,用户消费记录的分析,数据的获取 用户品牌偏好的分析,京东商城销售数据分析,24,数据的获取,利用爬虫程序,获取用户消费记录原始html代码,并过滤出记录数大于30的用户的消费消费记录。,25,数据的获取,京东商城销售数据分析,from _future_ import division#coding=gbkimport mathimport urllibimport res1=rE:jdonguseruser_firstpages3=.txtf=open(rE:jdonguseruserPingLunShuDaYu30.txt,a)for i in rang

19、e(1000000,1008594):yuanshifile=s1+str(i)+s3 f1=open(yuanshifile)lines=for line in f1.readlines():lines+=line.strip()f1.close()n=r评论数:(d+)条 commentNumber=re.findall(n,lines)if commentNumber:if int(commentNumber0)29:f.write(id+str(i)f.write(t)f.write(commentNumber0)f.write(n)f.flush()else:pass,26,数据的获

20、取,else:pass print user,i,got itf.close()f1=open(rE:jdonguseruserPingLunShuDaYu30.txt)user=f1.readlines()f1.close()h1=rhttp:/con in user:sub=con.split()num=sub0 f2=open(s1+str(num)+s2,a)page=math.ceil(int(sub1)/30)for i in range(1,int(page+1):html=h1+str(num)+h2+str(i)+h3 record=urllib.urlopen(html).

21、read()f2.write(record)f2.close(),京东商城销售数据分析,27,用户品牌喜好分析,京东商城销售数据分析,#coding=gbkimport reimport osf1=open(rC:UsersYANZHIQIANGDesktopbrand.txt)brand=f1.readlines()f1.close()d=for i in brand:di.strip()=0s1=rE:jdongkehucustmers2=BrandStatistic.txtf3=open(s1+final+s2,w)#save the records for item in os.lis

22、tdir(rE:jdonguser):,28,用户品牌喜好分析,for item in os.listdir(rE:jdonguser):if item.endswith(goods_records.txt):s=str(item)Id=re.search(d+,s).group()f2=open(rE:jdonguser+/+str(item),r)lines=for line in f2.readlines():lines+=line.strip()f2.close()f3.write(Id+t)for key in d.keys():dkey=len(re.findall(key,lin

23、es)if dkey=5:f3.write(str(key)+str(t)+str(dkey)+str(t)else:pass f3.write(n)f3.close()f4=open(rE:jdongkehucustmerfinalBrandStatistic.txt)arry=f4.readlines()f4.close()f5=open(rE:jdongkehubrandRecomendation.txt,w)for i in arry:if len(i.split()=2:f5.write(i)else:passf5.close(),京东商城销售数据分析,29,消费记录统计结果,经过过

24、滤,我们共得到939个用户的消费记录。对每个用户各自所购商品的品牌进行统计若某个用户购买某个品牌产品次数不低于5则记录该用户编号及该品牌。,30,共得到546个用户的喜好品牌,ID 品牌 1000007三星51000015爱普生5联想161000017亨氏10德力西51000018迪士尼5惠普51000026铼德6闪迪7,31,困难与问题,程序语言对中文的处理能力一般,关联分析的困难,用户评价的分析,32,展望,我们认为,京东与淘宝不同的是,一般情况下京东的商品大部分都是自己配送,而不是通过其他物流公司。所以,建立更加快捷高效的物流体系不仅可以节约运输成本,还可以给客户提供更加快捷优质的服务。利用已有的销售数据,完全可以对货物的分配、存储以及送货点的布局进行精确布控,从而实现智能物流。,33,Thank You!,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 建筑/施工/环境 > 项目建议


备案号:宁ICP备20000045号-2

经营许可证:宁B2-20210002

宁公网安备 64010402000987号