一、 课程总结

(一) Excel新增知识点:

1. 数据类型:字符串、文本、逻辑

2. left,right,mid,find,len函数的联用

3. vlookup函数:准确查找-第一个匹配到的值,模糊查找-最后一个匹配到的值

(二) 数据分析步骤:

7ad155343e1bb409fce585e7c2131eeb.png

(三) 数据清洗步骤:

5b64ae4808b4f42708824fcf64c05dc8.png

二、 小试牛刀

(一)明确问题

1. 销量好和销量差分别是哪些商品?

2. 销量好和销量差分别哪个时间点?

3. 用户复购情况如何?

4. 一级分类下二级产品的销量情况?

5. 用户的男女比例?

6. 用户的年龄分布?

7. 哪个性别的销量最高?

8. 哪个年龄段的销量最好?

(二)理解数据:字段释义 上篇文章已做说明

(三)数据清洗

对两表做原始数据存档,在复制表做数据清洗

72f6310cc901f59f25960b3a30645c38.png

表1数据清洗:

92b2d165144dd7e0457b3e9fe9c0600c.png

表2数据清洗:

e7fdcd2edf5177fcdcfaa4e2c1d19b37.png

(四)数据分析

1. 销量好和销量差分别是哪些商品?

3042bd3d297d7a405ce2c3056ba49818.png

2.销量好和销量差分别哪个时间点?

d2c080bd8f0cc420fa2e09f2460e48c8.png

3.用户复购情况如何?

07ce8c10d972ad36ec59928d50019741.png

4.一级分类下二级产品的销量情况?

12d60007672267de9bacf2b42cbb1b91.png

5.用户的男女比例?

3f785caf0e4d47b54f40b908684595c8.png

6.用户的年龄段分布?

ec806666f2a6be24cc01254593252aec.png

7.哪个性别的销量最高?

675a6bd91a283cd51d14214dea68a849.png

8.哪个年龄段的销量最高?

6c53e3c2034fe8e0753304ff5350db3f.png

对【购买数量】做Excel描述分析

a83166faf9c3ac407d7b9784ee305f50.png

总结:

1)从【购买数量】的描述分析看到,标准差较大,最大值最小值差距较大,说明销量的整体波动较大;而中位数、众数、平均数在1-2之间,说明大部分产品的销量主要集中在这个区间,少部分产品销售很好——可具体分析热销产品的特性,找到用户需求

2)问题2中可以看到2012-2014的销量是逐步增加的,但是2015年销量比2012年还低,追溯日期发现表格仅统计2015年两个月销量,其他年份则包含12个月销量,可以将2015年的两个月销量与其他三年同期销量对比,分析销量是否正常

同时认为在做整体分析时,应该将2015年两个月数据剔除,清洗数据时没有考虑到

3)问题3中用户复购率很低,分析原因,是因为产品本身特性无回购需求(例如婚庆行业)?或者是公司留存用户做的不好?

4)问题5和7,男女比例接近1:1,但是女比男销量高25%,认为女客户的产品需求更大

5)问题6和8, 年龄段在5-10的用户占比87%,86%的销量集中在年龄段为5-10的用户身上,认为销量与年龄有关

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐