excel部分字段相同模糊匹配_Excel——数据分析
一、 课程总结(一) Excel新增知识点:1. 数据类型:字符串、文本、逻辑2. left,right,mid,find,len函数的联用3. vlookup函数:准确查找-第一个匹配到的值,模糊查找-最后一个匹配到的值(二) 数据分析步骤:(三) 数据清洗步骤:二、 小试牛刀(一)明确问题1. 销量好和销量差分别是哪些商品?2. 销量好和销量差分别哪个时间点?3. 用户复购情况如何?4. 一级
一、 课程总结
(一) Excel新增知识点:
1. 数据类型:字符串、文本、逻辑
2. left,right,mid,find,len函数的联用
3. vlookup函数:准确查找-第一个匹配到的值,模糊查找-最后一个匹配到的值
(二) 数据分析步骤:
(三) 数据清洗步骤:
二、 小试牛刀
(一)明确问题
1. 销量好和销量差分别是哪些商品?
2. 销量好和销量差分别哪个时间点?
3. 用户复购情况如何?
4. 一级分类下二级产品的销量情况?
5. 用户的男女比例?
6. 用户的年龄分布?
7. 哪个性别的销量最高?
8. 哪个年龄段的销量最好?
(二)理解数据:字段释义 上篇文章已做说明
(三)数据清洗
对两表做原始数据存档,在复制表做数据清洗
表1数据清洗:
表2数据清洗:
(四)数据分析
1. 销量好和销量差分别是哪些商品?
2.销量好和销量差分别哪个时间点?
3.用户复购情况如何?
4.一级分类下二级产品的销量情况?
5.用户的男女比例?
6.用户的年龄段分布?
7.哪个性别的销量最高?
8.哪个年龄段的销量最高?
对【购买数量】做Excel描述分析
总结:
1)从【购买数量】的描述分析看到,标准差较大,最大值最小值差距较大,说明销量的整体波动较大;而中位数、众数、平均数在1-2之间,说明大部分产品的销量主要集中在这个区间,少部分产品销售很好——可具体分析热销产品的特性,找到用户需求
2)问题2中可以看到2012-2014的销量是逐步增加的,但是2015年销量比2012年还低,追溯日期发现表格仅统计2015年两个月销量,其他年份则包含12个月销量,可以将2015年的两个月销量与其他三年同期销量对比,分析销量是否正常。
同时认为在做整体分析时,应该将2015年两个月数据剔除,清洗数据时没有考虑到。
3)问题3中用户复购率很低,分析原因,是因为产品本身特性无回购需求(例如婚庆行业)?或者是公司留存用户做的不好?
4)问题5和7,男女比例接近1:1,但是女比男销量高25%,认为女客户的产品需求更大。
5)问题6和8, 年龄段在5-10的用户占比87%,86%的销量集中在年龄段为5-10的用户身上,认为销量与年龄有关。
更多推荐
所有评论(0)