一、项目说明

学完Power Bi基础操作后,最想做的就是跑一遍数据 ,不过真正麻烦的就藏在实操部分。一方面我们缺乏案例数据源,另一方面我们在实操部分会出现关系连接无效、度量值重复、视觉对象误导等等问题。这个项目是我第二次尝试复刻,仍然存在很多问题,不过复刻了95%的内容,初学者可以一起探索和交流以期共同进步。

二、数据源获取

数据源的获取有很多方式,可以通过官方权威Microsoft Learn,当中有人工智能数据示例、美国新冠肺炎数据示例等,其次可以通过Github、和鲸社区、kaggle中下载相关的数据集,需要一定的耐心挖掘。

这个项目复刻的是实体商店销售数据(Store Sales),来源于Github,可以学习一个简单的Power Bi可视化实操。

三、数据预处理

由于获取的数据主要格式是pbix,内部已经完成了表格关系、度量值的构建工作,要实操最好将其还原回简单数据集,步骤相对其他数据集较为繁琐,但复刻练习的主要目的通过对方的思路去学习数据可视化的练习。

将整理的数据集导入到Power Bi Desktop当中,进入Power Query编辑器当中进行提升标题、变更类型等操作。

3.1日期表构建

FiscalMonthName列的排序可以勾选Period,同时将日期表标记为日期表,标记列为ReportingPeriodID

3.2商店表日期处理

提取Opendate列当中的年月,同时根据时间2014为界线进行新店判断店铺类型

3.3销售表日期处理

3.4表格关系搭建

3.5度量值构建

度量值的构建最为关键的是明确可视化的目的,从目的出发我们才能明确我们需要展示的内容,这次我们需要展示的内容包括实体商铺的销售概况、不同区域商铺的月销售情况、新店销售情况。

3.5.1商店表

商店表需要构建5个度量值,包括店铺数量、新店数量、新店目标、开店日期计数、平均销售面积

3.5.2销售表

销售表需要构建度量值较多,其中最为关键的是今年销售额和去年销售额。

四、可视化展示

五、结论

复刻本身并不复杂。跟着做一遍,就能把分散的基础知识串成整体操作框架。想真正独立做分析,还得在复刻时想清楚两条:

1、度量值是怎么一层层搭出来的?

2、每张图到底要解决什么业务问题。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐