谁说菜鸟不会数据分析(入门篇)----- 学习笔记3(数据准备、处理)
1、数据准备:一维表的列标签是字段,二维表的列标签是数据数据表的设计要求数据表由标题行和数据部分组成第一行是标的列标题(字段名),列标题不能重复第二行是数据部分,数据部分的每一行数据称为一个记录,并且数据部分不允许出现空白行和空白列数据表中不能有合并单元格存在数据表与其他数据之间应该留出至少一个空白行和一个空白列数据表需要以一维...
·
1、数据准备:
一维表的列标签是字段,二维表的列标签是数据
|

2、数据处理:根据数据分析的目的,将收集到的数据,用适当的处理方法进行整理加工,形成适合数据分析的要求样式。
|
(1)删除重复值:countif 条件格式 高级 数据删除重复项
(2)缺失数据:缺失值是指在数据集中某个或某些属性的值是不完全的。
- 机械原因:由于数据收集或保存失败造成的数据缺失,如数据存储的失败,存储器失败,机器故障导致某段时间数据未能收集等
- 人为原因:由于人的主观失误、历史局限或有意隐瞒造成的数据缺失,如在市场调查中被访人拒绝透露相关问题的答案,或者对问题的回答是无效的,抑或数据录入人员失误漏录了数据。
|
(3)数据加工
- 数据抽取:是指保留数据表中某些字段的部分信息,组合成一个新字段。截取某一字段的部分信息——字段分列;将某个字段合并为一个新字段——字段合并;将原数据表没有但其他数据表中有的字段,有效的匹配过来——字段匹配。
- 数据计算
- 数据转换
(4)数据抽样
|
更多推荐
所有评论(0)