Excel 数据分析
整理与《谁说菜鸟不会数据分析》一、重复数据处理1、COUNTIF函数2、高级筛选法3、条件格式法4、数据透视表5、删除重复值二、缺失数据处理Ctrl G 定位 + Ctrl Enter1、用一个样本统计量的值代替缺失值:样本均值2、统计模型计算出来的值代替缺失值:常用的模型 回归模型、判别模型等3、直接删除缺失值4、将缺失值保留,仅仅需要的时候排除...
整理与《谁说菜鸟不会数据分析》
一、重复数据处理
1、COUNTIF函数
2、高级筛选法
3、条件格式法
4、数据透视表
5、删除重复值
二、缺失数据处理
Ctrl G 定位 + Ctrl Enter
1、用一个样本统计量的值代替缺失值:样本均值
2、统计模型计算出来的值代替缺失值:常用的模型 回归模型、判别模型等
3、直接删除缺失值
4、将缺失值保留,仅仅需要的时候排除
三、检查数据逻辑错误
1、利用IF函数检查错误
IF(logical_test,valur_if_true,value_if_false):执行语句
IF(countif(B3:H3,"<>0")>3),"错误","正确" 表示如果录入的选项(非0的数据)超过3个,则单元格显示错误,否则,显示正确。
2、利用条件格式标记错误
四、数据加工
1、数据抽取
1、1 字段分列
- 1、1菜单法
- 1、2函数法 left right
1、2 字段合并
concatenate(text1,text2...)
1、3 字段匹配
vlookup(lookup_value,table_array,col_index_num,range_lookup)
lookup_value: 两个表中的相同字段并且是唯一的,比如
为学生成绩表添加学生的年级
学生信息表 (id,age,sex,nianji )
学生成绩表(id,yuwen,shuxue,nianji)
此时lookup字段就是学生成绩表id
table_array :学生信息表全部数据,,id必须在第一列,而年级是要查找的值
col_index_num:4 ,要查找的值位于学生信息表的第四列
range_lookup: 0表示精准匹配,1表示模糊匹配
2、数据计算
函数计算(平均值求和,日期加减date函数,dataif函数,now函数,today函数)
3、数据分组
4、数据转换
5、数据抽样
更多推荐
所有评论(0)