Python数据分析(三)——数据预处理
写这篇文章的原因是在很多程序时都会出现数据集预处理,为什么要进行数据归一化,为什么要规约,这些困扰很久,今天就数据集预处理总结比较的好的博客文章搬过来。https://gofisher.github.io/2018/06/22/%E6%95%B0%E6%8D%AE%E9%A2%84%E5%A4%84%E7%90%86/规范化数据规范化(归一化)处理是数据挖掘的一项基础工作。...
·
写这篇文章的原因是在很多程序时都会出现数据集预处理,为什么要进行数据归一化,为什么要规约,这些困扰很久,今天就数据集预处理总结比较的好的博客文章搬过来。
https://gofisher.github.io/2018/06/22/%E6%95%B0%E6%8D%AE%E9%A2%84%E5%A4%84%E7%90%86/
规范化
数据规范化(归一化)处理是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲, 数之间的差别可能很大,不进行处理会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入特定的区域,便于进行综合分析。
- 把数据映射到[0,1]的区间中。
- 把有量纲形式变成无量纲形式 。
-
常用的规范化方法
更多推荐
所有评论(0)