写这篇文章的原因是在很多程序时都会出现数据集预处理,为什么要进行数据归一化,为什么要规约,这些困扰很久,今天就数据集预处理总结比较的好的博客文章搬过来。

https://gofisher.github.io/2018/06/22/%E6%95%B0%E6%8D%AE%E9%A2%84%E5%A4%84%E7%90%86/

规范化

      数据规范化(归一化)处理是数据挖掘的一项基础工作。不同评价指标往往具有不同的量纲, 数之间的差别可能很大,不进行处理会影响到数据分析的结果。为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化处理,将数据按照比例进行缩放,使之落入特定的区域,便于进行综合分析。

  • 把数据映射到[0,1]的区间中。
  • 把有量纲形式变成无量纲形式 。
  •                                                   常用的规范化方法

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐