python Z-score标准化

  • Zscore标准化
  • sklearn库实现Z-score标准化
  • 手动实现Z-score标准化

Zscore标准化

Z-score标准化(也称为标准差标准化)是一种常见的数据标准化方法,它将数据集中的每个特征的值转换为一个新的尺度,使得转化后的数据具有均值为0,标准差为1的分布。Z-score标准化公式如下:
在这里插入图片描述
其中:

  • X 是原始数据值
  • μ 是数据的均值
  • σ 是数据的标准差

sklearn库实现Z-score标准化

import numpy as np
from sklearn.preprocessing import StandardScaler

# 生成示例数据
data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])

# 创建StandardScaler对象
scaler = StandardScaler()

# 对数据进行标准化
data_standardized = scaler.fit_transform(data)

print("原始数据:")
print(data)
print("\n标准化后的数据:")
print(data_standardized)
print("\n均值:", scaler.mean_)
print("标准差:", scaler.scale_)

手动实现Z-score标准化

import numpy as np

# 生成示例数据
data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9], [10, 11, 12]])

# 计算均值和标准差
mean = np.mean(data, axis=0)
std = np.std(data, axis=0)

# 进行Z-score标准化
data_standardized = (data - mean) / std

print("原始数据:")
print(data)
print("\n标准化后的数据:")
print(data_standardized)

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐