python使用sklearn进行逻辑回归
在逻辑回归部分,使用的数据集为自定义的房屋租金和面积相关的数据集,在实验初始阶段会。标准化数据,保证每个维度的特征数据方差为。使得预测结果不会被某些维度过。查看标准化处理后的数据。
·
在逻辑回归部分,使用的数据集为自定义的房屋租金和面积相关的数据集,在实验初始阶段会
进行定义。
步骤
1
导入依赖
输入:
# 从 sklearn.preprocessing 里导入 StandardScaler。
from sklearn.preprocessing import StandardScaler
# 从 sklearn.linear_model 里导入 LogisticRegression
from sklearn.linear_model import LogisticRegression
步骤
2
自定义数据集
输入:
# X:每一项表示租金和面积
# y:表示是否租赁该房间(0:不租,1:租)
X=[[2200,15],[2750,20],[5000,40],[4000,20],[3300,20],[2000,10],[2500,12],[12000,80],
[2880,10],[2300,15],[1500,10],[3000,8],[2000,14],[2000,10],[2150,8],[3400,20],
[5000,20],[4000,10],[3300,15],[2000,12],[2500,14],[10000,100],[3150,10],
[2950,15],[1500,5],[3000,18],[8000,12],[2220,14],[6000,100],[3050,10]
]
y=[1,1,0,0,1,1,1,1,0,1,1,0,1,1,0,1,0,0,0,1,1,1,0,1,0,1,0,1,1,0]
步骤
3
数据预处理
标准化数据,保证每个维度的特征数据方差为
1
,均值为
0
。使得预测结果不会被某些维度过
大的特征值而主导。
输入:
ss = StandardScaler()
X_train = ss.fit_transform(X)
查看标准化处理后的数据。
输入:
print(X_train)
输出:
步骤
4
数据拟合
输入:
#调用 Lr 中的 fit 模块训练模型参数
lr = LogisticRegression()
lr.fit(X_train, y)
步骤
5
数据预测
输入:
testX = [[2000,8]]
X_test = ss.transform(testX)
print("待预测的值:",X_test)
label = lr.predict(X_test)
print("predicted label = ", label)
#输出预测概率
prob = lr.predict_proba(X_test)
print("probability = ",prob)
输出:
更多推荐
已为社区贡献1条内容
所有评论(0)