在逻辑回归部分,使用的数据集为自定义的房屋租金和面积相关的数据集,在实验初始阶段会
进行定义。
步骤 1 导入依赖
输入:

 

# 从 sklearn.preprocessing 里导入 StandardScaler。
from sklearn.preprocessing import StandardScaler
# 从 sklearn.linear_model 里导入 LogisticRegression
from sklearn.linear_model import LogisticRegression
步骤 2 自定义数据集
输入:
# X:每一项表示租金和面积
# y:表示是否租赁该房间(0:不租,1:租)
X=[[2200,15],[2750,20],[5000,40],[4000,20],[3300,20],[2000,10],[2500,12],[12000,80],
 [2880,10],[2300,15],[1500,10],[3000,8],[2000,14],[2000,10],[2150,8],[3400,20],
 [5000,20],[4000,10],[3300,15],[2000,12],[2500,14],[10000,100],[3150,10],
 [2950,15],[1500,5],[3000,18],[8000,12],[2220,14],[6000,100],[3050,10]
 ]
y=[1,1,0,0,1,1,1,1,0,1,1,0,1,1,0,1,0,0,0,1,1,1,0,1,0,1,0,1,1,0]
步骤 3 数据预处理
标准化数据,保证每个维度的特征数据方差为 1 ,均值为 0 。使得预测结果不会被某些维度过
大的特征值而主导。
输入:
ss = StandardScaler()
X_train = ss.fit_transform(X)
查看标准化处理后的数据。
输入:
print(X_train)

输出:

步骤 4 数据拟合
输入:
#调用 Lr 中的 fit 模块训练模型参数
lr = LogisticRegression()
lr.fit(X_train, y)
步骤 5 数据预测
输入:
testX = [[2000,8]]
X_test = ss.transform(testX)
print("待预测的值:",X_test)
label = lr.predict(X_test)
print("predicted label = ", label)
#输出预测概率
prob = lr.predict_proba(X_test)
print("probability = ",prob)

输出:

 

 

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐