动手学深度学习专题笔记--线性回归概述

线性回归概述1. 回归（regression）回归是指一类为一个或多个自变量与因变量之间关系建模的方法，通常用来表示输入和输出之间的关系。在机器学习中大多数任务都与预测有关，当我们想预测一个数值时就会涉及到回归问题。2. 线性回归（linear regression）2.1 假设假设自变量x和因变量y之间的关系是线性的。任何噪声都比较正常，如噪声遵循正太分布。我们以一个实际例子对线性回归进行解释，

Yuuu_le

307人浏览 · 2021-09-20 00:32:50

Yuuu_le · 2021-09-20 00:32:50 发布

线性回归概述

1. 回归（regression）

回归是指一类为一个或多个自变量与因变量之间关系建模的方法，通常用来表示输入和输出之间的关系。在机器学习中大多数任务都与预测有关，当我们想预测一个数值时就会涉及到回归问题。

2. 线性回归（linear regression）

2.1 假设

假设自变量x和因变量y之间的关系是线性的。
任何噪声都比较正常，如噪声遵循正太分布。

我们以一个实际例子对线性回归进行解释，我们希望根据房屋的面积（平方英尺）和房龄（年）来估算房屋价格（美元）

2.2 线性模型

线性模型是指目标（房屋价格）可以表示为特征（面积和房龄）的加权和，如下面的式子：
$price = w_{area}*area + w_{age}*age + b .$
其中 $w_{area}$ 称为权重， $\textbf{b}$ 称为偏置。在机器学习领域，数据集通常有较多的特征，所以针对多个特征的多样本数据集我们可以采用矩阵 $X$ 来表示。其中 $X$ 的每一行是一个样本，每一列是一种特征。列向量 $\textbf{w}$ 表示权重。所以对于特征集合 $X$ ,预测值 $\hat{y}$ 可以通过矩阵-向量乘法表示为：
$\hat{y} = Xw + b$

在寻找最好的模型参数 $w$ 和 $b$ 之前，我们还需要两个东西：

一种模型质量的度量方式。
一种能够更新模型以提高模型预测质量的方法。

2.3 损失函数

定义：损失函数能够量化目标的实际值与预测值之间的差距。且数值越小表示损失越小。
在回归问题中最常用的损失函数是平方差函数。为了度量模型在整个数据集上的质量，我们需要计算在训练集 $n$ 个样本上的损失均值。（也等价于求和）
$\frac{1}{n}\sum_{i=1}^nl^{(i)}(w,b) = \frac{1}{n}\sum_{i=1}^n\frac{1}{2}(w^Tx^{(i)} + b - y^{(i)})^2$
在训练时我们希望寻找一组参数，这组参数能最小化在所有训练样本上的损失总和。
在高斯噪音的假设下，可证最小化均方误差等价于对线性模型的最大似然估计。这也是为什么采用均方误差来作为损失函数的原因。

2.4 小批量梯度下降

作用：它通过不断地在损失函数递减的方向上更新参数来降低误差。
我们通常在每次需要计算更新的时候随机抽取一小批样本，而不是遍历整个数据集，这种变体叫做小批量随机梯度下降。

3. 代码实现

具体代码实现参考代码

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git