一元线性回归模型-线性回归(一元与多元)-编程文章分享

线性回归模型

例子：预测住房价格

我们要使用一个数据集，数据集包含俄勒冈州波特兰市的住房价格。在这里，我要根据不同房屋尺寸所售出的价格，画出我的数据集。比方说，如果你朋友的房子是1250平方尺大小，你要告诉他们这房子能卖多少钱。那么，你可以做的一件事就是构建一个模型，也许是条直线，从这个数据模型上来看，也许你可以告诉你的朋友，他能以大约220000(美元)左右的价格卖掉这个房子。这就是监督学习算法的一个例子。

它被称作监督学习是因为对于每个数据来说，我们给出了“正确的答案”，即告诉我们：根据我们的数据来说，房子实际的价格是多少，而且，更具体来说，这是一个回归问题。回归指的是，我们根据之前的数据预测出一个准确的输出值，对于这个例子就是价格，同时，还有另一种最常见的监督学习方式，叫做分类问题。更进一步来说，在监督学习中我们有一个数据集，这个数据集被称训练集。

模型表达式

定义一个假设 $h$，$h$ 是一个从 $x$ 到 $y$ 的函数映射

有如下符合标记

$m$ 代表训练集中实例的数量

$x$ 代表特征/输入变量

$y$ 代表目标变量/输出变量

$\left( x,y \right)$ 代表训练集中的实例

$({{x}^{(i)}},{{y}^{(i)}})$ 代表第 $i$ 个观察实例

$h$ 代表学习算法的解决方案或函数也称为假设（hypothesis）

要解决房价预测问题，实际上是要将训练集“喂”给我们的学习算法，进而学习得到一个假设，然后将要预测的房屋的尺寸作为输入变量输入给，预测出该房屋的交易价格作为输出变量输出为结果。那么，该如何表达？

一种可能的表达方式为： $h_\theta \left( x \right)=\theta_{0} + \theta_{1}x$ ，因为只含有一个特征/输入变量，因此这样的问题叫作单变量线性回归问题。

另一种写法

按照机器学习的惯例，您需要写一个存在细微差别的模型方程式：

$ y' = b + w_1x_1 $

其中：

$y'$ 指的是预测标签（理想输出值）。

$b$ 指的是偏差（$y$ 轴截距）。而在一些机器学习文档中，它称为 $w_0$。

$w_1$ 指的是特征 1 的权重。权重与上文中用 $m$ 表示的“斜率”的概念相同。

$x_1$ 指的是特征（已知输入项）。

一元线性回归模型

线性回归模型

模型表达式

相关推荐

请登录