首页 > 人工智能(Artificial Intelligence) > 机器学习基础 > 线性回归(一元与多元)

一元线性回归模型

线性回归模型

例子:预测住房价格

我们要使用一个数据集,数据集包含俄勒冈州波特兰市的住房价格。在这里,我要根据不同房屋尺寸所售出的价格,画出我的数据集。比方说,如果你朋友的房子是1250平方尺大小,你要告诉他们这房子能卖多少钱。那么,你可以做的一件事就是构建一个模型,也许是条直线,从这个数据模型上来看,也许你可以告诉你的朋友,他能以大约220000(美元)左右的价格卖掉这个房子。这就是监督学习算法的一个例子。

它被称作监督学习是因为对于每个数据来说,我们给出了“正确的答案”,即告诉我们:根据我们的数据来说,房子实际的价格是多少,而且,更具体来说,这是一个回归问题。回归指的是,我们根据之前的数据预测出一个准确的输出值,对于这个例子就是价格,同时,还有另一种最常见的监督学习方式,叫做分类问题。更进一步来说,在监督学习中我们有一个数据集,这个数据集被称训练集。

模型表达式

定义一个假设 $h$,$h$ 是一个从 $x$ 到 $y$ 的函数映射

有如下符合标记

$m$ 代表训练集中实例的数量

$x$ 代表特征/输入变量

$y$ 代表目标变量/输出变量

$\left( x,y \right)$ 代表训练集中的实例

$({{x}^{(i)}},{{y}^{(i)}})$ 代表第 $i$ 个观察实例

$h$ 代表学习算法的解决方案或函数也称为假设(hypothesis)

要解决房价预测问题,实际上是要将训练集“喂”给我们的学习算法,进而学习得到一个假设,然后将要预测的房屋的尺寸作为输入变量输入给,预测出该房屋的交易价格作为输出变量输出为结果。那么,该如何表达 ?

 一种可能的表达方式为: $h_\theta \left( x \right)=\theta_{0} + \theta_{1}x$ ,因为只含有一个特征/输入变量,因此这样的问题叫作单变量线性回归问题。

另一种写法

按照机器学习的惯例,您需要写一个存在细微差别的模型方程式:

$ y' = b + w_1x_1 $

其中:

$y'$ 指的是预测标签(理想输出值)。

$b$ 指的是偏差($y$ 轴截距)。而在一些机器学习文档中,它称为 $w_0$。

$w_1$ 指的是特征 1 的权重。权重与上文中用 $m$ 表示的“斜率”的概念相同。

$x_1$ 指的是特征(已知输入项)。

 

关闭
感谢您的支持,我会继续努力!
扫码打赏,建议金额1-10元


提醒:打赏金额将直接进入对方账号,无法退款,请您谨慎操作。