Azure|Azure(什么是回归)


你可能会发现,绘制的点几乎形成了一条对角线,换句话说,x 和 y 之间存在明显的线性关系,因此我们需要找出最适合数据样本的线性函数。 可以使用多种算法来确定此函数,这些算法最终将找到一条与所绘制点的总体方差最小的直线,如下所示:
Azure|Azure(什么是回归)
文章图片

该线表示一个线性函数,可以将其与任何 x 值一起使用,以应用该线的斜率及其截距(当 x 为 0 时,该线与 y 轴交叉)来计算 y。 在本例中,如果将该线向左延伸,会发现当 x 为 0 时 y 约为 20,并且该线的斜率决定了 x 每向右移动一个单位,y 会增加约 1.7。 因此,f 函数可以计算为 20 + 1.7 x。
现在我们已经定义了预测函数,可以使用它来预测所保留的验证数据的标签,并将预测值(通常用符号 y? 或“y-hat”表示)与实际已知的 y 值进行比较。

x y y?
82 156 159.4
54 114 111.8
62 129 125.4
让我们看一下 y 和 y? 值在绘图中的比较情况:
Azure|Azure(什么是回归)
文章图片

函数线上的绘制点是由函数计算的预测 y? 值,而其他绘制点是实际 y 值。
可以采用多种方法来度量预测值和实际值之间的差值,并且可以使用这些指标来评估模型的预测效果。
备注
机器学习基于统计和数学,因此必须了解统计学家和数学家(以及数据科学家)使用的特定术语。 可以将预测标签值与实际标签值之间的差值视为误差的度量。 但是实际上,“实际”值是基于样本观察值的(其本身可能会有一些随机变化)。 要清楚,我们将预测值 (y?) 与观察值 (y) 进行比较,我们将它们之间的差值称为残差。 我们可以汇总所有验证数据预测的残差,以计算模型中的总体损失,作为对其预测性能的度量。
度量损失的最常见方法之一是对各个残差求平方,求平方和,然后计算平均值。 对残差进行平方处理可以使计算基于绝对值(忽略差值是负还是正),并对较大的差值赋予较大的权重。 此指标称为均方误差。
对于我们的验证数据,计算结果如下所示:
y y? y - y? (y - y?)2
156 159.4 -3.4 11.56
114 111.8 2.2 4.84
129 125.4 3.6 12.96
Sum 29.36
平均值 x? 9.79
因此,基于 MSE 指标的模型损失为 9.79。
那有什么好处吗? 很难判断,因为 MSE 值未用有意义的度量单位表示。 我们知道,该值越小,模型中的损失就越少,因此其预测效果越好。 这使它成为了比较两个模型并找到性能最好的模型的有用指标。
有时,用与预测标签值本身相同的度量单位来表示损失更为有用,在本例中,为租赁数。 为此,可以计算 MSE 的平方根,此操作必定会生成一个已知指标,即均方根误差 (RMSE)。
√9.79 = 3.13
因此,模型的 RMSE 表明损失刚超过 3,可以粗略地解释为,平均而言,错误的预测约为 3 次租赁。
还有许多其他指标可用于度量回归中的损失。 例如,R2(R 平方)(有时称为确定系数),是 x 和 y 平方之间的相关性。 这会生成一个介于 0 和 1 之间的值,该值可测量模型可以解释的方差量。 通常,此值越接近 1,模型的预测效果就越好。

拟合度:R2 我们知道,成本函数可用于评估模型与训练它的数据之间的拟合程度。 线性回归模型有一个特殊的相关度量值,称为 R2(“R 平方”)。 R2 是一个介于 0 和 1 之间的值,指示线性回归模型与数据的拟合程度。 当人们说到相关性较强时,通常意味着 R2 值较大。
R2 使用的数学方法不在本课程的讨论范围内,但我们可以直观地考虑它。 我们来看看前面的练习,其中介绍了年龄与 core_temperature 之间的关系。 R2 等于 1 表示年份可用来完美预测哪位患者的体温较高,哪位患者的体温较低。 相反,0 表示年份与体温之间不相关。
【Azure|Azure(什么是回归)】实际情况通常介于这两者之间。 我们的模型可能预测体温等于某个温度(因此,它比 R2 = 0 好),但点可能与此预测值稍有不同(因此它小于 R2=1)。
R2 只是方案的一半
R2 值被广泛接受,但并不是可用于隔离的完美度量值。 它们有四项限制:
  • 鉴于 R2 的计算方式,因此样本越多,R2 值越大。 这可能会导致我们认为一个模型比另一个(相同的)模型好,原因仅仅是 R2 值是使用不同数量的数据计算的。
  • R2 值并不会告诉我们模型如何处理以前不可见的新数据。 统计学家通过计算补充度量值(称为 p 值)来解决此问题,此知识点本文不做介绍。 在机器学习中,我们通常会改为在另一个数据集上显式测试模型。
  • R2 值并不会告诉我们关系的方向。 例如,R2 值等于 0.8 不会告诉我们线是向上倾斜还是向下倾斜。 它也不会告诉我们线的斜率。
另外,请记住,对 R2 值“足够好”而言,没有通用标准。 例如,在大多数物理学中,不太接近 1 的相关性不太可能被视为有用,而当将复杂系统的 R2 值建模为低至 0.3 时,可能会被视为极佳。
链接:
什么是回归? - Learn | Microsoft Docs
什么是回归? - Learn | Microsoft Docs

    推荐阅读