监督机器学习

本文概要

  • 监督学习如何工作?
  • 在监督学习中涉及的步骤
  • 监督机器学习算法的类型
  • 监督学习的优点
  • 监督学习的缺点
监督学习是机器学习的一种,机器使用良好的“标记”训练数据进行训练,并根据这些数据预测输出。标记的数据意味着一些输入数据已经标记了正确的输出。
在监督学习中,提供给机器的训练数据充当监督者,教导机器正确地预测输出。它适用于学生在老师监督下学习的概念。
监督学习是向机器学习模型提供输入数据和正确输出数据的过程。监督学习算法的目标是找到一个映射函数来映射输入变量(x)和输出变量(y)。
【监督机器学习】在现实世界中,监督学习,可用于风险评估,图像分类,欺诈检测,垃圾邮件过滤等。
监督学习如何工作?在监督学习中,使用标记数据集对模型进行训练,其中模型学习每种类型的数据。一旦训练过程完成,就根据测试数据(训练集的子集)对模型进行测试,然后预测输出。
下面的例子和图表可以很容易地理解监督学习的工作原理:
监督机器学习

文章图片
假设我们有一个不同类型形状的数据集,其中包括正方形、矩形、三角形和多边形。现在第一步是我们需要训练每个形状的模型。
  • 如果给定的形状有四条边,并且所有的边都相等,那么它将被标记为正方形。
  • 如果给定的形状有三条边,那么它将被标记为三角形。
  • 如果给定的形状有六个相等的边,那么它将被标记为六边形。
现在,在训练之后,我们使用测试集测试我们的模型,模型的任务是识别形状。
机器已经对所有类型的形状进行了训练,当它发现一个新的形状时,它会根据一些边对形状进行分类,并预测输出。
在监督学习中涉及的步骤
  • 首先确定训练数据集的类型
  • 收集标注训练数据。
  • 拆分训练数据集为训练数据集,测试数据集和验证数据集。
  • 确定训练数据集,它应该有足够的知识,使模型能够准确预测输出。
  • 确定合适的算法的模型,诸如支持向量机,决策树等。
  • 在训练数据集上执行算法。有时我们需要验证集作为控制参数,它是训练数据集的子集。
  • 通过提供测试集来评估模型的准确性。如果模型预测了正确的输出,这意味着我们的模型是准确的。
监督机器学习算法的类型监督学习可以进一步划分为两种类型的问题:
监督机器学习

文章图片
1.回归
如果输入变量和输出变量之间存在关系,则使用回归算法。 用于连续变量的预测,如天气预报、市场趋势等。下面是一些在监督学习下流行的回归算法:
  • 线性回归
  • 回归树
  • 非线性回归
  • 贝叶斯线性回归
  • 多项式回归
2.分类
当输出变量为categorical时,使用分类算法,这意味着有两个类,如Yes-No、Male-Female、True-false等。
垃圾邮件过滤,
  • 随机森林
  • 决策树
  • Logistic回归
  • 支持向量机
注意:我们将在后面的章节中详细讨论这些算法。监督学习的优点
  • 在监督学习的帮助下,该模型可以根据之前的经验预测输出。
  • 在监督学习中,我们可以对对象的类有一个确切的概念。
  • 监督学习模型帮助我们解决各种现实问题,如欺诈检测、垃圾邮件过滤等。
监督学习的缺点
  • 监督学习模型不适合处理复杂任务。
  • 如果测试数据与训练数据不同,监督学习就不能预测正确的输出。
  • 训练需要大量的计算时间。
  • 在监督学习中,我们需要足够的对象类知识。

    推荐阅读