【监督学习应用】分类、标注和回归——笔记

学习

一个系统能够通过执行某个过程改进它的性能,这就是学习
监督学习
supervised learning 指从标注数据中学习预测模型。
【【监督学习应用】分类、标注和回归——笔记】标注数据表示输入输出的对应关系,预测模型对给定的输入产生相应的输出。监督学习的实质是学习输入到输出的映射的统计规律。

监督学习的应用主要在三个方面:分类、标注和回归
分类
  • 监督学习从数据中学习一个分类模型或分类决策函数,称为分类器(classifier),分类器对新的输入进行输出的预测,称为分类(classification)
  • 可能的输出称为类别(class)
  • 分类问题包括学习和分类两个过程
标注
  • 可以认为标注问题是分类问题的一个推广。但标注问题是更复杂的结构预测(structure prediction)问题的简单形式。
  • 分类问题中,输出变量Y去有限个离散值,输入X可以为离散的或者是连续的。
  • 标注问题的输入是一个观测序列,输出的是一个标记序列或状态序列。
  • 标注问题的目标在于学习一个模型,观测序列后会得出一个预测,该预测为标记序列
  • 可能的标记个数是有限的,但其组合所称的标记序列的个数是依序列长度呈指数增长的
  • 标注问题包括学习和标注两个过程
回归
  • 回归用于预测输入变量X和输出变量Y之间的关系
  • 所谓回归模型就是输入和输出之间映射的函数,Y = F(X)

    推荐阅读