机器学习的分类算法 ML分类算法|机器学习

本文概要

什么是分类算法？
在分类问题学生
ML分类算法的类型
评估分类模型
分类算法的使用案例

我们知道，在监督的机器学习算法可以大致分为回归和分类算法。在回归算法，我们预测连续值的输出，但预测分类值，我们需要分类算法。
什么是分类算法？分类算法是用来识别训练数据的基础上的新的观测类别监督学习技术。在分类上，从给定的数据集或观察程序学习并然后分类新的观察为多个类或组。比如，Yes或No，0或1，垃圾邮件或者非垃圾邮件，猫或狗等类可以被称为目标/标签或类别。
不像回归，分类器的输出变量是一个类别，而不是一个值，例如“绿色或蓝色”，“水果或动物”等。由于分类算法是监督学习技术，因此它需要标注的输入数据，其意味着它包含具有对应的输出的输入。
在分类算法，离散输出函数（Y）被映射到输入变量（x）。

y=f(x)，where y = categorical output

一个ML分类算法的最好的例子就是电子邮件垃圾邮件检测器。
分类算法的主要目标是确定一个给定的数据集的类，并且这些算法主要用于预测中的分类数据的输出。
分类算法可以使用下面的图可以更好地理解。在下面的图中，有两个类，类A和B类这些类拥有的功能是彼此相似的和不相似的其他类。

文章图片
它实现对数据集进行分类的算法被称为分类器。有两种类型的分类的：

二元分类：如果分类问题只有两种可能的结果，那么它被称为二元分类。实例：YES或NO，男性或女性，SPAM或NOT SPAM，猫或狗等
多级分类：若某分类问题有两个以上的结果，那么它被称为多级分类。示例：作物种类分类的音乐类型分类。

在分类问题学生在分类的问题，有两种类型的学习者：

懒学生：直到接收到测试数据集懒学习者首先存储训练数据集和等待。在懒惰学习者的情况下，分类存储在训练数据集的最相关数据的基础上完成的。这需要在训练，但更多的时间进行预测的时间更少。例如：K-NN算法，基于案例的推理
渴望学习者：渴望学习者开发基于训练数据集分类模型接收测试数据集之前。相反懒学生，渴望学习花费更少的时间在预测的训练和更多的时间。例如：决策树，朴素贝叶斯，ANN。

ML分类算法的类型分类算法可以进一步分为主要有两种类型：