PRML|绪论(0)


1. 训练集(trainingset),用来调节模型的参数,训练集中数字的类别实现已知,通常是被独立考察、人工标注的。
【PRML|绪论(0)】2. 目标向量(targetvector)t来表示数字的类别,它代表对应数字的标签。
3. 新的数字的图像集合组成了测试集(test set)。
4. 正确分类与训练集不同的新样本的能力叫做泛化(generalization)。
5. 训练数据的样本包含输入向量以及对应的?标向量的应用叫做有监督学习(supervisedlearning)问题。
6. 目标是给每个输入向量分配到有限数量离散标签中的?个,被称为分类(classification)。
7. 如果要求的输出由?个或者多个连续变量组成,那么这个任务被称为回归(regression)。
8. 训练数据由?组输?向量x组成,没有任何对应的?标值,称为?监督学习(unsupervised learning)。
9. 无监督学习(unsupervisedlearning)问题中,目标可能是发现数据中相似样本的分组,这被称为聚类(clustering),或者决定输入空间中数据的分布,这被称为密度估计(densityestimation),或者把数据从高维空间投影到二维或者三维空间,为了数据可视化(visualization)。

    推荐阅读