一、什么是聚类算法? 1、用于发现共同的群体(cluster),比如:邮件聚类、用户聚类、图片边缘。 2、聚类唯一会使用到的信息是:样本与样本之间的相似度(跟距离负相关) 给定N个训练样本(未标记的){x 1 , . . . , x N },同时给定结果聚类的个数K 目标:把比较“接近”的样本放到一
一、什么是聚类算法? 1、用于发现共同的群体(cluster),比如:邮件聚类、用户聚类、图片边缘。 2、聚类唯一会使用到的信息是:样本与样本之间的相似度(跟距离负相关) 给定N个训练样本(未标记的){x 1 , . . . , x N },同时给定结果聚类的个数K 目标:把比较“接近”的样本放到一