聚类分析的离差平方和法

二 。聚类方法(分析分类系统聚类方法)1,聚类方法,2.System 聚类 method:也叫层次化聚类 method,聚类分析method,-0 分析 (1)系统-0 分析方法聚类-3/是取样本 。SPSS聚类分析System聚类分析SPSS聚类分析:System,分类系统聚类)系统聚类方法通常被称为等级式聚类方法和等级式聚类方法,也就是聚类 。

1、南水北调中线河南受水区生态水文分区过程4.2.1分区单元的确定南水北调中线一期工程河南省受水区涉及河南省18个地级市的25个县 。本研究以这25个县为分区单元 。4.2.2分区指标体系的建立根据生态水文分区指标体系的原则和确定的结构 , 结合实际情况和数据来源,每个要素选取了12个指标(表4.2) 。表4.2南水北调中线一期工程河南受水区生态水文区划指标体系表4.2.3数据来源本次生态水文区划的原始数据来源主要有以下几个方面:1)自然要素中的地下水埋深数据来源于中国水文信息网;其他自然因素数据来自县统计年鉴和县政府信息网 。

3)土壤侵蚀数据来源于2005年全国土壤侵蚀遥感调查统计数据 。表4.3给出了南水北调中线一期工程河南省受水区县的指标值 。4.2.4数据的标准化县级行政单位收集的数据经过计算和转换,然后按照SPSS软件提供的标准化方法进行标准化 。标准化后,各项指标数据的平均值为0,标准差为1 。这一步由SPSS软件自动实现 。

2、 聚类 分析(clusteranalysis我们来看看这里聚类 分析 。比较流行的方法有聚类和K-means 聚类,属于split 聚类方法 。KMeans算法的思想很简单 。对于给定的样本集,根据样本之间的距离将其划分为k个聚类 。让簇内的点尽可能的紧密连接,让簇间的距离尽可能的大 。目标是最小化Esum(x\miu_i),其中\miu_i是每个聚类的平均值 。直接求上述公式的最小值并不容易,这是一个NP难问题,所以采用了启发式迭代法KMeans 。

【聚类分析的离差平方和法】上面的图A代表初始数据集,假设k3 。在图B中,我们随机选取三个K类别对应的类别质心,即图中的红绿和草绿质心,然后分别求出样本中所有点到这三个质心的距离,将每个样本的类别标记为与样本距离最小的类别 , 如图c所示,计算样本与红绿和草绿质心的距离后,第一次迭代后得到所有样本点的类别 。此时,我们找到我们当前点的新质心,分别标记为红色、绿色和草绿色 , 重复这个过程,将所有点的类别标记为最近质心的类别 , 找到新质心 。

    推荐阅读