基于聚类的“图像分割”案例——K-means聚类算法机器学习

图像分割：利用图像的灰度、颜色、纹理、形状等特征，把图像分成若干个互不重叠的区域，并使这些特征在同一区域内呈现相似性，在不同的区域之间存在明显的差异性。然后就可以将分割的图像中具有独特性质的区域提取出来用于不同的研究。
1. 应用 1.1. 在机车检验领域，可以应用到轮毂裂纹图像的分割，及时发现裂纹，保证行车安全。
1.2. 在生物医学工程方面，对肝脏CT图像进行分割，为临床治疗和病理学研究提供帮助。
2. 图像分割常用方法 2.1. 阈值分割：对图像灰度值进行度量，设置不同类别的阈值，达到分割的目的。
2.2. 边缘分割：对图像边缘进行检测，即检测图像中灰度值发生跳变的地方，则为一片区域的边缘。
2.3. 直方图法：对图像的颜色建立直方图，而直方图的波峰波谷能够表示一块区域的颜色值的范围，来达到分割的目的。
2.4. 特定理论：基于聚类分析、小波变换等理论完成图像分割。
3. 实例描述 3.1. 目标：利用 K-means聚类算法对图像像素点颜色进行聚类。
3.2. 输出：同一聚类中的点使用相同颜色标记，不同聚类颜色不同。
3.3. 导入Python模块：from sklearn.cluster import KMeans
3.4. 实例数据：本实例中的数据可以是任意大小的图片，为了使效果更佳直观，可以采用区分度比较明显的图片。
4. 实验过程 4.1. 实现步骤：

[ Step1 ] 建立工程并导入sklearn包
[ Step2 ] 加载图片并进行预处理
[ Step3 ] 加载 K-means聚类算法
[ Step4 ] 对像素点进行聚类并输出

PIL包: 因为本实验涉及图像的加载和创建，因此需要使用到 PIL 包。

Step1: 建立工程并导入sklearn包：

创建Kmeans.py文件
导入sklearn相关包

import numpy as np from PIL import Image#加载PIL包，用于加载创建图片 from sklearn.cluster import KMeans#加载Kmeans算法 import matplotlib.pyplot as plt#绘制图像

Step2: 加载图片并进行预处理：

加载训练数据

def loadData(filePath): f = open(filePath, 'rb') #以二进制形式打开文件 data = https://www.it610.com/article/[] img = Image.open(f)#以列表的形式返回图片像素值 m, n = img.size#获取图片的大小 for i in range(m):#将每个像素点的RGB颜色处理到0-1 for j in range(n): x,y,z = img.getpixel((i,j)) data.append([x/256.0, y/256.0, z/256.0]) #范围内并存入data f.close() return np.mat(data), m, n #以矩阵的形式返回data，以及图片大小

【基于聚类的“图像分割”案例——K-means聚类算法】Step3: 加载 K-means聚类算法：

选取聚类中心个数

#加载Kmeans聚类算法 km = KMeans(n_clusters= 3) #其中n clusters属性指定了聚类中心的个数为3

Step4: 对像素点进行聚类并输出：

对像素点进行聚类并输出心依据聚类中心，对属于同一聚类的点使用同样的颜色进行标记。

#聚类获取每个像素所属的类别 label = km.fit_predict(imgData) label = label.reshape([row, col]) #创建一张新的灰度图保存聚类后的结果 pic_new = Image.new('L', (row, col))#根据所属类别向图片中添加灰度值 # 最终利用聚类中心点的RGB值替换原图中每一个像素点的值，便得到了最终的分割后的图片 for i in range(row): for j in range(col): pic_new.putpixel((i, j), int(256 / (label[i][j] + 1)))#以JPEG格式保存图片 pic_new.save("result_demo1.jpg","JPEG") plt.imshow(pic_new) plt.show()

5. 用例数据及展示结果 5.1. 图片素材：
图片链接: link
5.2. 聚类的“图像分割”结果对比展示：

文章图片

加载 K-means聚类算法后，对像素点进行聚类输出结果：

文章图片

6. K-means聚类算法-程序代码

# -*- coding: utf-8 -*- # @Time: 2020/3/31 21:27 # @Author: Zudy # @FileName: course1.py''' 1.进行图像中颜色的分类（K-means聚类算法对图像像素点颜色进行聚类实现间的图像分割） '''import numpy as np from PIL import Image from sklearn.cluster import KMeans import matplotlib.pyplot as pltdef loadData(filePath): f = open(filePath, 'rb') #以二进制形式打开文件 data = https://www.it610.com/article/[] img = Image.open(f)#以列表的形式返回图片像素值 m, n = img.size#获取图片的大小 for i in range(m):#将每个像素点的RGB颜色处理到0-1 for j in range(n): x,y,z = img.getpixel((i,j)) data.append([x/256.0, y/256.0, z/256.0]) #范围内并存入data f.close() return np.mat(data), m, n #以矩阵的形式返回data，以及图片大小path ='D:/Python/Python_learning/Python_Machine_learning/基于聚类的整图分割/demo1.jpg' imgData, row, col = loadData(filePath= path) print(imgData) print(row) print(col)#加载Kmeans聚类算法 km = KMeans(n_clusters= 3)#聚类获取每个像素所属的类别 label = km.fit_predict(imgData) label = label.reshape([row, col]) #创建一张新的灰度图保存聚类后的结果 pic_new = Image.new('L', (row, col))#根据所属类别向图片中添加灰度值 # 最终利用聚类中心点的RGB值替换原图中每一个像素点的值，便得到了最终的分割后的图片 for i in range(row): for j in range(col): pic_new.putpixel((i, j), int(256 / (label[i][j] + 1)))#以JPEG格式保存图片 pic_new.save("result_demo1.jpg","JPEG") plt.imshow(pic_new) plt.show()

实验分析
通过设置不同的k值，能够得到不同的聚类结果。同时，k值的不确定也是Kmeans算法的- -个缺点。往往为了达到好的实验结果，需要进行多次尝试才能够选取最优的k值。