该问题源于工作中使用 k 折交叉验证选取最优的 KMeans 算法参数,过程中使用欧氏距离来评价参数的优劣。
1. 代公式,封装成函数
文章图片
def calEuclidean(x, y):
dist = np.sqrt(np.sum(np.square(x-y)))# 注意:np.array 类型的数据可以直接进行向量、矩阵加减运算。np.square 是对每个元素求平均~~~~
return dist
2. 调用 numpy 函数库 使用 numpy.linalg.norm(x, y) 可以计算向量 x 和向量 y 的欧氏距离~
def choose_bestK(myData):
'''
使用 K 折交叉验证,结合 KMeans 聚类算法,选取最优的 K
Input: myData 是训练集
'''
kMax = 5
scoreLis = []
for k in range(1, kMax+1):
kmeans = KMeans(n_clusters=k)
kmeans.fit(myData)
mu = kmeans.cluster_centers_
score = 0
for i, l in enumerate(kmeans.labels_):# i是索引,l是类簇
score += np.linalg.norm(myData[i, :] - mu[l, :])# 计算欧氏距离scoreLis.append(score)return np.argmin(scoreLis)+1# 返回 score 最小的对应索引
(参考:Python 计算Numpy向量之间的欧氏距离)
(参考:欧几里得度量)
知识点 1. np.square() 函数
函数功能:计算数组/向量/矩阵的元素的平方。
返回:返回一个新数组/向量/矩阵,他们的元素是源数组/向量/矩阵元素的平方。
(参考:Python中的numpy.square())
2. 类似地,对元素进行计算的还有 np.exp()、np.sqrt()、np.log()、np.sign() 等。
(参考:Numpy数学函数abs,sqrt(),square(),exp(),log(),sign(), 四舍五入函数,modf(),isnan(),isfinite()、isinf(),三角函数,二元函数等)
【Python|【20211129】【Python】使用Python计算欧氏距离的方法】
推荐阅读
- python|博客目录索引
- mysql|MySQL教程 - 视图(View)
- eventlet 的 link 函数用法
- 1582. 二进制矩阵中的特殊位置 : 简单模拟题
- Python统计学|Python统计学03——随机变量的概率分布
- 算法|opencvcv4.0
- 数据分析|Python数据分析29——seaborn可视化(五)之琴形图
- 「Python」面向对象封装案例1——小夏爱跑步、案例扩展(多个对象之间属性互不干扰)
- python|安装pytorch