ML|线性不可分SVM 软间隔 SVM|python|软间隔

前言：仅个人小记。参看https://blog.csdn.net/qq_25847123/article/details/108058804。
线性不可分 【ML|线性不可分SVM 软间隔】大部分样本线性可分，总体线性不可分。

文章图片
引入松弛变量某些样本点不能满足函数间隔大于等于1 1 1 这个约束条件，软间隔策略就是对每个样本点引入一个松弛变量ξ ≥ 0 \xi\geq 0 ξ≥0。是的函数间隔加上松弛变量是大于等于1 1 1 的。此时，之前硬间隔最大化中的约束条件更变为
y i ( w ? x i + b ) ≥ 1 ? ξ i y_i(\boldsymbol{w}\cdot \boldsymbol{x}_i+b)\geq 1{\color{red}-\xi_i} yi?(w?xi?+b)≥1?ξi?
同时，对每个松弛变量ξ i \xi_i ξi? 支付一个代价ξ i \xi_i ξi?。目标函数更变为
1 2 ∣ ∣ w ∣ ∣ 2 + C ∑ i = 1 N ξ i \frac{1}{2}||w||^2{\color{red}+C\sum_{i=1}^N\xi_i} 21?∣∣w∣∣2+Ci=1∑N?ξi?
C C C 成为惩罚参数，取决于实际的应用场景。 C C C 值越大，则对误分类的惩罚越大， C C C 值越小，对误分类的惩罚越小。现在，最小化目标函数意味着：1) 使得1 2 ∣ ∣ w ∣ ∣ 2 \frac{1}{2}||w||^2 21?∣∣w∣∣2 尽量小即间隔尽量大，同时使误分类点的个数尽量小， C C C 是调和二者的系数。
线性不可分SVM的凸二次规划线性不可分的线性支持向量机的学习问题更变为如下凸二次规划问题(原始问题)：
max ? w , b 1 2 ∣ ∣ w ∣ ∣ 2 + C ∑ i = 1 N ξ i s . t . y i ( w x i + b ) ≥ 1 ? ξ i , i = [ 1 , N ] ξ i ≥ 0 , i = 1 , 2 , . . . , N \begin{gathered}\max_{\boldsymbol{w},b}\frac{1}{2}||w||^2+{\color{red}C\sum_{i=1}^N\xi_i}\\ \mathsf{s.t.} y_i(\boldsymbol{w}\boldsymbol{x}_i+b)\geq 1{\color{red}-\xi_i},i=[1,N]\\ {\color{red}\xi_i\geq 0},i=1,2,...,N \end{gathered} w,bmax?21?∣∣w∣∣2+Ci=1∑N?ξi?s.t.yi?(wxi?+b)≥1?ξi?,i=[1,N]ξi?≥0,i=1,2,...,N?
可以证明， w \boldsymbol{w} w的解是唯一的，而 b b b可能不唯一，而是存在于一个区间（实际应用中，往往可以直接求出来）。
线性支持向量机的对偶形式 min ? α 1 2 ∑ i = 1 N ∑ i = 1 N α i α j y i y j ( x i x j ) ? ∑ i = 1 N α i s . t . ∑ i = 1 N α i y i = 1 0 ≤ α i ≤ C , i = 1 , 2 , . . . , N \begin{gathered}\min_{\alpha}\frac{1}{2}\sum_{i=1}^{N}\sum_{i=1}^{N}\alpha_i\alpha_jy_iy_j(\boldsymbol{x}_i\boldsymbol{x}_j)-\sum_{i=1}^N\alpha_i\\ \mathsf{s.t.} \sum_{i=1}^N \alpha_iy_i=1\\ 0\leq \alpha_i{\color{red}\leq C}, i =1,2,...,N \end{gathered} αmin?21?i=1∑N?i=1∑N?αi?αj?yi?yj?(xi?xj?)?i=1∑N?αi?s.t.i=1∑N?αi?yi?=10≤αi?≤C,i=1,2,...,N?
进一步得到原问题的解， w ? = ∑ i = 1 N α i ? y i x i b ? = y j ? ∑ i = 1 N α i ? y i ( x i x j ) \begin{gathered} w^*=\sum_{i=1}^N\alpha_i^*y_i\boldsymbol{x}_i\\ b^* = y_j-\sum_{i=1}^N \alpha_i^*y_i(\boldsymbol{x}_i\boldsymbol{x}_j) \end{gathered} w?=i=1∑N?αi??yi?xi?b?=yj??i=1∑N?αi??yi?(xi?xj?)?
其中， j j j是对应一个 α ? \alpha^* α?的分量 α j ? \alpha_j^* αj??，满足 0 < α j ? < C 0<\alpha_j^*{\color{red} 代码修改和线性可分SVM的对偶形式的算法代码相比，只有很小的区别。具体地只有四处有区别，已经在代码中通过表述“！！！！”指明。

import matplotlib.pyplot as plt import cvxopt import numpy as np # 软间隔最大化C=.5 # 这个值逼近0好像会有问题 !!!!dataset = np.array([[3,3],[4,3],[2.5,3],[2.8,2.6],[1,1],[1,2],[3,3.2]]) labels = np.array([1,1,1,1,-1,-1,-1]) #dataset = np.array([[3,3],[4,3],[1,1]]) #labels = np.array([1,1,-1]) #T = [(3,3,1),(4,3,1),(1,1,-1)] # 数据集，格式为 (x1,x2,y)，其中y 为标签，取值-1，+1 n = len(dataset) P = np.zeros((n,n))for i in range(n): for j in range(i+1): P[i][j] = labels[i]*labels[j]*np.dot(dataset[i],dataset[j]) P[j][i] = P[i][j]P = cvxopt.matrix(P)q = cvxopt.matrix([-1.0]*n)G = np.vstack((-np.identity(n),np.identity(n))) # !!!!! # G = -np.identity(n) G = cvxopt.matrix(G)h = cvxopt.matrix(np.hstack((np.zeros(n),C*np.ones(n)))) #!!!!! # h = cvxopt.matrix([0.0]*n) A = cvxopt.matrix([label*1.0 for label in labels],(1,n)) b = cvxopt.matrix([0.0],(1,1))sol = cvxopt.solvers.qp(P,q,G,h,A,b)alpha = sol['x']print(sol['x'])# 计算分离超平面 w = np.array([0.0,0.0]) for i in range(n): w += alpha[i]*labels[i]*dataset[i]alphaPos = 0 for i in range(n): if alpha[i] > 0 and alpha[i] < C:# !!!!!! #if alpha[i] > 0: alphaPos =i break t = 0 for i in range(n): t += alpha[i]*labels[i]*np.dot(dataset[i],dataset[alphaPos])b = labels[alphaPos]- tprint(w,b) drawScatterPointsAndLine(dataset,labels,w,b)

ML|线性不可分SVM 软间隔

推荐阅读

再看final关键字

兼职和主业之间的比重该如何安排（）

佳能cp910照片不完整佳能cp910照片格式

单反相机镜头上的字母和数字都代表什么，比如说佳能 EF-S 18-55mm f/3.5-5.6 II USM 镜头。请具体说明一

大金空调主板代码故障排除图解大金空调lc是什么故障 ,要考虑这些方面

afc电路的分析,Afc电路

求几本和灵舟遮天类似的小说

matlab对数据fft分析,MATLAB的FFT分析意义

孩子|逼孩子叫人、表演节目……最有毒的中国式见面礼，是亲妈就别这样做！

男人六十岁以后要疏远哪些关系？

word怎么删除空白页

荣耀pl2021年高性价比千元机推荐

豆皮与腐竹有哪些什么区别？

猫一年能怀几次孕

体育游戏100例体育游戏有哪些

黄冰糖怎么分辨是没有染色的

喜之郎果冻太空人广告喜之郎果冻广告

人生感悟个性签名经典句子有什么？

桃源深处有人家下一句桃源深处有人家育种配方有什么

最终幻想起源全人物介绍最终幻想起源全角色图鉴分享杰克