常见的损失函数MSE也称为L2 loss常见损失函数python:
随着预测与真实值的绝对误差的增加,均方差损失呈二次方增加 。
Huber Loss将L1和L2结合起来,也被称做smoothed L1 Loss 。增加了一个需要额外设置的超参数,来控制L2和L1的连接位置 。在误差接近0的时候使用L2,使损失函数可导,梯度更加稳定常见损失函数python;误差较大的时候用L1,可以降低outlier带来的巨大误差的影响 。
二分类中 , 通常使用Sigmoid函数将模型的输出压缩到(0, 1)区间 。给定输入,模型判断为正类/负类的概率:
合并成一个:
取对数加负号之后 , 得到:
N是所有样本的数量 。
图中曲线可以看出,当预测值越接近目标值损失越?。?随着误差变差 , 损失呈现指数增长 。
真实值现在是一个One-hot向量,Sigmoid换成了Softmax来把输出值压缩到(0, 1)之间,所有维度的输出和为1.
Softmax公式:
表示K个类别中的一个,k只在对应的类别上是1,其他时候是0 。
于是上式可以改写成:
是样本的目标类 。
分类问题中为什么不用MSE?因为MSE假设了误差服从高斯分布,在分类任务下这个假设无法满足 , 因此效果会很差 。
第二个论点是从信息论的角度来分析的,是关于由KL散度的角度来推导Cross Entropy的过程( 原文 )
是另一种二分类损失函数,适用于Maximum-margin的分类 , SVM的损失函数就是hinge lossL2正则化
下图为 , 当y为正类的时候(),不同的输出对应的loss图
当y为正类时,模型输出负值会有很大的惩罚 。即使输出为正值在(0, 1)区间,也还是会有一个较小的惩罚 。也就是只有置信度高的才会有零损失 。使用hinge loss直觉上的理解是要找到一个决策边界,使得素有数据点被这个边界正确地 , 高置信度地被分类 。
【常见损失函数python的简单介绍】同时hinge loss也反应了一点 , 对于那些已经可以被很好分类的样本,它不再对loss产生贡献,可以让模型花更多的energy去学习难以分类的样本 。
从零开始用Python构建神经网络从零开始用Python构建神经网络
动机:为了更加深入的理解深度学习,我们将使用 python 语言从头搭建一个神经网络,而不是使用像 Tensorflow 那样的封装好的框架 。我认为理解神经网络的内部工作原理 , 对数据科学家来说至关重要 。
这篇文章的内容是我的所学,希望也能对你有所帮助 。
神经网络是什么?
介绍神经网络的文章大多数都会将它和大脑进行类比 。如果你没有深入研究过大脑与神经网络的类比,那么将神经网络解释为一种将给定输入映射为期望输出的数学关系会更容易理解 。
神经网络包括以下组成部分
? 一个输入层,x
? 任意数量的隐藏层
? 一个输出层,?
? 每层之间有一组权值和偏置,W and b
? 为隐藏层选择一种激活函数 , σ 。在教程中我们使用 Sigmoid 激活函数
下图展示了 2 层神经网络的结构(注意:我们在计算网络层数时通常排除输入层)
2 层神经网络的结构
用 Python 可以很容易的构建神经网络类
训练神经网络
这个网络的输出 ? 为:
你可能会注意到,在上面的等式中,输出 ? 是 W 和 b 函数 。
因此 W 和 b 的值影响预测的准确率. 所以根据输入数据对 W 和 b 调优的过程就被成为训练神经网络 。
每步训练迭代包含以下两个部分:
? 计算预测结果 ?,这一步称为前向传播
? 更新 W 和 b, , 这一步成为反向传播
下面的顺序图展示了这个过程:
前向传播
正如我们在上图中看到的 , 前向传播只是简单的计算 。对于一个基本的 2 层网络来说,它的输出是这样的:
我们在 NeuralNetwork 类中增加一个计算前向传播的函数 。为了简单起见我们假设偏置 b 为0:
但是我们还需要一个方法来评估预测结果的好坏(即预测值和真实值的误差) 。这就要用到损失函数 。
损失函数
常用的损失函数有很多种,根据模型的需求来选择 。在本教程中,我们使用误差平方和作为损失函数 。
误差平方和是求每个预测值和真实值之间的误差再求和 , 这个误差是他们的差值求平方以便我们观察误差的绝对值 。
训练的目标是找到一组 W 和 b , 使得损失函数最好?。布丛げ庵岛驼媸抵抵涞木嗬胱钚?。
反向传播
我们已经度量出了预测的误差(损失),现在需要找到一种方法来传播误差,并以此更新权值和偏置 。
为了知道如何适当的调整权值和偏置,我们需要知道损失函数对权值 W 和偏置 b 的导数 。
回想微积分中的概念,函数的导数就是函数的斜率 。
梯度下降法
如果我们已经求出了导数,我们就可以通过增加或减少导数值来更新权值 W 和偏置 b(参考上图) 。这种方式被称为梯度下降法 。
但是我们不能直接计算损失函数对权值和偏置的导数,因为在损失函数的等式中并没有显式的包含他们 。因此,我们需要运用链式求导发在来帮助计算导数 。
链式法则用于计算损失函数对 W 和 b 的导数 。注意,为了简单起见 。我们只展示了假设网络只有 1 层的偏导数 。
这虽然很简陋,但是我们依然能得到想要的结果—损失函数对权值 W 的导数(斜率) , 因此我们可以相应的调整权值 。
现在我们将反向传播算法的函数添加到 Python 代码中
为了更深入的理解微积分原理和反向传播中的链式求导法则,我强烈推荐 3Blue1Brown 的如下教程:
Youtube:
整合并完成一个实例
既然我们已经有了包括前向传播和反向传播的完整 Python 代码,那么就将其应用到一个例子上看看它是如何工作的吧 。
神经网络可以通过学习得到函数的权重 。而我们仅靠观察是不太可能得到函数的权重的 。
让我们训练神经网络进行 1500 次迭代 , 看看会发生什么 。注意观察下面每次迭代的损失函数,我们可以清楚地看到损失函数单调递减到最小值 。这与我们之前介绍的梯度下降法一致 。
让我们看看经过 1500 次迭代后的神经网络的最终预测结果:
经过 1500 次迭代训练后的预测结果
我们成功了!我们应用前向和方向传播算法成功的训练了神经网络并且预测结果收敛于真实值 。
注意预测值和真实值之间存在细微的误差是允许的 。这样可以防止模型过拟合并且使得神经网络对于未知数据有着更强的泛化能力 。
下一步是什么?
幸运的是我们的学习之旅还没有结束,仍然有很多关于神经网络和深度学习的内容需要学习 。例如:
? 除了 Sigmoid 以外,还可以用哪些激活函数
? 在训练网络的时候应用学习率
? 在面对图像分类任务的时候使用卷积神经网络
我很快会写更多关于这个主题的内容,敬请期待!
最后的想法
我自己也从零开始写了很多神经网络的代码
虽然可以使用诸如 Tensorflow 和 Keras 这样的深度学习框架方便的搭建深层网络而不需要完全理解其内部工作原理 。但是我觉得对于有追求的数据科学家来说 , 理解内部原理是非常有益的 。
这种练习对我自己来说已成成为重要的时间投入,希望也能对你有所帮助
交叉熵损失函数是什么?平滑函数 。
交叉熵损失函数,也称为对数损失或者logistic损失 。当模型产生了预测值之后,将对类别的预测概率与真实值(由0或1组成)进行不比较,计算所产生的损失,然后基于此损失设置对数形式的惩罚项 。
在神经网络中,所使用的Softmax函数是连续可导函数,这使得可以计算出损失函数相对于神经网络中每个权重的导数(在《机器学习数学基础》中有对此的完整推导过程和案例,这样就可以相应地调整模型的权重以最小化损失函数 。
扩展资料:
注意事项:
当预测类别为二分类时,交叉熵损失函数的计算公式如下图,其中y是真实类别(值为0或1),p是预测类别的概率(值为0~1之间的小数) 。
计算二分类的交叉熵损失函数的python代码如下图,其中esp是一个极小值,第五行代码clip的目的是保证预测概率的值在0~1之间 , 输出的损失值数组求和后,就是损失函数最后的返回值 。
参考资料来源:百度百科-交叉熵
参考资料来源:百度百科-损失函数
常见损失函数用法 损失函数(loss function)又叫做代价函数(cost function),是用来评估模型常见损失函数python的预测值与真实值不一致的程度,也是神经网络中优化的目标函数 , 神经网络训练或者优化的过程就是最小化损失函数的过程,损失函数越?。得髂P偷脑げ庵稻驮浇咏媸侵担?模型的健壮性也就越好 。
常见的损失函数有以下几种常见损失函数python:
0-1损失函数是最为简单的一种损失函数,多适用于分类问题中,如果预测值与目标值不相等 , 说明预测错误 , 输出值为1;如果预测值与目标值相同,说明预测正确,输出为0,言外之意没有损失 。其数学公式可表示为常见损失函数python:
由于0-1损失函数过于理想化、严格化,且数学性质不是很好,难以优化,所以在实际问题中,我们经常会用以下的损失函数进行代替 。
感知损失函数是对0-1损失函数的改进,它并不会像0-1损失函数那样严格,哪怕预测值为0.99,真实值为1,都会认为是错误的;而是给一个误差区间,只要在误差区间内,就认为是正确的 。其数学公式可表示为:
顾名思义,平方损失函数是指预测值与真实值差值的平方 。损失越大,说明预测值与真实值的差值越大 。平方损失函数多用于线性回归任务中,其数学公式为:
接下来,我们延伸到样本个数为N的情况 , 此时的平方损失函数为:
Hinge损失函数通常适用于二分类的场景中,可以用来解决间隔最大化的问题,常应用于著名的SVM算法中 。其数学公式为:
其中在上式中 , t是目标值{-1,1},y为预测值的输出,取值范围在(-1,1)之间 。
对数损失函数也是常见的一种损失函数,常用于逻辑回归问题中,其标准形式为:
上式中 , y为已知分类的类别,x为样本值,我们需要让概率p(y|x)达到最大值 , 也就是说我们要求一个参数值,使得输出的目前这组数据的概率值最大 。因为概率P(Y|X)的取值范围为[0,1],log(x)函数在区间[0,1]的取值为负数,所以为了保证损失值为正数要在log函数前加负号 。
交叉熵损失函数本质上也是一种对数损失函数,常用于多分类问题中 。其数学公式为:
注意:公式中的x表示样本,y代表预测的输出,a为实际输出,n表示样本总数量 。交叉熵损失函数常用于当sigmoid函数作为激活函数的情景,因为它可以完美解决平方损失函数权重更新过慢的问题 。
原文参见
关于常见损失函数python和的介绍到此就结束了 , 不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站 。
推荐阅读
- java代码实现简单功能,java代码例子讲解
- 移动括号算法java代码,括号匹配问题java代码
- plc毕业设计用什么软件,plc毕业设计简单吗
- obs虚拟无人直播,obs无人直播会封号吗
- sl是linux的命令吗 linux sl命令
- ChatGPT哪里买,哪里买tt比较好
- go编写爬虫,go python 爬虫
- 虎牙直播星秀主播年度,虎牙星秀一姐排行榜
- 执行两条linux命令行 linux 两条命令先后执行