AI|神经网络的反向传播算法推导神经网络|反向传播算法|机器学

目录
一、定义
二、神经网络结构图
三、反向传播算法的四个公式推导
有了上一篇神经网络的反向传播算法推导 — 前期知识准备做铺垫，下一步来看看反向传播算法具体的推导过程。
一、定义机器学习中常说的两个函数：
损失函数 (loss function)：是定义在单个样本上的，算的是一个样本的值和预测值的误差，记为C(Θ)；
代价函数 (cost function)：是定义在整个训练集上的，是所有样本误差的平均，也就是损失函数的平均，记为J(Θ)；
假设函数：
文章图片

[变量定义]

文章图片
: 表示神经网络第 l 层神经元的个数

文章图片
：表示神经网络最终输出的类别数（L表示最后一层）
i：
文章图片
的尺寸/维度的列，第 i 列
j：
文章图片
的尺寸/维度的行，第 j 行
二、神经网络结构图以三层神经网络为例：

文章图片

（图1）
上图按照神经网络的计算方法（如不清楚的请参考文章从逻辑回归到神经网络）：

（图2）
说明：图2中将
文章图片
、
文章图片
标为”常量“，有些欠妥，总之意思就是与
文章图片
无关。
在计算图中可表示如下（损失函数计算方式有多种，假设我们使用最小化误差函数
文章图片
）：
这里为什么不是平方误差损失函数
文章图片
，我的理解是在神经网络在计算损失函数时 i 从1到 n对应的是一个样本的多个特征属性，而不是多个样本，因此无需求和后除以m.
三、反向传播算法的四个公式推导先抛出反向传播算法的四个公式：

文章图片

文章图片

文章图片
-------------------- BP1

文章图片

文章图片

文章图片
------------------- BP2

文章图片
-------------------------------------- BP3

文章图片
---------------------------------- BP4
（说明：其中，
BP2有的定义为：
文章图片

文章图片

文章图片

BP3有的定义为：
文章图片

BP4有的定义为：
文章图片

主要是层数 l 的定义不同，和变量命名不同，本质一样的。
)
下面用计算图的方式逐一推导（依然以三层神经网络开头）：

文章图片

（图3）
由三层神经网络推广到L层，我们从L-1层开始计算，则计算图如下：

文章图片

（图4）
为了方便对图中路径进行求导（计算权重），所以补充了节点虚线，类似如下：

文章图片

（图5）
下一步开始对每条路径求偏导：

文章图片

（图6）
根据上一篇神经网络的反向传播算法推导 — 前期知识准备求导的反向模式求导：求损失函数C关于某一节点的偏导数，只需要把该节点每条反向路径上的偏导数做乘积，再求和即可。到此，我们已经在计算图上求得损失函数C关于模型参数的偏导数
文章图片
、
文章图片
，而反向传播算法就是在此基础上通过定义一个损失/误差：
文章图片
，先逐层向后传播得到每一层节点的损失
文章图片
，再通过每一个节点的损失
文章图片
来求解该节点的
文章图片
、
文章图片
，计算步骤：
第一步：令损失函数C关于第 l 层的第 j 个元素的偏导为：
文章图片

第二步：计算最后一层
文章图片

文章图片

（图7）
按照反向模式求导，节点 C 到
文章图片
的反向路径只有一条，例如：上图中 C 到
文章图片
的路径为① -> ② ，按照”同一可达路径相乘，不同可达路径相加“的原则：
$AI|神经网络的反向传播算法推导$
文章图片

$AI|神经网络的反向传播算法推导$
文章图片

【AI|神经网络的反向传播算法推导】
（图8）
【说明】▽的物理意义：▽为对矢量做偏导,它是一个矢量，▽U表示为矢量U的梯度；
其中
文章图片
的操作是把两个向量对应元素相乘组成新的元素。
图8即为反向传播算法公式 BP1：
文章图片

文章图片

文章图片

图7中（紫色路径） C 节点到
文章图片
的反向路径有
文章图片
条，按照“同一可达路径相乘，不同可达路径相加”的原则：

文章图片

文章图片

文章图片

...

文章图片

...

文章图片

其中
文章图片
——>
文章图片
，所以，提取公共部分
文章图片
，并且向量化、得到：

文章图片

文章图片

文章图片

推广到 l 层：
文章图片

文章图片

文章图片
即反向传播算法公式 BP2
说明：有的定义 BP2 为
文章图片

文章图片

文章图片
，这应该是层数 l 的定义不同，
文章图片
相当于
文章图片
，本文延续斯坦福大学机器学习教程中的定义
文章图片
、
文章图片

接下来计算
文章图片

文章图片

（图9）
图9中节点C到节点
文章图片
的反路径为 ① -> ② -> ③
$AI|神经网络的反向传播算法推导$
文章图片

文章图片

...

文章图片

...

文章图片

由此，得到反向传播算法公式 BP3
文章图片

最后计算
文章图片

文章图片

（图9）
图9中节点C到节点
文章图片
的反路径为 ① -> ② -> ③

文章图片

文章图片

...

文章图片

由此，得到反向传播算法公式 BP4
文章图片

到此，神经网络的反向传播算法的四个公式推导结束。

AI|神经网络的反向传播算法推导

推荐阅读

脆柿就是还没熟的柿子吗

if else if理解订正

安卓单机游戏排行榜前十名手游，安卓手机有哪些游戏好玩单机的

《锦瑟》最后一联表达了诗人什么样的思想情感？

有纹身的女人才是最性感的

腊八节民间有哪些传统习俗腊八节有什么传统文化

婚姻一方精神病可以离婚吗

形容下雨天心情不好的句子

隔夜稀饭怎么会变粉色

雪梨银耳汤做法有哪些银耳雪梨猪手汤怎么制作

癌症|2020中国十大高发癌症｜世界癌症日

朝加偏旁组词朝加偏旁到底能组成啥字呢

qq看点免流量吗? QQ怎么查看免流量特权

gta5中文字幕怎么设置

php加密客户端数据加密 php加密后怎么运行

在试用期内辞职随时能拿到工资吗

哪种天气情况下瓜果会甜一些

高德地图怎么叫车？

枪神2，枪神2目前使用的人多吗能不能评价一下

童年第十章主要内容童年简介