机器学习|神经网络（一）基本概念 python|开发语言|学习笔记

一、概率论基本概念 ①概率：随机事件发生的可能性大小，介于0-1之间
②随机变量：可能发生的事件，称为X
③概率分布：一个随机变量X取每种可能值的概率（总和为1）
④离散随机变量：
伯努利分布：X为事件A出现的次数，事件A发生的概率为μ，不发生的概率为1-μ
分布公式为：
文章图片

二项分布：n次伯努利分布中，X表示A出现的次数，
分布公式为：
文章图片
,k=1...,n
⑤连续随机变量：一般采用概率密度函数来描述

文章图片

高斯分布：
文章图片

文章图片

⑥累积分布函数：随机变量X的取值小于等于x的概率
cdf(x) = P(X≤x)
文章图片

⑦随机向量：一组随机变量构成的向量
联合概率分布：
文章图片

条件概率：对于离散随机向量(X,Y)，已知X=x时，Y=y的条件概率

文章图片

⑧采样：给定一个概率分布p(x)，生成满足条件的样本
如何进行采样
1.直接采样：均匀分布->线性同余发生器：
文章图片

2.间接采样：仅均匀分布能直接采样，其他的都是通过间接采样
⑨期望：随机变量的均值
离散变量：
文章图片

连续随机变量：
文章图片

⑩大数定律：样本数量很大的时候，样本均值和真实均值（期望）充分接近
二、机器学习的定义 【机器学习|神经网络（一）基本概念】通过算法使机器从大量数据中学习规律从而对新的样本做决策

文章图片

三、机器学习的类型 1.监督学习包含了回归问题(连续)和分类问题(离散)

文章图片

2.无监督学习包含三种方法类聚、降维、密度估计

文章图片

3.强化学习通过与环境的交互来进行学习（例如阿尔法狗），属于无监督学习
4.总结
文章图片

四、机器学习的要素机器学习的四要素：数据、模型、学习准则、优化算法
1.模型 ???????
文章图片

文章图片

2.学习准则好的模型在所有取值上应与真实映射函数一致

文章图片

损失函数：非负的实数函数，用以量化模型预测和真实标签之间的差异
以回归问题为例：平方损失函数
??????????????
文章图片

期望风险：损失函数在真实数据分布下的期望

文章图片

由大数定律可知，在N区域无穷时，期望风险可以近似为经验风险
经验风险：由训练数据推算而来

文章图片

机器学习目的是寻找参数
文章图片
，使得经验风险函数最小化
3.优化算法机器学习问题通过经验风险转变为一个最优化问题
①导数法：令函数一阶导=0，求极值点
②梯度下降法：是一种迭代算法

文章图片

搜索步长α也可称为学习率
学习率为一种超参数，需要人工选择。学习率的选择极为重要，不能过大/过小

文章图片

②-1:随机梯度下降法：在每次迭代时只采集一个样本，当经过足够次数的迭代时，也可以收敛到一个局部最优解。
优点：每次计算开销小，支持在线学习
缺点：无法充分利用计算机的并行算法
②-2：小批量随机梯度下降法：随机选取一小部分训练样本来计算梯度并更新参数
五、泛化和正则化机器学习拟合中可能出现的问题：欠拟合、过拟合

文章图片

机器学习≠优化（期望风险≠经验风险）
1.泛化误差
文章图片
(期望风险和经验风险的差值)
2.正则化降低模型复杂度以减少泛化误差
所有损害优化的方法
如：增加约束（L1/L2优化、数据增强）
干扰优化过程（权重衰减、随机梯度下降、提前停止）
提前停止：使用一个验证集，每次迭代后使用参数在验证集上进行测试，如错误率不再下降则停止迭代

文章图片

机器学习|神经网络（一）基本概念

推荐阅读

如何科学坐月子春季坐月子这6件事千万别做

广汽本田广汽本田皓影三大件是进口的吗

小森生活抗寒衣服怎么做小森生活抗寒套装制作攻略

冬枣泡了糖精水的怎么看

怎么用炉甘石治荨麻疹

警察是否有权上门抓狗

伊利鲜奶好还是蒙牛纯牛奶好带你了解伊利纯牛奶和蒙牛纯牛奶有什么区别

正常胸和下垂胸对比如何揉胸才能变大

ps快速替换靠山颜色

夏天发面要几个小时才会发的好夏天发面是用冷水还是用温水

圆点|每日好价：大牌小圆点机械键盘开售颜值超高

臀部|臀部引发各种疼痛，令人很苦恼，这些锻炼方法，您会吗？尝试看一看

接触区域按接触还是挤压强度分析

NLP教程（Python NLTK用法示例和完整指南）

三国志战略版震慑状态是什么九大震慑类战法使用攻略

如何为企业选择合适的云服务器？企业要用云服务器怎么搞

lol2018战斗之夜奖励重随在哪领取战斗之夜奖励重随领取地址

果树环剥的方法及作用果树环剥注意事项

考研什么时候出成绩考研是什么

瓜蒌皮的功效与作用及禁忌