深度学习第一讲（数据预处理）深度学习

【深度学习第一讲（数据预处理）】一、安装百度paddle平台（ubuntu 14.04)
paddle要求：Python2.7.x (dev)，Pip >= 9.0.1
Python3.5.x (dev)，Pip3 >= 9.0.1
安装python: sudo apt install python-dev python-pip
python3: sudo apt install python3.5-dev
升级pip到最新版本: pip install --upgrade pip
二、数据预处理
1、属性归一化
在数据集中，常常存在各维度的数据取值范围差别较大，这会导致：
（1）过大或过小的数值范围会导致计算时的浮点上溢或者下溢。
（2）不同的取值范围会使得各个维度的数据重要性不同（至少存在于训练的初始阶段），这会使得训练时间大大加长。
2、整理训练集与测试集
数据集分为测试集和训练集，训练集用于调整模型的参数，通过训练数据找到规律来预测未知数据。而测试集用来反应模型表现的指标。
分割测试集和训练集的比例应考虑到：更多的训练数据会降低参数估计的误差，从而得到更可信的模型。而更多的测试数据会降低测试误差的方差，从而得到更可信的测试误差。
注意：在更加复杂的模型训练中，常常会使用验证集。复杂的模型中有一些超参数需要调节，我们会使用多种超参数的组合来分别训练多个模型，对比它们在验证集上的表现，选择一组表现最好的超参数，最后才使用这组参数在测试集上评估测试误差。
参考文章：http://www.paddlepaddle.org/documentation/docs/zh/1.1/beginners_guide/quick_start/fit_a_line/README.cn.html

深度学习第一讲（数据预处理）

推荐阅读

如何删除共享怎么删除共享服务器上

企业所得税详细计算公式企业所得税汇算清缴在哪里下载，怎么查汇算清缴报表

铝热剂反应原理

热恋中的女人常犯这些错误热恋中的女人常犯这些错误吗

累计概率值是什么意思累计概率值具体是什么意思

能学会用

牛年元旦励志语录有关元旦的正能量句子

附唐山分配数量唐山2023兔年贺岁纪念币一个人能约几枚？

ar游戏什么意思趣ar是什么意思

济南安卓培训学校,济南大支教育培训学校有限公司联系方式:

ios ui开发，有谁知道ios开发UI新手要学些什么课程适合呢

高仿手机,华强北高仿手机

按键精灵脚本代码大全按键精灵命令使用方法

崩坏4银河最新消息,崩坏4银河测试时间

老蛙微距和佳能微距老蛙微距对比佳能微距

玫瑰奶冻卷步骤玫瑰奶冻卷步骤视频

现代诗‖九月的最后几天

哈啰出行司机要求是什么司机注册条件及流程步骤

经营婚姻的相处之道男人怎样做婚姻会幸福

肾结石不能吃十种食物下面带你了解一下