TechDay实录|TechDay实录 | 认识PaddlePaddle(更低使用成本、更高开发效率的深度学习框架)

导读:
在人工智能时代,各行各业都在尝试利用机器学习/深度学习等前沿技术来解决自身的业务需求,深度学习框架也应运而生。为了继续帮助AI开发者们在深度学习的道路上快速升级,百度PaddlePaddle于2019年重磅启动系列技术公开课“PaddlePaddle TechDay”。
2019年1月5日,第一期活动于北京中关村创业大街百度大脑创新体验中心展开,秉承着“技术为先,应用至上”的理念,百度邀请深度学习技术平台主任工程师胡晓光和高级算法工程师、百度认证布道师胡晓曼作为此次主讲嘉宾,分享PaddlePaddle框架设计原理、实现方式、完整实例等技术点,并结合百度自身AI实践的应用发展,详解PaddlePaddle针对深度学习模型的应用、训练与优化等具体细节。
以下为胡晓光讲师的演讲实录:
2012年,百度开始深度学习的应用,其深度学习框架内部版本可追溯到2013年,到2016年,为了满足开发者的使用需求,百度开源了深度学习平台PaddlePaddle,2018年底,百度又推出了PaddlePaddle Suit,力求框架使用成本越来越低。
如今,各大巨头公司都在进入深度学习领域,那深度学习框架为何如此重要?其实深度学习框架相当于传统的操作系统,起到连接底层硬件和上层应用场景的作用,以此支持各种AI相关的应用,使其与业务结合,实实在在解决业务场景中的问题。例如,通过该框架,可以将底层的CPU、GPU、FPGA、专用AI芯片、手机移动端上的芯片等各类硬件相关隔离并进行管理;在中间层将数据进行组网、训练,进一步得到模型进行预测;在应用层,还可以跟语音、NLP、视觉、推荐等实际场景中的业务进行结合。
可以看到,PaddlePaddle致力于通过输出领先的深度学习技术,赋能各行各业,全方位满足企业级深度学习的应用;同时,PaddlePaddle更加注重用户的开发成本,以最少的时间获得最满意的功能和效果。
支持不同层级开发者需求的PaddlePaddle全功能套件
TechDay实录|TechDay实录 | 认识PaddlePaddle(更低使用成本、更高开发效率的深度学习框架)
文章图片
如上图所示,PaddlePaddle的整体架构主要包含四个层面:核心框架、辅助工具、通用技术方案、服务平台。
核心框架包括:PaddlePaddle训练框架、PaddlePaddleServing(预测)、PaddlePaddle Mobile(移动端手机上可部署),在这个基础框架之上,可以做深度学习相关的工作。
再往上一层,针对深度学习应用的辅助工具包括:Visual DL可视化工具、Auto DL网络自动设计工具、PARL强化学习工具。
通用技术方案上,目前PaddlePaddle主要支持包括文本处理/NLP、CV 、智能推荐相关的三个方向,这三个方向里有大量的模型。
服务平台方面,面向用户实际业务场景,Easy DL无需用户写代码,便可低成本获取定制化服务;此外,还有学习深度学习的平台AI Studio、针对深度学习云服务的Infinity。
PaddlePaddle设计思想
TechDay实录|TechDay实录 | 认识PaddlePaddle(更低使用成本、更高开发效率的深度学习框架)
文章图片
具体到执行流程,通常前端程序是用Python来写的,但实际代码程序是在后端的C++语言环境下实现的,那二者是如何关联起来的呢?
在Python前端,有一个接口可做到前后端的调度,中间还有一个程序ProgramDecs,可进行网络结构的序列化。然后将Programdesc通过接口传给Transpiler,对原始Program做进一步优化,再传给一个新的Programdesc。而在C++后端有一个执行器,这里面对各种各样的Operator进行计算和调用,相当于在CPU上跑的各种指令在这里完成。之后,像梯度或参数等计算结果跑出来后,需要返回预测值,还是通过这个接口再传给Python前端。也就是说,输入数据和返回的结果都是可以在前端完成的。正因如此,整个框架后端是基于C++的,效率也十分高。
执行过程
编译期:定义Program
1.编译时,用户编写一段python程序,通过调用 Fluid 提供的算子,向一段 Program 中添加变量(Tensor)以及对变量的操作(Operators 或者 Layers)。用户只需要描述核心的前向计算,不需要关心反向计算、分布式下以及异构设备下如何计算。
2.原始的 Program在平台内部转换为中间描述语言: ProgramDesc。
3.编译期最重要的一个功能模块是 Transpiler。Transpiler 接受一段 ProgramDesc ,输出一段变化后的 ProgramDesc ,作为后端 Executor 最终需要执行的 Fluid Program
4.后端 Executor 接受 Transpiler 输出的这段 Program ,依次执行其中的 Operator(可以类比为程序语言中的指令),在执行过程中会为 Operator 创建所需的输入输出并进行管理。
执行期:1.执行Program
TechDay实录|TechDay实录 | 认识PaddlePaddle(更低使用成本、更高开发效率的深度学习框架)
文章图片
2.创建Executor
Fluid中使用fluid.Executor(place)创建Executor,place属性由用户定义,代表程序将在哪里执行。
下例代码表示创建一个Executor,其运行场所在CPU内:
TechDay实录|TechDay实录 | 认识PaddlePaddle(更低使用成本、更高开发效率的深度学习框架)
文章图片
3.运行Executor
Fluid使用Executor.run来运行程序。定义中通过Feed映射获取数据,通过fetch_list获取结果:
TechDay实录|TechDay实录 | 认识PaddlePaddle(更低使用成本、更高开发效率的深度学习框架)
文章图片
官方支持最多模型库——PaddlePaddle Fluid模型库
目前,基于PaddlePaddle框架基础上开发了大量的模型,可以支持像CV、NLP、推荐等各类非常前沿的技术应用。值得一提的是,模型应用有很多已经放在GitHub上开源出来,如果开发者想要进一步尝试PaddlePaddle,除了查看官方文档,也可以在GitHub上快速找到PaddlePaddle最新开源的模型。
目前来看,PaddlePaddle官方支持的模型数量超过其他主流框架,主要包括计算机视觉里的图像分类、目标检测、人脸检测、关键点、OCR识别、语义分割、视频分类,自然语言处理里的中文词法分析、语义匹配、机器翻译,个性化推荐模型,语音识别等。
TechDay实录|TechDay实录 | 认识PaddlePaddle(更低使用成本、更高开发效率的深度学习框架)
文章图片
1.图像分类
目前网络模型主要朝着两个方向发展:一是越来越深;二是越来越复杂。如AlexNet、VGG、GoogleNet、ResNet、Inception-v4、MobileNet、Dual Path Network、SE-ResNeXt,2012年以来的经典图像识别网络都包含在PaddlePaddle的图像分类模型库里。
2.目标检测 SSD
Single Shot MultiBoxDetector (SSD) 是目标检测领域较新且效果较好的检测算法之一,具有检测速度快且检测精度高的特点。
对比 Faster R-CNN和SSD在GPU上的运行速度和准确率,可以得知,Faster R-CNN的准确率会很高,但跑得速度会慢些;而SSD会快很多,但准确率会低些。
3.人脸检测 PyramidBox
在图像检测里,人脸检测是比较特殊的,包括人脸拍照、人脸识别解锁,其核心基础都是检测。2018年,百度最新推出的PyramidBox,可以说是迄今最好的人脸算法。除了传统算法之外,重点考虑人脸的上下文特征,可以很好地提升人脸检测的交互率和准确率。
4.语义分割DeepLab V3+、语义实时分割ICNet
目前,用于语义分割的DeepLab V3+模型基于PaddlePaddle得到了实现,并取得了非常好的效果。可以看到,它有一些操作并不是标准的卷积,这意味着有可以针对这些操作进行更深入底层优化的空间。
5.视频分类
视频分类方法主要包含基于卷积神经网络、基于循环神经网络、或将这两者结合的方法,目前包含Temporal Segment Network(TSN)模型。
6.中文词法分析(LAC
中文词法分析(Lexical Analysis of Chinese)是一个联合的词法分析模型,包括中文分词、词性标注、专有名词识别任务。LAC基于一个堆叠的双向GRU结构,在长文本上准确复刻了百度AI开放平台上的词法分析算法。这三个任务可以做一个训练,其效果是非常显著的。
7.语义匹配 DAM
在最新发表的“Multi-Turn Response Selection for Chatbotswith Deep Attention Matching Network”论文中指出,主要使用了全局方法的网络结构,可判断全局信息,通过上下文表示句子语义结构,目前已在内部如聊天或对话系统中取得了非常好的效果。
8.机器翻译 Transformer
从2017年起提出的Transformer现已成为业界机器翻译模型训练的标配。Transformer是一个基于自注意力机制的机器翻译模型,其中不再有RNN或CNN结构,而是完全利用Attention学习语言中的上下文依赖。
9.个性化推荐模型
PaddlePaddle对推荐算法的训练提供了完整的支持,并提供了多种模型配置供用户选择,包括:TagSpace、GRU4Rec、SequenceSemanticRetrieval、DeepCTR、Multiview-Simnet。
模型库:
https://github.com/PaddlePaddle/models
【TechDay实录|TechDay实录 | 认识PaddlePaddle(更低使用成本、更高开发效率的深度学习框架)】总结来讲,PaddlePaddle是一个功能全面而又特别注重实用性的框架,百度在生产环境的打磨使其具备了强大的工业级生产能力,同时从框架的内部设计和实现上注重接口的简洁性和稳定性,并规避了复杂概念和设计的引入,使其降低了PaddlePaddle的开发门槛,对开发者也更加友好。此外,开放出大量支持最新主流的模型库,从而全方位为企业开发者提供帮助,使其可以顺畅地进行上层开发。当前仍处于深度学习研究和应用的持续火热期,深度学习框架及平台在研究界和工业界的需求仍持续增长,百度PaddlePaddle也将随着深度学习在各行各业的广泛应用,持续迭代和更新,为中国开发者和企业提供更强、更贴近需求的服务,我们也欢迎广大开发者和企业加入到百度PaddlePaddle的大家庭当中来,共建深度学习生态,助力AI落地。

    推荐阅读