主流深度学习框架简介主流深度学习框架简介

Caffe

http://caffe.berkeleyvision.org/

Caffe是伯克利人工智能研究室维护的深度学习库。

底层用c++实现
支持python接口
有大量的预训练模型库
支持CUDA
支持多块GPU
只能单机使用

Theano

http://deeplearning.net/software/theano/

Theano是蒙特利尔大学开源的深度学习库。

底层用python实现
接口只支持python一种
有预训练模型库
支持CUDA
支持多块GPU
只能单机使用

Tensorflow

https://www.tensorflow.org/

TensorFlow是Google开源的深度学习框架。

底层用c++实现
支持 python,c++,Java,Go
没有预训练模型库，无法迁移学习
支持Cuda
支持多块GPU
支持集群
支持移动设备

MXNET

http://mxnet.io/

MXNET是由开源社区DMLC发起的深度学习项目，目前MXNET已经被amazon AWS指定为官方深度学习平台。

底层用c++实现
支持Python、R、Scala、Julia、Perl、MATLAB、JavaScript语言。
支持CUDA
支持多块GPU
有预训练模型库，支持迁移学习
支持集群
支持移动设备

keras

https://keras-cn.readthedocs.io

Keras是一个高层神经网络API，Keras由纯Python编写而成。Keras是一个模型级的库，提供了快速构建深度学习网络的模块。Keras依赖于处理张量的库称为“后端引擎”。Keras提供了两种后端引擎Theano/Tensorflow，并将其函数统一封装，使得用户可以以同一个接口调用不同后端引擎的函数。Keras 为支持快速实验而生，能够把你的idea迅速转换为结果，如果你有如下需求，请选择Keras:

简易和快速的原型设计
支持CNN和RNN
无缝CPU和GPU切换

速度

文章图片
速度比较可以看出MXNet，Torch和Caffe三者在性能上不相上下。这个符合预期，因为在单卡上评测的几个网络的绝大部分运算都由CUDA和CUDNN完成。TensorFlow比其他三者都慢2倍以上，这可能由于是低版本的CUDNN和项目刚开源的缘故。
内存占用 Caffe > TensorFlow > MXNET
编程模型比较编程模型分为命令式和符号式两种。
关于不同编程模型各自的特点，参见：http://mxnet.io/architecture/program_model.html
【主流深度学习框架简介】Caffe是命令式架构，其余都是符号式架构。
非符号架构缺点：