python机器学习常用函数 python 机器学习( 三 )


PyMVPAPyMVPA是另一个统计学习库,API上与Scikit-learn很像 。包含交叉验证和诊断工具,但是没有Scikit-learn全面 。
【python机器学习常用函数 python 机器学习】深度学习尽管深度学习是机器学习的一个子节,我们在这里创建单独一节的原因是 , 它最新吸引了Google和Facebook人才招聘部门的很多注意 。
TheanoTheano是最成熟的深度学习库 。它提供了不错的数据结构(张量,tensor)来表示神经网络的层,对线性代数来说很高效,与Numpy的数组类似 。需要注意的是,它的API可能不是很直观 , 用户的学习曲线会很高 。有很多基于Theano的库都在利用其数据结构 。它同时支持开箱可用的GPU编程 。
PyLearn2还有另外一个基于Theano的库,PyLearn2,它给Theano引入了模块化和可配置性,你可以通过不同的配置文件来创建神经网络,这样尝试不同的参数会更容易 。可以说 , 如果分离神经网络的参数和属性到配置文件,它的模块化能力更强大 。
DecafDecaf是最近由UC Berkeley发布的深度学习库,在Imagenet分类挑战中测试发现,其神经网络实现是很先进的(state of art) 。
Nolearn如果你想在深度学习中也能使用优秀的Scikit-learn库API,封装了Decaf的Nolearn会让你能够更轻松地使用它 。它是对Decaf的包装,与Scikit-learn兼容(大部分),使得Decaf更不可思议 。
OverFeatOverFeat是最近猫vs.狗(kaggle挑战)的胜利者,它使用C++编写,也包含一个Python包装器(还有Matlab和Lua) 。通过Torch库使用GPU,所以速度很快 。也赢得了ImageNet分类的检测和本地化挑战 。如果你的领域是计算机视觉,你可能需要看看 。
HebelHebel是另一个带有GPU支持的神经网络库,开箱可用 。你可以通过YAML文件(与Pylearn2类似)决定神经网络的属性,提供了将神级网络和代码友好分离的方式,可以快速地运行模型 。由于开发不久,就深度和广度上说 , 文档很匮乏 。就神经网络模型来说,也是有局限的,因为只支持一种神经网络模型(正向反馈,feed-forward) 。但是 , 它是用纯Python编写,将会是很友好的库,因为包含很多实用函数,比如调度器和监视器,其他库中我们并没有发现这些功能 。
NeurolabNeuroLab是另一个API友好(与Matlabapi类似)的神经网络库 。与其他库不同,它包含递归神经网络(Recurrent Neural Network,RNN)实现的不同变体 。如果你想使用RNN,这个库是同类API中最好的选择之一 。
与其他语言集成你不了解Python但是很擅长其他语言?不要绝望!Python(还有其他)的一个强项就是它是一个完美的胶水语言,你可以使用自己常用的编程语言,通过Python来访问这些库 。以下适合各种编程语言的包可以用于将其他语言与Python组合到一起:R - RPythonMatlab - matpythonJava - JythonLua - Lunatic PythonJulia - PyCall.jl
不活跃的库这些库超过一年没有发布任何更新,我们列出是因为你有可能会有用,但是这些库不太可能会进行BUG修复,特别是未来进行增强 。MDPMlPyFFnetPyBrain如果我们遗漏了你最爱的Python机器学习包,通过评论让我们知道 。我们很乐意将其添加到文章中 。
python基础:数据分析常用包1. Numpy
Python没有提供数组功能,Numpy可以提供数组支持以及相应的高效处理函数,是Python数据分析的基?。?也是SciPy、Pandas等数据处理和科学计算库最基本的函数功能库,且其数据类型对Python数据分析十分有用 。
2. Pandas
Pandas是Python强大、灵活的数据分析和探索工具,包含Series、DataFrame等高级数据结构和工具,安装Pandas可使Python中处理数据非常快速和简单 。

推荐阅读