投稿|PyTorch打败Google( 二 )


从时间上来看,TensorFlow总比PyTorch早,开源的时间早,整合的时间也早 。
但从趋势来看,TensorFlow的领先优势越来越不明显,Google Trends显示,甚至PyTorch已经超过了它 。
 投稿|PyTorch打败Google
文章图片

图1 Google Trends : PyTorch VS TensorFlow
02 巨人歌利亚Google确实是技术上的歌利亚 。
 
不说安卓,不说搜索,不说谷歌地图 。
 
熟悉的人,应该还记得大数据的故事 。
 
2003年开始,Google把自己内部用的几种数据处理技术陆续整理成论文,公开发表 。其中具有奠基性的有三个,分别是计算框架MapReduce,文件系统GFS和表格存储BigTable 。
 
芸芸众生借此一时眼界大开 。
 
读论文的众多人中,有一个叫做Doug Cutting的青年,他认为这些技术很有通用性,便照着论文把里边的系统自己做了一个出来 。
 
Google言之,于我心有戚戚焉 。
 
于是,大名鼎鼎的,很快成为大数据事实标准的Hadoop就这么诞生了 。
 
大家或许听过阿里云飞天5K的故事 。在王坚的力推下,阿里云参考Hadoop开发了一套自己的大数据系统,而飞天5K,就是指这套系统成功支撑住了5千个节点 。
 
但飞天5K发生在2013年,Hadoop诞生在2006年,Google发论文在2003年,而Google的内部系统的启用时间,不知何年 。
 
什么叫技术代差,这就叫技术代差 。
 
Doug Cutting后来被称为“盗火者”,而那三篇论文,史称“Google 三驾马车” 。
 
所以技术圈一直有一种印象,那就是Google藏了很多黑科技,随便把自己内部用了很久、甚至已经不用的系统拿出来发表一下,便能引起江湖上的血雨腥风 。比如我在阿里时,就总听说某某Google大佬回国后,在阿里把自己在Google用过的系统重新实现一遍而走上巅峰的故事,长恨自己眼界太窄又不在其中 。
而TensorFlow不仅是Google直接开源自己的内部系统,而且是优化版——TensorFlow之前,Google还有一个2011年开始的DistBelief,TensorFlow正是总结了DistBelief的很多问题后升级而来的 。 
而且,AlphaGo也是Google的,再而且,它还运行在TensorFlow之上 。
 
所以按理说,TensorFlow应该比被人抄出来的Hadoop更容易成功,可Hadoop出来后就成了大数据的事实标准,TensorFlow却没有 。
 
不仅没有,似乎还在走下坡路 。
 
IT界有个达维多定律,说市场的第一代产品总能自动获得50%的市场份额 。TensorFlow比PyTorch早,技术上没有代差,却在有明显优势的情况下被PyTorch拉了下来 。
 
确实不可思议,说Google输了也不为过 。
03 大卫的策略 那PyTorch做对了什么?
 
知乎上对两者有相当多的讨论,但主要集中在技术层面的对比 。
 
诚然技术是一切的基础,但毕竟被比较的是Google,在这个领域,他有Jeff Dean,有深度学习的图灵奖获得者,还有一系列顶级专家 。引用腾讯机器学习平台负责人潘欣的原话来说,Google在2015年后的几年间包揽了全世界在深度学习领域一半以上的关键技术突破,比如TPU, Transformer, BERT, Neural Machine Translation, Inception, Neural Architecture Search, GAN,Adverserial Training, Bidrectional RNN……说Google技术不行,似乎很难成立 。
 
所以我更倾向于认为问题在别处 。
 
周其仁说自己观察经济现象有两个法门,一曰远,一曰简,远是远远的看大势,简是永远选择最简单的指标 。

推荐阅读