在云计算峰会 Cloud Next 17 上,Google 资深学者杰夫·迪恩 (Jeff Dean) 宣布,该公司开源的机器学习基础系统 TensorFlow 已经成为 GitHub 上最受欢迎的机器学习类项目。
TensorFlow 在机器学习业界究竟有多受欢迎?TensorFlow 项目负责人拉贾·蒙加 (Rajat Monga) 给出了几组数据:
自从 2015 年 11 月开源,已经有近 500 名非 Google 员工对 TensorFlow 核心项目做出贡献;到今年年初,项目在 GitHub 上的提交数已经超过了 1.4 万个。
在程序员提问平台 Stack Overflow上,已经有超过 5000 个与 TensorFlow 有关的问题得到了回答;TensorFlow 甚至一度抢过了 Google 云计算部门另一个开源项目 Kubernetes 的风头,两个项目正在公司内部竞争到底谁是最受欢迎的开源项目;不仅如此,斯坦福大学、加州大学伯克利分校、多伦多大学等学界名校也都紧跟潮流,开设了 TensorFlow 的有关课程。
在 GitHub 上和其他机器学习开源项目相比,TensorFlow 获得星数 (star count) 增长趋势是下图这样的。迪恩说 TensorFlow 居然这么受欢迎,他自己也有点没想到。
]
TensorFlow 是 Google 的一套综合性的机器学习系统框架,开源之前是仅供该公司内部使用,从搜索排名到应用商城推荐,从 Gmail 反垃圾到 Android 系统,被几乎所有产品团队所采用。迪恩透露,Google 内部有超过 4000 个项目里能找到 TensorFlow 的配置文件。它的开发者是 Google 内部最早系统性地研究人工智能技术的团队——Google 大脑。TensorFlow 已经是 Google 的第二代机器学习工具,前身是 DistBelief。
DistBelief 的缺点是仅局限于神经网络,配置难度高,和 Google 内部的产品联系紧密,这就决定了它很难与外界分享。从 DistBelief 伊始,迪恩一直想要要把内部的机器学习工具开放出去,为更多人所用(事实上 Google 一直也是这样做的,云端部署工具 Kubernetes、办公套件G Suite 都是例子)。他的想法也跟业界趋势以及公司的想法吻合,Google 批准他在 DistBelief 的基础上对代码和架构进行加工简化,在合适的时候开源,TensorFlow 就这样诞生了。
迪恩说开发(并开源) TensorFlow 有三个目标:建立一个通用的机器学习平台,让它成为世界上最好的平台,然后再把它开放给所有人。
但 Google 同意开源 TensorFlow,除了迪恩的理想之外还有更多现实的考虑。作为科技公司的 Google 是一家营利组织。Google Cloud 对 TensorFlow 的支持是最好的,而该部门在营收贡献上的重要性正在逐渐提升。包括 Google Cloud 在内的“其他收入”,在 Google 上一季度财报中共计 34 亿美元,占季度总营收 13%。虽然比重还很小,但仍体现出了极高的增长性,最主要的增长来自 Google Cloud。
考虑到深度学习技术广阔的前景,如果 TensorFlow 有助于人们更多涉足深度学习,而 Google Cloud 又是深度学习训练和应用最佳的承载平台,何不将它开源呢?这笔账不难算。