据外媒(Ars Technica)报道,上周微软宣布实现语音识别新突破:其开发的语音转录系统识别误差仅为5.9% ,已接近人类大脑水平。该转录系统基于微软自家的开源软件Cognitive Toolkit所开发,微软于昨日发布了该软件的 2.0 beta版。
此前这一软件一直被叫做Computational Network Toolkit(CNTK)。这个使用 MIT 许可协议、经由GitHub 托管的项目给开发者提供现成的神经网络代码,可以用来打造其各自的机器学习系统。这些应用能够在 CPU 和GPU 上运行,并提供对计算机集群的支持。这些特性使得 CNTK 同来自谷歌的同类竞品 TensorFlow 相比也毫不逊色。
CNTK 原本是为语音应用程序而打造,并在随后的发展中逐渐适配到其他机器学习用途。Bing 团队使用它来进行关键字推断。比如当用户搜索“如何做一个苹果派?”即使这句话中并不包含“食谱”这个关键字,机器学习也能让搜索引擎理解到用户语言背后的食谱要求。昨日发布的 Cognitive Toolkit 2.0 beta 中最重大的一项更新便是提供了 Python 语言支持,另外适配能力也有很大改进。
不知不觉中机器学习变得越来越普遍,微软小娜和 Skype 地语音翻译中都有这种技术的参与。传统观念上运行机器学习所需要的庞大计算机资源让普通开发者望尘莫及,不过微软开源 Cognitive Toolkit 却意在降低 AI 和机器学习的门槛,促进其从高端科研向实际应用的方向转变。