谷歌发布最新版AI系统图像配文准确率高达 93.9%

近日，谷歌发布了最新版机器学习系统，通过识别图像中的内容，配上对应文字，效果达到了历史最佳。谷歌已经在 TensorFlow 上开源了这项成果。自 2014 年以来，谷歌一直致力于这个项目，现在这个算法描述图像的准确率已经高达 93.9% 。因为他们正在使用一个使用一个开始架构的最新的迭代，所以对于谷歌团队来说，有个大问题是该算法是否可以做得比简单识别图像中的对象更多。

要真正解释和描述一张照片，人工智能不仅需要了解图片中是什么，更要了解图像中这些对象有什么相互关系。谷歌的开发人员表示这不只是一个数据的倒推。该算法必须能够自然地理解图像中的对象和它们的用途。

谷歌研究的博客发文说：“令人兴奋的是，在展示全新情境时，我们的模型的确可以产生准确的配文，这显示出系统对图像中目标和背景的理解更深了。”同样重要的是，“它还学会了如何用自然的英语短语表达知识，尽管它只读了人类给的说明字幕，没有在接受其他额外的训练。”

至少从目前来说，相对于视频，机器学习算法能更好地理解静止图像的内容。

via Google Research Blog

2016年9月26日业界资讯

关于作者

创新性IT解决方案提供商，专注解决信息化问题，用心陪伴企业成长。芊雅企服通过轻量的产品技术咨询和敏捷的软件研发，为企业提供定制化软件解决方案的一站式落地服务。用技术为企业加速！帮助传统企业技术上 “通水电”，我们相信产品和技术能让世界变得更好！

相关文章

全开源无人自助茶室棋牌室系统源码
2025年3月22日

2025年自助棋牌室系统源码
2025年3月8日

芊雅智慧空间系统v1.6发布，台球计费系统，棋牌室计费系统，茶室系统系统，全屋智控解决方案
2025年2月27日

一键把DeepSeek部署在你电脑
2025年2月25日

AI 编程工具开发商 Codeium 获新一轮融资，估值近 30 亿美元
2025年2月21日

Mozilla 再次延长 Firefox 对 Windows 7 的支持
2025年2月21日

产品咨询

开源产品

定制产品

解决方案

售后服务

售后服务

咨询

微信

电话