谷歌开源大规模语言建模库，探索RNN极限

近日，谷歌宣布开源大规模语言建模模型库，这项名为“探索RNN极限”的研究今年2月发表时就引发激论，如今姗姗来迟的开源更加引人瞩目。研究测试取得了极好的成绩，另外开源的数据库含有大约10亿英语单词，词汇有80万，大部分是新闻数据。这是典型的产业研究，只有在谷歌这样的大公司才做得出来。这次开源也应该会像作者希望的那样，在机器翻译、语音识别等领域起到推进作用。

开源部分包括：

TensorFlow GraphDef proto buffer 文本文件
TensorFlow 预训练 checkpoint shards
评估预训练模型的代码
词汇表
LM-1B 评估测试

代码支持 4 种评估模式：

提供数据库，计算模型的 perplexity
提供前缀，预测后面一个单词
softmax 嵌入项，字符级别的 CNN 单词嵌入项
输入句子，将转存 LSTM 状态的嵌入项

更多详情查看：开源地址

2016年9月17日业界资讯

关于作者

创新性IT解决方案提供商，专注解决信息化问题，用心陪伴企业成长。芊雅企服通过轻量的产品技术咨询和敏捷的软件研发，为企业提供定制化软件解决方案的一站式落地服务。用技术为企业加速！帮助传统企业技术上 “通水电”，我们相信产品和技术能让世界变得更好！

相关文章

全开源无人自助茶室棋牌室系统源码
2025年3月22日

2025年自助棋牌室系统源码
2025年3月8日

芊雅智慧空间系统v1.6发布，台球计费系统，棋牌室计费系统，茶室系统系统，全屋智控解决方案
2025年2月27日

一键把DeepSeek部署在你电脑
2025年2月25日

AI 编程工具开发商 Codeium 获新一轮融资，估值近 30 亿美元
2025年2月21日

Mozilla 再次延长 Firefox 对 Windows 7 的支持
2025年2月21日

产品咨询

开源产品

定制产品

解决方案

售后服务

售后服务

咨询

微信

电话