英特尔助力人工智能语言识别

在近日举行的NeurIPS大会上，发布了两册英特尔提供支持的关于口语数据集的白皮书，其中，《人的语言》主要涉及到“自动语音识别”任务，另一册——《多语种口语语料库》则涵盖“关键词识别”。

在NeurIPS大会上发布的两个数据集可助编目数十种语言

在近日举行的NeurIPS大会上，发布了两册英特尔提供支持的关于口语数据集的白皮书，其中，《人的语言》主要涉及到“自动语音识别”任务，另一册——《多语种口语语料库》则涵盖“关键词识别”。这两个项目的数据集都贡献了大量丰富的音频数据，且每个数据集在同类中都拥有最大的可用体量。

《多语种口语语料库》由英特尔软件与先进技术事业部（SATG）的机器学习工程师Keith Achorn参与撰写。Keith在英特尔社区网站的博客中讲述了自己参与该项目的经历。

在ML Commons 的支持下，“人的语言”和“多语种口语语料库”于2018年开始启动，该项目旨在识别世界上最常用的 50 种语言并统一到单一的数据集中，从而使这些数据得到有效利用。该项目小组成员来自英特尔、哈佛大学、阿里巴巴、甲骨文、Landing AI、密歇根大学、谷歌、百度等。

在当今多元化、国际化、多语言的工作环境中，准确转录和翻译的能力愈发重要。通过使用以上数据集，计算机可以“听到”口语单词，并自动生成文本或译文。

这两个项目都运用了“多样化语音”，这意味着它们可以更好地展现自然环境音，如背景噪音、非正式语言模式、录音设备混音以及其他声学环境等。这与诸如有声读物之类的高度受控的内容不同，后者产生的声音更加“纯净”。然而，在实际应用中，多样化语音训练有助于提高识别的准确性。

“人的语言”项目内含数万小时的对话音频。如今，它是世界上最大的、可免费下载的、用于学术和商用的英语语音识别数据集之一。

“多语种口语语料库”是一个音频语音数据集，不仅拥有超过30万个关键字的数十种语言，能够通过智能设备访问，还涵盖了50多亿用户的日常对话，有助于推动全球范围内受众语音应用的研发。

这两个数据集都将提供给广泛的用户进行应用，它们包括商用在内的授权许可条款都相对较为宽松。

来源：业界供稿

英特尔

0赞

好文章，需要你的鼓励

英特尔助力人工智能语言识别

来源：业界供稿

2021

12/10

09:30

分享

点赞

英伟达发布全新小型开源模型Nemotron-Nano-9B-v2，支持推理开关控制

谷歌翻译将集成AI功能并增加游戏化学习模式

边缘AI基础设施的现实挑战与解决方案

Hugging Face：企业在不牺牲性能下降低AI成本的5种方法

阿里推出Ovis2.5：多模态大语言模型的又一重要突破

对话谷歌副总裁Karen Teo：“短剧”“AI应用”现象级出海，我们看到中国开发者的三种内核

谷歌Gemini大模型登陆甲骨文云平台

Linux的微内核替代方案？Debian/Hurd证明微内核Unix梦想仍在继续

你的每一个问题、每一条评论，我都在记录

2035年最热门的十大颠覆性产业

AI"教父"提出让AI具备母性本能引发争议

生成式AI助力MIT科学家对抗超级细菌

成本打到6万以下，手把手教你用4路锐炫显卡+至强W跑DeepSeek

天翼云CPU实例部署DeepSeek-R1模型最佳实践

MWC 2025：英特尔展示基于至强6处理器的基础网络设施

英特尔至强6新品发布，能为数据中心带来哪些改变？

英特尔推出具备高性能和能效的以太网解决方案

英特尔推出搭载至强6处理器的卓越AI和网络解决方案

HPE Gen12：英特尔至强6加持，数据中心和边缘计算的“新宠”

英特尔Gaudi 2D AI加速器为DeepSeek Janus Pro模型提供加速

英特尔：旗下的“主打”18A 产品将于2025 年下半年投产

英特尔至强6加持下的火山引擎，要降低大模型的应用门槛

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

关于AI Agent落地，李开复强调了两件事：“价值交付”和“一把手工程”

AWS re:Inforce：费城这天不只拼进球，还拼生成式AI安全

在欧洲之门马德里，我们再次见证了SAP激活企业增长的“飞轮”

IEEE专家委员胡凝：消解AI幻觉“阴影”，洞见“超级个体”价值锚点

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: