发布于

Google刚刚重新定义了人工智能的听觉方式

作者

谷歌刚刚重新定义了人工智能的聆听方式:他们的新S2R人工智能模型完全跳过了文本步骤,直接从您的语音中理解意义

不再有“尖叫”被误解为“屏幕”。

不再有脆弱的语音助手因口音或噪音而崩溃。

S2R(语音到检索)将口语查询直接编码为语义向量——匹配意图,而不是单词。

结果是准确性几乎与17种语言的完美转录相匹配——而且不需要写下一个单词

这标志着人工智能与人类交流方式的哲学转变

几十年来,人工智能一直试图听我们说什么。

现在它正在学习理解我们是什么意思。

以下是为什么这很重要:

→ 设计为无错误:跳过了脆弱的转录管道。

→ 更快、更轻:适合手机、可穿戴设备和实时语音搜索。

→ 包容:在低资源语言中表现同样出色。

→ 私密:无文本日志 = 较少的数据暴露。

→ 开放:由谷歌的开放简单语音问题数据集支持,涵盖17种语言。

更重要的是,这是意图优先人工智能的开始。

语音不仅仅是回答,还可以执行行动。

想象一下,说“给我订一趟航班”,你的代理直接就... 执行了。

或者“那是什么声音?”——你的手机就知道了。

这就是S2R的方向,从语音搜索到语音智能。

我们终于见证了会说人类语言的人工智能的诞生。

请注意,中文版本是由 AI 辅助翻译的,因此可能存在细微错误。

作者

Ai Base Network (ABN), ABN ASIA由具有深厚学术背景的人员创立,他们在美国、荷兰、匈牙利、日本、韩国、新加坡和越南等国家有工作经验。ABN Asia是学术界和技术相遇的地方。凭借我们领先的解决方案和优秀的软件开发服务,我们帮助企业提升水平,走向全球舞台。我们的承诺:更快。更好。更可靠。在大多数情况下:也更便宜。

无论您需要IT服务、数字咨询、现成软件解决方案,还是想向我们发送招标要求(RFPs),都请随时与我们联系。您可以通过[email protected]与我们联系。我们随时准备为您提供所有技术需求的帮助。

ABNAsia.org

© ABN ASIA