Apple试图修复用户与Siri之间目前存在的语言和商业障碍:拥有A.I.实际上认识到当地企业的名称。它的计划?使系统能够访问用户地理定位的知识,从而了解特定社区中的餐馆,精品店和五金店。
Apple称这种技术为“基于地理位置的语言模型”,简称为Geo-LMs。在该公司机器学习期刊的一篇星期四博客文章中,Siri的语音识别团队解释说,他们将使用它来无缝地显示有关您当地比萨饼联合的信息,而不是回复商标,“抱歉,我不太明白“。
Siri是一个自动语音识别(ASR)系统,由两个单元组成,一个声学模型和一个语言模型。前者捕获有人说话时所发出的单词和声音,而前者则决定某些单词在所说语言中的可能性。从本质上讲,Siri充其量只是在理解你所要求的东西时做出了有根据的猜测。
Apple发现了两个有趣的缺点。例如,用于商业的某些单词和名称不用于标准对话,因此它们很少出现在系统的训练数据中,并且无法说明用户如何发音这些单词或名称。
为了解决这个问题,Geo-LMs会让Siri访问博客所谓的“实体名称”。通过这种方式,语音助理可以更好地预测您何时在谈论餐馆,而不是,例如,一个公园可能分享一个类似的名字。
Apple使用来自169个地区的美国人口普查局数据整理其Geo-LM,其中覆盖了80%的美国人口。他们还为不包含在这些领域的每个地区建立了全球Geo-LM。因此,如果用户要求Siri找到人口普查数据未涵盖的当地杂货店,则会使用全球Geo-LM。
尽管这可能会填补Siri的一些空白,但Apple仍然落后于目前正在培训下一代语音助手Duplex的谷歌,后者能够用超现实的人声拨打电话。虽然重要的是要注意谷歌也在努力提高Google智能助理能够理解各种口音,方言和语言。
博客文章未指定何时推出此更新。但是,我们希望你可以让Siri从Denino's Pizza订购而不会误将你的朋友Dino打电话给他。