–®—Ç–Æ—Ä–º! –Í–Æ–Π! –Í–Μ—Ç—Ä–∞ –°–≤–∏—Å—Ç!
随着亚马逊的Alexa和Siri一直承担更多家务(并且变得越来越狡猾)的能力的出现,许多人都在想:自然语言理解和会话语音接口的下一步是什么?
在这场比赛中有几家公司并驾齐驱。有Facebook收购的Wit.ai--您可以随身携带演示。 (尝试这个命令:“我想看猫。”)Apple有它的HomeKit,并且有了它,正在做Apple最擅长的事情 - 踢屁股。亚马逊也配备了Alexa配备的Echo和Echo Dot。
MindMeld是一家热衷于自然语言理解的公司。 MindMeld为其他希望为其产品,服务或设备添加智能语音接口的公司提供其自然语言理解功能。这家位于旧金山的公司为合作伙伴提供基础设施和定制选项,使他们的设备可以拥有自己的微调个人助理。 MindMeld最近宣布与Spotify建立了合作关系,但也与汽车公司,国防机构,电子商务公司等合作。 (当然,它无法分享这种伙伴关系的许多细节。)
逆 与MindMeld的Sam Vasisht讨论了语音识别领域的现状 - 但他很快指出,“语音识别”作为一个企业,现在是一个“平凡的话题”。现在,这一切都是关于“自然语言理解。 “语音识别几乎达到了顶峰:经过50多年的发展,AIs现在可以有效识别语音。这些系统在工作中几乎比人类更好,并且很快就会超过凡人。
然后,可预测的下一步 - 就像孩子的发展一样 - 就是教这些系统 了解 他们现在可以识别的语言。 “这个人在说话;这些是“远非如此”,我理解这个人在说什么;请允许我帮忙。“
而这一进一步的发展需要解释 含义 :模仿人类思维处理口头信息的方式。这个等式有两个部分。第一个是意图:说出这句话时人类的目标或愿望是什么?可以从口头语句中提取意图的计算机可以“理解”人类想要影响的意图 X 或与…互动 ÿ 。与此过程交织在一起的是等式的第二部分:实体。 A.I.必须知道如何确定被解决的实体,即人类意图的对象。
要做到这一点,MindMeld不是(正如我所推测或希望的)雇用哲学家。它聘请了自然语言专家,但大部分是A.I. “学习”过程本身就是相对不干涉的。如果您正在教导系统理解咖啡订单,您需要向系统展示人们可能订购咖啡的所有不同方式。
“我想要摩卡咖啡。”
“我可以请一杯乔吗?”
“对我来说只是一大杯咖啡。”
这就是自然语言专家 - 语言学家 - 进入的地方。但即使这样也不再需要,因为我们可以对数据进行众包。这些工具使您能够向成千上万的人询问相同的问题并编译他们的回答。然后你只需将这些回复反馈到A.I.,和 瞧 :A.I。可以对各种可能的询问做出反应。 “从成千上万的查询中,我们现在可以基本上机器学习如何生成数十亿的其他查询,”Vasisht说。
逆 Vasisht问道,他一直是A.I.的内幕人士。和自然语言理解领域,为我们推测。
MindMeld可以参与扩展对话吗?例如,如果我问一个后续问题,那么A.I.了解并继续回应?
是。这是设计的一部分。如果有人提出一个不完整的问题 - 例如,如果我要点咖啡,而且我没有说明我想要的咖啡的大小,它会回来说:“你的咖啡大小想?”
您是否期望图灵测试取得任何进展?
我认为我们非常接近它。我的意思是,IBM Watson做到了 危险! ,我认为这是一个非常好的例子。我们就是这样:它越来越近了。就像现在一样,在语音识别方面,我们正处于机器与人类一样好的地步,我想我们 - 肯定会在未来三到五年内 - 处于大多数这些会话语音的地步系统将被视为与人类一样好。
MindMeld做什么样的家庭自动化事情?
我们可以将我们的技术应用于任何类型的产品,任何类型的服务,任何类型的数据域。家庭自动化就是其中之一。在家里,你有照明控制,恒温器,安全系统,音频系统,视频系统,所有这些东西。我们能够控制任何提供适当接口的系统。
您希望您能在自己的家中与MindMeld联系起来吗?
我认为更高级的用例 - 例如与我的Spotify交谈,说“播放滚石乐队的播放列表”或“今晚播放我的古典音乐” - 这些类型的东西将是……真棒。
您想用声音控制的任何更意想不到或开箱即用的东西?
我向你描述的事情是我认为迫在眉睫的事情。换句话说,这些将很快发生。我认为,不会立即发生的事情将是微波炉,咖啡机和冰箱等。控制这些设备 - 所以我基本上可以说,“我的咖啡机是否准备好制作咖啡?打开咖啡机“如果它没有准备好,它应该回来说”我很抱歉,但你的咖啡机还没有准备好“ - 那种情报还不存在。这将是圣杯:基本上每个设备都可以与你交谈,并告诉你它能做什么,不能做什么。但我们还没到那里。
您如何看待这个行业的发展?
现在,这些都是极低成本的设备。我的意思是,这些是你几乎什么都买不到的装置。十年前,他们花了更多的钱。因此,构建新功能会增加这些设备的成本。最终,当前价值主张非常强烈;大多数这些制造商并不倾向于添加新功能,除非它们的成本非常低。
我认为这是它的一个方面。另一方面是,我们正在谈论连接这些设备。因此,连接这些设备不仅仅需要一个语音用例。在它们变得可行之前,必须有更多的功能需要依赖该连接。
你知道有哪家公司正在研究后者的能力吗?
许多半导体公司正在研发非常低成本的麦克风阵列。你可以基本上嵌入的东西 - 非常低的成本,几乎任何设备或应用程序 - 允许有语音输入。而且你不必站在这些设备旁边 - 你可以在10英尺外的地方说话。建立这种能力 - 我认为这是起点。而且我认为这将允许人们开始在设备上放置麦克风,然后其他高级功能将随之而来。但截至目前,我不知道有哪家公司正在建造这种智能咖啡机,智能微波炉或洗衣机。
当我们拥有完全智能的住宅,完全智能的公寓时,您最好的估计是什么?
今天,我们实际上几乎拥有人们想要自动化的所有必要子系统,这些子系统能够实现自动化。这包括灯,恒温器,安全系统,车库门,前门锁等等。所有这些都可以做到。问题实际上是围绕价格点。这些仍处于价格点,主要是早期采用者和对他们有迫切需求的人。但是这些东西的价格点急剧下降,非常快。我想我们可能会在未来几年内将这些子系统推向大众市场。
我谈到的其他事情 - 自动化低成本设备 - 我认为这些可能最早在五到七年的时间框架内。更像是10年之后,在那些成为现实之前。但是,正如我之前所说的那样,那些需要将许多其他东西聚集在一起的东西。如果这些各种成分更快地融合在一起,它可能会更快发生。
您认为2050年纽约市或旧金山公寓的样子如何?
2050!哇。我想我们会完全在那里。我们在科幻电影中看到的东西 - 你几乎可以与你家中的每个系统交谈,并用声音控制一切 - 我认为这些功能将会很普遍。当然在纽约和旧金山等城市。