麻省理工学院的新算法可以在他们变得尴尬之前预测人类的互动

$config[ads_kvadrat] not found

–®—Ç–Æ—Ä–º! –Í–Æ–Π! –Í–Μ—Ç—Ä–∞ –°–≤–∏—Å—Ç!

–®—Ç–Æ—Ä–º! –Í–Æ–Π! –Í–Μ—Ç—Ä–∞ –°–≤–∏—Å—Ç!
Anonim

我们无法阅读其他人已导致一些史诗般的高五失败和错过的吻。即使经过一生的经验,人类的互动也很难预测。但麻省理工学院计算机科学与人工智能实验室的研究人员认为他们可以提供帮助:通过一种新的深度学习算法,可以预测两个人何时拥抱,亲吻,握手或高五,他们向未来迈出了一大步幸运地没有那些尴尬的时刻。

他们希望他们的新算法 - 在600小时的YouTube视频和电视节目中受过训练 办公室, 磨砂, 大爆炸理论 ,和 绝望的主妇 - 可用于编制较少社交笨拙的机器人,并开发Google Glass风格的耳机,以便在我们有机会错过之前为我们提供行动。在他们想象的未来,你永远不会再有机会与你的同事一起打高五。

意识到机器人以与我们相同的方式学习社交是算法成功的关键。 “人类通过经验自动学会预测行动,这使我们有兴趣试图让计算机具有同样的常识,”CSAIL博士说。学生Carl Vondrick是本周在计算机视觉和模式识别国际会议上发表的相关论文的第一作者。 “我们希望通过观看大量视频来表明,计算机可以获得足够的知识,以便始终如一地预测周围环境。”

Vondrick和他的团队教授算法的多个“神经网络”来分析这个案例中的大量数据,Jim和Pam的五个小时,以及Mike和Susan偷偷摸摸的吻。考虑到伸展的手臂,举手或长时间凝视等因素,每个神经网络都猜到了下一秒会发生什么,并且网络的普遍共识被视为最终的“预测”。研究。

该算法在43%的时间内正确运行。虽然这似乎不足以保证我们的日常交互不会那么奇怪,但它对现有算法有很大的改进,现有算法的精度只有36%。

此外,人类只能在71%的时间内预测行动。我们需要得到所有帮助。

在研究的第二部分,该算法被教导预测什么对象 - 家庭情景喜剧主食如遥控器,餐具和垃圾桶 - 将在五秒钟后出现在场景中。例如,如果打开微波炉门,那么下一个杯子出现的可能性相对较高。

他们的算法对Google Glass来说还不够准确,但与合着者Antonio Torralba博士合作。 - 由Google教师研究奖和Vondrick与Google博士研究生资助。团契 - 我们可以打赌它会到达那里。 Vondrick预测,该算法的未来版本可用于对机器人进行编程以与人类进行交互,甚至可以教导安全摄像机在人员跌倒或受伤时进行登记。

“视频不像'选择你自己的冒险'一书,你可以看到所有潜在的路径,”Vondrick说。 “未来本质上是模棱两可的,所以挑战自己开发一个使用这些表示来预测所有可能性的系统是令人兴奋的。”

$config[ads_kvadrat] not found