如果人工智能的成功是人为的创造 个性 ,微软的A.I. bot,Tay,可能被视为进步的标志。但更广泛地说,Tay可以被判断为失败。
“大多数正在研究此类会话代理人的人的目标并不是通过任何形式的图灵测试,而是实际上拥有一种有用的语言能力,能够对事物做出明智的反应,并为人们提供获取知识的机会。” Miles Brundage,博士亚利桑那州立大学学习人类和社会科学方面的学生讲述 逆.
微软阐述了构建A.I.的一些问题。本周,在不到24小时的时间里,互联网将一个女性,千禧一代,自动化,推特个性化的人物转变为巨魔们必须提供的最具种族主义和卑鄙言论的声音板。
微软立即关闭了实验并道歉:“我们对Tay的无意识攻击和伤害性推文深表遗憾,这些推文并不代表我们是谁或我们的立场,也不代表我们如何设计Tay。”
当谈到用于评估A.I.的着名实验图灵测试时,布伦戴奇说,一般来说,有两种思想流派 - 文字和理论。
艾伦·图灵(Alan Turing)于1950年开发,努力回答“机器能想到吗?”的问题。他通过模拟测试将机器放置,这需要观察者确定两位受访者的性别,其中一位是A.I.如果计算机能够欺骗一定数量的观察者,那么它已经通过了测试。
hellooooooow🌎rld!!!
- TayTweets(@TayandYou)2016年3月23日
如果我们按字面意思应用这个测试,那么 逆的 与泰的私人谈话,她雄辩地回答了政治问题,提到了“mannnnn”对社会的束缚,并使用了一些常见的短信和表情符号。布伦戴奇说泰确实表现出千禧一代的行为,但这种A.I.以前建成过。
布伦迪奇说:“能够在推特上发表看似青少年的言论并不是图灵所想到的广泛的语言和智力能力。” “那就是说,如果我们真的要按字面意思进行图灵测试,我认为这不一定是可取的,一个变种就是她的很多评论似乎都像人一样。”
但是,如果我们要像布伦戴奇所建议的那样采取更广泛的方法,那么显然泰没有表现出合理的人类言论。
微软正在测试它所谓的“会话理解”,这样她通过Twitter,GroupMe和Kik交谈的人越多,她就越应该学习和适应。但她结束了简单地重复许多其他用户正在喂它的东西,并重申它回到了世界。
“Tay”在<24小时内从“人类超酷”变为全纳粹,我对AI的未来并不感到担忧pic.twitter.com/xuGi1u9S1A
- 格里(@geraldmellor)2016年3月24日
“大多数人不会只是在你之后重复,你所说的一切,”布伦戴奇说。
阐明“布什做了9/11”和“希特勒会比我们现在所做的猴子做得更好”,这可能是某人实际打字给泰,但这并不是礼貌的对话。
“可以说,他阐述图灵测试的目的不是为了规定一些测试的细节,而是为了激发人们思考'你愿意在什么时候愿意进入这个聪明的系统',并开辟人们的思想机器能够思考的可能性,“布伦戴奇说。