麻省理工学院博士后研究员Bradley Hayes刚刚将唐纳德“德鲁普夫”特朗普变成了一个机器人。他编写了一个反复出现的神经网络 - 一种人工智能 - 来研究和模仿共和党候选人的演讲。
他说,Hayes的“日常工作”是“专注于人机组合的研究:设计算法让机器人与人类一起工作并向人类学习,以便人类在工作中更安全,更有效,更有效。”@ DeepDrumpf是一个“侧面项目。”他从John Oliver的“奇妙草图”中获得灵感。 (“希望他能看到这一点 - 希望他能看到这一点并欣赏它。”)
逆 与海耶斯讨论了这种爱国主义的努力。
还有什么能激励你制作@DeepDrumpf?
它来自与我的一些同事的午餐时间对话,这些同事也进行机器人研究并处理机器学习。我们讨论的是一些与我们的研究实际相关的各种统计建模技术。事实证明,DeepDrumpf背后的相同技术适用于许多机器人领域,因为它是一种建模技术,试图学习顺序信息或顺序数据的结构。自然语言是顺序数据的一个很好的例子,其中句子的结构是相当一致的:有规则,并且你得到的所有数据都有底层结构。
继承1亿?现在我正在世界各地建设。而且我有点酷。
- DeepDrumpf(@DeepDrumpf)2016年3月4日
斯坦福大学一位不同的研究人员写了一篇关于神经网络的课程,特别是发表了一篇题为“回归神经网络的不合理有效性”的文章。所以,他写了这篇关于这种统计建模技术的精彩介绍,以及一堆人们已经证明,在这种自由形式的文本数据写作中,它具有代表结构的这种不合理的力量。
我看到一篇文章比较了各种政治领跑者的言语复杂性。文章说的是特朗普如何使用更简单的语言,这对他的投票人口和他的粉丝来说是一个巨大的打击。从政治的角度来看,这真的很棒,因为它可以使你的信息清晰,并且能够抓住最广泛的受众;从机器学习的角度来看,这意味着这可能是我们可以做出的最易处理的模型。
你听说过一种名为“让Python再次成为伟大”的编码语言吗?
你知道,我昨天看到了。 TrumpPython还是那样的?我确实看到了。我读了一篇关于它的文章,我去了他们的GitHub页面,但我还没有时间玩它。但它看起来很棒。
我们能从你的A.I.那里了解特朗普的语言倾向,或类似的东西吗?
是的,从某种意义上说,如果你看一下模型的输出,它就可以表明模型从数据中学到的结构。因此,重复的种类,从模型中产生的事物的类型,将告诉你 - 可能 - 关于他的说话模式和他的信息所固有的某些事物。
堪萨斯他们都说,“我什么都不需要。他们有一个可怕的国家,有特殊的基础设施,我们的国家需要富裕。
- DeepDrumpf(@DeepDrumpf)2016年3月4日
你不一定能从Twitter帐户本身获得,主要是因为Twitter只给你140个字符。并且,因为没有很多数据进入模型,部分原因是成绩单来自辩论 - 候选人(特别是特朗普)倾向于自我中断 - 这导致了输出中的这些不连续性。
从这个模型中基本上采样一段文字,然后通过它并选出最好的连续140个字符的金块,然后发布它,还需要一些手工工作。
这是它的事。我们的总统是奥巴马医改。现在,这就是它不是。非常感谢你。我们不是啦啦队长,我们很有趣
- DeepDrumpf(@DeepDrumpf)2016年3月4日
那么现在还不是很放手?
它有效地学习为概率分布,您可以从中进行采样。这意味着什么 - 你有你的模型,你可以要求它写一封信。而且,如果你要求它连续写出足够的字母,它会给你类似英语的东西。或者,甚至更好,其中一些类似于特朗普可能实际说过的东西 - 因为它是在他身上训练的。所以,我一直关注的一般过程是:我会从中抽取500或1,000个字符。它只会给我一个文本墙,其中包含500或1,000个字符,我猜,随意,然后,从内部,我将选择最有意义的140个字符块。或者从它出来的最好的句子似乎有点相关。
例如,昨晚我用它来进行现场推特辩论。所以,你可以用这样的模型做的事情之一是你可以填充它。因此,因为模型一次只给你一个角色,所以它依赖于之前的角色 - 它之前输出的字母。这就是它学习单词的方式,就是它如何捕获句子结构和语法的某些元素。
假设我用'Romney is'开始我的句子,然后问下一千个字符。我们称之为启动。它会提供它想要的任何输出,但它会将序列的初始部分设置为'罗姆尼是……'
这是用引号括号的短语引用这些推文吗?
非常正确。
罗姆尼是一种工具。我想告诉你这个。它们可能是我们在领导者中最不需要的东西,我们不能这样做。
- DeepDrumpf(@DeepDrumpf)2016年3月3日
我希望做的事情之一,一旦过程稍微清洁一点 - 而这将会带来更多数据 - 就是开始让它与其他候选人互动。如果您查看Twitter帐户,它会跟随其他主要候选人。最终,它有望开始回应他们并可能挑战他们。但这更像是一个周末项目的事情。
@realDonaldTrump他们现在要付钱,绝对是。我真的很有钱。哦,我想支持并拥有它们。
- DeepDrumpf(@DeepDrumpf)2016年3月3日
你能用简单的非专业语言来解释复发神经网络是什么吗?
当然 - 我们会试试。一般来说,神经网络正在接受一些输入,然后它在中间做一些数学运算,它会给你一个输出。一般来说,它只是一个分类器。因此,给定一些输入,它将告诉您输入对应的类。一个流行的例子是 - 一个基本的神经网络 - 你给它一张猫的图片,你想要它告诉你 - 如果它是,像猫,狗,飞机,或汽车 - 你想要它说“好吧 - 很有信心 - 这只是你给我的猫。”
这就是高级分类任务。这是一个类似的概念,但不是猫,狗,汽车,类是字母和标点符号的单个字母。所以它正在接受一个输入,然后它根据它学到的东西对它进行数学运算 - 所以所有的学习都发生在'中间',我们称之为 - 它最后会给你一个分类。所以,像, 这封信.
使它成为一个的东西 复发 神经网络是前一步骤的输出作为模型的一部分被送入下一步骤。模型给我一个'M'的事实将进入模型的下一个贯穿期。那么它可能会给你一个'a',然后一个'k',然后一个'e',因为它试图推出'让美国再次变得伟大',因为它在数据中代表了很多。
到目前为止,您是否对任何DeepDrumpf推文感到特别自豪?
是的,实际上。我有几个我还没有发布的,但是 -
独家.
笑完全正确。在发布的内容中,我特别满意'我是ISIS不需要的。'
我是伊斯兰国不需要的。
- DeepDrumpf(@DeepDrumpf)2016年3月3日
让我们看看……我确实播种了'我不是种族主义者,但是……'而且这种延续就是'……相信它',我认为这非常好。如果它变得相关的话,我会在相关的时候保存那个。
这些话之后没有任何好事。
你愿意投票给唐纳德特朗普还是投票给@DeepDrumpf?
我认为每种选择都有权衡。